首页 > 最新文献

AStA Wirtschafts- und Sozialstatistisches Archiv最新文献

英文 中文
Bürgerbeteiligung in Deutschland – Wer beteiligt sich wofür mit welchen Auswirkungen? 德国的公民参与--谁参与了什么,产生了什么影响?
Pub Date : 2024-03-08 DOI: 10.1007/s11943-024-00336-2
Olaf Hübler

Bürgerbeteiligungen finden sich in nahezu allen Bereichen des öffentlichen Lebens. Häufig sind Unzufriedenheit mit öffentlichen Entscheidungen und Politikverdrossenheit dafür ausschlaggebend, dass es zu einem Engagement der Bürger außerhalb des Berufslebens kommt. Über Auswirkungen und Struktur von Bürgerinitiativen ist wenig bekannt. Empirische Untersuchungen beschränken sich häufig auf Einzelfallanalysen. Eine breitere Datenbasis unter Verwendung von statistisch-ökonometrischen Verfahren ist notwendig, um zu verallgemeinerbaren Aussagen zu gelangen. Welcher Typ Mensch ist bei über das Private hinausgehenden Angelegenheiten aktiv und beteiligt sich an diesen? Inwiefern wird er davon in seiner Einstellung und seinen Verhaltensweisen beeinflusst. Bürgerräte sind ein vergleichsweise neu entwickeltes Instrument zur Bürgerbeteiligung, zu dem aus statistischer Sicht noch eine Reihe an Informationen fehlt. Zufallsgesteuerte Auswahlverfahren sollen dazu beitragen, dass sich Politikempfehlungen und Politikentscheidungen stärker am Bevölkerungswillen orientieren. Welche persönlichen Merkmale sind für Bürgerratsmitglieder typisch? Entspricht die Verteilung dieser Merkmale der in der Gesamtbevölkerung?

Die empirische Untersuchung zeigt, dass übliche demographische Merkmale nur beschränkt die Teilnahme an Bürgerinitiativen erklären können und dass eine wechselseitige Beziehung zur Beteiligung an Bürgerinitiativen besteht. Von zusätzlicher Bedeutung sind Big 5 Charakteristika und Beurteilungen, was als gerecht empfunden wird. Lebenszufriedenheit und Vertrauen in Politiker offenbaren sich bei Personen mit und ohne Erfahrung im Bereich der Bürgerinitiativen unterschiedlich. Insgesamt ist die Bedeutung von Bürgerbeteiligung geringer einzuschätzen als die anderer altruistisch orientierter Aktivitäten.

公民参与几乎存在于公共生活的所有领域。对公共决策的不满和对政治的失望往往是公民在职业生活之外参与其中的主要原因。人们对公民倡议的效果和结构知之甚少。实证研究往往局限于个案分析。有必要利用统计-计量经济学方法,建立更广泛的数据基础,以得出具有普遍意义的结论。什么类型的人积极参与私人领域以外的事务?这在多大程度上影响了他们的态度和行为?公民委员会是一种相对较新的公民参与工具,从统计角度看,这方面的信息还很缺乏。随机遴选程序应有助于确保政策建议和决策更加符合民众的意愿。公民大会成员具有哪些典型的个人特征?这些特征的分布是否与整个人口的分布相一致? 实证研究表明,通常的人口特征只能在一定程度上解释公民倡议的参与情况,而公民倡议的参与情况与人口特征之间存在相互关系。更重要的是五大特征和对公平的判断。生活满意度和对政治家的信任度在有公民倡议经验和没有公民倡议经验的人身上有不同的表现。总体而言,公民参与的重要性低于其他利他主义导向的活动。
{"title":"Bürgerbeteiligung in Deutschland – Wer beteiligt sich wofür mit welchen Auswirkungen?","authors":"Olaf Hübler","doi":"10.1007/s11943-024-00336-2","DOIUrl":"10.1007/s11943-024-00336-2","url":null,"abstract":"<p>Bürgerbeteiligungen finden sich in nahezu allen Bereichen des öffentlichen Lebens. Häufig sind Unzufriedenheit mit öffentlichen Entscheidungen und Politikverdrossenheit dafür ausschlaggebend, dass es zu einem Engagement der Bürger außerhalb des Berufslebens kommt. Über Auswirkungen und Struktur von Bürgerinitiativen ist wenig bekannt. Empirische Untersuchungen beschränken sich häufig auf Einzelfallanalysen. Eine breitere Datenbasis unter Verwendung von statistisch-ökonometrischen Verfahren ist notwendig, um zu verallgemeinerbaren Aussagen zu gelangen. Welcher Typ Mensch ist bei über das Private hinausgehenden Angelegenheiten aktiv und beteiligt sich an diesen? Inwiefern wird er davon in seiner Einstellung und seinen Verhaltensweisen beeinflusst. Bürgerräte sind ein vergleichsweise neu entwickeltes Instrument zur Bürgerbeteiligung, zu dem aus statistischer Sicht noch eine Reihe an Informationen fehlt. Zufallsgesteuerte Auswahlverfahren sollen dazu beitragen, dass sich Politikempfehlungen und Politikentscheidungen stärker am Bevölkerungswillen orientieren. Welche persönlichen Merkmale sind für Bürgerratsmitglieder typisch? Entspricht die Verteilung dieser Merkmale der in der Gesamtbevölkerung?</p><p>Die empirische Untersuchung zeigt, dass übliche demographische Merkmale nur beschränkt die Teilnahme an Bürgerinitiativen erklären können und dass eine wechselseitige Beziehung zur Beteiligung an Bürgerinitiativen besteht. Von zusätzlicher Bedeutung sind Big 5 Charakteristika und Beurteilungen, was als gerecht empfunden wird. Lebenszufriedenheit und Vertrauen in Politiker offenbaren sich bei Personen mit und ohne Erfahrung im Bereich der Bürgerinitiativen unterschiedlich. Insgesamt ist die Bedeutung von Bürgerbeteiligung geringer einzuschätzen als die anderer altruistisch orientierter Aktivitäten.</p>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"18 1","pages":"99 - 116"},"PeriodicalIF":0.0,"publicationDate":"2024-03-08","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-024-00336-2.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"142410616","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Subventionen für „kleine Jobs“: 为 "小工作 "提供补贴:
Pub Date : 2024-03-04 DOI: 10.1007/s11943-024-00335-3
Regina T. Riphahn

Die Grohmann-Vorlesung des Jahres 2023 beschäftigt sich mit dem Phänomen der „kleinen Jobs“ in Deutschland. Zunächst wird der institutionelle und historische Hintergrund von Minijobs erläutert und die Intensität ihrer Nutzung beschrieben. Anschließend fasst der Text die Inhalte von drei empirischen Studien zusammen. Diese setzen sich mit der Frage auseinander ob (i) Arbeitgeber reguläre Beschäftigung durch Minijobs ersetzen, (ii) Minijobs zur „motherhood penalty“ in Deutschland beitragen und (iii) ob Midijobs Übergänge aus Minijobs in reguläre sozialversicherungspflichtige Beschäftigung erleichtert haben. Die Vorlesung schließt mit einer Betrachtung möglicher Regelungsalternativen für „kleine Jobs“ in Deutschland.

2023 年格罗曼讲座的主题是德国的 "小工作 "现象。首先解释了小型工作的制度和历史背景,并介绍了小型工作的使用强度。然后,文章总结了三项实证研究的内容。这些研究涉及以下问题:(i) 雇主是否以小型工作取代正规就业;(ii) 小型工作是否助长了德国的 "母亲惩罚";(iii) 中型工作是否促进了从小型工作向正规就业的过渡,而正规就业需要缴纳社会保险金。讲座最后探讨了德国对 "小型工作 "可能采取的替代监管措施。
{"title":"Subventionen für „kleine Jobs“:","authors":"Regina T. Riphahn","doi":"10.1007/s11943-024-00335-3","DOIUrl":"10.1007/s11943-024-00335-3","url":null,"abstract":"<p>Die Grohmann-Vorlesung des Jahres 2023 beschäftigt sich mit dem Phänomen der „kleinen Jobs“ in Deutschland. Zunächst wird der institutionelle und historische Hintergrund von Minijobs erläutert und die Intensität ihrer Nutzung beschrieben. Anschließend fasst der Text die Inhalte von drei empirischen Studien zusammen. Diese setzen sich mit der Frage auseinander ob (i) Arbeitgeber reguläre Beschäftigung durch Minijobs ersetzen, (ii) Minijobs zur „motherhood penalty“ in Deutschland beitragen und (iii) ob Midijobs Übergänge aus Minijobs in reguläre sozialversicherungspflichtige Beschäftigung erleichtert haben. Die Vorlesung schließt mit einer Betrachtung möglicher Regelungsalternativen für „kleine Jobs“ in Deutschland.</p>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"18 1","pages":"5 - 14"},"PeriodicalIF":0.0,"publicationDate":"2024-03-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-024-00335-3.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"140079905","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Establishing a probability sample in a crisis context: the example of Ukrainian refugees in Germany in 2022 在危机背景下建立概率样本:以 2022 年德国境内的乌克兰难民为例
Pub Date : 2024-03-04 DOI: 10.1007/s11943-024-00338-0
Hans Walter Steinhauer, Jean Philippe Décieux, Manuel Siegert, Andreas Ette, Sabine Zinn

Following Russia’s invasion of Ukraine in early 2022, more than one million refugees have arrived in Germany. These Ukrainian refugees differ in many aspects from Germany’s past forced migration experiences and there exists an urgent need for sound data and information for politics, practitioners, and academics. In response, the IAB-BiB/FReDA-BAMF-SOEP study was established to provide high-quality longitudinal data following a register-based probability sample. We detail on an approach for sampling refugees in brief time, making use of two different registers—the German population register and the central register of foreigners—and discuss the quality of the final sample with respect to potential selectivity of participation in the panel. Overall, we demonstrate the benefits and feasibility of establishing register-based samples even in the context of a geopolitical crisis and the necessity of sound data within brief time horizons. We provide guidance that can be followed for similar events in the future.

2022 年初俄罗斯入侵乌克兰之后,已有 100 多万难民抵达德国。这些乌克兰难民在许多方面都不同于德国过去的被迫移民经历,因此迫切需要为政界、从业人员和学术界提供可靠的数据和信息。为此,IAB-BiB/FReDA-BAMF-SOEP 研究应运而生,通过基于登记的概率抽样,提供高质量的纵向数据。我们详细介绍了利用两种不同的登记册--德国人口登记册和外国人中央登记册--对难民进行短时间抽样的方法,并讨论了最终样本的质量以及参与小组的潜在选择性。总之,我们证明了在地缘政治危机的背景下建立基于登记册的样本的好处和可行性,以及在短时间内获得可靠数据的必要性。我们为今后类似的事件提供了可遵循的指导。
{"title":"Establishing a probability sample in a crisis context: the example of Ukrainian refugees in Germany in 2022","authors":"Hans Walter Steinhauer,&nbsp;Jean Philippe Décieux,&nbsp;Manuel Siegert,&nbsp;Andreas Ette,&nbsp;Sabine Zinn","doi":"10.1007/s11943-024-00338-0","DOIUrl":"10.1007/s11943-024-00338-0","url":null,"abstract":"<div><p>Following Russia’s invasion of Ukraine in early 2022, more than one million refugees have arrived in Germany. These Ukrainian refugees differ in many aspects from Germany’s past forced migration experiences and there exists an urgent need for sound data and information for politics, practitioners, and academics. In response, the IAB-BiB/FReDA-BAMF-SOEP study was established to provide high-quality longitudinal data following a register-based probability sample. We detail on an approach for sampling refugees in brief time, making use of two different registers—the German population register and the central register of foreigners—and discuss the quality of the final sample with respect to potential selectivity of participation in the panel. Overall, we demonstrate the benefits and feasibility of establishing register-based samples even in the context of a geopolitical crisis and the necessity of sound data within brief time horizons. We provide guidance that can be followed for similar events in the future.</p></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"18 1","pages":"77 - 97"},"PeriodicalIF":0.0,"publicationDate":"2024-03-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-024-00338-0.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"142409775","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Can machine learning algorithms deliver superior models for rental guides? 机器学习算法能否为租赁指南提供卓越的模型?
Pub Date : 2023-12-12 DOI: 10.1007/s11943-023-00333-x
Oliver Trinkaus, Göran Kauermann

In this paper we discuss the use and potential advantages and disadvantages of machine learning driven models in rental guides. Rental guides are a formal legal instrument in Germany for surveying rents of flats in cities and municipalities, which are today based on regression models or simple contingency tables. We discuss if and how modern and timely methods of machine learning outperform existing and established routines. We make use of data from the Munich rental guide and mainly focus on the predictive power of these models. We discuss the “black-box” character making some of these models difficult to interpret and hence challenging for applications in the rental guide context. Still, it is of interest to see how “black-box” models perform with respect to prediction error. Moreover, we study adversarial effects, i.e. we investigate robustness in the sense how corrupted data influence the performance of the prediction models. With the data at hand we show that models with promising predictive performance suffer from being more vulnerable to corruptions than classic linear models including Ridge or Lasso regularization.

本文将讨论机器学习驱动模型在租金指南中的应用和潜在优缺点。租金指南是德国调查城市和市政单位租金的正式法律文书,目前基于回归模型或简单的或然率表。我们将讨论现代和及时的机器学习方法是否以及如何优于现有的常规方法。我们利用慕尼黑租金指南中的数据,主要关注这些模型的预测能力。我们讨论了 "黑箱 "特性,这种特性使得其中一些模型难以解释,因此在租赁指南中的应用具有挑战性。不过,我们还是有兴趣了解 "黑箱 "模型在预测误差方面的表现。此外,我们还研究了对抗效应,即从损坏数据如何影响预测模型性能的角度来研究鲁棒性。我们利用手头的数据表明,与包括 Ridge 或 Lasso 正则化在内的经典线性模型相比,具有良好预测性能的模型更容易受到干扰的影响。
{"title":"Can machine learning algorithms deliver superior models for rental guides?","authors":"Oliver Trinkaus,&nbsp;Göran Kauermann","doi":"10.1007/s11943-023-00333-x","DOIUrl":"10.1007/s11943-023-00333-x","url":null,"abstract":"<div><p>In this paper we discuss the use and potential advantages and disadvantages of machine learning driven models in rental guides. Rental guides are a formal legal instrument in Germany for surveying rents of flats in cities and municipalities, which are today based on regression models or simple contingency tables. We discuss if and how modern and timely methods of machine learning outperform existing and established routines. We make use of data from the Munich rental guide and mainly focus on the predictive power of these models. We discuss the “black-box” character making some of these models difficult to interpret and hence challenging for applications in the rental guide context. Still, it is of interest to see how “black-box” models perform with respect to prediction error. Moreover, we study adversarial effects, i.e. we investigate robustness in the sense how corrupted data influence the performance of the prediction models. With the data at hand we show that models with promising predictive performance suffer from being more vulnerable to corruptions than classic linear models including Ridge or Lasso regularization.</p></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 3-4","pages":"305 - 330"},"PeriodicalIF":0.0,"publicationDate":"2023-12-12","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00333-x.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"138987242","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Editorial issue 3 + 4, 2023 2023 年第 3 期和第 4 期社论
Pub Date : 2023-12-07 DOI: 10.1007/s11943-023-00334-w
Florian Dumpert, Sebastian Wichert, Thomas Augustin, Nina Storfinger
{"title":"Editorial issue 3 + 4, 2023","authors":"Florian Dumpert,&nbsp;Sebastian Wichert,&nbsp;Thomas Augustin,&nbsp;Nina Storfinger","doi":"10.1007/s11943-023-00334-w","DOIUrl":"10.1007/s11943-023-00334-w","url":null,"abstract":"","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 3-4","pages":"191 - 194"},"PeriodicalIF":0.0,"publicationDate":"2023-12-07","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00334-w.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"138591428","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Ten propositions on machine learning in official statistics 关于官方统计中机器学习的十项主张
Pub Date : 2023-12-07 DOI: 10.1007/s11943-023-00330-0
Arnout van Delden, Joep Burger, Marco Puts

Machine learning (ML) is increasingly being used in official statistics with a range of different applications. The main focus of ML models is to accurately predict attributes of new, unlabeled cases whereas the focus of classical statistical models is to describe the relations between independent and dependent variables. There is already a lot of experience in the sound use of classical statistical models in official statistics, but for ML models this is still under development. Recent discussions concerning the quality aspects of using ML in official statistics have concentrated on its implications for existing quality frameworks. We are in favor of the use of ML in official statistics, but the main question remains as to what factors need to be considered when using ML models in official statistics. As a means of raising awareness regarding these factors, we pose ten propositions regarding the (sensible) use of ML in official statistics.

机器学习(ML)正越来越多地应用于官方统计中的一系列不同领域。ML 模型的主要重点是准确预测未标记的新案例的属性,而经典统计模型的重点是描述自变量和因变量之间的关系。在官方统计中合理使用经典统计模型方面已经有了很多经验,但对于 ML 模型来说,这仍处于发展阶段。最近有关在官方统计中使用 ML 的质量问题的讨论主要集中在其对现有质量框架的影响上。我们赞成在官方统计中使用 ML,但主要问题仍然是在官方统计中使用 ML 模型时需要考虑哪些因素。为了提高对这些因素的认识,我们提出了关于在官方统计中(合理)使用 ML 的十项主张。
{"title":"Ten propositions on machine learning in official statistics","authors":"Arnout van Delden,&nbsp;Joep Burger,&nbsp;Marco Puts","doi":"10.1007/s11943-023-00330-0","DOIUrl":"10.1007/s11943-023-00330-0","url":null,"abstract":"<div><p>Machine learning (ML) is increasingly being used in official statistics with a range of different applications. The main focus of ML models is to accurately predict attributes of new, unlabeled cases whereas the focus of classical statistical models is to describe the relations between independent and dependent variables. There is already a lot of experience in the sound use of classical statistical models in official statistics, but for ML models this is still under development. Recent discussions concerning the quality aspects of using ML in official statistics have concentrated on its implications for existing quality frameworks. We are in favor of the use of ML in official statistics, but the main question remains as to what factors need to be considered when using ML models in official statistics. As a means of raising awareness regarding these factors, we pose ten propositions regarding the (sensible) use of ML in official statistics.</p></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 3-4","pages":"195 - 221"},"PeriodicalIF":0.0,"publicationDate":"2023-12-07","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"138590780","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Exploring quality dimensions in trustworthy Machine Learning in the context of official statistics: model explainability and uncertainty quantification 在官方统计背景下探索可信机器学习的质量维度:模型的可解释性和不确定性量化
Pub Date : 2023-11-29 DOI: 10.1007/s11943-023-00331-z
Saeid Molladavoudi, Wesley Yung

Despite the fact that National Statistical Offices (NSOs) continue to embrace and adopt Machine Learning (ML) methods and tools in a variety of areas of their operations, including data collection, integration, and processing, it is still not clear how these complex and prediction-oriented approaches can be incorporated into the quality standards and frameworks within NSOs or if the frameworks themselves need to be modified. This article focuses on and builds upon two of the quality dimensions proposed in the Quality Framework for Statistical Algorithms (QF4SA): model explainability and accuracy (including uncertainty). The implications of the current methods for explainable ML and uncertainty quantification will be examined in further detail, as well as their possible uses in statistical production, such as continuous model monitoring in intermediate ML classifications and auto-coding phases. This strategy will ensure that human subject-matter experts, who are an essential component of every statistical program, are effectively integrated into the life cycle of ML projects. It will also guarantee to maintain the quality of ML models in production, adhere to the current quality frameworks within NSOs, and ultimately boost confidence and trust in these emerging technologies.

尽管各国国家统计局(NSO)在数据收集、整合和处理等多个业务领域不断接受并采用机器学习(ML)方法和工具,但目前仍不清楚如何将这些复杂且以预测为导向的方法纳入国家统计局的质量标准和框架,或者是否需要对框架本身进行修改。本文重点关注并借鉴了统计算法质量框架(QF4SA)中提出的两个质量维度:模型的可解释性和准确性(包括不确定性)。本文将进一步详细分析当前可解释 ML 和不确定性量化方法的影响,以及这些方法在统计生产中的可能用途,例如在中间 ML 分类和自动编码阶段对模型进行持续监控。这一战略将确保作为每个统计程序重要组成部分的人类主题专家有效融入 ML 项目的生命周期。它还将保证在生产过程中保持 ML 模型的质量,遵守国家统计局当前的质量框架,并最终增强人们对这些新兴技术的信心和信任。
{"title":"Exploring quality dimensions in trustworthy Machine Learning in the context of official statistics: model explainability and uncertainty quantification","authors":"Saeid Molladavoudi,&nbsp;Wesley Yung","doi":"10.1007/s11943-023-00331-z","DOIUrl":"10.1007/s11943-023-00331-z","url":null,"abstract":"<div><p>Despite the fact that National Statistical Offices (NSOs) continue to embrace and adopt Machine Learning (ML) methods and tools in a variety of areas of their operations, including data collection, integration, and processing, it is still not clear how these complex and prediction-oriented approaches can be incorporated into the quality standards and frameworks within NSOs or if the frameworks themselves need to be modified. This article focuses on and builds upon two of the quality dimensions proposed in the Quality Framework for Statistical Algorithms (QF4SA): model explainability and accuracy (including uncertainty). The implications of the current methods for explainable ML and uncertainty quantification will be examined in further detail, as well as their possible uses in statistical production, such as continuous model monitoring in intermediate ML classifications and auto-coding phases. This strategy will ensure that human subject-matter experts, who are an essential component of every statistical program, are effectively integrated into the life cycle of ML projects. It will also guarantee to maintain the quality of ML models in production, adhere to the current quality frameworks within NSOs, and ultimately boost confidence and trust in these emerging technologies.</p></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 3-4","pages":"223 - 252"},"PeriodicalIF":0.0,"publicationDate":"2023-11-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"139211742","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Quality aspects of annotated data 注释数据的质量问题
Pub Date : 2023-11-27 DOI: 10.1007/s11943-023-00332-y
Jacob Beck

The quality of Machine Learning (ML) applications is commonly assessed by quantifying how well an algorithm fits its respective training data. Yet, a perfect model that learns from and reproduces erroneous data will always be flawed in its real-world application. Hence, a comprehensive assessment of ML quality must include an additional data perspective, especially for models trained on human-annotated data. For the collection of human-annotated training data, best practices often do not exist and leave researchers to make arbitrary decisions when collecting annotations. Decisions about the selection of annotators or label options may affect training data quality and model performance.

In this paper, I will outline and summarize previous research and approaches to the collection of annotated training data. I look at data annotation and its quality confounders from two perspectives: the set of annotators and the strategy of data collection. The paper will highlight the various implementations of text and image annotation collection and stress the importance of careful task construction. I conclude by illustrating the consequences for future research and applications of data annotation. The paper is intended give readers a starting point on annotated data quality research and stress the necessity of thoughtful consideration of the annotation collection process to researchers and practitioners.

机器学习(ML)应用的质量通常是通过量化算法与各自训练数据的匹配程度来评估的。然而,从错误数据中学习并再现错误数据的完美模型在实际应用中总是存在缺陷。因此,对人工智能质量的全面评估必须包括额外的数据视角,特别是对于根据人类标注数据训练的模型。在收集人工标注的训练数据方面,通常不存在最佳实践,研究人员在收集标注时只能随意做出决定。在本文中,我将概述和总结以往收集注释训练数据的研究和方法。我将从两个角度来探讨数据注释及其质量问题:注释者的集合和数据收集策略。本文将重点介绍文本和图像注释收集的各种实现方法,并强调仔细构建任务的重要性。最后,我将说明数据标注对未来研究和应用的影响。本文旨在为读者提供一个注释数据质量研究的起点,并强调研究人员和从业人员在注释收集过程中深思熟虑的必要性。
{"title":"Quality aspects of annotated data","authors":"Jacob Beck","doi":"10.1007/s11943-023-00332-y","DOIUrl":"10.1007/s11943-023-00332-y","url":null,"abstract":"<div><p>The quality of Machine Learning (ML) applications is commonly assessed by quantifying how well an algorithm fits its respective training data. Yet, a perfect model that learns from and reproduces erroneous data will always be flawed in its real-world application. Hence, a comprehensive assessment of ML quality must include an additional data perspective, especially for models trained on human-annotated data. For the collection of human-annotated training data, best practices often do not exist and leave researchers to make arbitrary decisions when collecting annotations. Decisions about the selection of annotators or label options may affect training data quality and model performance.</p><p>In this paper, I will outline and summarize previous research and approaches to the collection of annotated training data. I look at data annotation and its quality confounders from two perspectives: the set of <i>annotators</i> and the <i>strategy</i> of data collection. The paper will highlight the various implementations of text and image annotation collection and stress the importance of careful task construction. I conclude by illustrating the consequences for future research and applications of data annotation. The paper is intended give readers a starting point on annotated data quality research and stress the necessity of thoughtful consideration of the annotation collection process to researchers and practitioners.</p></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 3-4","pages":"331 - 353"},"PeriodicalIF":0.0,"publicationDate":"2023-11-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00332-y.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"139230573","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Qualitätsdimensionen maschinellen Lernens in der amtlichen Statistik 官方统计中机器学习的质量维度
Pub Date : 2023-11-17 DOI: 10.1007/s11943-023-00329-7
Younes Saidani, Florian Dumpert, Christian Borgs, Alexander Brand, Andreas Nickl, Alexandra Rittmann, Johannes Rohde, Christian Salwiczek, Nina Storfinger, Selina Straub

Die amtliche Statistik zeichnet sich durch ihren gesetzlich auferlegten Fokus auf die Qualität ihrer Veröffentlichungen aus. Dabei folgt sie den europäischen Qualitätsrahmenwerken, die auf nationaler Ebene in Form von Qualitätshandbüchern konkretisiert und operationalisiert werden, sich jedoch bis dato hinsichtlich Ausgestaltung und Interpretation an den Anforderungen der „klassischen“ Statistikproduktion orientieren. Der zunehmende Einsatz maschineller Lernverfahren (ML) in der amtlichen Statistik muss daher zur Erfüllung des Qualitätsanspruchs durch ein spezifisches, darauf zugeschnittenes Qualitätsrahmenwerk begleitet werden. Das vorliegende Papier leistet einen Beitrag zur Erarbeitung eines solchen Qualitätsrahmenwerks für den Einsatz von ML in der amtlichen Statistik, indem es (1) durch den Vergleich mit bestehenden Qualitätsgrundsätzen des Verhaltenskodex für Europäische Statistiken relevante Qualitätsdimensionen für ML identifiziert und (2) diese unter Berücksichtigung der besonderen methodischen Gegebenheiten von ML ausarbeitet. Dabei (2a) ergänzt es bestehende Vorschläge durch den Aspekt der Robustheit, (2b) stellt Bezug zu den Querschnittsthemen Machine Learning Operations (MLOps) und Fairness her und (2c) schlägt vor, wie die Qualitätssicherung der einzelnen Dimensionen in der Praxis der amtlichen Statistik ausgestaltet werden kann. Diese Arbeit liefert die konzeptionelle Grundlage, um Qualitätsindikatoren für ML-Verfahren formell in die Instrumente des Qualitätsmanagements im Statistischen Verbund zu überführen und damit langfristig den hohen Qualitätsstandard amtlicher Statistik auch bei Nutzung neuer Verfahren zu sichern.

官方统计数据的特点是依法注重其出版物的质量。在此过程中,官方统计遵循欧洲质量框架,该框架以质量手册的形式在国家层面具体化和可操作化,但迄今为止一直以 "传统 "统计编制在设计和解释方面的要求为导向。因此,在官方统计中越来越多地使用机器学习方法 (ML) 的同时,还必须有一个具体的、定制的质量框架,以满足质量要求。本文有助于为官方统计中使用机器学习方法制定这样一个质量框架:(1) 通过与《欧洲统计业务守则》的现有质量原则进行比较,确定机器学习方法的相关质量维度;(2) 考虑到机器学习方法的具体方法特征,对这些维度进行详细阐述。它(2a) 从稳健性方面补充了现有建议,(2b) 建立了与机器学习操作 (MLOps) 和公平性等交叉问题的联系,(2c) 提出了如何在官方统计实践中组织各个维度的质量保证。这项工作为将机器学习程序的质量指标正式纳入统计网络的质量管理工具提供了概念基础,从而确保官方统计的长期高质量标准,即使在使用新程序时也是如此。
{"title":"Qualitätsdimensionen maschinellen Lernens in der amtlichen Statistik","authors":"Younes Saidani,&nbsp;Florian Dumpert,&nbsp;Christian Borgs,&nbsp;Alexander Brand,&nbsp;Andreas Nickl,&nbsp;Alexandra Rittmann,&nbsp;Johannes Rohde,&nbsp;Christian Salwiczek,&nbsp;Nina Storfinger,&nbsp;Selina Straub","doi":"10.1007/s11943-023-00329-7","DOIUrl":"10.1007/s11943-023-00329-7","url":null,"abstract":"<p>Die amtliche Statistik zeichnet sich durch ihren gesetzlich auferlegten Fokus auf die Qualität ihrer Veröffentlichungen aus. Dabei folgt sie den europäischen Qualitätsrahmenwerken, die auf nationaler Ebene in Form von Qualitätshandbüchern konkretisiert und operationalisiert werden, sich jedoch bis dato hinsichtlich Ausgestaltung und Interpretation an den Anforderungen der „klassischen“ Statistikproduktion orientieren. Der zunehmende Einsatz maschineller Lernverfahren (ML) in der amtlichen Statistik muss daher zur Erfüllung des Qualitätsanspruchs durch ein spezifisches, darauf zugeschnittenes Qualitätsrahmenwerk begleitet werden. Das vorliegende Papier leistet einen Beitrag zur Erarbeitung eines solchen Qualitätsrahmenwerks für den Einsatz von ML in der amtlichen Statistik, indem es (1) durch den Vergleich mit bestehenden Qualitätsgrundsätzen des Verhaltenskodex für Europäische Statistiken relevante Qualitätsdimensionen für ML identifiziert und (2) diese unter Berücksichtigung der besonderen methodischen Gegebenheiten von ML ausarbeitet. Dabei (2a) ergänzt es bestehende Vorschläge durch den Aspekt der Robustheit, (2b) stellt Bezug zu den Querschnittsthemen Machine Learning Operations (MLOps) und Fairness her und (2c) schlägt vor, wie die Qualitätssicherung der einzelnen Dimensionen in der Praxis der amtlichen Statistik ausgestaltet werden kann. Diese Arbeit liefert die konzeptionelle Grundlage, um Qualitätsindikatoren für ML-Verfahren formell in die Instrumente des Qualitätsmanagements im Statistischen Verbund zu überführen und damit langfristig den hohen Qualitätsstandard amtlicher Statistik auch bei Nutzung neuer Verfahren zu sichern.</p>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 3-4","pages":"253 - 303"},"PeriodicalIF":0.0,"publicationDate":"2023-11-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00329-7.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"139266451","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Innovation for improving climate-related data—Lessons learned from setting up a data hub 改进气候相关数据的创新--从建立数据中心汲取的经验教训
Pub Date : 2023-10-26 DOI: 10.1007/s11943-023-00326-w
Hendrik Christian Doll, Gabriela Alves Werb

In this article, we present a framework to assess the challenges in the climate-related data landscape. From our perspective, we describe challenges and opportunities for innovation to close existing gaps in selected data quality dimensions for central banks and statistical offices. We further examine the role of networks in promoting innovation and international collaboration, highlighting practical experiences with a case study of the Sustainable Finance Data Hub at the Deutsche Bundesbank. Finally, we discuss how these lessons can provide avenues to enhance data quality in central banks and official statistics and outline directions for future research.

在本文中,我们提出了一个评估气候相关数据领域挑战的框架。从我们的视角出发,我们描述了为缩小中央银行和统计局在选定数据质量方面的现有差距而进行创新所面临的挑战和机遇。我们进一步研究了网络在促进创新和国际合作方面的作用,并通过德意志联邦银行可持续金融数据中心的案例研究强调了实践经验。最后,我们讨论了这些经验教训如何为提高中央银行和官方统计的数据质量提供途径,并概述了未来的研究方向。
{"title":"Innovation for improving climate-related data—Lessons learned from setting up a data hub","authors":"Hendrik Christian Doll,&nbsp;Gabriela Alves Werb","doi":"10.1007/s11943-023-00326-w","DOIUrl":"10.1007/s11943-023-00326-w","url":null,"abstract":"<div><p>In this article, we present a framework to assess the challenges in the climate-related data landscape. From our perspective, we describe challenges and opportunities for innovation to close existing gaps in selected data quality dimensions for central banks and statistical offices. We further examine the role of networks in promoting innovation and international collaboration, highlighting practical experiences with a case study of the Sustainable Finance Data Hub at the Deutsche Bundesbank. Finally, we discuss how these lessons can provide avenues to enhance data quality in central banks and official statistics and outline directions for future research.</p></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 3-4","pages":"355 - 380"},"PeriodicalIF":0.0,"publicationDate":"2023-10-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00326-w.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"134908277","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
期刊
AStA Wirtschafts- und Sozialstatistisches Archiv
全部 Acc. Chem. Res. ACS Applied Bio Materials ACS Appl. Electron. Mater. ACS Appl. Energy Mater. ACS Appl. Mater. Interfaces ACS Appl. Nano Mater. ACS Appl. Polym. Mater. ACS BIOMATER-SCI ENG ACS Catal. ACS Cent. Sci. ACS Chem. Biol. ACS Chemical Health & Safety ACS Chem. Neurosci. ACS Comb. Sci. ACS Earth Space Chem. ACS Energy Lett. ACS Infect. Dis. ACS Macro Lett. ACS Mater. Lett. ACS Med. Chem. Lett. ACS Nano ACS Omega ACS Photonics ACS Sens. ACS Sustainable Chem. Eng. ACS Synth. Biol. Anal. Chem. BIOCHEMISTRY-US Bioconjugate Chem. BIOMACROMOLECULES Chem. Res. Toxicol. Chem. Rev. Chem. Mater. CRYST GROWTH DES ENERG FUEL Environ. Sci. Technol. Environ. Sci. Technol. Lett. Eur. J. Inorg. Chem. IND ENG CHEM RES Inorg. Chem. J. Agric. Food. Chem. J. Chem. Eng. Data J. Chem. Educ. J. Chem. Inf. Model. J. Chem. Theory Comput. J. Med. Chem. J. Nat. Prod. J PROTEOME RES J. Am. Chem. Soc. LANGMUIR MACROMOLECULES Mol. Pharmaceutics Nano Lett. Org. Lett. ORG PROCESS RES DEV ORGANOMETALLICS J. Org. Chem. J. Phys. Chem. J. Phys. Chem. A J. Phys. Chem. B J. Phys. Chem. C J. Phys. Chem. Lett. Analyst Anal. Methods Biomater. Sci. Catal. Sci. Technol. Chem. Commun. Chem. Soc. Rev. CHEM EDUC RES PRACT CRYSTENGCOMM Dalton Trans. Energy Environ. Sci. ENVIRON SCI-NANO ENVIRON SCI-PROC IMP ENVIRON SCI-WAT RES Faraday Discuss. Food Funct. Green Chem. Inorg. Chem. Front. Integr. Biol. J. Anal. At. Spectrom. J. Mater. Chem. A J. Mater. Chem. B J. Mater. Chem. C Lab Chip Mater. Chem. Front. Mater. Horiz. MEDCHEMCOMM Metallomics Mol. Biosyst. Mol. Syst. Des. Eng. Nanoscale Nanoscale Horiz. Nat. Prod. Rep. New J. Chem. Org. Biomol. Chem. Org. Chem. Front. PHOTOCH PHOTOBIO SCI PCCP Polym. Chem.
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1