首页 > 最新文献

AStA Wirtschafts- und Sozialstatistisches Archiv最新文献

英文 中文
Exploring quality dimensions in trustworthy Machine Learning in the context of official statistics: model explainability and uncertainty quantification 在官方统计背景下探索可信机器学习的质量维度:模型的可解释性和不确定性量化
Pub Date : 2023-11-29 DOI: 10.1007/s11943-023-00331-z
Saeid Molladavoudi, Wesley Yung

Despite the fact that National Statistical Offices (NSOs) continue to embrace and adopt Machine Learning (ML) methods and tools in a variety of areas of their operations, including data collection, integration, and processing, it is still not clear how these complex and prediction-oriented approaches can be incorporated into the quality standards and frameworks within NSOs or if the frameworks themselves need to be modified. This article focuses on and builds upon two of the quality dimensions proposed in the Quality Framework for Statistical Algorithms (QF4SA): model explainability and accuracy (including uncertainty). The implications of the current methods for explainable ML and uncertainty quantification will be examined in further detail, as well as their possible uses in statistical production, such as continuous model monitoring in intermediate ML classifications and auto-coding phases. This strategy will ensure that human subject-matter experts, who are an essential component of every statistical program, are effectively integrated into the life cycle of ML projects. It will also guarantee to maintain the quality of ML models in production, adhere to the current quality frameworks within NSOs, and ultimately boost confidence and trust in these emerging technologies.

尽管各国国家统计局(NSO)在数据收集、整合和处理等多个业务领域不断接受并采用机器学习(ML)方法和工具,但目前仍不清楚如何将这些复杂且以预测为导向的方法纳入国家统计局的质量标准和框架,或者是否需要对框架本身进行修改。本文重点关注并借鉴了统计算法质量框架(QF4SA)中提出的两个质量维度:模型的可解释性和准确性(包括不确定性)。本文将进一步详细分析当前可解释 ML 和不确定性量化方法的影响,以及这些方法在统计生产中的可能用途,例如在中间 ML 分类和自动编码阶段对模型进行持续监控。这一战略将确保作为每个统计程序重要组成部分的人类主题专家有效融入 ML 项目的生命周期。它还将保证在生产过程中保持 ML 模型的质量,遵守国家统计局当前的质量框架,并最终增强人们对这些新兴技术的信心和信任。
{"title":"Exploring quality dimensions in trustworthy Machine Learning in the context of official statistics: model explainability and uncertainty quantification","authors":"Saeid Molladavoudi,&nbsp;Wesley Yung","doi":"10.1007/s11943-023-00331-z","DOIUrl":"10.1007/s11943-023-00331-z","url":null,"abstract":"<div><p>Despite the fact that National Statistical Offices (NSOs) continue to embrace and adopt Machine Learning (ML) methods and tools in a variety of areas of their operations, including data collection, integration, and processing, it is still not clear how these complex and prediction-oriented approaches can be incorporated into the quality standards and frameworks within NSOs or if the frameworks themselves need to be modified. This article focuses on and builds upon two of the quality dimensions proposed in the Quality Framework for Statistical Algorithms (QF4SA): model explainability and accuracy (including uncertainty). The implications of the current methods for explainable ML and uncertainty quantification will be examined in further detail, as well as their possible uses in statistical production, such as continuous model monitoring in intermediate ML classifications and auto-coding phases. This strategy will ensure that human subject-matter experts, who are an essential component of every statistical program, are effectively integrated into the life cycle of ML projects. It will also guarantee to maintain the quality of ML models in production, adhere to the current quality frameworks within NSOs, and ultimately boost confidence and trust in these emerging technologies.</p></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 3-4","pages":"223 - 252"},"PeriodicalIF":0.0,"publicationDate":"2023-11-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"139211742","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Quality aspects of annotated data 注释数据的质量问题
Pub Date : 2023-11-27 DOI: 10.1007/s11943-023-00332-y
Jacob Beck

The quality of Machine Learning (ML) applications is commonly assessed by quantifying how well an algorithm fits its respective training data. Yet, a perfect model that learns from and reproduces erroneous data will always be flawed in its real-world application. Hence, a comprehensive assessment of ML quality must include an additional data perspective, especially for models trained on human-annotated data. For the collection of human-annotated training data, best practices often do not exist and leave researchers to make arbitrary decisions when collecting annotations. Decisions about the selection of annotators or label options may affect training data quality and model performance.

In this paper, I will outline and summarize previous research and approaches to the collection of annotated training data. I look at data annotation and its quality confounders from two perspectives: the set of annotators and the strategy of data collection. The paper will highlight the various implementations of text and image annotation collection and stress the importance of careful task construction. I conclude by illustrating the consequences for future research and applications of data annotation. The paper is intended give readers a starting point on annotated data quality research and stress the necessity of thoughtful consideration of the annotation collection process to researchers and practitioners.

机器学习(ML)应用的质量通常是通过量化算法与各自训练数据的匹配程度来评估的。然而,从错误数据中学习并再现错误数据的完美模型在实际应用中总是存在缺陷。因此,对人工智能质量的全面评估必须包括额外的数据视角,特别是对于根据人类标注数据训练的模型。在收集人工标注的训练数据方面,通常不存在最佳实践,研究人员在收集标注时只能随意做出决定。在本文中,我将概述和总结以往收集注释训练数据的研究和方法。我将从两个角度来探讨数据注释及其质量问题:注释者的集合和数据收集策略。本文将重点介绍文本和图像注释收集的各种实现方法,并强调仔细构建任务的重要性。最后,我将说明数据标注对未来研究和应用的影响。本文旨在为读者提供一个注释数据质量研究的起点,并强调研究人员和从业人员在注释收集过程中深思熟虑的必要性。
{"title":"Quality aspects of annotated data","authors":"Jacob Beck","doi":"10.1007/s11943-023-00332-y","DOIUrl":"10.1007/s11943-023-00332-y","url":null,"abstract":"<div><p>The quality of Machine Learning (ML) applications is commonly assessed by quantifying how well an algorithm fits its respective training data. Yet, a perfect model that learns from and reproduces erroneous data will always be flawed in its real-world application. Hence, a comprehensive assessment of ML quality must include an additional data perspective, especially for models trained on human-annotated data. For the collection of human-annotated training data, best practices often do not exist and leave researchers to make arbitrary decisions when collecting annotations. Decisions about the selection of annotators or label options may affect training data quality and model performance.</p><p>In this paper, I will outline and summarize previous research and approaches to the collection of annotated training data. I look at data annotation and its quality confounders from two perspectives: the set of <i>annotators</i> and the <i>strategy</i> of data collection. The paper will highlight the various implementations of text and image annotation collection and stress the importance of careful task construction. I conclude by illustrating the consequences for future research and applications of data annotation. The paper is intended give readers a starting point on annotated data quality research and stress the necessity of thoughtful consideration of the annotation collection process to researchers and practitioners.</p></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 3-4","pages":"331 - 353"},"PeriodicalIF":0.0,"publicationDate":"2023-11-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00332-y.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"139230573","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Qualitätsdimensionen maschinellen Lernens in der amtlichen Statistik 官方统计中机器学习的质量维度
Pub Date : 2023-11-17 DOI: 10.1007/s11943-023-00329-7
Younes Saidani, Florian Dumpert, Christian Borgs, Alexander Brand, Andreas Nickl, Alexandra Rittmann, Johannes Rohde, Christian Salwiczek, Nina Storfinger, Selina Straub

Die amtliche Statistik zeichnet sich durch ihren gesetzlich auferlegten Fokus auf die Qualität ihrer Veröffentlichungen aus. Dabei folgt sie den europäischen Qualitätsrahmenwerken, die auf nationaler Ebene in Form von Qualitätshandbüchern konkretisiert und operationalisiert werden, sich jedoch bis dato hinsichtlich Ausgestaltung und Interpretation an den Anforderungen der „klassischen“ Statistikproduktion orientieren. Der zunehmende Einsatz maschineller Lernverfahren (ML) in der amtlichen Statistik muss daher zur Erfüllung des Qualitätsanspruchs durch ein spezifisches, darauf zugeschnittenes Qualitätsrahmenwerk begleitet werden. Das vorliegende Papier leistet einen Beitrag zur Erarbeitung eines solchen Qualitätsrahmenwerks für den Einsatz von ML in der amtlichen Statistik, indem es (1) durch den Vergleich mit bestehenden Qualitätsgrundsätzen des Verhaltenskodex für Europäische Statistiken relevante Qualitätsdimensionen für ML identifiziert und (2) diese unter Berücksichtigung der besonderen methodischen Gegebenheiten von ML ausarbeitet. Dabei (2a) ergänzt es bestehende Vorschläge durch den Aspekt der Robustheit, (2b) stellt Bezug zu den Querschnittsthemen Machine Learning Operations (MLOps) und Fairness her und (2c) schlägt vor, wie die Qualitätssicherung der einzelnen Dimensionen in der Praxis der amtlichen Statistik ausgestaltet werden kann. Diese Arbeit liefert die konzeptionelle Grundlage, um Qualitätsindikatoren für ML-Verfahren formell in die Instrumente des Qualitätsmanagements im Statistischen Verbund zu überführen und damit langfristig den hohen Qualitätsstandard amtlicher Statistik auch bei Nutzung neuer Verfahren zu sichern.

官方统计数据的特点是依法注重其出版物的质量。在此过程中,官方统计遵循欧洲质量框架,该框架以质量手册的形式在国家层面具体化和可操作化,但迄今为止一直以 "传统 "统计编制在设计和解释方面的要求为导向。因此,在官方统计中越来越多地使用机器学习方法 (ML) 的同时,还必须有一个具体的、定制的质量框架,以满足质量要求。本文有助于为官方统计中使用机器学习方法制定这样一个质量框架:(1) 通过与《欧洲统计业务守则》的现有质量原则进行比较,确定机器学习方法的相关质量维度;(2) 考虑到机器学习方法的具体方法特征,对这些维度进行详细阐述。它(2a) 从稳健性方面补充了现有建议,(2b) 建立了与机器学习操作 (MLOps) 和公平性等交叉问题的联系,(2c) 提出了如何在官方统计实践中组织各个维度的质量保证。这项工作为将机器学习程序的质量指标正式纳入统计网络的质量管理工具提供了概念基础,从而确保官方统计的长期高质量标准,即使在使用新程序时也是如此。
{"title":"Qualitätsdimensionen maschinellen Lernens in der amtlichen Statistik","authors":"Younes Saidani,&nbsp;Florian Dumpert,&nbsp;Christian Borgs,&nbsp;Alexander Brand,&nbsp;Andreas Nickl,&nbsp;Alexandra Rittmann,&nbsp;Johannes Rohde,&nbsp;Christian Salwiczek,&nbsp;Nina Storfinger,&nbsp;Selina Straub","doi":"10.1007/s11943-023-00329-7","DOIUrl":"10.1007/s11943-023-00329-7","url":null,"abstract":"<p>Die amtliche Statistik zeichnet sich durch ihren gesetzlich auferlegten Fokus auf die Qualität ihrer Veröffentlichungen aus. Dabei folgt sie den europäischen Qualitätsrahmenwerken, die auf nationaler Ebene in Form von Qualitätshandbüchern konkretisiert und operationalisiert werden, sich jedoch bis dato hinsichtlich Ausgestaltung und Interpretation an den Anforderungen der „klassischen“ Statistikproduktion orientieren. Der zunehmende Einsatz maschineller Lernverfahren (ML) in der amtlichen Statistik muss daher zur Erfüllung des Qualitätsanspruchs durch ein spezifisches, darauf zugeschnittenes Qualitätsrahmenwerk begleitet werden. Das vorliegende Papier leistet einen Beitrag zur Erarbeitung eines solchen Qualitätsrahmenwerks für den Einsatz von ML in der amtlichen Statistik, indem es (1) durch den Vergleich mit bestehenden Qualitätsgrundsätzen des Verhaltenskodex für Europäische Statistiken relevante Qualitätsdimensionen für ML identifiziert und (2) diese unter Berücksichtigung der besonderen methodischen Gegebenheiten von ML ausarbeitet. Dabei (2a) ergänzt es bestehende Vorschläge durch den Aspekt der Robustheit, (2b) stellt Bezug zu den Querschnittsthemen Machine Learning Operations (MLOps) und Fairness her und (2c) schlägt vor, wie die Qualitätssicherung der einzelnen Dimensionen in der Praxis der amtlichen Statistik ausgestaltet werden kann. Diese Arbeit liefert die konzeptionelle Grundlage, um Qualitätsindikatoren für ML-Verfahren formell in die Instrumente des Qualitätsmanagements im Statistischen Verbund zu überführen und damit langfristig den hohen Qualitätsstandard amtlicher Statistik auch bei Nutzung neuer Verfahren zu sichern.</p>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 3-4","pages":"253 - 303"},"PeriodicalIF":0.0,"publicationDate":"2023-11-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00329-7.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"139266451","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Innovation for improving climate-related data—Lessons learned from setting up a data hub 改进气候相关数据的创新--从建立数据中心汲取的经验教训
Pub Date : 2023-10-26 DOI: 10.1007/s11943-023-00326-w
Hendrik Christian Doll, Gabriela Alves Werb

In this article, we present a framework to assess the challenges in the climate-related data landscape. From our perspective, we describe challenges and opportunities for innovation to close existing gaps in selected data quality dimensions for central banks and statistical offices. We further examine the role of networks in promoting innovation and international collaboration, highlighting practical experiences with a case study of the Sustainable Finance Data Hub at the Deutsche Bundesbank. Finally, we discuss how these lessons can provide avenues to enhance data quality in central banks and official statistics and outline directions for future research.

在本文中,我们提出了一个评估气候相关数据领域挑战的框架。从我们的视角出发,我们描述了为缩小中央银行和统计局在选定数据质量方面的现有差距而进行创新所面临的挑战和机遇。我们进一步研究了网络在促进创新和国际合作方面的作用,并通过德意志联邦银行可持续金融数据中心的案例研究强调了实践经验。最后,我们讨论了这些经验教训如何为提高中央银行和官方统计的数据质量提供途径,并概述了未来的研究方向。
{"title":"Innovation for improving climate-related data—Lessons learned from setting up a data hub","authors":"Hendrik Christian Doll,&nbsp;Gabriela Alves Werb","doi":"10.1007/s11943-023-00326-w","DOIUrl":"10.1007/s11943-023-00326-w","url":null,"abstract":"<div><p>In this article, we present a framework to assess the challenges in the climate-related data landscape. From our perspective, we describe challenges and opportunities for innovation to close existing gaps in selected data quality dimensions for central banks and statistical offices. We further examine the role of networks in promoting innovation and international collaboration, highlighting practical experiences with a case study of the Sustainable Finance Data Hub at the Deutsche Bundesbank. Finally, we discuss how these lessons can provide avenues to enhance data quality in central banks and official statistics and outline directions for future research.</p></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 3-4","pages":"355 - 380"},"PeriodicalIF":0.0,"publicationDate":"2023-10-26","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00326-w.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"134908277","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Interview mit der Präsidentin des Statistischen Bundesamtes Dr. Ruth Brand 美国联邦统计局主席鲁思·布兰德博士访谈录
Pub Date : 2023-09-19 DOI: 10.1007/s11943-023-00327-9
Ulrich Rendtel

Zusammenfassung

Dieser Artikel enthält ein Interview mit der neuen Präsidentin des Statistischen Bundesamtes Dr. Ruth Brand.

摘要本文采访了美国联邦统计局新任主席鲁思·布兰德博士。
{"title":"Interview mit der Präsidentin des Statistischen Bundesamtes Dr. Ruth Brand","authors":"Ulrich Rendtel","doi":"10.1007/s11943-023-00327-9","DOIUrl":"10.1007/s11943-023-00327-9","url":null,"abstract":"<div><h2>Zusammenfassung</h2><div><p>Dieser Artikel enthält ein Interview mit der neuen Präsidentin des Statistischen Bundesamtes Dr. Ruth Brand.</p></div></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 2","pages":"183 - 190"},"PeriodicalIF":0.0,"publicationDate":"2023-09-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00327-9.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"50497401","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Eine Analyse des Studienerfolgs im Masterstudium auf der Basis von Umfrage- und administrativen Prüfungsdaten: Ein Vergleich von fünf Masterstudiengängen am Fachbereich Wirtschaftswissenschaft der Freien Universität Berlin 基于调查和行政考试数据的硕士课程学业成就分析:柏林自由大学经济系五个硕士课程的比较
Pub Date : 2023-08-28 DOI: 10.1007/s11943-023-00325-x
Ulrich Rendtel, Yeonjoo Lee, Hartmut Gerks

In einer Umfrage unter den neu immatrikulierten Master-Studierenden wurden unter anderem der soziale Hintergrund, die Studienfinanzierung und die Motivation für den gewählten Studiengang erfragt. Durch die Verknüpfung von administrativen Prüfungsdaten mit den neuen Umfragedaten wird die Analyse der Studienverläufe und des Studienerfolgs im Zusammenhang mit individuellen Merkmalen ermöglicht. Damit vermeiden wir die Schwachstellen üblicher studentischer Befragungen mit hohem Non-response und Erinnerungsfehlern. Dieser Ansatz wird hier zum Vergleich von fünf Masterstudiengängen am Fachbereich (FB) Wirtschaftswissenschaft der Freien Universität Berlin (FU Berlin) benutzt. Nach der ersten Befragung wurden die Studierenden über die ersten 6 Fachsemester hinsichtlich des Erwerbs von Leistungspunkten (LP), dem Abschluss ihres Masterstudiums sowie den dabei erzielten Noten begleitet.

In den verknüpften Daten konnte ein Erfolgsbias der teilnahmebereiten Studierenden der Kohorte festgestellt werden, der aber durch eine geeignete Gewichtung über die Responserate gut beherrschbar ist. Wir vergleichen die Studiengänge in verschiedenen Phasen: Studieneingangsphase, Erreichen der Regelstudienzeit und Abschluss bis zum 6 Fachsemester. Weiterhin wird der Einfluss von Hintergrundmerkmalen auf die erreichte Note beim Studienabschluss untersucht. In der Studieneingangsphase ergeben sich deutliche Unterschiede zwischen den Studiengängen. Konditioniert man allerdings auf den Studienerfolg im ersten Semester, so verschwinden diese Unterschiede für die zweite Studienphase und den Abschluss des Studiums. Überraschend ist der geringe Einfluss der Bachelor-Note auf den Studienerfolg und die erzielte Master-Note. Die Ergebnisse zeigen die Möglichkeit auf, einen möglichen Studienabbruch schon relativ sicher anhand der erzielten LP in der Studieneingangsphase zu erkennen.

在对新入学的硕士生进行的调查中,询问了他们的社会背景、学习资金和选择学位课程的动机等问题。通过将行政考试数据与新的调查数据联系起来,我们可以分析与个人特征相关的学习过程和学业成就。通过这种方法,我们避免了传统学生调查中无应答和回忆误差大的缺点。本文采用这种方法对柏林自由大学(FU Berlin)商业与经济学院的五个硕士课程进行了比较。在第一次调查之后,我们对学生前 6 个学期的学分(CP)获得情况、硕士学位课程的完成情况以及在此过程中取得的成绩进行了跟踪调查,相关数据显示,在愿意参与调查的学生群体中存在成功偏差,但这可以通过适当的响应率加权来轻松控制。我们对不同阶段的学位课程进行了比较:我们对不同阶段的学位课程进行了比较:入学阶段、达到标准学习年限阶段和完成学业至第 6 学期阶段。此外,我们还分析了背景特征对毕业成绩的影响。各学位课程在入门阶段存在明显差异。但是,如果以第一学期的学习成绩为条件,这些差异在第二学习阶段和完成学位课程时就会消失。令人惊讶的是,学士学位对学习成绩和硕士学位的影响很小。结果表明,根据最初学习阶段的学习成绩,可以比较可靠地识别出可能的辍学情况。
{"title":"Eine Analyse des Studienerfolgs im Masterstudium auf der Basis von Umfrage- und administrativen Prüfungsdaten: Ein Vergleich von fünf Masterstudiengängen am Fachbereich Wirtschaftswissenschaft der Freien Universität Berlin","authors":"Ulrich Rendtel,&nbsp;Yeonjoo Lee,&nbsp;Hartmut Gerks","doi":"10.1007/s11943-023-00325-x","DOIUrl":"10.1007/s11943-023-00325-x","url":null,"abstract":"<p>In einer Umfrage unter den neu immatrikulierten Master-Studierenden wurden unter anderem der soziale Hintergrund, die Studienfinanzierung und die Motivation für den gewählten Studiengang erfragt. Durch die Verknüpfung von administrativen Prüfungsdaten mit den neuen Umfragedaten wird die Analyse der Studienverläufe und des Studienerfolgs im Zusammenhang mit individuellen Merkmalen ermöglicht. Damit vermeiden wir die Schwachstellen üblicher studentischer Befragungen mit hohem Non-response und Erinnerungsfehlern. Dieser Ansatz wird hier zum Vergleich von fünf Masterstudiengängen am Fachbereich (FB) Wirtschaftswissenschaft der Freien Universität Berlin (FU Berlin) benutzt. Nach der ersten Befragung wurden die Studierenden über die ersten 6 Fachsemester hinsichtlich des Erwerbs von Leistungspunkten (LP), dem Abschluss ihres Masterstudiums sowie den dabei erzielten Noten begleitet.</p><p>In den verknüpften Daten konnte ein Erfolgsbias der teilnahmebereiten Studierenden der Kohorte festgestellt werden, der aber durch eine geeignete Gewichtung über die Responserate gut beherrschbar ist. Wir vergleichen die Studiengänge in verschiedenen Phasen: Studieneingangsphase, Erreichen der Regelstudienzeit und Abschluss bis zum 6 Fachsemester. Weiterhin wird der Einfluss von Hintergrundmerkmalen auf die erreichte Note beim Studienabschluss untersucht. In der Studieneingangsphase ergeben sich deutliche Unterschiede zwischen den Studiengängen. Konditioniert man allerdings auf den Studienerfolg im ersten Semester, so verschwinden diese Unterschiede für die zweite Studienphase und den Abschluss des Studiums. Überraschend ist der geringe Einfluss der Bachelor-Note auf den Studienerfolg und die erzielte Master-Note. Die Ergebnisse zeigen die Möglichkeit auf, einen möglichen Studienabbruch schon relativ sicher anhand der erzielten LP in der Studieneingangsphase zu erkennen.</p>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"18 1","pages":"37 - 76"},"PeriodicalIF":0.0,"publicationDate":"2023-08-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00325-x.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"72934211","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Die Lohnlücke in der Zeitarbeit 临时工作的工资差距
Pub Date : 2023-08-25 DOI: 10.1007/s11943-023-00323-z
Ronald Bachmann, Fernanda Martínez Flores, Christian Rulff

Die Lohnlücke zwischen Personen, die innerhalb und außerhalb der Zeitarbeit beschäftigt sind, wird in Deutschland auf Grundlage verschiedener Datensätze berechnet, was teilweise zu sehr unterschiedlichen Ergebnissen führt. Der vorliegende Artikel untersucht die Lohnlücke in der Zeitarbeit daher anhand zweier Datensätze, den Integrierten Erwerbsbiografien (IEB) des Instituts für Arbeitsmarkt- und Berufsforschung der Bundesagentur für Arbeit und der Verdienststrukturerhebung (VSE) des Statistischen Bundesamtes. Hierzu wird die Lohnlücke auf Basis der beiden Mikrodatensätze mithilfe verschiedener ökonometrischer Verfahren analysiert.

Die Ergebnisse der Studie zeigen, dass beim Vergleich von öffentlichen Statistiken auf eine Vergleichbarkeit der zugrundeliegenden Stichprobe geachtet werden sollte. Die Lohnlücke bei den Monatslöhnen ist bei Verwendung von IEB-Daten etwas größer als bei VSE-Daten, was auf Unterschiede in der Zusammensetzung der Stichprobe zurückzuführen ist. Die ökonometrische Analyse der Monatslöhne ergibt für beide Datensätze, dass die bereinigte Lohnlücke, d. h. die Lohnlücke nach Kontrolle für beobachtbare Charakteristika, deutlich geringer ausfällt als die unbereinigte Lohnlücke. Eine zusätzliche Analyse der Stundenlöhne auf Grundlage der VSE zeigt, dass die bereinigte Lohnlücke nahe null liegt. Dies deutet darauf hin, dass die Arbeitszeit eine wichtige Rolle für die Lohnlücke spielt.

在德国,临时工与非临时工之间的工资差距是根据不同的数据集计算出来的,有时会得出截然不同的结果。因此,本文使用两个数据集,即联邦就业局就业研究所的综合就业传记 (IEB) 和联邦统计局的收入结构调查 (VSE),来研究临时工作的工资差距。研究结果表明,在比较公共统计数据时,应注意确保基础样本的可比性。由于样本构成的差异,使用国际教育指数数据时的月工资差距略大于使用创业就业指数数据时的月工资差距。对两个数据集的月工资进行的计量经济学分析表明,调整后的工资差距(即控制了可观测特征后的工资差距)明显小于未调整的工资差距。基于 VSE 对小时工资的额外分析表明,调整后的工资差距接近于零。这表明工时在工资差距中起着重要作用。
{"title":"Die Lohnlücke in der Zeitarbeit","authors":"Ronald Bachmann,&nbsp;Fernanda Martínez Flores,&nbsp;Christian Rulff","doi":"10.1007/s11943-023-00323-z","DOIUrl":"10.1007/s11943-023-00323-z","url":null,"abstract":"<p>Die Lohnlücke zwischen Personen, die innerhalb und außerhalb der Zeitarbeit beschäftigt sind, wird in Deutschland auf Grundlage verschiedener Datensätze berechnet, was teilweise zu sehr unterschiedlichen Ergebnissen führt. Der vorliegende Artikel untersucht die Lohnlücke in der Zeitarbeit daher anhand zweier Datensätze, den Integrierten Erwerbsbiografien (IEB) des Instituts für Arbeitsmarkt- und Berufsforschung der Bundesagentur für Arbeit und der Verdienststrukturerhebung (VSE) des Statistischen Bundesamtes. Hierzu wird die Lohnlücke auf Basis der beiden Mikrodatensätze mithilfe verschiedener ökonometrischer Verfahren analysiert.</p><p>Die Ergebnisse der Studie zeigen, dass beim Vergleich von öffentlichen Statistiken auf eine Vergleichbarkeit der zugrundeliegenden Stichprobe geachtet werden sollte. Die Lohnlücke bei den Monatslöhnen ist bei Verwendung von IEB-Daten etwas größer als bei VSE-Daten, was auf Unterschiede in der Zusammensetzung der Stichprobe zurückzuführen ist. Die ökonometrische Analyse der Monatslöhne ergibt für beide Datensätze, dass die bereinigte Lohnlücke, d. h. die Lohnlücke nach Kontrolle für beobachtbare Charakteristika, deutlich geringer ausfällt als die unbereinigte Lohnlücke. Eine zusätzliche Analyse der Stundenlöhne auf Grundlage der VSE zeigt, dass die bereinigte Lohnlücke nahe null liegt. Dies deutet darauf hin, dass die Arbeitszeit eine wichtige Rolle für die Lohnlücke spielt.</p>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"18 1","pages":"15 - 36"},"PeriodicalIF":0.0,"publicationDate":"2023-08-25","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00323-z.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"80341024","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Die Corona Pandemie in Deutschland 德国的冠状病毒大流行
Pub Date : 2023-08-23 DOI: 10.1007/s11943-023-00324-y
Ulrich Rendtel

Zusammenfassung

Der Artikel präsentiert die Resultate der Grohmann Vorlesung, die am Ende der Corona Pandemie in Deuschland gehalten wurde. Er gibt einen Überblick über die Defizite des Monitorings der Pandemie in Deutschland und schlägt Alternativen vor, wie man bei zukünftigen Pandemien verfahren sollte. Der Artikel analysiert die Schwächen des offiziellen Meldesystems der Inzidenzzahlen und der Vorhersagen von Erkrankungsfällen. Die Vorgehensweise der wissenschaftlichen Kommission zur Evaluierung der Corona Schutzmaßnahmen wird kontrastiert mit alternativen Ansätzen und Ergebnissen. Schließlich werden weitere Zugänge zum Monitoring über Abwasserproben und repräsentative Stichproben vorgestellt. Der Artikel schließt mit einem Plädoyer für eine stärkere Rolle von Statistikern bei Entscheidungen über zukünftige Pandemien.

摘要本文介绍了格罗曼讲座的结果,该讲座在新冠疫情结束时在德国举行。它概述了德国在监测疫情方面的不足,并提出了应对未来疫情的替代方案。文章分析了官方发病率和疾病病例预测报告系统的弱点。科学委员会评估电晕保护措施的方法与其他方法和结果进行了对比。最后,提出了通过废水样本和代表性样本进行监测的进一步方法。文章最后呼吁统计学家在未来流行病的决策中发挥更大的作用。
{"title":"Die Corona Pandemie in Deutschland","authors":"Ulrich Rendtel","doi":"10.1007/s11943-023-00324-y","DOIUrl":"10.1007/s11943-023-00324-y","url":null,"abstract":"<div><h2>Zusammenfassung</h2><div><p>Der Artikel präsentiert die Resultate der Grohmann Vorlesung, die am Ende der Corona Pandemie in Deuschland gehalten wurde. Er gibt einen Überblick über die Defizite des Monitorings der Pandemie in Deutschland und schlägt Alternativen vor, wie man bei zukünftigen Pandemien verfahren sollte. Der Artikel analysiert die Schwächen des offiziellen Meldesystems der Inzidenzzahlen und der Vorhersagen von Erkrankungsfällen. Die Vorgehensweise der wissenschaftlichen Kommission zur Evaluierung der Corona Schutzmaßnahmen wird kontrastiert mit alternativen Ansätzen und Ergebnissen. Schließlich werden weitere Zugänge zum Monitoring über Abwasserproben und repräsentative Stichproben vorgestellt. Der Artikel schließt mit einem Plädoyer für eine stärkere Rolle von Statistikern bei Entscheidungen über zukünftige Pandemien.</p></div></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 2","pages":"113 - 144"},"PeriodicalIF":0.0,"publicationDate":"2023-08-23","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00324-y.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"50506714","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Langfrist-Prognose von Performance-Indizes: Vergleich einiger Verfahren 绩效指标的长期预测:几种方法的比较
Pub Date : 2023-07-13 DOI: 10.1007/s11943-023-00322-0
Günter Bamberg, Sebastian Heiden, Michael Krapp

Zusammenfassung

Langfrist-Prognosen sind typischerweise problematischer als Kurzfrist-Prognosen. Im Kapitalmarktkontext ist die Sachlage jedoch umgekehrt, da verlässliche Kurzfrist-Prognosen durch Arbitrageure sofort zunichte gemacht würden. Ex ante ist der Performance-Index am Prognosehorizont eine extrem rechtsschief verteilte Zufallsvariable. Prognosen, die auf dessen Modalwert abzielen, sind daher viel zu pessimistisch. Prognosen, die auf den Erwartungswert abzielen, sind dagegen zu optimistisch. Von den drei prominenten Lagemaßen ist nur der Median in der Lage, als Basis für eine verlässliche Prognose zu dienen. Es werden einige Praktiker-Verfahren untereinander und mit einem neuen Prognoseverfahren verglichen, welches auf der erwartungstreuen Schätzung des Medians beruht. Zur Illustration der Verfahren und der resultierenden Prognosen werden Daten des DAX bis 2022 verwendet. Es zeigt sich unter anderem, dass der erwartungstreue Median-Schätzer bessere Prognosen als das beste ‚Praktiker-Verfahren‘ liefert.

摘要长期预测通常比短期预测更有问题。然而,在资本市场背景下,情况发生了逆转,因为可靠的短期预测将立即被仲裁员宣布无效。事前,预测范围内的绩效指数是一个极为直角的随机变量。因此,针对其模态价值的预测过于悲观。另一方面,针对预期值的预测过于乐观。在三个显著位置测量中,只有中位数能够作为可靠预后的基础。将许多从业者的方法相互比较,并与基于中值预期估计的新预测方法进行比较。DAX截至2022年的数据用于说明程序和由此产生的预测。研究表明,除其他外,忠实的中值估计器比最佳的“从业者”方法提供了更好的预测。
{"title":"Langfrist-Prognose von Performance-Indizes: Vergleich einiger Verfahren","authors":"Günter Bamberg,&nbsp;Sebastian Heiden,&nbsp;Michael Krapp","doi":"10.1007/s11943-023-00322-0","DOIUrl":"10.1007/s11943-023-00322-0","url":null,"abstract":"<div><h2>Zusammenfassung</h2><div><p>Langfrist-Prognosen sind typischerweise problematischer als Kurzfrist-Prognosen. Im Kapitalmarktkontext ist die Sachlage jedoch umgekehrt, da verlässliche Kurzfrist-Prognosen durch Arbitrageure sofort zunichte gemacht würden. Ex ante ist der Performance-Index am Prognosehorizont eine extrem rechtsschief verteilte Zufallsvariable. Prognosen, die auf dessen Modalwert abzielen, sind daher viel zu pessimistisch. Prognosen, die auf den Erwartungswert abzielen, sind dagegen zu optimistisch. Von den drei prominenten Lagemaßen ist nur der Median in der Lage, als Basis für eine verlässliche Prognose zu dienen. Es werden einige Praktiker-Verfahren untereinander und mit einem neuen Prognoseverfahren verglichen, welches auf der erwartungstreuen Schätzung des Medians beruht. Zur Illustration der Verfahren und der resultierenden Prognosen werden Daten des DAX bis 2022 verwendet. Es zeigt sich unter anderem, dass der erwartungstreue Median-Schätzer bessere Prognosen als das beste ‚Praktiker-Verfahren‘ liefert.</p></div></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 2","pages":"161 - 181"},"PeriodicalIF":0.0,"publicationDate":"2023-07-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00322-0.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"50477710","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Die Berücksichtigung von außergesetzlichen Merkmalen bei der Mietspiegelerstellung – Kausalität versus Vorhersage 租金镜像计算中对非法律特征的考虑——因果关系与预测
Pub Date : 2023-06-14 DOI: 10.1007/s11943-023-00321-1
Göran Kauermann, Michael Windmann

Zusammenfassung

Das neue Mietspiegelgesetz erlaubt die Berücksichtigung von sogenannten außergesetzlichen Merkmalen wie Mietdauer und Vermietertyp bei der Erstellung von Mietspiegeln. Diese außergesetzlichen Merkmale dürfen in zukünftigen Mietspiegeln bei deren Erstellung und Modellwahl Einfluss finden, nicht aber im konkreten Mietspiegelmodell. Diese gesetzliche Vorgabe lässt viel Spielraum, der in diesem Beitrag aus statistischer Sicht beleuchtet wird. Anhand von konkreten Daten werden die Konsequenzen quantifiziert und aufgezeigt.

总结新的Mietspielgesetz(Mietspiel gesetz)允许在创建租赁镜像时考虑所谓的非法定特征,如租赁期限和房东类型。在创建和选择模型时,这些法律外特征可能会对未来的租赁镜像产生影响,但不会对具体的租赁镜像模型产生影响。这一法律要求留下了很大的回旋余地,本文将从统计的角度对此进行审查。根据具体数据,对后果进行了量化和显示。
{"title":"Die Berücksichtigung von außergesetzlichen Merkmalen bei der Mietspiegelerstellung – Kausalität versus Vorhersage","authors":"Göran Kauermann,&nbsp;Michael Windmann","doi":"10.1007/s11943-023-00321-1","DOIUrl":"10.1007/s11943-023-00321-1","url":null,"abstract":"<div><h2>Zusammenfassung</h2><div><p>Das neue Mietspiegelgesetz erlaubt die Berücksichtigung von sogenannten außergesetzlichen Merkmalen wie Mietdauer und Vermietertyp bei der Erstellung von Mietspiegeln. Diese außergesetzlichen Merkmale dürfen in zukünftigen Mietspiegeln bei deren Erstellung und Modellwahl Einfluss finden, nicht aber im konkreten Mietspiegelmodell. Diese gesetzliche Vorgabe lässt viel Spielraum, der in diesem Beitrag aus statistischer Sicht beleuchtet wird. Anhand von konkreten Daten werden die Konsequenzen quantifiziert und aufgezeigt.</p></div></div>","PeriodicalId":100134,"journal":{"name":"AStA Wirtschafts- und Sozialstatistisches Archiv","volume":"17 2","pages":"145 - 160"},"PeriodicalIF":0.0,"publicationDate":"2023-06-14","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://link.springer.com/content/pdf/10.1007/s11943-023-00321-1.pdf","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"50481542","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"OA","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
期刊
AStA Wirtschafts- und Sozialstatistisches Archiv
全部 Acc. Chem. Res. ACS Applied Bio Materials ACS Appl. Electron. Mater. ACS Appl. Energy Mater. ACS Appl. Mater. Interfaces ACS Appl. Nano Mater. ACS Appl. Polym. Mater. ACS BIOMATER-SCI ENG ACS Catal. ACS Cent. Sci. ACS Chem. Biol. ACS Chemical Health & Safety ACS Chem. Neurosci. ACS Comb. Sci. ACS Earth Space Chem. ACS Energy Lett. ACS Infect. Dis. ACS Macro Lett. ACS Mater. Lett. ACS Med. Chem. Lett. ACS Nano ACS Omega ACS Photonics ACS Sens. ACS Sustainable Chem. Eng. ACS Synth. Biol. Anal. Chem. BIOCHEMISTRY-US Bioconjugate Chem. BIOMACROMOLECULES Chem. Res. Toxicol. Chem. Rev. Chem. Mater. CRYST GROWTH DES ENERG FUEL Environ. Sci. Technol. Environ. Sci. Technol. Lett. Eur. J. Inorg. Chem. IND ENG CHEM RES Inorg. Chem. J. Agric. Food. Chem. J. Chem. Eng. Data J. Chem. Educ. J. Chem. Inf. Model. J. Chem. Theory Comput. J. Med. Chem. J. Nat. Prod. J PROTEOME RES J. Am. Chem. Soc. LANGMUIR MACROMOLECULES Mol. Pharmaceutics Nano Lett. Org. Lett. ORG PROCESS RES DEV ORGANOMETALLICS J. Org. Chem. J. Phys. Chem. J. Phys. Chem. A J. Phys. Chem. B J. Phys. Chem. C J. Phys. Chem. Lett. Analyst Anal. Methods Biomater. Sci. Catal. Sci. Technol. Chem. Commun. Chem. Soc. Rev. CHEM EDUC RES PRACT CRYSTENGCOMM Dalton Trans. Energy Environ. Sci. ENVIRON SCI-NANO ENVIRON SCI-PROC IMP ENVIRON SCI-WAT RES Faraday Discuss. Food Funct. Green Chem. Inorg. Chem. Front. Integr. Biol. J. Anal. At. Spectrom. J. Mater. Chem. A J. Mater. Chem. B J. Mater. Chem. C Lab Chip Mater. Chem. Front. Mater. Horiz. MEDCHEMCOMM Metallomics Mol. Biosyst. Mol. Syst. Des. Eng. Nanoscale Nanoscale Horiz. Nat. Prod. Rep. New J. Chem. Org. Biomol. Chem. Org. Chem. Front. PHOTOCH PHOTOBIO SCI PCCP Polym. Chem.
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1