Abstract. Two-level binary logistic regression is a multilevel analysis used to analyze data that has a two-level hierarchical structure with binary response data. Hierarchical data structure is data with observation units nested in higher units. Two-level regression is the simplest multilevel model where the first level is individual data and the second level is group data. In this study, we will discuss the use of two-level binary logistic regression on data on the Passing Status of Statistics Courses of Bandung Islamic University Students Class of 2019. The data used is secondary data obtained from PSITEK Bandung Islamic University, with a total data of 1173 students nested into 3 groups (Faculty). The research variable in this study is the status of passing the statistics course as the dependent variable (Y), with two categories, namely 0 for students who do not pass and 1 for students who pass, as well as gender, regional origin and GPA as predictor variables (X) at level 1 and science clumps as predictor variables (Z) at level 2. The parameter estimator is carried out using the Maximum Likelihood via Quadrature method. Based on the results of the application of 2-level binary logistic regression, the factors that influence the response are the variables of regional origin and GPA (level 1/student) and clumps of knowledge (level 2/Faculty). Abstrak. Regresi logistik biner dua-level merupakan analisis multilevel yang digunakan untuk menganalisis data yang mempunyai struktur hirarki dua level dengan data respon biner. Struktur data hirarki adalah data dengan unit-unit observasi yang bersarang pada unit yang lebih tinggi. Regresi dua-level merupakan model multilevel yang paling sederhana dimana level kesatu data individu dan level kedua data kelompok. Dalam penelitian ini, akan membahas penggunaan regresi logistik biner dua level pada data Status Kelulusan Mata Kuliah Statistika Mahasiswa Universitas Islam Bandung Angkatan 2019. Data yang digunakan adalah data sekunder yang diperoleh dari PSITEK Universitas Islam Bandung, dengan total data sebanyak 1173 mahasiswa yang tersarang kedalam 3 kelompok (Fakultas). Variabel penelitian dalam penelitian ini adalah status lulus mata kuliah statistika sebagai variabel dependen (Y), dengan dua kategori yaitu 0 untuk mahasiswa yang tidak lulus dan 1 untuk mahasiswa yang lulus, serta jenis kelamin, asal daerah dan IPK sebagai variabel prediktor (X) pada level 1 dan rumpun ilmu sebagai variabel prediktor (Z) pada level 2. Penaksir parameter dilakukan menggunakan metode Maximum Likelihood via Quadrature. Berdasarkan hasil penerapan regresi logistik biner 2-level menyatakan bahwa fakor-faktor yang mempengaruhi respon adalah variabel asal daerah dan IPK (level 1/mahasiswa) dan rumpun ilmu (level 2/Fakultas).
摘要二水平二元逻辑回归是一种多水平分析,用于分析具有两级层次结构的数据与二元响应数据。分层数据结构是将观测单元嵌套在更高单元中的数据。两层回归是最简单的多层模型,第一层是个体数据,第二层是群体数据。在本研究中,我们将讨论对万隆伊斯兰大学2019届学生统计学课程通过情况的数据使用两级二元逻辑回归。数据来源于PSITEK万隆伊斯兰大学,共1173名学生,分为3组(院系)。本研究的研究变量为统计学课程的及格状况作为因变量(Y),分为两类,不及格学生为0,及格学生为1,性别、地区出身和GPA作为预测变量(X)作为水平1,科学团块作为预测变量(Z)作为水平2。利用正交法的极大似然进行参数估计。根据二水平二元逻辑回归的应用结果,影响响应的因素是区域起源和GPA(一级/学生)和知识团块(二级/教师)变量。Abstrak。回归logistic线性回归双水平merupakan分析多水平yang diunakan untuk分析数据yang mempunyai结构hirarki双水平dunan数据响应线性回归。结构数据hirarki adalah数据dengan单位观测yang bersarang pada单位yang lebih tinggi。回归双级merupakan模型,多级阳平,多级阳平,多级阳平,多级阳平,多级阳平,多级阳平,多级阳平。Dalam penelitian ini, akan成员,penggunaan和回归logistic biner双级数据状态Kelulusan Mata Kuliah统计,Mahasiswa伊斯兰大学,万隆昂加丹2019。数据yang digunakan adalah数据sekunder yang diperoleh dari PSITEK Universitas Islam Bandung, dunan总数据sebanyak 1173 mahasiswa yang tersarang kedalam 3 kelompok (Fakultas)。变量penelitian dalam penelitian ini adalah status lulus mata kuliah statisticka sebagai变量依赖(Y), dunan dua ategori yitu 0 untuk mahasiswa yang tidak lulus 1 untuk mahasiswa yang lulus, serta jenis kelamin, asal daerah dan IPK sebagai变量预测因子(X)水平1 dan rumpun ilmu sebagai变量预测因子(Z)水平2。Penaksir参数dilakukan - menggunakan方法的正交极大似然。2-level menyatakan bahwa fakor- fakor- fakaruhi响应的变量asal - daerah dan IPK (level 1/mahasiswa)和rumpun ilmu (level 2/Fakultas)。
{"title":"Regresi Logistik Dua Level Respon Biner untuk Pemodelan Data Status Kelulusan Mata Kuliah Statistika Mahasiswa Fakultas X, Y dan Z Universitas Islam Bandung Angkatan 2019","authors":"Alma Mariana Sofiah, Nusar Hajarisman","doi":"10.29313/bcss.v3i2.8228","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8228","url":null,"abstract":"Abstract. Two-level binary logistic regression is a multilevel analysis used to analyze data that has a two-level hierarchical structure with binary response data. Hierarchical data structure is data with observation units nested in higher units. Two-level regression is the simplest multilevel model where the first level is individual data and the second level is group data. In this study, we will discuss the use of two-level binary logistic regression on data on the Passing Status of Statistics Courses of Bandung Islamic University Students Class of 2019. The data used is secondary data obtained from PSITEK Bandung Islamic University, with a total data of 1173 students nested into 3 groups (Faculty). The research variable in this study is the status of passing the statistics course as the dependent variable (Y), with two categories, namely 0 for students who do not pass and 1 for students who pass, as well as gender, regional origin and GPA as predictor variables (X) at level 1 and science clumps as predictor variables (Z) at level 2. The parameter estimator is carried out using the Maximum Likelihood via Quadrature method. Based on the results of the application of 2-level binary logistic regression, the factors that influence the response are the variables of regional origin and GPA (level 1/student) and clumps of knowledge (level 2/Faculty). \u0000Abstrak. Regresi logistik biner dua-level merupakan analisis multilevel yang digunakan untuk menganalisis data yang mempunyai struktur hirarki dua level dengan data respon biner. Struktur data hirarki adalah data dengan unit-unit observasi yang bersarang pada unit yang lebih tinggi. Regresi dua-level merupakan model multilevel yang paling sederhana dimana level kesatu data individu dan level kedua data kelompok. Dalam penelitian ini, akan membahas penggunaan regresi logistik biner dua level pada data Status Kelulusan Mata Kuliah Statistika Mahasiswa Universitas Islam Bandung Angkatan 2019. Data yang digunakan adalah data sekunder yang diperoleh dari PSITEK Universitas Islam Bandung, dengan total data sebanyak 1173 mahasiswa yang tersarang kedalam 3 kelompok (Fakultas). Variabel penelitian dalam penelitian ini adalah status lulus mata kuliah statistika sebagai variabel dependen (Y), dengan dua kategori yaitu 0 untuk mahasiswa yang tidak lulus dan 1 untuk mahasiswa yang lulus, serta jenis kelamin, asal daerah dan IPK sebagai variabel prediktor (X) pada level 1 dan rumpun ilmu sebagai variabel prediktor (Z) pada level 2. Penaksir parameter dilakukan menggunakan metode Maximum Likelihood via Quadrature. Berdasarkan hasil penerapan regresi logistik biner 2-level menyatakan bahwa fakor-faktor yang mempengaruhi respon adalah variabel asal daerah dan IPK (level 1/mahasiswa) dan rumpun ilmu (level 2/Fakultas).","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"13 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"132916884","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Regression analysis is a method used to determine the causal relationship of response variables with one or more predictor variables. It is generally divided into three regression analyses namely parametric, semiparametric, and nonparametric. Parametric regression has assumptions that can be met and the regression curve is known, but not all data can meet this. Therefore, the use of nonparametric regression can be an alternative because the use is not bound by assumptions and is used when the data does not follow a certain curve pattern. Nonparametric regression of the Fourier series is a method used to estimate the parameters of the regression curve through a data pattern approach. The best modeling uses the Generalized Cross Validation (GCV) method to derive the optimal oscillation point from the minimum GCV value. The purpose of the study is to obtain the best model of the Open Unemployment Rate (TPT) in West Java in 2022. Where the variables that are thought to affect the Open Unemployment Rate (TPT) are population density, percentage of poor people, gross participation rate (APK), Human Development Index (HDI), and Labor Force Participation Rate (TPAK). The results of the analysis show that the best fourier series nonparametric regression model for the Open Unemployment Rate (TPT) in West Java is at the 3th oscillation point with a coefficient of determination value of 84%. Abstrak. Analisis regresi adalah suatu metode yang digunakan untuk mengetahui hubungan sebab akibat dari variabel respon dengan satu atau lebih variabel prediktor. Umumnya dibagi menjadi tiga analisis regresi yaitu parametrik, semiparametrik, dan nonparametrik. Pada regresi parametrik memiliki asumsi yang dapat terpenuhi dan kurva regresi diketahui akan tetapi tidak semua data dapat memenuhi hal tersebut. Oleh karena itu penggunaan regresi nonparametrik t Rate, Generalized Cross Validation.dapat menjadi alternatif karena penggunaan tidak terikat asumsi-asumsi dan digunakan ketika data tidak mengikuti pola kurva tertentu. Regresi nonparametrik deret fourier adalah metode yang digunakan untuk mengestimasi parameter kurva regresi melalui pendekatan pola data. Pemodelan terbaik menggunakan metode Generalized Cross Validation (GCV) untuk memperoleh titik osilasi optimal dari nilai GCV minimum. Tujuan dari penelitian untuk memperoleh model terbaik Tingkat Pengangguran Terbuka (TPT) di Jawa Barat tahun 2022. Dimana variabel-variabel yang diduga mempengaruhi Tingkat Pengangguran Terbuka (TPT) yaitu kepadatan penduduk, presentase penduduk miskin, angka partisipasi kasar (APK), Indeks Pembangunan Manusia (IPM), dan Tingkat Partisipasi Angkatan Kerja (TPAK). Hasil analisis menunjukkan model regresi nonparametrik deret fourier terbaik untuk Tingkat Pengangguran Terbuka (TPT) di Jawa Barat adalah pada titik osilasi ke-3 dengan nilai koefisien determinasi sebesar 84%.
摘要。回归分析是一种用于确定响应变量与一个或多个预测变量之间因果关系的方法。它通常分为三种回归分析,即参数、半参数和非参数。参数回归具有可以满足的假设,并且回归曲线是已知的,但并非所有数据都能满足这一点。因此,使用非参数回归可以是另一种选择,因为使用非参数回归不受假设的约束,并且在数据不遵循特定曲线模式时使用。傅立叶级数的非参数回归是一种通过数据模式方法估计回归曲线参数的方法。最好的建模方法是使用广义交叉验证(GCV)方法从最小GCV值推导出最优振荡点。研究的目的是获得2022年西爪哇开放失业率(TPT)的最佳模型。其中被认为影响公开失业率(TPT)的变量是人口密度、贫困人口百分比、总参与率(APK)、人类发展指数(HDI)和劳动力参与率(TPAK)。分析结果表明,西爪哇省公开失业率(TPT)的最佳傅立叶级数非参数回归模型位于第3个振荡点,其决定系数为84%。Abstrak。分析回归的数据分析方法,杨迪库纳肯、孟格塔肯、胡邦肯、西布库纳肯、亚布肯、亚布肯、亚布肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯、亚伯肯。参数化、半参数化、非参数化分析。帕达回归的参数化记忆,假设为杨氏回归的参数化记忆;库尔瓦回归的参数化记忆,假设为杨氏回归的参数化记忆;王晓东,王晓东,等。回归非参数率。广义交叉验证。Dapat menjadi alternatif karena penggunaan tidak terikat asumsi-asumsi Dan digunakan ketika data tidak mengikuti pola kurva tertentu。回归的非参数离散傅立叶逼近方法,参数库尔瓦回归的非参数离散傅立叶逼近方法。Pemodelan - terbaik - menggunakan方法广义交叉验证(GCV)的最优解与GCV最小值。Tujuan dari penelitian untuk memperoleh model terbaik Tingkat Pengangguran Terbuka (TPT) di javabarat tahun 2022。Dimana variable -variabel yang diduga mempengaruhi Tingkat Pengangguran Terbuka (TPT) yitu kepadatan penduduk, presentase penduduk miskin, angka partisipasi kasar (APK), Indeks Pembangunan Manusia (IPM), dan Tingkat partisipasi Angkatan Kerja (TPAK)。Hasil分析menunjukkan模型回归非参数离散傅里叶terbakk - untuk - Tingkat Pengangguran - Terbuka (TPT) di javabarat adalah - pada - titik - osilasi ke-3 dengan nilai koefisien determinasi sebesar 84%。
{"title":"Pemodelan Tingkat Pengangguran Terbuka (TPT) di Jawa Barat Menggunakan Regresi Nonparametrik Deret Fourier","authors":"Sukma Wiyasih Izumi, Teti Sofia Yanti","doi":"10.29313/bcss.v3i2.8769","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8769","url":null,"abstract":"Abstract. Regression analysis is a method used to determine the causal relationship of response variables with one or more predictor variables. It is generally divided into three regression analyses namely parametric, semiparametric, and nonparametric. Parametric regression has assumptions that can be met and the regression curve is known, but not all data can meet this. Therefore, the use of nonparametric regression can be an alternative because the use is not bound by assumptions and is used when the data does not follow a certain curve pattern. Nonparametric regression of the Fourier series is a method used to estimate the parameters of the regression curve through a data pattern approach. The best modeling uses the Generalized Cross Validation (GCV) method to derive the optimal oscillation point from the minimum GCV value. The purpose of the study is to obtain the best model of the Open Unemployment Rate (TPT) in West Java in 2022. Where the variables that are thought to affect the Open Unemployment Rate (TPT) are population density, percentage of poor people, gross participation rate (APK), Human Development Index (HDI), and Labor Force Participation Rate (TPAK). The results of the analysis show that the best fourier series nonparametric regression model for the Open Unemployment Rate (TPT) in West Java is at the 3th oscillation point with a coefficient of determination value of 84%. \u0000Abstrak. Analisis regresi adalah suatu metode yang digunakan untuk mengetahui hubungan sebab akibat dari variabel respon dengan satu atau lebih variabel prediktor. Umumnya dibagi menjadi tiga analisis regresi yaitu parametrik, semiparametrik, dan nonparametrik. Pada regresi parametrik memiliki asumsi yang dapat terpenuhi dan kurva regresi diketahui akan tetapi tidak semua data dapat memenuhi hal tersebut. Oleh karena itu penggunaan regresi nonparametrik t Rate, Generalized Cross Validation.dapat menjadi alternatif karena penggunaan tidak terikat asumsi-asumsi dan digunakan ketika data tidak mengikuti pola kurva tertentu. Regresi nonparametrik deret fourier adalah metode yang digunakan untuk mengestimasi parameter kurva regresi melalui pendekatan pola data. Pemodelan terbaik menggunakan metode Generalized Cross Validation (GCV) untuk memperoleh titik osilasi optimal dari nilai GCV minimum. Tujuan dari penelitian untuk memperoleh model terbaik Tingkat Pengangguran Terbuka (TPT) di Jawa Barat tahun 2022. Dimana variabel-variabel yang diduga mempengaruhi Tingkat Pengangguran Terbuka (TPT) yaitu kepadatan penduduk, presentase penduduk miskin, angka partisipasi kasar (APK), Indeks Pembangunan Manusia (IPM), dan Tingkat Partisipasi Angkatan Kerja (TPAK). Hasil analisis menunjukkan model regresi nonparametrik deret fourier terbaik untuk Tingkat Pengangguran Terbuka (TPT) di Jawa Barat adalah pada titik osilasi ke-3 dengan nilai koefisien determinasi sebesar 84%.","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"1 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129402106","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. In the textile industry the resulting liquid waste has toxic characteristics and is harmful to the environment. Therefore, liquid waste needs to go through a processing and quality control process before being discharged into the waters. Control chart is one of the statistical tools used in statistical quality control. In practice we will encounter situations where it is necessary to control for two or more quality characteristics that are not normally distributed multivariate, so the control chart used is the Multivariate Exponentially Weighed Moving Average (MEWMA). This study uses data on the quality of textile industrial wastewater which has been processed using an WWTP (Wastewater Treatment Plant). There are 48 samples (months) for the period 2018 - 2021 with 6 variables of liquid waste content. The results of the quality control analysis by applying the MEWMA control chart obtained the most optimum weighting value of 0.05 with an Upper Control Limit (UCL) value of 14.6, there was 1 observation that was out of control. This shows that the quality of liquid waste in WWTP in the textile company CV. Sandang Sari is not statistically controlled. Abstrak. Pada industri tekstil limbah cair yang dihasilkan memiliki karakteristik beracun dan berbahaya bagi lingkungan hidup. Oleh karena itu limbah cair perlu melalui proses pengolahan dan pengendalian kualitas terlebih dahulu sebelum dibuang ke perairan. Diagram kendali adalah salah satu alat satatistik yang digunakan pada pengendalian kualitas statistik. Dalam praktiknya kita akan bertemu situasi dimana perlu untuk mengontrol dua atau lebih karakteristik kualitas yang tidak berdistribusi normal multivariat, maka diagram kendali yang digunakan adalah Multivariate Exponentially Weighed Moving Average (MEWMA). Penelitian ini menggunakan data kualitas limbah cair industri tekstil yang sudah melalui proses pengolahan menggunakan IPAL (Instalasi Pengolahan Air Limbah), ada sebanyak 48 sampel (bulan) periode 2018 - 2021 dengan 6 variabel kandungan limbah cair. Hasil analisis pengendalian kualitas dengan menerapkan diagram kendali MEWMA didapat nilai pembobot yang paling optimum sebesar 0,05 dengan nilai Batas Kendali Atas (BKA) sebesar 14,6 terdapat 1 pengamatan yang berada diluar kendali. Hal ini menunjukkan bahwa kualitas limbah cair pada IPAL di perusahaan tekstil CV. Sandang Sari tidak terkendali secara statistik.
摘要。在纺织工业中,产生的废液具有毒性,对环境有害。因此,废液在排入水体之前需要经过处理和质量控制过程。控制图是用于统计质量控制的统计工具之一。在实践中,我们会遇到需要控制两个或多个非正态分布的多变量质量特征的情况,因此使用的控制图是多变量指数加权移动平均(MEWMA)。本研究采用污水处理厂处理后的纺织工业废水水质数据。2018 - 2021年期间有48个样本(月),有6个液体废物含量变量。应用MEWMA控制图进行质量控制分析的结果得到最优权重值为0.05,控制上限(UCL)值为14.6,有1个观测值失控。这表明,纺织公司污水处理厂的废液质量。三当纱丽没有统计上的控制。Abstrak。巴国工业泰克仍然是林巴主席,杨迪哈斯坎·米里基·巴里基·巴里基·林昆甘。Oleh karena itu limbah主席perlu melalui进程pengolahan dan pengendalian kualitas terlebih dahulu sebelum dibuang ke perairan。图表kendali adalah salah satu alat satatistik yang digunakan padpengendalian kualitas统计。多变量指数加权移动平均(MEWMA)是指多变量指数加权移动平均(multi - exponential weighted Moving Average, MEWMA)。Penelitian ini menggunakan数据kualitas limbah industry tekstil yang sudah melalui提出了pengolahan menggunakan IPAL (Instalasi pengolahan Air limbah), ada sebanyak 48个样本(bulan)期间2018 - 2021年登干6个变量kandungan limbah椅。Hasil分析pengendalian kualitas dengan menerapkan图kendali MEWMA didapat nilai phembobot yang paling优优sebesar 0,05 dengan nilai Batas kendali Atas (BKA) sebesar 14,6 terdapat 1 pengamatan yang berada diluar kendali。Hal ini menunjukkan bahwa kualitas limbah cair padal di perushaan tekstil CV。Sandang Sari tidak terkendali secara统计。
{"title":"Pengendalian Kualitas Limbah Cair Menggunakan Diagram Kendali Multivariate Exponentially Weighted Moving Average (MEWMA)","authors":"Tania Grahanita, Anneke Iswani Achmad","doi":"10.29313/bcss.v3i2.9261","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.9261","url":null,"abstract":"Abstract. In the textile industry the resulting liquid waste has toxic characteristics and is harmful to the environment. Therefore, liquid waste needs to go through a processing and quality control process before being discharged into the waters. Control chart is one of the statistical tools used in statistical quality control. In practice we will encounter situations where it is necessary to control for two or more quality characteristics that are not normally distributed multivariate, so the control chart used is the Multivariate Exponentially Weighed Moving Average (MEWMA). This study uses data on the quality of textile industrial wastewater which has been processed using an WWTP (Wastewater Treatment Plant). There are 48 samples (months) for the period 2018 - 2021 with 6 variables of liquid waste content. The results of the quality control analysis by applying the MEWMA control chart obtained the most optimum weighting value of 0.05 with an Upper Control Limit (UCL) value of 14.6, there was 1 observation that was out of control. This shows that the quality of liquid waste in WWTP in the textile company CV. Sandang Sari is not statistically controlled. Abstrak. Pada industri tekstil limbah cair yang dihasilkan memiliki karakteristik beracun dan berbahaya bagi lingkungan hidup. Oleh karena itu limbah cair perlu melalui proses pengolahan dan pengendalian kualitas terlebih dahulu sebelum dibuang ke perairan. Diagram kendali adalah salah satu alat satatistik yang digunakan pada pengendalian kualitas statistik. Dalam praktiknya kita akan bertemu situasi dimana perlu untuk mengontrol dua atau lebih karakteristik kualitas yang tidak berdistribusi normal multivariat, maka diagram kendali yang digunakan adalah Multivariate Exponentially Weighed Moving Average (MEWMA). Penelitian ini menggunakan data kualitas limbah cair industri tekstil yang sudah melalui proses pengolahan menggunakan IPAL (Instalasi Pengolahan Air Limbah), ada sebanyak 48 sampel (bulan) periode 2018 - 2021 dengan 6 variabel kandungan limbah cair. Hasil analisis pengendalian kualitas dengan menerapkan diagram kendali MEWMA didapat nilai pembobot yang paling optimum sebesar 0,05 dengan nilai Batas Kendali Atas (BKA) sebesar 14,6 terdapat 1 pengamatan yang berada diluar kendali. Hal ini menunjukkan bahwa kualitas limbah cair pada IPAL di perusahaan tekstil CV. Sandang Sari tidak terkendali secara statistik.","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"84 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124424251","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Linear regression analysis is a statistical method used to model the relationship between the dependent variable and one or more independent variables expressed in the form of a regression equation. The Ordinary Least Square (OLS) can be used to estimate regression parameters. The regression parameter estimator obtained will be good if the assumptions that apply to MKT are met. One of the assumptions that must be met is that there is a linear relationship between the dependent variable and each independent variable. If linearity is violated, kernels can be used. In addition, another assumption that must be met is the absence of multicollinearity between independent variables. An alternative method that can be used to overcome multicollinearity is using Principal Component Analysis. If the linearity and multicollinearity assumptions are violated, the Kernel Principal Component Regression method can be applied. This study will apply the Kernel Principal Component Regression (KPCR) method, where the principal component is a nonlinear combination of independent variables through a kernel function. This KPCR method is implemented to predict house prices in South Jakarta based on building area, land area, number of bedrooms, number of bathrooms, and number of car capacity in the garage. Based on the results of the study, 3 main components of the kernel were formed with a prediction model Y ̂ = 76,3612 + 409,5373 KUK1 + 328,4967 KUK2 – 291,7757 KUK3 and a coefficient of determination (R2) of 70.4640%. Abstrak. Analisis regresi linear merupakan suatu metode statistika yang digunakan untuk memodelkan hubungan antara variabel dependen dengan satu atau lebih variabel independen yang dinyatakan dalam bentuk persamaan regresi. Dalam menaksir parameter regresi dapat menggunakan Metode Kuadrat Terkecil (MKT). Penaksir parameter regresi yang diperoleh akan baik jika asumsi-asumsi yang berlaku untuk MKT dipenuhi. Salah satu asumsi yang harus dipenuhi adalah terdapat hubungan linear antara variabel dependen dan masing-masing variabel independen. Apabila linearitas terlanggar, dapat menggunakan kernel. Selain itu, asumsi lainnya yang harus terpenuhi adalah tidak adanya multikolinearitas antar variabel independen. Metode alternatif yang dapat digunakaan untuk mengatasi multikolinearitas adalah menggunakan Analisis Komponen Utama. Apabila asumsi linearitas dan multikolinearitas terlanggar, dapat diterapkan metode Regresi Komponen Utama Kernel. Dalam penelitian ini, akan diterapkan metode Regresi Komponen Utama Kernel (RKUK), dimana komponen utama merupakan kombinasi nonlinier dari variabel independen melalui fungsi kernel. Metode RKUK ini diimplementasikan untuk memprediksi harga rumah di Jakarta Selatan berdasarkan luas bangunan, luas tanah, jumlah kamar tidur, jumlah kamar mandi, dan jumlah kapasitas mobil dalam garasi. Berdasarkan hasil penelitian, terbentuk 3 buah komponen utama kernel dengan model prediksi Y ̂ = 76,3612 + 409,5373 KUK1 + 328,4967 KUK2
摘要线性回归分析是一种统计方法,用来对因变量和一个或多个自变量之间的关系进行建模,以回归方程的形式表示。普通最小二乘(OLS)可以用来估计回归参数。如果满足适用于MKT的假设,则得到的回归参数估计量是好的。必须满足的一个假设是因变量和每个自变量之间存在线性关系。如果违反了线性,可以使用核函数。此外,另一个必须满足的假设是自变量之间不存在多重共线性。另一种可用于克服多重共线性的方法是使用主成分分析。如果线性和多重共线性假设不成立,则可采用核主成分回归方法。本研究将应用核主成分回归(KPCR)方法,其中主成分是通过核函数的自变量的非线性组合。这种KPCR方法是根据建筑面积、土地面积、卧室数量、浴室数量和车库的汽车容量来预测雅加达南部的房价。根据研究结果,形成了3个核主成分,预测模型Y = 76、3612 + 409、5373 KUK1 + 328、4967 KUK2 - 291、7757 KUK3,决定系数(R2)为70.4640%。Abstrak。分析回归线性merupakan suatu方法统计变量依赖于dengan状态变量独立于yang dinyakan dalam bentuk persamaan回归。Dalam menaksir参数回归与孟古纳肯metokuadrat terkil (MKT)。Penaksir参数回归yang diperoleh akan baik jika假定-假定yang berlaku untuk MKT dipenuhi。Salah satu asumsi yang harus dipenuhi adalah terdapat hubungan线性antara变量依赖与masmasing变量独立。Apabila linearitas terlanggar, dapat menggunakan kernel。Selain itu,假设在多变量独立的情况下,多变量独立的情况下,在多变量独立的情况下,在多变量独立的情况下,在多变量独立的情况下,在多变量独立的情况下。方法交替分析:多线性回归分析,多线性回归分析。Apabila假设单线性和多线性,采用双线性回归方法。摘要/ abstract Dalam penelitian ini, akan diterapkan方法回归Komponen Utama Kernel (RKUK), dimana Komponen Utama merupakan kombinasi非线性变量独立千层真菌Kernel。我的意思是,在雅加达,我的家乡,我的家乡,我的家乡,我的家乡,我的家乡,我的家乡,我的家乡。Berdasarkan hasil penelitian, terbentuk 3 buah komponen utama kernel dengan模型predidiky = 76,3612 + 409,5373 KUK1 + 328,4967 KUK2 - 291,7757 KUK3 serta nilai koefisien determinasi (R2) sebesar 70,4640%。
{"title":"Penerapan Metode Regresi Komponen Utama Kernel untuk Prediksi Harga Rumah","authors":"M. Verdiansyah, Suwanda","doi":"10.29313/bcss.v3i2.9084","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.9084","url":null,"abstract":"Abstract. Linear regression analysis is a statistical method used to model the relationship between the dependent variable and one or more independent variables expressed in the form of a regression equation. The Ordinary Least Square (OLS) can be used to estimate regression parameters. The regression parameter estimator obtained will be good if the assumptions that apply to MKT are met. One of the assumptions that must be met is that there is a linear relationship between the dependent variable and each independent variable. If linearity is violated, kernels can be used. In addition, another assumption that must be met is the absence of multicollinearity between independent variables. An alternative method that can be used to overcome multicollinearity is using Principal Component Analysis. If the linearity and multicollinearity assumptions are violated, the Kernel Principal Component Regression method can be applied. This study will apply the Kernel Principal Component Regression (KPCR) method, where the principal component is a nonlinear combination of independent variables through a kernel function. This KPCR method is implemented to predict house prices in South Jakarta based on building area, land area, number of bedrooms, number of bathrooms, and number of car capacity in the garage. Based on the results of the study, 3 main components of the kernel were formed with a prediction model Y ̂ = 76,3612 + 409,5373 KUK1 + 328,4967 KUK2 – 291,7757 KUK3 and a coefficient of determination (R2) of 70.4640%. \u0000Abstrak. Analisis regresi linear merupakan suatu metode statistika yang digunakan untuk memodelkan hubungan antara variabel dependen dengan satu atau lebih variabel independen yang dinyatakan dalam bentuk persamaan regresi. Dalam menaksir parameter regresi dapat menggunakan Metode Kuadrat Terkecil (MKT). Penaksir parameter regresi yang diperoleh akan baik jika asumsi-asumsi yang berlaku untuk MKT dipenuhi. Salah satu asumsi yang harus dipenuhi adalah terdapat hubungan linear antara variabel dependen dan masing-masing variabel independen. Apabila linearitas terlanggar, dapat menggunakan kernel. Selain itu, asumsi lainnya yang harus terpenuhi adalah tidak adanya multikolinearitas antar variabel independen. Metode alternatif yang dapat digunakaan untuk mengatasi multikolinearitas adalah menggunakan Analisis Komponen Utama. Apabila asumsi linearitas dan multikolinearitas terlanggar, dapat diterapkan metode Regresi Komponen Utama Kernel. Dalam penelitian ini, akan diterapkan metode Regresi Komponen Utama Kernel (RKUK), dimana komponen utama merupakan kombinasi nonlinier dari variabel independen melalui fungsi kernel. Metode RKUK ini diimplementasikan untuk memprediksi harga rumah di Jakarta Selatan berdasarkan luas bangunan, luas tanah, jumlah kamar tidur, jumlah kamar mandi, dan jumlah kapasitas mobil dalam garasi. Berdasarkan hasil penelitian, terbentuk 3 buah komponen utama kernel dengan model prediksi Y ̂ = 76,3612 + 409,5373 KUK1 + 328,4967 KUK2","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"21 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"128367676","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstrak. Asuransi kendaraan bermotor adalah polis asuransi standar yang digunakan di Indonesia yang mencakup pertanggungan gabungan yaitu pertanggungan atas kendaraan bermotor itu sendiri dan pertanggungan tanggung jawab hukum kepada pihak ketiga. Salah satu hal yang perlu diperhatikan perusahaan asuransi sebagai lembaga penerima risiko adalah memodelkan data besar klaim. Distribusi yang cocok untuk memodelkan data besar klaim adalah distribusi kontinu yang non negatif, memiliki kemiringan yang positif, dan memiliki ekor yang tebal. Distribusi Lindley merupakan distribusi eksponensial campuran dan memiliki kriteria yang sesuai untuk pemodelan data besar klaim. Parameter yang ada ditaksir menggunakan metode kemungkinan maksimum. Pengujian kecocokan distribusi menggunakan uji Kolmogorov-Smirnov. Data yang digunakan merupakan data sekunder PT. X tahun 2019 yang terdiri dari data besar klaim pemegang polis asuransi kendaraan bermotor kategori 7 wilayah 2. Berdasarkan hasil penerapan distribusi Lindley untuk memodelkan data besar klaim asuransi kendaraan bermotor PT. X tahun 2019 dengan menggunakan uji Kolmogorov-Smirnov, dapat disimpulkan bahwa data besar klaim asuransi kendaraan bermotor PT. X tahun 2019 berasal dari populasi yang berdistribusi Lindley dengan nilai taksiran parameter distribusi Lindley sebesar θ=0,0000002995. Abstract. Motor vehicle insurance is a standard insurance policy used in Indonesia that includes combined coverage, namely coverage of the motor vehicle itself and legal liability coverage to third parties. One of the things that insurance companies need to pay attention to as risk-receiving institution is modeling the amount of the claim. A suitable distribution for modeling the amount of the claim is a continuous distribution that is non-negative, has a positive skew, and has a heavy tail. The Lindley distribution is a mixed exponential distribution and has criteria suitable for modeling the amount of the claim. The parameters were estimated using the maximum likelihood method. Testing the suitability of the distribution using the Kolmogorov-Smirnov test. The data used is secondary data of PT. X in 2019 which consists of data on large claims of motor vehicle insurance policyholders in category 7 region 2. Based on the results of the application of the Lindley distribution to model the 2019 PT. X motor vehicle insurance claim data using the Kolmogorov-Smirnov test, it can be concluded that the 2019 PT. X motor vehicle insurance claim data comes from a Lindley-distributed population with an estimated value of the Lindley distribution parameter of θ = 0.0000002995.
抽象。汽车保险是印度尼西亚使用的一种标准保险单,包括对汽车本身的综合责任和对第三方的法律责任。保险公司作为风险接收机构需要考虑的一件事是模拟大量的索赔数据。对大型数据进行微分的合适分配是一个非负的连续分布,斜率为正,尾巴为粗。Lindley的分布是一个组合的指数分布,其标准与大规模数据索赔建模的标准相符。评估参数使用最大可能的方法。用kolmogorov smirnov测试匹配分布。数据是2019年PT. X的次要数据,包括大量来自第7区机动车保险持有人的要求。根据应用大数据保险索赔的林德利分布来模拟机动车PT . X用Kolmogorov-Smirnov试验,2019年大数据可以得出结论,机动车保险索赔PT . X berdistribusi林德利的2019年来自人口林德利分布参数θ= 0.0000002995大预算的价值。抽象。汽车保险是在印尼使用的一种标准的保险政策,包括定期投保,namely对汽车的合法责任负责保险公司需要注意的一件事是,这一危险机构正在建构索赔的遗产。一个可靠的分配来调制索赔的分量是不断的分配,这不是消极的,有积极的正面,有沉重的尾巴。Lindley的分销是一个混合的分布区域,非常适合在索赔堆的模型上制作。parameters预计将使用最大的假药方法。用kolmogorov smirnov测试测试分发的设备。可用数据在2019年发布林德利(应用程序》改编自the results of distribution到2019《PT . X摩托车模型车辆保险数据要求用《Kolmogorov-Smirnov测试,它可以成为结论这就是2019 PT . X摩托车车辆保险要求数据来自a Lindley-distributed人口with an estimated林德利之价值0000002995 distribution参数θ= 0的。
{"title":"Penerapan Distribusi Lindley pada Data Besar Klaim Asuransi Kendaraan Bermotor di Indonesia","authors":"Puput Aryanti, Aceng Komarudin Mutaqin","doi":"10.29313/bcss.v3i2.8202","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8202","url":null,"abstract":"Abstrak. Asuransi kendaraan bermotor adalah polis asuransi standar yang digunakan di Indonesia yang mencakup pertanggungan gabungan yaitu pertanggungan atas kendaraan bermotor itu sendiri dan pertanggungan tanggung jawab hukum kepada pihak ketiga. Salah satu hal yang perlu diperhatikan perusahaan asuransi sebagai lembaga penerima risiko adalah memodelkan data besar klaim. Distribusi yang cocok untuk memodelkan data besar klaim adalah distribusi kontinu yang non negatif, memiliki kemiringan yang positif, dan memiliki ekor yang tebal. Distribusi Lindley merupakan distribusi eksponensial campuran dan memiliki kriteria yang sesuai untuk pemodelan data besar klaim. Parameter yang ada ditaksir menggunakan metode kemungkinan maksimum. Pengujian kecocokan distribusi menggunakan uji Kolmogorov-Smirnov. Data yang digunakan merupakan data sekunder PT. X tahun 2019 yang terdiri dari data besar klaim pemegang polis asuransi kendaraan bermotor kategori 7 wilayah 2. Berdasarkan hasil penerapan distribusi Lindley untuk memodelkan data besar klaim asuransi kendaraan bermotor PT. X tahun 2019 dengan menggunakan uji Kolmogorov-Smirnov, dapat disimpulkan bahwa data besar klaim asuransi kendaraan bermotor PT. X tahun 2019 berasal dari populasi yang berdistribusi Lindley dengan nilai taksiran parameter distribusi Lindley sebesar θ=0,0000002995. \u0000 \u0000Abstract. Motor vehicle insurance is a standard insurance policy used in Indonesia that includes combined coverage, namely coverage of the motor vehicle itself and legal liability coverage to third parties. One of the things that insurance companies need to pay attention to as risk-receiving institution is modeling the amount of the claim. A suitable distribution for modeling the amount of the claim is a continuous distribution that is non-negative, has a positive skew, and has a heavy tail. The Lindley distribution is a mixed exponential distribution and has criteria suitable for modeling the amount of the claim. The parameters were estimated using the maximum likelihood method. Testing the suitability of the distribution using the Kolmogorov-Smirnov test. The data used is secondary data of PT. X in 2019 which consists of data on large claims of motor vehicle insurance policyholders in category 7 region 2. Based on the results of the application of the Lindley distribution to model the 2019 PT. X motor vehicle insurance claim data using the Kolmogorov-Smirnov test, it can be concluded that the 2019 PT. X motor vehicle insurance claim data comes from a Lindley-distributed population with an estimated value of the Lindley distribution parameter of θ = 0.0000002995.","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"24 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116970116","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Regression analysis is one analysis that is widely used. Regression analysis is used to perform predictions and forecasts. Regression analysis can also be used to understand which independent variables can be related to the dependent variable, as well as to determine the form of the relationship. Multiple linear regression is a regression model that involves more than one independent variable and a dependent variable (response). For this reason, it is necessary to test the meaning of regression simultaneously. In addition, the determination of the confidence interval of response prediction must involve correlation among the dependent variables. In this thesis, the implementation of multivariate regression on weightlifting sports data will be discussed, namely squat or Squat weight modeling (Y 1), bench weight pressed or Bench (Y 2), weight lifted or Deadlift (Y3), over Age (Z1) and Body weight (Z2). From the model obtained, it can be useful to make confidence intervals from the response values of Squat (Y1), Bench (Y 2), Deadlift (Y3) based on certain age (Z1) and Body weight (Z2) values outside the analyzed sample. Because the data used are world championship results, the qualification standards above apply to world-level weightlifting events. For national level events, the standard can be lowered and for the provincial level, the standard can be lowered again lower than the national level. There is a linear relationship between the type of squat weight lift or Squat (Y 1), bench weight pressed or Bench (Y 2), weight lifted or Deadlift (Y3), over Age (Z1) and Body weight (Z2) which is significant at a real level of 5%. The effect of the Age (Z 1) variable on the type of Squat (Y1), Bench (Y 2), and Deadlift (Y2) is negative. The effect of variable Body Weight (Z 2) on the type of Squat (Y1), Bench (Y2), and Deadlift (Y3) is positive. From a 50% confidence interval, a response prediction value is obtained that can be used as a minimum standard to qualify for participation in weightlifting competitions. Abstrak. Analisis regresi adalah salah satu analisis yang luas pemakaiannya. Analisis regresi digunakan untuk melakukan prediksi dan ramalan. Analisis regresi juga dapat digunakan untuk memahami variabel – variabel bebas mana saja yang dapat berhubungan dengan variabel terikat, serta untuk mengetahui bentuk hubungan tersebut. Regresi linear berganda merupakan model regresi yang melibatkan lebih dari satu variabel independent dan sebuah variabel dependen (Respon). Untuk itu perlu dilakukan pengujian keberartian regresi secara simultan. Selain itu, penentuan selang kepercayaan prediksi respon harus melibatkan korelasi diantara variabel dependen. Dalam skripsi ini akan dibahas implementasi regresi multivariat pada data olah raga angkat berat yaitu pemodelan berat badan jongkok atau Squat (Y1), berat bangku yang ditekan atau Bench (Y2), beban yang diangkat atau Deadlift (Y3), atas Usia(Z1) dan Berat badan (Z2). Dari model yang diperoleh dapa
摘要回归分析是一种应用广泛的分析方法。回归分析用于进行预测和预测。回归分析还可以用来了解哪些自变量可以与因变量相关,以及确定关系的形式。多元线性回归是一种涉及多个自变量和一个因变量(响应)的回归模型。因此,有必要同时对回归的意义进行检验。此外,反应预测置信区间的确定必须涉及因变量之间的相关性。本文将讨论举重运动数据的多元回归实现,即深蹲或深蹲重量模型(Y 1)、卧推或卧推重量模型(Y 2)、举重或硬举重量模型(Y3)、年龄模型(Z1)和体重模型(Z2)。从所获得的模型中,可以根据分析样本外的特定年龄(Z1)和体重(Z2)值,从深蹲(Y1)、卧举(y2)、硬举(Y3)的响应值建立置信区间。由于使用的数据是世界锦标赛成绩,因此上述资格标准适用于世界级举重项目。对于国家级赛事,可以降低标准,对于省级赛事,可以再次降低标准,低于国家标准。深蹲举重(Y 1)、卧推举重(Y 2)、举重或硬举(Y3)、年龄(Z1)和体重(Z2)之间存在线性关系,在5%的实际水平上具有显著性。年龄(Z 1)变量对深蹲(Y1)、卧举(Y2)和硬举(Y2)类型的影响是负的。可变体重(Z 2)对深蹲(Y1)、卧举(Y2)和硬举(Y3)类型的影响是正的。从50%的置信区间得到一个反应预测值,可以作为参加举重比赛资格的最低标准。Abstrak。分析回归adalah salah状态分析yang luas pemakaiannya。分析回归分析与统计分析。分析回归juga dapat digunakan untuk memahami变量-变量bebas mansaja yang dapat berhubungan dengan变量terikat, serta untuk mengetahui bentuk hubungan tersebut。回归线性berganda merupakan模型回归杨melibatkan lebih dari状态变量独立但变量依赖(response)。这是一只企鹅,一只企鹅,一只小企鹅,一只小企鹅。Selain电联,penentuan selang kepercayaan prediksi响应harus melibatkan korelasi diantara variabel dependen。Dalam skripsi ini akan dibahas实现了多元数据的回归,包括raga angkat berat yitu peemodelan berat badan jongkok atau蹲下(Y1), berat bangku yang ditekan atau Bench (Y2), beban yang diangkat atau Deadlift (Y3), atas Usia(Z1)和berat badan (Z2)。在不同的样品阳淀分析中,采用了不同的阳淀模型,采用了不同的阳淀分析方法,采用了不同的阳淀分析方法,包括:深蹲(Y1)、深蹲(Y2)、深蹲(Y3)、深蹲(Y1)、深蹲(Y2)、深蹲(Y3)、深蹲(Z1)、深蹲(Z2)和深蹲(Z2)。Karena data yang digunakan adalah hasil kejuaraan dunia, maka standard kualifikasi data berlaku untuk peringand angkat berat tingkat dunia。Untuk event tingkat national . Untuk . cn . cn . cn . cn . cn . cn . cn . cn . cn . cnTerdapat hubungan linier antara jenis angkatan berat badan jongkok atau深蹲(Y1), berat bangku yang ditekan atau Bench (Y2), beban yang diangkat atau Deadlift (Y3), atas Usia(Z1) dan berat badan (Z2) yang signfikan pada taraf nyata 5%。Pengaruh变量Usia (Z1) padjenis angkatan深蹲(Y1),卧举(Y2),单举(Y2)阳虚负。鹏格罗变量:卧式八达杠(Z2)、蹲式八达杠(Y1)、卧式八达杠(Y2)、硬举式八达杠(Y3),阳气正。Dari selang keperkayan和50% diperolet nilai prediksi响应yang dapat dijadikan标准最小值untuk dapat lolos paada keikutsertaan和comppetisi angkat berat。
{"title":"Pengaplikasian Model Regresi Linier Berganda Multivariat terhadap Data Cabang Olahraga Angkat Berat","authors":"Azmy Rabah, Suwanda","doi":"10.29313/bcss.v3i2.8200","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8200","url":null,"abstract":"Abstract. Regression analysis is one analysis that is widely used. Regression analysis is used to perform predictions and forecasts. Regression analysis can also be used to understand which independent variables can be related to the dependent variable, as well as to determine the form of the relationship. Multiple linear regression is a regression model that involves more than one independent variable and a dependent variable (response). For this reason, it is necessary to test the meaning of regression simultaneously. In addition, the determination of the confidence interval of response prediction must involve correlation among the dependent variables. In this thesis, the implementation of multivariate regression on weightlifting sports data will be discussed, namely squat or Squat weight modeling (Y 1), bench weight pressed or Bench (Y 2), weight lifted or Deadlift (Y3), over Age (Z1) and Body weight (Z2). From the model obtained, it can be useful to make confidence intervals from the response values of Squat (Y1), Bench (Y 2), Deadlift (Y3) based on certain age (Z1) and Body weight (Z2) values outside the analyzed sample. Because the data used are world championship results, the qualification standards above apply to world-level weightlifting events. For national level events, the standard can be lowered and for the provincial level, the standard can be lowered again lower than the national level. There is a linear relationship between the type of squat weight lift or Squat (Y 1), bench weight pressed or Bench (Y 2), weight lifted or Deadlift (Y3), over Age (Z1) and Body weight (Z2) which is significant at a real level of 5%. The effect of the Age (Z 1) variable on the type of Squat (Y1), Bench (Y 2), and Deadlift (Y2) is negative. The effect of variable Body Weight (Z 2) on the type of Squat (Y1), Bench (Y2), and Deadlift (Y3) is positive. From a 50% confidence interval, a response prediction value is obtained that can be used as a minimum standard to qualify for participation in weightlifting competitions. \u0000Abstrak. Analisis regresi adalah salah satu analisis yang luas pemakaiannya. Analisis regresi digunakan untuk melakukan prediksi dan ramalan. Analisis regresi juga dapat digunakan untuk memahami variabel – variabel bebas mana saja yang dapat berhubungan dengan variabel terikat, serta untuk mengetahui bentuk hubungan tersebut. Regresi linear berganda merupakan model regresi yang melibatkan lebih dari satu variabel independent dan sebuah variabel dependen (Respon). Untuk itu perlu dilakukan pengujian keberartian regresi secara simultan. Selain itu, penentuan selang kepercayaan prediksi respon harus melibatkan korelasi diantara variabel dependen. Dalam skripsi ini akan dibahas implementasi regresi multivariat pada data olah raga angkat berat yaitu pemodelan berat badan jongkok atau Squat (Y1), berat bangku yang ditekan atau Bench (Y2), beban yang diangkat atau Deadlift (Y3), atas Usia(Z1) dan Berat badan (Z2). Dari model yang diperoleh dapa","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"23 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"114455714","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Bullying is an act of using power to hurt a person or group of people verbally, physically or psychologically so that the victim feels depressed, traumatized and helpless. In addition, bullying does affect an individual's self-confidence and interferes with the happiness of the subject or victim concerned. This study aims to determine whether there is an effect of bullying on the self-confidence of statistics students of the 2019 Islamic University of Bandung. The research method used is descriptive quantitative using a Likert scale and the number of samples taken is 100 respondents from Faculty of Mathematics and Natural Sciences Unisba class of 2019. The analysis technique used is regression analysis where the research results are significant regression coefficients or it can be said that bullying has a significant effect on Confidence of students of the Faculty of Mathematics and Natural Sciences, Bandung Islamic University class of 2019. Abstrak. Bullying adalah tindakan penggunaan kekuasaan untuk menyakiti seseorang atau sekelompok orang baik secara verbal, fisik maupun psikologis sehingga korban merasa tertekan, trauma dan tak berdaya. Selain itu bullying memang mempengaruhi kepercayaan diri seorang individu dan mengganggu kebahagiaan dari subjek atau korban yang bersangkutan. Penelitian ini bertujuan untuk mengetahui apakah terdapat pengaruh bullying terhadap kepercayaan diri mahasiswa statistika Angkatan 2019 Universitas Islam Bandung. Metode penelitian yang digunakan yaitu deskriptif kuantitatif dengan menggunakan skala likert dan jumlah sampel yang diambil yaitu sebanyak 100 responden dari Mahasiswa Fakultas FMIPA Unisba angkatan 2019. Teknis analisis yang digunakan yaitu analisis regresi dimana hasil penelitiannya yaitu koefisien regresi signifikan atau dapat dikatakan Bullying berpengaruh secara signifikan terhadap Kepercayaan diri Mahasiswa Fakultas MIPA Universitas Islam Bandung angkatan 2019.
摘要欺凌是一种使用权力在口头、身体或心理上伤害一个人或一群人,使受害者感到沮丧、创伤和无助的行为。此外,欺凌确实会影响个人的自信,干扰相关主体或受害者的幸福。本研究旨在确定欺凌是否对2019届万隆伊斯兰大学统计专业学生的自信心产生影响。所使用的研究方法是使用李克特量表进行描述性定量研究,样本数量为来自Unisba数学与自然科学学院2019届的100名受访者。使用的分析技术是回归分析,研究结果是显著的回归系数,或者可以说欺凌对万隆伊斯兰大学数学与自然科学学院2019级学生的信心有显著影响。Abstrak。霸凌adalah tindakan penggunaan kekuasaan untuk menyakiti seseorang atau sekelompok orang baik secara verbal, finisik maupun心理学sehinga korban merasa tertekan,创伤dan tak berdaya。Selain to欺凌mempenaruhi keperayaan diri seorang个人dan mengganggu kebahagiaan dari科目atau korban yang bersangkutan。Penelitian ini bertujuan untuk mengetahui apakah terdapat pengaruh欺凌terhadap kepercayaan diri mahasiswa Angkatan 2019伊斯兰大学万隆。方法penelitian yang digunakan yaitu deskriptif kuantitititian menggunakan skala likert dan jumlah sampel yang digunakan yaitu sebanyak 100受访者dari Mahasiswa Fakultas FMIPA Unisba angkatan 2019。马来西亚大学伊斯兰大学,马来西亚万隆大学,2019。
{"title":"Analisis Pengaruh Bullying terhadap Kepercayaan Diri Mahasiswa Fakultas Mipa Universitas Islam Bandung Angkatan 2019","authors":"Avin Rahmadian, Aceng Komarudin Mutaqin","doi":"10.29313/bcss.v3i2.8204","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8204","url":null,"abstract":"Abstract. Bullying is an act of using power to hurt a person or group of people verbally, physically or psychologically so that the victim feels depressed, traumatized and helpless. In addition, bullying does affect an individual's self-confidence and interferes with the happiness of the subject or victim concerned. This study aims to determine whether there is an effect of bullying on the self-confidence of statistics students of the 2019 Islamic University of Bandung. The research method used is descriptive quantitative using a Likert scale and the number of samples taken is 100 respondents from Faculty of Mathematics and Natural Sciences Unisba class of 2019. The analysis technique used is regression analysis where the research results are significant regression coefficients or it can be said that bullying has a significant effect on Confidence of students of the Faculty of Mathematics and Natural Sciences, Bandung Islamic University class of 2019. \u0000Abstrak. Bullying adalah tindakan penggunaan kekuasaan untuk menyakiti seseorang atau sekelompok orang baik secara verbal, fisik maupun psikologis sehingga korban merasa tertekan, trauma dan tak berdaya. Selain itu bullying memang mempengaruhi kepercayaan diri seorang individu dan mengganggu kebahagiaan dari subjek atau korban yang bersangkutan. Penelitian ini bertujuan untuk mengetahui apakah terdapat pengaruh bullying terhadap kepercayaan diri mahasiswa statistika Angkatan 2019 Universitas Islam Bandung. Metode penelitian yang digunakan yaitu deskriptif kuantitatif dengan menggunakan skala likert dan jumlah sampel yang diambil yaitu sebanyak 100 responden dari Mahasiswa Fakultas FMIPA Unisba angkatan 2019. Teknis analisis yang digunakan yaitu analisis regresi dimana hasil penelitiannya yaitu koefisien regresi signifikan atau dapat dikatakan Bullying berpengaruh secara signifikan terhadap Kepercayaan diri Mahasiswa Fakultas MIPA Universitas Islam Bandung angkatan 2019.","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"1 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"125891973","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. In general, if a response variable is in the form of a proportion with an open interval (0,1), a beta regression model can be used. In forming the beta regression model, it is necessary to include the average response simultaneously using the dispersion parameter, therefore it is necessary to reparameterize the density function of the beta distribution. The parameters of the beta regression model can be interpreted in the form of averages derived from the response variables, and when using the logit relationship function, these regression parameters are interpreted as odds ratios. The estimation parameter model uses the Maximum Likelihood Estimator (MLE) method, with a log-likelihood function where the estimation process can be solved numerically. This thesis will discuss the factors that cause neonatal death through parameter estimation and the application of data modeling on the proportion of neonatal mortality through a beta regression model. The data used comes from secondary data obtained from the West Java Provincial Health Office. The results of the research that was carried out using the Beta regression model showed that there was only one predictor variable that had a significant effect on the proportion of neonatal mortality, namely the number of cases of Low Birth Weight (LBW), where the highest proportion of cases was the highest out of every 27 districts/cities in West Java Province in 2020, namely Indramayu Regency and Garut Regency, while the lowest proportion of cases was Bekasi City and Tasikmalaya City. Abstrak. Pada umumnya jika suatu variabel respons yang berbentuk proporsi dengan selang terbuka (0,1) dapat menggunakan model regresi beta. Dalam membentuk model regresi beta perlu menyertakan rata-rata respons bersamaan menggunakan parameter dispersinya, oleh karena itu perlu dilakukan reparameterisasi dari fungsi densitas distribusi beta. Parameter model regresi beta dapat diinterpretasikan dalam bentuk rata-rata yang berasal dari variabel respons, serta saat menggunakan fungsi hubung logit, maka parameter regresi ini diinterpretasikan menjadi odds ratio. Penaksiran parameter model menggunakan metode Maximum Likelihood Estimator (MLE), dengan turunan fungsi log-likelihood dimana proses penaksirannya dapat diselesaikan secara numerik. Dalam skripsi ini akan membahas mengenai faktor-faktor penyebab kematian neonatal melalui penaksiran parameter dan penerapan dari pemodelan data proporsi angka kematian neonatal melalui model regresi beta. Data yang digunakan berasal dari data sekunder yang diperoleh dari Dinas Kesehatan Provinsi Jawa Barat. Dari hasil penelitian yang telah dilakukan menggunakan model regresi Beta menunjukkan bahwa hanya terdapat satu variabel prediktor yang berpengaruh secara signifikan terhadap proporsi angka kematian neonatal, yaitu banyaknya kasus Berat Badan Lahir Rendah (BBLR), dimana proporsi kasus tertinggi dari setiap 27 kabupaten/kota di Provinsi Jawa Barat tahun 2020 yaitu Kabupaten Indramayu
摘要。一般情况下,如果响应变量是开放区间(0,1)的比例形式,则可以使用beta回归模型。在形成beta回归模型时,需要同时使用弥散参数包含平均响应,因此需要对beta分布的密度函数进行重新参数化。beta回归模型的参数可以用响应变量的平均值来解释,当使用logit关系函数时,这些回归参数被解释为比值比。估计参数模型采用极大似然估计(MLE)方法,采用对数似然函数对估计过程进行数值求解。本文将通过参数估计来讨论导致新生儿死亡的因素,并通过beta回归模型对新生儿死亡率比例进行数据建模。所使用的数据来自西爪哇省卫生局获得的二手数据。研究的结果进行了使用β回归模型显示,只有一个预测变量,对新生儿死亡率的比例有显著的影响,即低出生体重的病例数(激光焊),比例最高的情况下最高每27个地区/城市2020年在西爪哇省,即Indramayu摄政和加鲁特摄政,病例的比例最低的是Bekasi城市和Tasikmalaya城市。Abstrak。Pada umumnya jika suatu变量响应yang berbentuk比例dengan selang terbuka (1,1) dapat menggunakan模型回归β。Dalam membentuk模型的回归系数β(回归系数β)与孟古纳坎参数分布的关系,oleh karena模型的回归系数β(回归系数β)与孟古纳坎参数分布的关系。参数模型回归β dapat diinterpretasikan dalam bentuk rata-rata yang berasal dari变量响应,serta saat menggunakan真菌hubung logit, maka参数回归i diinterpretasikan menjadi比值比。Penaksiran参数模型menggunakan方法极大似然估计器(MLE), dungan turunan真菌对数似然动态处理penaksiranya dapat diselesaikan secara数值。Dalam skripsi ini akan成员menmeni因子-因子penyebab kematian新生儿千层数penaksian参数danpenerapan千层数模型数据比例为angka kematian新生儿千层数模型回归β。数据yang digunakan berasal dari数据搜索yang diperoleh dari Dinas Kesehatan省爪哇巴拉。dalhasil penelitian yang telah dilakukan menggunakan模型回归Beta menunjukkan bahwa hanya terdapatatsatsatu变量预测因子yang berpengaruh secara signifikan terhadap proporsi angka kematian新生儿,yitu banyaknya kasus Berat Badan Lahir Rendah (BBLR), dimana proporsi kasus tertinggi Dari semana比例27 kabupaten/kota di Provinsi Jawa Barat tahun 2020 yitu kabupaten Indramayu dan kabupaten Garut, sedangkan untuk proporsi jumlah kasus terendah yitu kota Bekasi dan kota Tasikmalaya。
{"title":"Penerapan Model Regresi Beta pada Proporsi Angka Kematian Neontal Tingkat Kabupaten/Kota di Provinsi Jawa Barat Tahun 2020","authors":"Balqis Nabilah Khairunnisa, Nusar Hajarisman","doi":"10.29313/bcss.v3i2.7893","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.7893","url":null,"abstract":"Abstract. In general, if a response variable is in the form of a proportion with an open interval (0,1), a beta regression model can be used. In forming the beta regression model, it is necessary to include the average response simultaneously using the dispersion parameter, therefore it is necessary to reparameterize the density function of the beta distribution. The parameters of the beta regression model can be interpreted in the form of averages derived from the response variables, and when using the logit relationship function, these regression parameters are interpreted as odds ratios. The estimation parameter model uses the Maximum Likelihood Estimator (MLE) method, with a log-likelihood function where the estimation process can be solved numerically. This thesis will discuss the factors that cause neonatal death through parameter estimation and the application of data modeling on the proportion of neonatal mortality through a beta regression model. The data used comes from secondary data obtained from the West Java Provincial Health Office. The results of the research that was carried out using the Beta regression model showed that there was only one predictor variable that had a significant effect on the proportion of neonatal mortality, namely the number of cases of Low Birth Weight (LBW), where the highest proportion of cases was the highest out of every 27 districts/cities in West Java Province in 2020, namely Indramayu Regency and Garut Regency, while the lowest proportion of cases was Bekasi City and Tasikmalaya City. \u0000Abstrak. Pada umumnya jika suatu variabel respons yang berbentuk proporsi dengan selang terbuka (0,1) dapat menggunakan model regresi beta. Dalam membentuk model regresi beta perlu menyertakan rata-rata respons bersamaan menggunakan parameter dispersinya, oleh karena itu perlu dilakukan reparameterisasi dari fungsi densitas distribusi beta. Parameter model regresi beta dapat diinterpretasikan dalam bentuk rata-rata yang berasal dari variabel respons, serta saat menggunakan fungsi hubung logit, maka parameter regresi ini diinterpretasikan menjadi odds ratio. Penaksiran parameter model menggunakan metode Maximum Likelihood Estimator (MLE), dengan turunan fungsi log-likelihood dimana proses penaksirannya dapat diselesaikan secara numerik. Dalam skripsi ini akan membahas mengenai faktor-faktor penyebab kematian neonatal melalui penaksiran parameter dan penerapan dari pemodelan data proporsi angka kematian neonatal melalui model regresi beta. Data yang digunakan berasal dari data sekunder yang diperoleh dari Dinas Kesehatan Provinsi Jawa Barat. Dari hasil penelitian yang telah dilakukan menggunakan model regresi Beta menunjukkan bahwa hanya terdapat satu variabel prediktor yang berpengaruh secara signifikan terhadap proporsi angka kematian neonatal, yaitu banyaknya kasus Berat Badan Lahir Rendah (BBLR), dimana proporsi kasus tertinggi dari setiap 27 kabupaten/kota di Provinsi Jawa Barat tahun 2020 yaitu Kabupaten Indramayu ","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"18 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-07-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"121972070","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. The main problem in performing regression analysis is getting an estimate of the shape of the regression curve. There are several approaches in regression models, namely parametric, nonparametric and semiparametric regression models. The shape of the regression model depends on the curve . Non-parametric regression is a method to determine the pattern of the relationship between predictor variables and response variables whose function form is unknown. This is because there is no prior information about the shape of . B-Spline is one of the nonparametric regression methods. B-Spline is a regression model that has very specific statistical and visual interpretations such as data patterns that cannot be identified parametrically, besides that B-Spline is also able to handle smooth data characters. The best model is obtained by minimizing the Generalized Cross Validation (GCV) and the accuracy value. The data used in this study are the Labor Force Participation Rate and GRDP , and the Open Unemployment Rate as the response variable (Y). The modeling results show that with the third order (m = 3) with knot point is one, namely at the knot point and the number of knot points is three, namely at the point with a GCV value of and the coefficient of determination obtained is . Abstrak. Permasalahan utama dalam melakukan analisis regresi ialah mendapatkan taksiran bentuk kurva regresi. Terdapat beberapa pendekatan dalam model regresi, yaitu model regresi parametrik, nonparametrik dan semiparametrik. Bentuk model regresi tergantung pada kurva . Regresi nonparametrik merupakan suatu metode untuk mengetahui pola hubungan antara variabel prediktor dengan variabel respon yang tidak diketahui bentuk fungsinya. Hal ini karena sebelumnya tidak terdapat informasi tentang bentuk . B-Spline ialah salah satu metode regresi nonparametrik. B-Spline merupakan model regresi yang mempunyai interpretasi statistik dan visual sangat khusus seperti pola data yang tidak dapat diidentifikasi secara parametrik, disamping itu B-Spline juga mampu menangani karakter data yang mulus (smooth). Model terbaik didapat dengan meminimumkan Generalized Cross Validation (GCV) dan dari nilai akurasinya. Data yang digunakan pada penelitian ini adalah Tingkat Partisipasi Angkatan Kerja dan PDRB, dan Tingkat Pengangguran Terbuka (TPT) sebagai variabel respon . Hasil pemodelan menunjukkan bahwa dengan orde tiga dengan dengan titik knot adalah satu yaitu pada titik knot dan banyaknya titik knot adalah tiga yaitu pada titik dengan nilai GCV sebesar dan koefisien determinasi yang diperoleh sebesar .
摘要。进行回归分析的主要问题是对回归曲线的形状进行估计。回归模型有几种方法,即参数回归模型、非参数回归模型和半参数回归模型。回归模型的形状取决于曲线。非参数回归是确定函数形式未知的预测变量与响应变量之间关系模式的一种方法。这是因为没有关于形状的先验信息。b样条是一种非参数回归方法。b样条是一种回归模型,具有非常具体的统计和可视化解释,例如无法参数化识别的数据模式,此外b样条还能够处理平滑的数据字符。通过最小化广义交叉验证(GCV)和精度值,得到最优模型。本研究使用的数据为劳动力参与率和GRDP,以开放失业率作为响应变量(Y)。建模结果表明,当三阶(m = 3)的结点为1时,即在结点处,结点个数为3,即在GCV值为的点处,得到的决定系数为。Abstrak。回归分析:回归分析,回归分析,回归分析。Terdapat beberapa pendekatan dalam模型回归,yaitu模型回归参数化,非参数化和半参数化。本图克模型回归分析。回归非参数merupakan suatu方法,untuk mengetahui pola hubungan antara变量预测器,dengan变量响应,yang tidak diketahui bentuk真菌。Hal ini karena sebelumnya tdatapat informastentenbentuk。非参数的b样条回归方法。b样条merupakan模型回归yang mempunyai解释统计,但视觉sangat khusus seperti pola数据yang tidak dapat diidentififikasi secara参数,disamp为b样条juga mampu menangani karakter数据yang mulus (smooth)。基于广义交叉验证(GCV)的模型分析[j]。数据yang digunakan pada penelitian ini adalah Tingkat Partisipasi Angkatan Kerja dan PDRB, dan Tingkat Pengangguran Terbuka (TPT) sebagai变量响应。Hasil pemodelan menunjukkan bahwa dengan秩序,秩序,秩序,秩序,秩序,秩序,秩序,秩序,秩序,秩序,秩序,秩序,秩序,秩序,秩序,秩序,秩序
{"title":"Penerapan Regresi Nonparametrik B-Spline pada Model Tingkat Pengangguran Terbuka Berdasarkan Tingkat Partisipasi Angkatan Kerja dan PDRB di Provinsi Jawa Barat","authors":"Putri Ratna Wulan, Nur Azizah komara Rifai","doi":"10.29313/bcss.v3i2.8095","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8095","url":null,"abstract":"Abstract. The main problem in performing regression analysis is getting an estimate of the shape of the regression curve. There are several approaches in regression models, namely parametric, nonparametric and semiparametric regression models. The shape of the regression model depends on the curve . Non-parametric regression is a method to determine the pattern of the relationship between predictor variables and response variables whose function form is unknown. This is because there is no prior information about the shape of . B-Spline is one of the nonparametric regression methods. B-Spline is a regression model that has very specific statistical and visual interpretations such as data patterns that cannot be identified parametrically, besides that B-Spline is also able to handle smooth data characters. The best model is obtained by minimizing the Generalized Cross Validation (GCV) and the accuracy value. The data used in this study are the Labor Force Participation Rate and GRDP , and the Open Unemployment Rate as the response variable (Y). The modeling results show that with the third order (m = 3) with knot point is one, namely at the knot point and the number of knot points is three, namely at the point with a GCV value of and the coefficient of determination obtained is . \u0000Abstrak. Permasalahan utama dalam melakukan analisis regresi ialah mendapatkan taksiran bentuk kurva regresi. Terdapat beberapa pendekatan dalam model regresi, yaitu model regresi parametrik, nonparametrik dan semiparametrik. Bentuk model regresi tergantung pada kurva . Regresi nonparametrik merupakan suatu metode untuk mengetahui pola hubungan antara variabel prediktor dengan variabel respon yang tidak diketahui bentuk fungsinya. Hal ini karena sebelumnya tidak terdapat informasi tentang bentuk . B-Spline ialah salah satu metode regresi nonparametrik. B-Spline merupakan model regresi yang mempunyai interpretasi statistik dan visual sangat khusus seperti pola data yang tidak dapat diidentifikasi secara parametrik, disamping itu B-Spline juga mampu menangani karakter data yang mulus (smooth). Model terbaik didapat dengan meminimumkan Generalized Cross Validation (GCV) dan dari nilai akurasinya. Data yang digunakan pada penelitian ini adalah Tingkat Partisipasi Angkatan Kerja dan PDRB, dan Tingkat Pengangguran Terbuka (TPT) sebagai variabel respon . Hasil pemodelan menunjukkan bahwa dengan orde tiga dengan dengan titik knot adalah satu yaitu pada titik knot dan banyaknya titik knot adalah tiga yaitu pada titik dengan nilai GCV sebesar dan koefisien determinasi yang diperoleh sebesar .","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"2 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-07-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116642849","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Poisson regression is used to analyze the relationship between predictor variables and response variables in the form of discrete data. In Poisson regression, one of the problems often faced is that the response has more than 50% zero data (zero inflation). So, the regression model to overcome the problem where the data contains too many zero values in discrete data and Poisson distribution is the Zero Inflated Poisson (ZIP) regression model. The purpose of this study is to obtain the application of the Zero-Inflated Poisson regression model to infant mortality cases in Bandung City in 2020. The data used in this study contains 80 observations based on UPT puskesmas in Bandung City with infant mortality data in Bandung city in 2020 and the factors that are thought to influence it. Parameter estimation of the ZIP regression model was carried out using the Maximum Likelihood Estimation (MLE) method and solved using the Expectation-Maximization (EM) algorithm, followed by testing the significance of the model using the likelihood ratio test and testing the significance of the parameters with the Wald test. From the results of hypothesis testing using a real level of 5%, the variable that affects infant mortality cases in the Poisson State model is unhealthy housing, while the variable that affects the chance of infant mortality cases being zero in the Zero State model is low birth weight. Abstrak. Regresi Poisson digunakan untuk menganalisis hubungan antara variabel prediktor dengan variabel respon yang berupa data diskrit. Pada regresi poisson salah satu permasalahan yang sering dihadapi yaitu responnya mempunyai data nol yang lebih dari 50% (zero inflation). Sehingga, model regresi untuk mengatasi masalah di mana data mengandung terlalu banyak nilai nol pada data diskrit dan berdistribusi Poisson adalah model regresi Zero Inflated Poisson (ZIP). Tujuan dari penelitian ini yaitu memperoleh penerapan model regresi Zero-Inflated Poisson pada kasus kematian bayi di Kota Bandung tahun 2020. Data yang digunakan dalam penelitian ini berisi 80 pengamatan berdasarkan UPT puskesmas di Kota Bandung dengan data angka kematian bayi di kota Bandung pada tahun 2020 beserta faktor-faktor yang diduga mempengaruhinya. Penaksiran parameter model regresi ZIP dilakukan dengan metode Maximum Likelihood Estimation (MLE) dan diselesaikan menggunakan algoritma Ekspektasi-Maksimalisasi (EM), dilanjutkan dengan pengujian signifikansi model dengan menggunakan likelihood ratio test dan pengujian signifikansi parameter dengan uji Wald. Dari hasil pengujian hipotesis menggunakan taraf nyata sebesar 5% variabel yang mempengaruhi kasus kematian bayi pada model Poisson State yaitu rumah tidak sehat, sedangkan variabel yang mempengaruhi peluang kasus kematian bayi bernilai nol pada model Zero State yaitu berat badan bayi lahir rendah.
摘要泊松回归以离散数据的形式分析预测变量和响应变量之间的关系。在泊松回归中,经常面临的一个问题是响应中有超过50%的零数据(零通货膨胀)。因此,克服离散数据和泊松分布中数据包含太多零值的回归模型是零膨胀泊松(zero Inflated Poisson, ZIP)回归模型。本研究的目的是获得零膨胀泊松回归模型在万隆市2020年婴儿死亡率病例中的应用。本研究中使用的数据包含80个基于万隆市UPT puskesmas的观察结果,其中包含万隆市2020年婴儿死亡率数据以及被认为影响它的因素。ZIP回归模型的参数估计采用最大似然估计(Maximum Likelihood estimation, MLE)方法,求解采用期望最大化(Expectation-Maximization, EM)算法,然后采用似然比检验检验模型的显著性,采用Wald检验检验参数的显著性。从使用5%实际水平的假设检验结果来看,在泊松状态模型中影响婴儿死亡率病例的变量是不健康的住房,而在零状态模型中影响婴儿死亡率病例为零的机会的变量是低出生体重。Abstrak。Regresi泊松digunakan为她menganalisis hubungan安塔拉variabel prediktor dengan variabel响应杨diskrit berupa数据。帕达回归poisson salah satu permasalahan yang服务dihadapi yaitya响应mempunyya数据,杨利比达50%(零通货膨胀)。sehinga,模型回归,untuk mengatasi masalah数据,mengandung terlalu banyak nilai数据,diskrddan berdistribution busi Poisson数据回归,零膨胀泊松(ZIP)模型回归。基于零膨胀泊松模型的模型回归分析[j] .四川大学学报(自然科学版),2020。数据yang digunakan dalam penelitian ini berisi 80 pengamatan berdasarkan UPT puskesmas di Kota万隆邓安数据angka kematian bayi di Kota万隆padtahun 2020 beserta factor - factor for yang diduga mempengaruhinya。Penaksiran参数模型回归ZIP dilakukan dengan方法最大似然估计(MLE)算法、Ekspektasi-Maksimalisasi (EM)算法、dilanjutkan dengan dengan menggunakan模型、dengan menggunakan似然比检验、dengkan dengan uji Wald参数。达里哈西企鹅的hipoesis menggunakan taraf nyata sebesar 5%变量yang mempengaruhi kasus kematian bayi padada模型泊松状态yitu rumah tidak sehat, sedangkan变量yang mempengaruhi peluang kasus kematian bayi bernilai nol padada模型零状态yitu berat badan bayi lahir rendah。
{"title":"Penerapan Model Regresi Zero-Inflated Poisson pada Kasus Kematian Bayi di Kota Bandung Tahun 2020","authors":"Nanda Shofia Nur Ihsan, Nusar Hajarisman","doi":"10.29313/bcss.v3i2.8042","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8042","url":null,"abstract":"Abstract. Poisson regression is used to analyze the relationship between predictor variables and response variables in the form of discrete data. In Poisson regression, one of the problems often faced is that the response has more than 50% zero data (zero inflation). So, the regression model to overcome the problem where the data contains too many zero values in discrete data and Poisson distribution is the Zero Inflated Poisson (ZIP) regression model. The purpose of this study is to obtain the application of the Zero-Inflated Poisson regression model to infant mortality cases in Bandung City in 2020. The data used in this study contains 80 observations based on UPT puskesmas in Bandung City with infant mortality data in Bandung city in 2020 and the factors that are thought to influence it. Parameter estimation of the ZIP regression model was carried out using the Maximum Likelihood Estimation (MLE) method and solved using the Expectation-Maximization (EM) algorithm, followed by testing the significance of the model using the likelihood ratio test and testing the significance of the parameters with the Wald test. From the results of hypothesis testing using a real level of 5%, the variable that affects infant mortality cases in the Poisson State model is unhealthy housing, while the variable that affects the chance of infant mortality cases being zero in the Zero State model is low birth weight. \u0000Abstrak. Regresi Poisson digunakan untuk menganalisis hubungan antara variabel prediktor dengan variabel respon yang berupa data diskrit. Pada regresi poisson salah satu permasalahan yang sering dihadapi yaitu responnya mempunyai data nol yang lebih dari 50% (zero inflation). Sehingga, model regresi untuk mengatasi masalah di mana data mengandung terlalu banyak nilai nol pada data diskrit dan berdistribusi Poisson adalah model regresi Zero Inflated Poisson (ZIP). Tujuan dari penelitian ini yaitu memperoleh penerapan model regresi Zero-Inflated Poisson pada kasus kematian bayi di Kota Bandung tahun 2020. Data yang digunakan dalam penelitian ini berisi 80 pengamatan berdasarkan UPT puskesmas di Kota Bandung dengan data angka kematian bayi di kota Bandung pada tahun 2020 beserta faktor-faktor yang diduga mempengaruhinya. Penaksiran parameter model regresi ZIP dilakukan dengan metode Maximum Likelihood Estimation (MLE) dan diselesaikan menggunakan algoritma Ekspektasi-Maksimalisasi (EM), dilanjutkan dengan pengujian signifikansi model dengan menggunakan likelihood ratio test dan pengujian signifikansi parameter dengan uji Wald. Dari hasil pengujian hipotesis menggunakan taraf nyata sebesar 5% variabel yang mempengaruhi kasus kematian bayi pada model Poisson State yaitu rumah tidak sehat, sedangkan variabel yang mempengaruhi peluang kasus kematian bayi bernilai nol pada model Zero State yaitu berat badan bayi lahir rendah.","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"54 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-07-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123247922","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}