Abstract. The Fuzzy Time Series method was first developed by Song and Chissom in 1993 which is a data forecasting method using the concept of fuzzy sets as the basis for calculation, the forecasting system by capturing patterns from past data is then used to project future data. In 1996, Chen found that the model had a poor error rate so he refined the model. Then in 2009, Lee found a model better than Chen's model with the least error rate. There are several schools that have an increasing or decreasing number of prospective students, as well as at SMA Negeri 1 Senayang. The purpose of this study was to obtain the results of forecasting the number of enrollments of SMA Negeri 1 Senayang students for the next period using Lee's Fuzzy Time Series model with sturgess rules and calculating the error rate of forecasting results. This study used data on the number of enrollments of SMA Negeri 1 Senayang students for the period 2002/2003 to 2022/2023 as many as 21 data. The forecasting results for the 2023/2024 period using Lee's Fuzzy Time Series model are 48 students with a forecasting result error rate of 13.9883 or 14% with good forecasting model criteria and can be used for forecasting the next period. Abstrak. Metode Fuzzy Time Series pertama kali dikembangkan oleh Song dan Chissom pada tahun 1993 yang merupakan metode peramalan data menggunakan konsep himpunan fuzzy sebagai dasar perhitungan, sistem peramalannya dengan menangkap pola dari data masa lampau kemudian digunakan untuk memproyeksi data yang akan datang. Pada tahun 1996, Chen menemukan bahwa model tersebut mempunyai tingkat kesalahan yang kurang baik sehingga ia menyempurnakan modelnya. Kemudian tahun 2009, Lee menemukan model yang lebih baik dari model Chen dengan tingkat kesalahan paling kecil. Terdapat beberapa sekolah yang mempunyai jumlah calon siswa yang mengalami peningkatan maupun penurunan, begitu pun di SMA Negeri 1 Senayang. Tujuan penelitian ini adalah mendapatkan hasil peramalan jumlah pendaftaran siswa SMA Negeri 1 Senayang untuk satu periode berikutnya menggunakan Fuzzy Time Series model Lee dengan aturan sturgess serta menghitung tingkat kesalahan hasil peramalan. Penelitian ini menggunakan data jumlah pendaftaran siswa SMA Negeri 1 Senayang periode 2002/2003 sampai 2022/2023 sebanyak 21 data. Hasil peramalan untuk periode 2023/2024 dengan menggunakan Fuzzy Time Series model Lee yaitu sebesar 48 siswa dengan tingkat kesalahan hasil peramalan sebesar 13.9883 atau 14% dengan kriteria model peramalan baik dan dapat digunakan untuk peramalan periode berikutnya.
摘要模糊时间序列法由Song和Chissom于1993年首次提出,是一种以模糊集概念为计算基础的数据预测方法,通过从过去数据中捕获模式的预测系统,然后用于预测未来数据。1996年,陈发现该模型的错误率很低,于是他对模型进行了改进。然后在2009年,Lee发现了一个比Chen的模型更好、错误率最小的模型。有几所学校的未来学生人数在增加或减少,包括SMA Negeri 1 Senayang。本研究的目的是利用具有应力规则的Lee's模糊时间序列模型预测SMA Negeri 1 Senayang学生下一时期的入学人数,并计算预测结果的错误率。本研究使用了2002/2003年至2022/2023年期间SMA Negeri 1 Senayang学生入学人数的数据多达21个数据。使用Lee的模糊时间序列模型预测2023/2024年期间的结果为48名学生,预测结果错误率为13.9883或14%,预测模型标准良好,可用于下一时期的预测。Abstrak。方法模糊时间序列perama kali dikembangkan oleh Song dan Chissom padtahun 1993 yang merupakan方法peramalan数据menggunakan konsep hinimpan模糊sebagai dasar perhitungan系统peramalannya dengan menangkap pola dari数据masa lampau kemudian digunakan untuk memproyeksi数据yang akan datang。帕达胡1996年,陈美木坎巴瓦模型,但孟普尼廷卡特kesalahan杨kurang baik seingga孟普尼坎模型。Kemudian tahun 2009, Lee menemukan模型yang lebih baik dari模型Chen dengan tingkat kesalahan paling kecil。Terdapat beberapa sekolah yang mempunyai jumlah calon siswa yang mengalami peningkatan maupun penurunan, begitu pun di SMA Negeri 1 Senayang。图juan penelitian ini adalah mendapatkan hasil peramalan jumlah pendaftaran siswa SMA Negeri 1 Senayang untuk satu周期berikutnya menggunakan模糊时间序列模型Lee dengan aturan sturgess serta menghitung tingkat kesalahan hasil peramalan。Penelitian ini menggunakan数据jumlah pendaftaran siswa SMA Negeri 1 Senayang期间2002/2003年sampai 2022/2023年sebanyak 21数据。Hasil peramalan untuk周期2023/2024 dengan menggunakan模糊时间序列模型Lee yitu sebesar 48 siswa dengan tingkat kesalahan Hasil peramalan sebesar 13.9883 atau 14% dengan标准模型peramalan baik dan dapat digunakan untuk peramalan周期berikutnya。
{"title":"Penerapan Metode Fuzzy Time Series Model Lee pada Peramalan Jumlah Pendaftaran Siswa SMA Negeri 1 Senayang Kepulauan Riau","authors":"Regina Maulisya, Nur Azizah komara Rifai","doi":"10.29313/bcss.v3i2.9303","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.9303","url":null,"abstract":"Abstract. The Fuzzy Time Series method was first developed by Song and Chissom in 1993 which is a data forecasting method using the concept of fuzzy sets as the basis for calculation, the forecasting system by capturing patterns from past data is then used to project future data. In 1996, Chen found that the model had a poor error rate so he refined the model. Then in 2009, Lee found a model better than Chen's model with the least error rate. There are several schools that have an increasing or decreasing number of prospective students, as well as at SMA Negeri 1 Senayang. The purpose of this study was to obtain the results of forecasting the number of enrollments of SMA Negeri 1 Senayang students for the next period using Lee's Fuzzy Time Series model with sturgess rules and calculating the error rate of forecasting results. This study used data on the number of enrollments of SMA Negeri 1 Senayang students for the period 2002/2003 to 2022/2023 as many as 21 data. The forecasting results for the 2023/2024 period using Lee's Fuzzy Time Series model are 48 students with a forecasting result error rate of 13.9883 or 14% with good forecasting model criteria and can be used for forecasting the next period. \u0000Abstrak. Metode Fuzzy Time Series pertama kali dikembangkan oleh Song dan Chissom pada tahun 1993 yang merupakan metode peramalan data menggunakan konsep himpunan fuzzy sebagai dasar perhitungan, sistem peramalannya dengan menangkap pola dari data masa lampau kemudian digunakan untuk memproyeksi data yang akan datang. Pada tahun 1996, Chen menemukan bahwa model tersebut mempunyai tingkat kesalahan yang kurang baik sehingga ia menyempurnakan modelnya. Kemudian tahun 2009, Lee menemukan model yang lebih baik dari model Chen dengan tingkat kesalahan paling kecil. Terdapat beberapa sekolah yang mempunyai jumlah calon siswa yang mengalami peningkatan maupun penurunan, begitu pun di SMA Negeri 1 Senayang. Tujuan penelitian ini adalah mendapatkan hasil peramalan jumlah pendaftaran siswa SMA Negeri 1 Senayang untuk satu periode berikutnya menggunakan Fuzzy Time Series model Lee dengan aturan sturgess serta menghitung tingkat kesalahan hasil peramalan. Penelitian ini menggunakan data jumlah pendaftaran siswa SMA Negeri 1 Senayang periode 2002/2003 sampai 2022/2023 sebanyak 21 data. Hasil peramalan untuk periode 2023/2024 dengan menggunakan Fuzzy Time Series model Lee yaitu sebesar 48 siswa dengan tingkat kesalahan hasil peramalan sebesar 13.9883 atau 14% dengan kriteria model peramalan baik dan dapat digunakan untuk peramalan periode berikutnya.","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"140 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122598602","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Earthquake is a natural phenomenon that is not known when it will occur because measurements are not made in all locations. With these limitations, we need a method that can predict the level of earthquake strength at several points where measurements are not carried out, for example by the spatial interpolation method. There are several methods used to perform spatial interpolation, one of which is the ordinary kriging method. Ordinary kriging (OK) utilizes spatial values at sample locations and variograms that show correlations between spatial points to predict values at non-sample locations where the predicted value depends on their proximity to the sample locations. This thesis discusses the development of the ordinary kriging method on regional earthquake magnitudes and the b-value Gutenberg Richter variable using the West Java earthquake catalog. Regional magnitude variables and b-values were used to model the spatial correlation via a spherical variogram. Variogram parameters were estimated using the least squares method. The results of the Ordinary Kriging assessment of an area show that the level of rock fragility (b-value) is quite high, namely 6.523 which illustrates that the area has low stress accumulation or it can be said that a high b-value has experienced a large-scale earthquake so that only energy left that is capable of producing small earthquakes. Abstrak. Gempa bumi merupakan fenomena alam yang tidak seorang pun mengetahui kapan terjadinya karena pengukuran tidak dilakukan di semua lokasi. Dengan keterbatasan tersebut, diperlukan suatu metode yang dapat memprediksi tingkat kekuatan gempa di beberapa titik yang tidak dilakukan pengukuran, misalnya dengan metode interpolasi spasial. Terdapat beberapa metode yang digunakan untuk melakukan interpolasi spasial, salah satunya metode ordinary kriging. Ordinary kriging (OK) memanfaatkan nilai spasial pada lokasi tersampel dan variogram yang menunjukkan korelasi antar titik spasial untuk memprediksi nilai pada lokasi yang tidak tersampel yang mana nilai prediksi tersebut tergantung pada kedekatannya terhadap lokasi tersampel. Skripsi ini membahas pengembangan metode ordinary kriging pada peubah teregioanal magnitude gempa dan b-value Gutenberg Richter menggunakan katalog gempa Jawa Barat. Peubah teregional magnitude dan nilai-b digunakan untuk memodelkan korelasi spasial melalui variogram spherical. Parameter variogram diestimasi menggunakan metode kuadrat terkecil. Hasil dari penaksiran Ordinary Kriging dari suatu wilayah menunjukkan bahwa nilai tingkat kerapuhan batuan (b-value) cukup tinggi yaitu sebesar 6.523, menggambarkan bahwa daerah tersebut memiliki akumulasi stress yang rendah atau dapat dikatakan nilai b-value yang tinggi pernah terjadi gempa bumi dengan skala besar sehingga hanya tersisa energi yang mampu menghasilkan gempa kecil.
摘要。地震是一种自然现象,我们不知道它什么时候会发生,因为并不是在所有地方都进行了测量。由于这些限制,我们需要一种方法,可以在没有进行测量的几个点上预测地震强度水平,例如通过空间插值方法。进行空间插值有几种方法,其中一种是普通的克里格法。普通克里格(OK)利用样本位置的空间值和显示空间点之间相关性的变异图来预测非样本位置的值,其中预测值取决于它们与样本位置的接近程度。本文利用西爪哇地震目录,讨论了区域地震震级的普通克里格方法和b值古腾堡里希特变量的发展。区域幅度变量和b值通过球面变异图来模拟空间相关性。方差函数参数用最小二乘法估计。普通克里格评价结果表明,某地区的岩石脆性等级(b值)较高,为6.523,说明该地区应力积累较低,或者可以说高b值的地区经历了大地震,只剩下能产生小地震的能量。Abstrak。企鹅的习性,企鹅的习性,企鹅的习性,企鹅的习性。企鹅,企鹅,企鹅,企鹅,企鹅,企鹅,企鹅,企鹅,企鹅。Terdapat beberapa方法yang digunakan untuk melakukan interpolasi special, salah satunya方法ordinary kriging。普通kriging (OK) memanfaatkan nilai特殊pada lokasi tersampel和变异图yang menunjukkan korelasi antar titik特殊untuk memprediksi nilai pada lokasi yang tidak tersampel yang mana nilai prediksi terse但tergantong pada kedekatannya terhadap lokasi tersampel。Skripsi ini成员有pengembangan方法,普通克里金帕达佩巴,区域震级genpa和b值Gutenberg Richter menggunakan目录genpa Jawa Barat。Peubah区域震级dan nilae -b digunakan untuk memodelkan korelasi空间千元变差球。蒙古纳坎方法的参数变异函数估计。Hasil dari penaksiran an Ordinary Kriging dari suatu wilayah menunjukkan bahwa daerah terkawa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa awa
{"title":"Ordinary Kriging Magnitude dan Nilai B-Value Gutenberg-Richterpada Katalog Gempa Bumi Jawa Barat","authors":"Salsabila Nur Fitriana, Sutawanir Darwis","doi":"10.29313/bcss.v3i2.8385","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8385","url":null,"abstract":"Abstract. Earthquake is a natural phenomenon that is not known when it will occur because measurements are not made in all locations. With these limitations, we need a method that can predict the level of earthquake strength at several points where measurements are not carried out, for example by the spatial interpolation method. There are several methods used to perform spatial interpolation, one of which is the ordinary kriging method. Ordinary kriging (OK) utilizes spatial values at sample locations and variograms that show correlations between spatial points to predict values at non-sample locations where the predicted value depends on their proximity to the sample locations. This thesis discusses the development of the ordinary kriging method on regional earthquake magnitudes and the b-value Gutenberg Richter variable using the West Java earthquake catalog. Regional magnitude variables and b-values were used to model the spatial correlation via a spherical variogram. Variogram parameters were estimated using the least squares method. The results of the Ordinary Kriging assessment of an area show that the level of rock fragility (b-value) is quite high, namely 6.523 which illustrates that the area has low stress accumulation or it can be said that a high b-value has experienced a large-scale earthquake so that only energy left that is capable of producing small earthquakes. \u0000Abstrak. Gempa bumi merupakan fenomena alam yang tidak seorang pun mengetahui kapan terjadinya karena pengukuran tidak dilakukan di semua lokasi. Dengan keterbatasan tersebut, diperlukan suatu metode yang dapat memprediksi tingkat kekuatan gempa di beberapa titik yang tidak dilakukan pengukuran, misalnya dengan metode interpolasi spasial. Terdapat beberapa metode yang digunakan untuk melakukan interpolasi spasial, salah satunya metode ordinary kriging. Ordinary kriging (OK) memanfaatkan nilai spasial pada lokasi tersampel dan variogram yang menunjukkan korelasi antar titik spasial untuk memprediksi nilai pada lokasi yang tidak tersampel yang mana nilai prediksi tersebut tergantung pada kedekatannya terhadap lokasi tersampel. Skripsi ini membahas pengembangan metode ordinary kriging pada peubah teregioanal magnitude gempa dan b-value Gutenberg Richter menggunakan katalog gempa Jawa Barat. Peubah teregional magnitude dan nilai-b digunakan untuk memodelkan korelasi spasial melalui variogram spherical. Parameter variogram diestimasi menggunakan metode kuadrat terkecil. Hasil dari penaksiran Ordinary Kriging dari suatu wilayah menunjukkan bahwa nilai tingkat kerapuhan batuan (b-value) cukup tinggi yaitu sebesar 6.523, menggambarkan bahwa daerah tersebut memiliki akumulasi stress yang rendah atau dapat dikatakan nilai b-value yang tinggi pernah terjadi gempa bumi dengan skala besar sehingga hanya tersisa energi yang mampu menghasilkan gempa kecil.","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"46 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"133982493","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Ridge regression is one of the methods used to stabilize the value of the regression coefficient caused by multicollinearity. In ridge regression, to reduce the impact of multicollinearity is carried out by adding ridge parameter c to the hat matrix. This ridge parameter makes the regression coefficients have a smaller variance than the least squares method estimator variance. However, the ridge estimates are biased. Thus, hypothesis testing using the usual method cannot be applied to the coefficients ridge regression. Therefore Bae, et al., (2014) developed a method for testing the hypothesis of the coefficients of ridge regression. This thesis aims to apply this method to the gross regional domestic product data for West Java province in 2022. Based on the results of the research, it shows that there is a multicollinearity problem in the data, so it is modelLed using ridge regression. it was obtained The ridge regression model : . From the results of testing the hypothesis, it can be concluded that the independent variables, namely local original income (X1), general allocation funds (X2), profit sharing funds (X3), regional expenditures (X4) and labor (X5) together have a significant effect on the PDRB (Y) of West Java Province in 2022. The ridge regression model is returned to the original model . Abstract. Ridge regression is one of the methods used to stabilize the value of the regression coefficient caused by multicollinearity. In ridge regression, to reduce the impact of multicollinearity is carried out by adding ridge parameter c to the hat matrix. This ridge parameter makes the regression coefficients have a smaller variance than the least squares method estimator variance. However, the ridge estimates are biased. Thus, hypothesis testing using the usual method cannot be applied to the coefficients ridge regression. Therefore Bae, et al., (2014) developed a method for testing the hypothesis of the coefficients of ridge regression. This thesis aims to apply this method to the gross regional domestic product data for West Java province in 2022. Based on the results of the research, it shows that there is a multicollinearity problem in the data, so it is modelLed using ridge regression. it was obtained The ridge regression model : . From the results of testing the hypothesis, it can be concluded that the independent variables, namely local original income (X1), general allocation funds (X2), profit sharing funds (X3), regional expenditures (X4) and labor (X5) together have a significant effect on the PDRB (Y) of West Java Province in 2022. The ridge regression model is returned to the original model .
{"title":"Pengujian pada Regresi Ridge dan Penerapannya terhadap Data Produk Domestik Regional Bruto Provinsi Jawa Barat","authors":"Weni Nuryati, Suliadi Suliadi","doi":"10.29313/bcss.v3i2.8424","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8424","url":null,"abstract":"Abstract. Ridge regression is one of the methods used to stabilize the value of the regression coefficient caused by multicollinearity. In ridge regression, to reduce the impact of multicollinearity is carried out by adding ridge parameter c to the hat matrix. This ridge parameter makes the regression coefficients have a smaller variance than the least squares method estimator variance. However, the ridge estimates are biased. Thus, hypothesis testing using the usual method cannot be applied to the coefficients ridge regression. Therefore Bae, et al., (2014) developed a method for testing the hypothesis of the coefficients of ridge regression. This thesis aims to apply this method to the gross regional domestic product data for West Java province in 2022. Based on the results of the research, it shows that there is a multicollinearity problem in the data, so it is modelLed using ridge regression. it was obtained The ridge regression model : . From the results of testing the hypothesis, it can be concluded that the independent variables, namely local original income (X1), general allocation funds (X2), profit sharing funds (X3), regional expenditures (X4) and labor (X5) together have a significant effect on the PDRB (Y) of West Java Province in 2022. The ridge regression model is returned to the original model . \u0000Abstract. Ridge regression is one of the methods used to stabilize the value of the regression coefficient caused by multicollinearity. In ridge regression, to reduce the impact of multicollinearity is carried out by adding ridge parameter c to the hat matrix. This ridge parameter makes the regression coefficients have a smaller variance than the least squares method estimator variance. However, the ridge estimates are biased. Thus, hypothesis testing using the usual method cannot be applied to the coefficients ridge regression. Therefore Bae, et al., (2014) developed a method for testing the hypothesis of the coefficients of ridge regression. This thesis aims to apply this method to the gross regional domestic product data for West Java province in 2022. Based on the results of the research, it shows that there is a multicollinearity problem in the data, so it is modelLed using ridge regression. it was obtained The ridge regression model : . From the results of testing the hypothesis, it can be concluded that the independent variables, namely local original income (X1), general allocation funds (X2), profit sharing funds (X3), regional expenditures (X4) and labor (X5) together have a significant effect on the PDRB (Y) of West Java Province in 2022. The ridge regression model is returned to the original model .","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"14 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"130869534","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Poisson regression is a regression method used to analyze count data with Poisson distributed response variables. In Poisson regression, there is an assumption that the mean value of the response variable must be equal to the variance value. If that assumption is not met, for example there is an overdispersion case where the variance value is greater than the average value and that is left unaddressed, making the standard error value of the estimated regression parameter tend to be lower than the supposed value (underestimate) resulting in a less accurate test conclusion. In this study, overdispersion cases can be solved using Generalized Poisson (GP) regression models. The GP regression model contains Generalized Poisson I regression and Generalized Poisson II regression. Generalized Poisson II regression can control a higher degree of variance in discrete data so that it can provide a more accurate parameter estimation compared to Generalized Poisson I regression in handling overdispersion cases. The purpose of this study is to model measles cases in infants in Bandung Regency in 2020. Measles cases are a form of data count. The Maximum Likhelood Estimation (MLE) method is used to estimate parameters. Calculation results show that the overdispersion case occurs in the response variable data (Y), so the study is continued using Generalized Poisson II regression method and the regression model is . From the results of the hypothesis test, the factor that has a significant effect on the number of measles cases in Bandung Regency in 2020 is the percentage of measles immunization in infants with a Pseudo R 2 value of 0,3936. Abstrak. Regresi Poisson merupakan metode regresi yang digunakan untuk menganalisa data count (jumlah) dengan variabel respon berdistribusi Poisson. Pada regresi Poisson, terdapat asumsi yang harus dipenuhi yaitu nilai rata-rata pada variabel respon harus sama dengan nilai varians (equidispersi). Jika asumsi tersebut tidak dipenuhi, misalnya terjadi kasus overdispersi di mana nilai varians lebih besar dari nilai rata-rata dan hal tersebut dibiarkan tanpa diatasi maka akan membuat nilai standard error dari dugaan parameter regresi cenderung lebih rendah dari nilai seharusnya (underestimate) sehingga menghasilkan kesimpulan pengujian yang kurang akurat. Dalam penelitian ini, kasus overdispersi dapat diatasi dengan model regresi Generalized Poisson (GP). Model regresi GP memuat regresi Generalized Poisson I dan regresi Generalized Poisson II. Pada regresi Generalized Poisson II dapat mengendalikan tingkat varians yang lebih tinggi dalam data diskrit sehingga mampu memberikan estimasi parameter yang lebih akurat dibandingkan dengan regresi Generalized Poisson I dalam menangani kasus overdispersi. Tujuan dari penelitian ini adalah untuk memodelkan kasus campak pada balita di Kabupaten Bandung tahun 2020. Kasus campak merupakan salah satu bentuk dari data count. Metode Maximum Likelihood Estimation (MLE) digunakan untuk me
摘要。泊松回归是一种用泊松分布响应变量对计数数据进行分析的回归方法。在泊松回归中,有一个假设,即响应变量的均值必须等于方差值。如果不满足该假设,例如存在方差值大于平均值且未解决的过度分散情况,使得估计的回归参数的标准误差值倾向于低于假设值(低估),从而导致不太准确的测试结论。在本研究中,过度分散的情况可以用广义泊松(GP)回归模型来解决。GP回归模型包括广义泊松I回归和广义泊松II回归。广义泊松II回归可以控制离散数据中更高程度的方差,因此在处理过分散情况时,与广义泊松I回归相比,它可以提供更准确的参数估计。本研究的目的是模拟2020年万隆县婴儿麻疹病例。麻疹病例是数据计数的一种形式。采用最大似然估计(MLE)方法对参数进行估计。计算结果表明,响应变量数据(Y)出现过分散情况,因此采用广义泊松II回归方法继续研究,回归模型为。从假设检验的结果来看,对万隆县2020年麻疹病例数有显著影响的因素是婴儿麻疹免疫接种百分比,其伪r2值为0.3936。Abstrak。回归泊松方法回归阳迪古纳坎untuk menganali数据计数(jumlah)登根变量响应分布泊松。[2] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [3]Jika asumsi tersebut tidak dipenuhi, misalnya terjadi kasus overdesi di mana nilai varians lebih besar dari nilai rata-rata dan hal tersebut dibiarkan tanpa diatasi maka akan membunai标准误差dari dugaan参数回归,cenderung lebih rendah dari nilai seharusnya(低估)seingga menghasilkan kespulan penguin yang kurang akurat。[1]李建平,李建平,李建平,等。基于广义泊松(GP)回归的dengan模型。广义泊松I和广义泊松II的回归。广义泊松I dalam menangani kasus过度分散,广义泊松I dalam menangani kasus过度分散,广义泊松I dalam menangani kasus过度分散,广义泊松I dalam menangani kasus过度分散。2020年,我们将为大家带来更多的快乐和快乐。Kasus campak merupakan salah satu bentuk dari数据计数。方法最大似然估计(MLE)是一种基于最小似然估计参数的方法。广义泊松模型回归分析[j], [j], [j]。中文翻译:企鹅的进化menyatakan bahwa faktor yang berpengaru signfikan terhadap jumlah kasus campak pagada di Kabupaten Bandung tahun 2020 adalah代表inunisasi campak pagada bayi dengan nilai伪R2 sebesar,3936。
{"title":"Penerapan Generalized Poisson Regression (GPR) dalam Memodelkan Kasus Campak pada Balita di Kabupaten Bandung Tahun 2020","authors":"Irna Noviana, Nur Azizah komara Rifai","doi":"10.29313/bcss.v3i2.7850","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.7850","url":null,"abstract":"Abstract. Poisson regression is a regression method used to analyze count data with Poisson distributed response variables. In Poisson regression, there is an assumption that the mean value of the response variable must be equal to the variance value. If that assumption is not met, for example there is an overdispersion case where the variance value is greater than the average value and that is left unaddressed, making the standard error value of the estimated regression parameter tend to be lower than the supposed value (underestimate) resulting in a less accurate test conclusion. In this study, overdispersion cases can be solved using Generalized Poisson (GP) regression models. The GP regression model contains Generalized Poisson I regression and Generalized Poisson II regression. Generalized Poisson II regression can control a higher degree of variance in discrete data so that it can provide a more accurate parameter estimation compared to Generalized Poisson I regression in handling overdispersion cases. The purpose of this study is to model measles cases in infants in Bandung Regency in 2020. Measles cases are a form of data count. The Maximum Likhelood Estimation (MLE) method is used to estimate parameters. Calculation results show that the overdispersion case occurs in the response variable data (Y), so the study is continued using Generalized Poisson II regression method and the regression model is . From the results of the hypothesis test, the factor that has a significant effect on the number of measles cases in Bandung Regency in 2020 is the percentage of measles immunization in infants with a Pseudo R 2 value of 0,3936. \u0000Abstrak. Regresi Poisson merupakan metode regresi yang digunakan untuk menganalisa data count (jumlah) dengan variabel respon berdistribusi Poisson. Pada regresi Poisson, terdapat asumsi yang harus dipenuhi yaitu nilai rata-rata pada variabel respon harus sama dengan nilai varians (equidispersi). Jika asumsi tersebut tidak dipenuhi, misalnya terjadi kasus overdispersi di mana nilai varians lebih besar dari nilai rata-rata dan hal tersebut dibiarkan tanpa diatasi maka akan membuat nilai standard error dari dugaan parameter regresi cenderung lebih rendah dari nilai seharusnya (underestimate) sehingga menghasilkan kesimpulan pengujian yang kurang akurat. Dalam penelitian ini, kasus overdispersi dapat diatasi dengan model regresi Generalized Poisson (GP). Model regresi GP memuat regresi Generalized Poisson I dan regresi Generalized Poisson II. Pada regresi Generalized Poisson II dapat mengendalikan tingkat varians yang lebih tinggi dalam data diskrit sehingga mampu memberikan estimasi parameter yang lebih akurat dibandingkan dengan regresi Generalized Poisson I dalam menangani kasus overdispersi. Tujuan dari penelitian ini adalah untuk memodelkan kasus campak pada balita di Kabupaten Bandung tahun 2020. Kasus campak merupakan salah satu bentuk dari data count. Metode Maximum Likelihood Estimation (MLE) digunakan untuk me","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"81 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116224329","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. One of the basic multivariate analysis is dependency analysis through the variance-covariance matrix. But sometimes it is difficult to interpret the diversity of data from the covariance matrix, so a single measure is needed, namely Generalized variance (GV). Generalized variance (GV) is a way to provide information on all the variance and covariance of the variance-covariance matrix into a single value and measure the variability of data on multivariate observations GV is defined as determinant of the sample covariance matrix. In some application one wants to know whether the variability of two groups of variables is the same or not. Jafari (2012) proposes to build confidence intervals and test hypotheses about two ratios of Generalized variance (GV) for two groups of dependent variables which can be used to see whether the Generalized variance (GV) of the two groups is the same or not. In this thesis, the ratio of two Generalized Variance (GV) is applied to Human Development Index (IPM) data to see the variability of the factors that influence the Human Development Index (IPM) which consists of 2 groups of variables, the first one is the economic variable including PDRB and real per capita expenditure, and the second one is the Education variable including Years of Schooling (HLS) and Average Length of Schooling (RLS). From the results of hypothesis testing, it was concluded that the general variance of the economic variable group and the Education variable group in the 2022 Human Development Index (IPM) data in Indonesia is different from the confidence interval, namely [6.748766, 13.38937]. Abstrak. Dengan menggunakan teknik analisis ini maka dapat menganalisis perbedaan dan hubungan beberapa variabel terhadap variabel lainnya dalam waktu yang bersamaan. Analisis multivariat secara dasar salah satunya terdapat analisis dependensi melalui matriks variance-covariance. Namun terkadang sulit untuk menginterpretasikan keragaman data dari matriks kovarians, maka dibutuhkan suatu ukuran tunggal yaitu Generalized variance (GV). Generalized variance (GV) adalah sebuah cara untuk memberikan informasi dari semua varians dan kovarians dari matriks varians-kovarians menjadi satu nilai tunggal dan untuk mengukur variabilitas data pada pengamatan yang bersifat multivariat dan merupakan determinan dari sampel matriks kovarians. Seringkali ingin diketahui apakah variabilitas dua kelompok variabel sama atau tidak. Jafari (2012) mengusulkan untuk membangun selang kepercayaan dan menguji hipotesis tentang dua rasio Generalized variance (GV) dua kelompok variabel yang tidak bebas yang dapat digunakan untuk melihat apakah Generalized variance (GV) kedua kelompok tersebut sama atau tidak. Dalam skripsi ini Rasio dua Generalized Variance (GV) ini diterapkan pada data Indeks Pembangunan Manusia (IPM) untuk melihat variabilitas dari faktor-faktor yang mempengaruhi Indeks Pembangunan Manusia (IPM) yang terdiri dari 2 variabel, variabel pertama yaitu variabel
摘要。其中一个基本的多变量分析是通过方差-协方差矩阵进行的相关性分析。但有时很难从协方差矩阵中解释数据的多样性,因此需要一个单一的度量,即广义方差(GV)。广义方差(GV)是一种将方差-协方差矩阵的所有方差和协方差信息转化为单个值并度量数据在多变量观测值上的可变性的方法。广义方差被定义为样本协方差矩阵的行列式。在某些应用中,人们想知道两组变量的可变性是否相同。Jafari(2012)提出对两组因变量建立广义方差(GV)的两个比值的置信区间并检验假设,可以用来判断两组因变量的广义方差(GV)是否相同。本文将两个广义方差(GV)之比应用于人类发展指数(IPM)数据,考察影响人类发展指数(IPM)的因素的变异性。人类发展指数(IPM)由两组变量组成,一组是包含PDRB和实际人均支出的经济变量,另一组是包含学龄(HLS)和平均学龄(RLS)的教育变量。从假设检验的结果来看,印度尼西亚2022年人类发展指数(Human Development Index, IPM)数据中经济变量组和教育变量组的总方差不同于置信区间,即[6.748766,13.38937]。Abstrak。邓安梦古那坎技术分析ini maka dapat梦古那坎perbedaan danhubungan梦古那坎变量terhadap变量lainnya dalam waktu yang bersamaan。多变量分析,即方差-协方差分析。Namun terkadang sulit untuk menginterpretasikan keragaman数据dari matriks kovarians, maka dibutuhkan suatu ukuran tungal yitu广义方差(GV)。广义方差(GV) adalah sebuah cara untuk member, informasi dari semua varians dankovarians dari matriks varians-kovarians menjadi satu nilai tungal danuntuk mengukur variabilitas data, pada pengamatan yang bersifat多变量danmerupakan和确定的dari样本matriks kovarians。Seringkali ingin diketahui apakah variabilitas dua kelompok variable sama atau tidak。Jafari (2012) mengusulkan untuk membangun selang keperayaan dan menguji hipoesis tentantdua rasio广义方差(GV) dua kelompok变量yang tidak bebas yang dapat digunakan untuk melihat apakah广义方差(GV) kedua kelompok tersebut sama atau tidak。Dalam skripsi ini Rasio dua广义方差(GV) ini diiterapkan数据Indeks Pembangunan Manusia (IPM) untuk melihav variabilitas dari factor - factor yang mempengaruhi Indeks Pembangunan Manusia (IPM) yang terdiri dari 2变量,变量pertamama yitu变量economi diantaranya PDRB danpeneluaran rkapita,变量kedua yitu变量Pendidikan diantaranya Harapan Lama Sekolah (HLS) dan Rata-rata Lama Sekolah (RLS)。dankelompok variabel Pendidikan pagada data penyusun Indeks Pembangunan Manusia (IPM) tahun 2022 di Indonesia berbeda dengan selang kepercayaan yitu[6.748766, 13.38937]。
{"title":"Penerapan Metode Pengujian Rasio Dua Generalized Variance (GV) pada Data Indeks Pembangunan Manusia di Indonesia Tahun 2022","authors":"Shafira Nur Fauziah, Suliadi","doi":"10.29313/bcss.v3i2.8853","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8853","url":null,"abstract":"Abstract. One of the basic multivariate analysis is dependency analysis through the variance-covariance matrix. But sometimes it is difficult to interpret the diversity of data from the covariance matrix, so a single measure is needed, namely Generalized variance (GV). Generalized variance (GV) is a way to provide information on all the variance and covariance of the variance-covariance matrix into a single value and measure the variability of data on multivariate observations GV is defined as determinant of the sample covariance matrix. In some application one wants to know whether the variability of two groups of variables is the same or not. Jafari (2012) proposes to build confidence intervals and test hypotheses about two ratios of Generalized variance (GV) for two groups of dependent variables which can be used to see whether the Generalized variance (GV) of the two groups is the same or not. In this thesis, the ratio of two Generalized Variance (GV) is applied to Human Development Index (IPM) data to see the variability of the factors that influence the Human Development Index (IPM) which consists of 2 groups of variables, the first one is the economic variable including PDRB and real per capita expenditure, and the second one is the Education variable including Years of Schooling (HLS) and Average Length of Schooling (RLS). From the results of hypothesis testing, it was concluded that the general variance of the economic variable group and the Education variable group in the 2022 Human Development Index (IPM) data in Indonesia is different from the confidence interval, namely [6.748766, 13.38937]. \u0000Abstrak. Dengan menggunakan teknik analisis ini maka dapat menganalisis perbedaan dan hubungan beberapa variabel terhadap variabel lainnya dalam waktu yang bersamaan. Analisis multivariat secara dasar salah satunya terdapat analisis dependensi melalui matriks variance-covariance. Namun terkadang sulit untuk menginterpretasikan keragaman data dari matriks kovarians, maka dibutuhkan suatu ukuran tunggal yaitu Generalized variance (GV). Generalized variance (GV) adalah sebuah cara untuk memberikan informasi dari semua varians dan kovarians dari matriks varians-kovarians menjadi satu nilai tunggal dan untuk mengukur variabilitas data pada pengamatan yang bersifat multivariat dan merupakan determinan dari sampel matriks kovarians. Seringkali ingin diketahui apakah variabilitas dua kelompok variabel sama atau tidak. Jafari (2012) mengusulkan untuk membangun selang kepercayaan dan menguji hipotesis tentang dua rasio Generalized variance (GV) dua kelompok variabel yang tidak bebas yang dapat digunakan untuk melihat apakah Generalized variance (GV) kedua kelompok tersebut sama atau tidak. Dalam skripsi ini Rasio dua Generalized Variance (GV) ini diterapkan pada data Indeks Pembangunan Manusia (IPM) untuk melihat variabilitas dari faktor-faktor yang mempengaruhi Indeks Pembangunan Manusia (IPM) yang terdiri dari 2 variabel, variabel pertama yaitu variabel","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"164 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"121770420","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Regression analysis is used to model between two quantitative variables. When doing regression modeling it is often found that the data is not normally distributed, the way to overcome this is to do a transformation. One of the transformations used is the Box-Cox transformation. Box and Cox consider a single-parameter transformation class, namely the parameter λ with respect to Y so that with λ is the parameter to be estimated. Estimation of the parameter λ uses a maximum likelihood estimator. In general, the value of λ is assumed to be known, but some values of λ (called ) the assumption of normality are not met. This has an impact on the problem of parameter estimation based on maximum likelihood to be inappropriate so that another alternative is needed to obtain the value of λ, namely using a new approach method which is carried out by means of a grid search combined with normality testing. In this study a new approach to the Box-Cox transformation method will involve the response variable, namely the amount of poverty and the predictor variables, namely the Open Unemployment Rate, Human Development Index, and Minimum Wage. In this study, we wanted to find out the factors that influence the amount of poverty in West Java Province in 2022. The data used is secondary data sourced from the Central Statistics Agency and the West Java Province Website. From the analysis results, the optimum λ estimation is 0.5 and the regression model is y^3/5 = (0.0168^5/3 + (1.2410^(5/3)X1) - (2.3160^(5/3)X2) + (0.00000066^(5/3)X3) Abstrak. Analisis regresi digunakan untuk memodelkan di antara dua variabel kuantitatif. Ketika melakukan pemodelan regresi sering kali ditemukan data tidak berdistribusi normal, cara untuk mengatasinya dapat melakukan transformasi. Salah satu transformasi yang digunakan adalah transformasi Box-Cox. Box dan Cox mempertimbangkan kelas transformasi berparameter tunggal yaitu parameter λ terhadap Y sehingga menjadi dengan λ adalah parameter yang harus diduga. Pendugaan parameter λ menggunakan penduga kemungkinan maksimum. Pada umumnya nilai λ diasumsikan sudah diketahui, namun beberapa nilai dari λ (disebut ) asumsi kenormalan tidak terpenuhi. Hal ini berdampak pada masalah pendugaan parameter yang didasarkan pada kemungkinan maksimum menjadi tidak tepat sehingga perlu alternatif lain untuk memperoleh nilai λ yaitu menggunakan metode pendekatan baru yang dilakukan dengan cara pencarian secara grid yang dikombinasikan dengan pengujian kenormalan. Dalam penelitian ini pendekatan baru metode transformasi Box-Cox akan melibatkan variabel respon yaitu Jumlah kemiskinan dan variabel prediktor yaitu Tingkat Pengangguran Terbuka, Indeks Pembangunan Manusia, dan Upah Minimum Kerja. Pada penelitian ini ingin mengetahui faktor-faktor yang mempengaruhi jumlah kemiskinan di Provinsi Jawa Barat tahun 2022. Data yang digunakan adalah data sekunder yang bersumber dari Badan Pusat Statistika dan Website Provinsi Jawa Barat. Dari hasil analisis
摘要采用回归分析对两个定量变量之间进行建模。在进行回归建模时,经常会发现数据不是正态分布的,克服这种情况的方法是进行转换。使用的转换之一是Box-Cox转换。Box和Cox考虑一个单参数变换类,即参数λ相对于Y,因此与λ为待估计的参数。参数λ的估计使用极大似然估计器。一般情况下,假设λ的值是已知的,但有些λ的值(称为正态性假设)不满足。这对基于最大似然的参数估计问题产生了不适当的影响,因此需要另一种方法来获得λ的值,即使用一种新的方法,该方法是通过网格搜索结合正态性检验来实现的。在本研究中,Box-Cox变换方法的新方法将涉及响应变量(即贫困数量)和预测变量(即开放失业率、人类发展指数和最低工资)。在这项研究中,我们想找出影响2022年西爪哇省贫困数量的因素。所使用的数据是来自中央统计局和西爪哇省网站的二手数据。从分析结果来看,最优λ估计为0.5,回归模型为y^3/5 = (0.0168^5/3 + (1.2410^(5/3)X1) - (2.3160^(5/3)X2) + (0.00000066^(5/3)X3)。变量量化的回归分析与记忆分析。统计数据显示,数据分布呈正态分布,数据分布呈正态分布,数据分布呈正态变化。Salah satu transformasi yang digunakan adalah transformasi Box-Cox。Box dan Cox mempertimbangkan kelas transformasi参数tunggal yitu参数λ terhadap Y seingga menjadi dengan λ adalah参数yang harus diduga。Pendugaan参数λ menggunakan penduga kemungkinan极大值。Pada umumnya nilai λ disumsikan sudah diketahui, namun beberapa nilai dari λ (disebut) asumsi kenormalan tidak terpenuhi。halini berdampak padpadmasalah pendugaan参数yang didasarkan padkemungkinan maksimum menjadi tippat seingga perlu alternatik untuk memperoleh nilai yitu menggunakan medekatan baru yang dilakukan dengan cara secara grid yang dikombinaskan dengan penguin kenormalan。Dalam penelitian ini pendekatan baru mede transformasi Box-Cox akan melibatkan变量响应yitu Jumlah kemiskinan变量预测yitu Tingkat Pengangguran Terbuka, Indeks Pembangunan Manusia, dan Upah Minimum Kerja。巴巴多斯在孟格塔赫市的地位,在孟格塔赫市的地位,在孟格塔赫市的地位,在孟格塔赫市的地位。数据阳digunakan adalah数据搜索阳消费者数据达巴丹统计网站省爪哇巴拉。dhail分析didapat pendugaan λ yang最优yitu 0.5 dan模型回归y^3/5 = (0.0168^5/3 + (1.2410^(5/3)X1) - (2.3160^(5/3)X2) + (0.00000066^(5/3)X3)
{"title":"Pendekatan Baru dari Transformasi Box-Cox untuk Mengatasi Masalah Ketidaknormalan pada Variabel Respon","authors":"Dwi Andini Juniawati, Nusar Hajarisman","doi":"10.29313/bcss.v3i2.8553","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8553","url":null,"abstract":"Abstract. Regression analysis is used to model between two quantitative variables. When doing regression modeling it is often found that the data is not normally distributed, the way to overcome this is to do a transformation. One of the transformations used is the Box-Cox transformation. Box and Cox consider a single-parameter transformation class, namely the parameter λ with respect to Y so that with λ is the parameter to be estimated. Estimation of the parameter λ uses a maximum likelihood estimator. In general, the value of λ is assumed to be known, but some values of λ (called ) the assumption of normality are not met. This has an impact on the problem of parameter estimation based on maximum likelihood to be inappropriate so that another alternative is needed to obtain the value of λ, namely using a new approach method which is carried out by means of a grid search combined with normality testing. In this study a new approach to the Box-Cox transformation method will involve the response variable, namely the amount of poverty and the predictor variables, namely the Open Unemployment Rate, Human Development Index, and Minimum Wage. In this study, we wanted to find out the factors that influence the amount of poverty in West Java Province in 2022. The data used is secondary data sourced from the Central Statistics Agency and the West Java Province Website. From the analysis results, the optimum λ estimation is 0.5 and the regression model is y^3/5 = (0.0168^5/3 + (1.2410^(5/3)X1) - (2.3160^(5/3)X2) + (0.00000066^(5/3)X3) \u0000Abstrak. Analisis regresi digunakan untuk memodelkan di antara dua variabel kuantitatif. Ketika melakukan pemodelan regresi sering kali ditemukan data tidak berdistribusi normal, cara untuk mengatasinya dapat melakukan transformasi. Salah satu transformasi yang digunakan adalah transformasi Box-Cox. Box dan Cox mempertimbangkan kelas transformasi berparameter tunggal yaitu parameter λ terhadap Y sehingga menjadi dengan λ adalah parameter yang harus diduga. Pendugaan parameter λ menggunakan penduga kemungkinan maksimum. Pada umumnya nilai λ diasumsikan sudah diketahui, namun beberapa nilai dari λ (disebut ) asumsi kenormalan tidak terpenuhi. Hal ini berdampak pada masalah pendugaan parameter yang didasarkan pada kemungkinan maksimum menjadi tidak tepat sehingga perlu alternatif lain untuk memperoleh nilai λ yaitu menggunakan metode pendekatan baru yang dilakukan dengan cara pencarian secara grid yang dikombinasikan dengan pengujian kenormalan. Dalam penelitian ini pendekatan baru metode transformasi Box-Cox akan melibatkan variabel respon yaitu Jumlah kemiskinan dan variabel prediktor yaitu Tingkat Pengangguran Terbuka, Indeks Pembangunan Manusia, dan Upah Minimum Kerja. Pada penelitian ini ingin mengetahui faktor-faktor yang mempengaruhi jumlah kemiskinan di Provinsi Jawa Barat tahun 2022. Data yang digunakan adalah data sekunder yang bersumber dari Badan Pusat Statistika dan Website Provinsi Jawa Barat. Dari hasil analisis","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"27 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124416018","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. The stochastic frontier has two error components, namely errors originating from random errors and errors originating from other factors than can be controlled, namely inefficiency errors. The Stochastic Frontier Analysis model is an extension of the deterministic frontier model developed by Aigner and Chu (1968) in Coelli et al (1998). Stochastic Frontier Analysis (SFA) is one of the best known techniques for determining efficiency. So to overcome the level of efficiency of a company researchers will use the stochastic frontier with the Cobb-Douglas production function model. The profit function (profit) is a two-way approach, and is often used to measure the level of production efficiency. Measuring the level of production efficiency, both technical and allocative efficiency, using the commonly used profit function is only relative. This study aims to rank the level of efficiency of companies in Indonesia. The results of the research based on 10 life insurance companies in Indonesia in 2017-2021 can use the application of the stochastic frontier analysis model of the Cobb-Douglas function. And for the value of the highest efficiency level obtained by PT. Sequis Financial with a value of 0.9996, and for the lowest efficiency value obtained by PT. Sequis Financial with an efficient value of 0.0845. Abstrak. Stochastic frontier memiliki dua komponen galat yaitu galat yang berasal dari kesalahan acak dan galat yang berasal dari faktor-faktor lain ang bisa dikendalikan yaitu galat inefisiensi. Model Stochastic Frontier Analysis merupakan perkembangan dari model deterministic frontier yang dikembangkan oleh Aigner dan Chu (1968) dalam Coelli et al (1998). Stochastic Frontier Analysis (SFA) adalah salah satu teknik yang paling dikenal untuk menentukan efisiensi. Maka untuk menanggulangi tingkat efisiensi suatu perusahaan peneliti akan menggunakan stochastic frontier dengan model fungsi produksi cobb-douglas. Fungsi keuntungan (profit) merupakan pendekatan dua arah, dan sering digunakan untuk mengukur tingkat efisiensi produksi. Mengukur tingkat efisiensi produksi, baik efisiensi teknis maupun alokatif, dengan menggunakan fungsi profit yang umum digunakan hanya bersifat relative. Penelitian ini bertujuan untuk mengurutkan tingkat efisiensi perusahaan di Indonesia. Hasil penelitian berdasarkan dari 10 perusahaan asuransi jiwa di Indonesia pada tahun 2017-2021 dapat menggunakan penerapan model stochastic frontier analysis fungsi cobb-douglas. Dan untuk nilai tingkat efisiensi tertinggi didapatkan oleh PT. Sequis Financial dengan nilai 0.9996, dan untuk nilai efisiensi terendah didapatkan oleh PT. Sequis Financial dengan nilai efisien 0.0845.
摘要随机前沿有两个误差分量,即源于随机误差的误差和源于其他无法控制因素的误差,即低效率误差。随机前沿分析模型是对Aigner和Chu(1968)在Coelli等人(1998)中提出的确定性前沿模型的扩展。随机前沿分析(SFA)是确定效率的最著名的技术之一。因此,为了克服一个公司的效率水平,研究人员将使用随机前沿与柯布-道格拉斯生产函数模型。利润函数(利润)是双向的,经常被用来衡量生产效率的水平。衡量生产效率水平,包括技术效率和配置效率,使用常用的利润函数只是相对的。本研究旨在对印尼公司的效率水平进行排名。基于2017-2021年印尼10家寿险公司的研究结果可以应用Cobb-Douglas函数的随机前沿分析模型。而PT. Sequis Financial获得的最高效率水平值为0.9996,PT. Sequis Financial获得的最低效率值为0.0845。Abstrak。随机前沿记忆dua komponen galat yitu galat yang berasal dari kesalahan akak dan galat yang berasal dari factor - factor - line ang bisa dikendalikan yitu galat inifisiensi。模型随机前沿分析merupakan perkembangan dari模型确定性前沿yang dikembangkan oleh Aigner dan Chu (1968) dalam Coelli等(1998)。随机前沿分析(SFA):基于随机前沿分析、随机前沿分析、随机前沿分析和随机前沿分析。Maka untuk, menanggulangi, tingkat, efisiensis, suatu, perushaan, peneliti, akan, menggunakan随机前沿登干模型真菌产品,cobbb -douglas。凤尾蝶(利润),凤尾蝶,凤尾蝶,凤尾蝶,凤尾蝶,凤尾蝶等产品。孟廓尔市丁克市芦笋制品、北京芦笋制品、登安市芦笋制品、阳县芦笋制品、阳县芦笋制品。Penelitian ini bertujuan untuk mengurutkan tingkat efisiensi perusahaan di Indonesia。Hasil penelitian berdasarkan dari 10 perusahaan asuransi jiwa di Indonesia pada tahun 2017-2021 dapat menggunakan penerapan模型随机前沿分析[j]。丹为她汝tingkat efisiensi tertinggi didapatkan oleh pokalchuk PT。亮片金融dengan汝0.9996,丹为她汝efisiensi terendah didapatkan oleh pokalchuk PT。亮片金融dengan汝efisien 0.0845。
{"title":"Analisis Pengukuran Tingkat Efisiensi Perusahaan Menggunakan Metode Stochastic Frontier Analysis (SFA)","authors":"Salma Inayatul Afifah, Suwanda","doi":"10.29313/bcss.v3i2.8369","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8369","url":null,"abstract":"Abstract. The stochastic frontier has two error components, namely errors originating from random errors and errors originating from other factors than can be controlled, namely inefficiency errors. The Stochastic Frontier Analysis model is an extension of the deterministic frontier model developed by Aigner and Chu (1968) in Coelli et al (1998). Stochastic Frontier Analysis (SFA) is one of the best known techniques for determining efficiency. So to overcome the level of efficiency of a company researchers will use the stochastic frontier with the Cobb-Douglas production function model. The profit function (profit) is a two-way approach, and is often used to measure the level of production efficiency. Measuring the level of production efficiency, both technical and allocative efficiency, using the commonly used profit function is only relative. This study aims to rank the level of efficiency of companies in Indonesia. The results of the research based on 10 life insurance companies in Indonesia in 2017-2021 can use the application of the stochastic frontier analysis model of the Cobb-Douglas function. And for the value of the highest efficiency level obtained by PT. Sequis Financial with a value of 0.9996, and for the lowest efficiency value obtained by PT. Sequis Financial with an efficient value of 0.0845. \u0000Abstrak. Stochastic frontier memiliki dua komponen galat yaitu galat yang berasal dari kesalahan acak dan galat yang berasal dari faktor-faktor lain ang bisa dikendalikan yaitu galat inefisiensi. Model Stochastic Frontier Analysis merupakan perkembangan dari model deterministic frontier yang dikembangkan oleh Aigner dan Chu (1968) dalam Coelli et al (1998). Stochastic Frontier Analysis (SFA) adalah salah satu teknik yang paling dikenal untuk menentukan efisiensi. Maka untuk menanggulangi tingkat efisiensi suatu perusahaan peneliti akan menggunakan stochastic frontier dengan model fungsi produksi cobb-douglas. Fungsi keuntungan (profit) merupakan pendekatan dua arah, dan sering digunakan untuk mengukur tingkat efisiensi produksi. Mengukur tingkat efisiensi produksi, baik efisiensi teknis maupun alokatif, dengan menggunakan fungsi profit yang umum digunakan hanya bersifat relative. Penelitian ini bertujuan untuk mengurutkan tingkat efisiensi perusahaan di Indonesia. Hasil penelitian berdasarkan dari 10 perusahaan asuransi jiwa di Indonesia pada tahun 2017-2021 dapat menggunakan penerapan model stochastic frontier analysis fungsi cobb-douglas. Dan untuk nilai tingkat efisiensi tertinggi didapatkan oleh PT. Sequis Financial dengan nilai 0.9996, dan untuk nilai efisiensi terendah didapatkan oleh PT. Sequis Financial dengan nilai efisien 0.0845.","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"5 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122735779","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Linear regression is usually used to model the relationship between a dependent variable and one or more independent variables where the response is continuous and normally distributed. However, if the assumption of normality of the response is not met, and the estimation for the linear regression model is not accurate, then zero-one inflated beta (BEINF) regression is an alternative method to model the relationship between the response variable and predictors where the response is a mixture of beta distribution and bernouli distribution. The results of this research are that there are several factors that affect the response variable, namely the BMI variable (X1), Forty Yard Run (X2), Vertical Jump (X3), Wide Jump (X4) and for predicting the chances of soccer players it can be said that, in the model 0 < Y < 1 the chance that a soccer player will be chosen to play in the match is equal to =0.4514 times more than before assuming the value of the other predictor variables is fixed. In the Y = 1 model, the chance that a soccer player will be chosen to play in the match increases by f(y=1)= 0.2086 times compared to before assuming the value of the other predictor variables remains constant. In the Y = 0 model, the chance that a soccer player will not be chosen to play in the match increases by f(y=0)=0,7576 times compared to before, assuming the values of the other predictor variables remain constant. Abstrak. Regresi linier biasanya digunakan untuk memodelkan hubungan antara variabel dependen dengan satu atau lebih variabel independen yang dimana respon bersifat kontinu dan berdistribusi normal. Namun apabila asumsi normalitas respon tidak terpenuhi, dan estimasi untuk model regresi linier tidak akurat, maka regresi zero-one inflated beta (BEINF) adalah metode alternatif untuk memodelkan hubungan antara variabel respon dan prediktor dimana respon berdistribusi campuran antara distribusi beta dan distribusi bernouli. Hasil dari penelitan ini adalah terdapat beberapa faktor yang mempengaruhi variabel respon yaitu variabel BMI (X1), Lari Empat Puluh Yard (X2), Lompat Vertikal (X3), Lompat Lebar (X4) dan untuk prediksi peluang pemain sepak bola dapat dikatakan bahwa, pada model 0 < Y < 1 peluang pemain sepak bola akan dipilih untuk bermain di pertandingan adalah sebesar =0.4514 kali lipat dibanding sebelumnya dengan asumsi nilai variabel prediktor lain tetap. Pada model Y = 1 peluang pemain sepak bola akan dipilih untuk bermain di pertandingan meningkat sebesar f(y=1)= 0.2086 kali lipat dibanding sebelumnya dengan asumsi nilai variabel prediktor lain tetap. Pada model Y = 0 peluang pemain sepak bola tidak akan dipilih untuk bermain di pertandingan meningkat sebesar f(y=0)=0,7576 kali lipat dibanding sebelumnya dengan asumsi nilai variabel prediktor lain tetap.
摘要。线性回归通常用于模拟一个因变量和一个或多个自变量之间的关系,其中响应是连续的和正态分布的。但是,如果不满足响应的正态性假设,并且对线性回归模型的估计不准确,则0 - 1膨胀β (BEINF)回归是对响应变量与预测因子之间的关系建模的另一种方法,其中响应是β分布和伯努利分布的混合分布。这项研究的结果,有几个因素影响的响应变量,即BMI变量(X1)、40码运行(X2)、垂直跳(X3),宽跳(X4)和预测足球运动员的几率可以说,在模型中0 < Y < 1的足球运动员会选择参加比赛之前假设的= = 0.4514倍其他预测变量的值是固定的。在Y =1模型中,与假设其他预测变量保持不变之前相比,足球运动员被选中参加比赛的机会增加了f(Y =1)= 0.2086倍。在Y =0模型中,假设其他预测变量的值保持不变,足球运动员不被选中参加比赛的几率比之前增加了f(Y =0)=0,7576倍。Abstrak。回归线性方程biasanya digunakan untuk memodelkan hubungan antara变量依赖于denan状态,变量依赖于denan状态,变量独立于denan状态,响应是连续的,分布是正态的。Namun apabili假设正态响应(Namun apabili), dan estimasuntuk模型回归(linier tidakurat),使回归0 - 1膨胀beta (BEINF) adalah方法替代untuk memodelkan hubungan antara变量响应和预测因子dimana响应berdistribution busi campuran antara分布busi beta和分布busi bernouli。Hasil dari penelitan ini adalah terdapa bebera factor for yang mempengaruhi变量响应yytu变量BMI (X1), Lari Empat puluyard (X2), Lompat Vertikal (X3), Lompat Lebar (X4) dan untuk prediksi peluang paina sepak bola dapat dikatakan bahwa, pada模型0 < Y < 1 peluang pemenak bola akan dippilih untuk bermain di perding和adalah sebesar =0.4514 kali lipat dibanding sebelumya dengan and asumsi nilai变量预测因子ltetap。Pada模型Y =1 (p =1)= 0.2086 (p =1)= 0.2086 (p =1)= 0.2086) (p =1)= 0.2086) (p =1)= 0.2086) (p =1)= 0.2086) (p =1)= 0.2086) (p =1)= 0.2086) (p =1)= 0.2086)。Pada模型Y =0,可预测脑脊膜炎患者脑脊膜炎的发病情况;Pada模型f(Y =0)= 0.7576,可预测脑脊膜炎患者脑脊膜炎的发病情况。
{"title":"Penerapan Model Regresi Zero-One Inflated Beta (BEINF) pada Proporsi Pemain Sepak Bola yang dimainkan dalam Satu Musim","authors":"Rida Faridah, Nusar Hajarisman","doi":"10.29313/bcss.v3i2.8223","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8223","url":null,"abstract":"Abstract. Linear regression is usually used to model the relationship between a dependent variable and one or more independent variables where the response is continuous and normally distributed. However, if the assumption of normality of the response is not met, and the estimation for the linear regression model is not accurate, then zero-one inflated beta (BEINF) regression is an alternative method to model the relationship between the response variable and predictors where the response is a mixture of beta distribution and bernouli distribution. The results of this research are that there are several factors that affect the response variable, namely the BMI variable (X1), Forty Yard Run (X2), Vertical Jump (X3), Wide Jump (X4) and for predicting the chances of soccer players it can be said that, in the model 0 < Y < 1 the chance that a soccer player will be chosen to play in the match is equal to =0.4514 times more than before assuming the value of the other predictor variables is fixed. In the Y = 1 model, the chance that a soccer player will be chosen to play in the match increases by f(y=1)= 0.2086 times compared to before assuming the value of the other predictor variables remains constant. In the Y = 0 model, the chance that a soccer player will not be chosen to play in the match increases by f(y=0)=0,7576 times compared to before, assuming the values of the other predictor variables remain constant. \u0000Abstrak. Regresi linier biasanya digunakan untuk memodelkan hubungan antara variabel dependen dengan satu atau lebih variabel independen yang dimana respon bersifat kontinu dan berdistribusi normal. Namun apabila asumsi normalitas respon tidak terpenuhi, dan estimasi untuk model regresi linier tidak akurat, maka regresi zero-one inflated beta (BEINF) adalah metode alternatif untuk memodelkan hubungan antara variabel respon dan prediktor dimana respon berdistribusi campuran antara distribusi beta dan distribusi bernouli. Hasil dari penelitan ini adalah terdapat beberapa faktor yang mempengaruhi variabel respon yaitu variabel BMI (X1), Lari Empat Puluh Yard (X2), Lompat Vertikal (X3), Lompat Lebar (X4) dan untuk prediksi peluang pemain sepak bola dapat dikatakan bahwa, pada model 0 < Y < 1 peluang pemain sepak bola akan dipilih untuk bermain di pertandingan adalah sebesar =0.4514 kali lipat dibanding sebelumnya dengan asumsi nilai variabel prediktor lain tetap. Pada model Y = 1 peluang pemain sepak bola akan dipilih untuk bermain di pertandingan meningkat sebesar f(y=1)= 0.2086 kali lipat dibanding sebelumnya dengan asumsi nilai variabel prediktor lain tetap. Pada model Y = 0 peluang pemain sepak bola tidak akan dipilih untuk bermain di pertandingan meningkat sebesar f(y=0)=0,7576 kali lipat dibanding sebelumnya dengan asumsi nilai variabel prediktor lain tetap.","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"4 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"115388553","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Statistical quality control is the application of statistical techniques in controlling a process that is useful for achieving process stability and increasing ability through reducing quality variability. Tools for quality control, one of which is the control chart. In practice, control charts often used in univariate cases are Shewhart, Cumulative Sum (CUSUM) and Exponentially Weighted Moving Average (EWMA). However, when there is more than one quality characteristic (mutivariate characteristics), simultaneous control is required. The thesis discusses the Multivariate Exponentially Weighted Moving Average (MEWMA) control chart procedure. The uniqueness of the MEWMA control chart is that it is robust to normal which means that if the data used is not normally distributed, then the MEWMA control chart can still be done. MEWMA control chart will be used to control PDAM Water Quality. The data used is the quality of customer drinking water in January-February 2022 Perumda Tugu Tirta Drinking Water Malang City which amounted to 50 observations with 5 characteristics observed including pH, nitrite, iron (Fe), manganese and residual chlorine (Cl2). Based on the results of MEWMA analysis shows that it is in a statistically uncontrolled condition because for weighting 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 and 0.9 there are observations that are beyond the control limit, namely in the 46th observation. As well as the optimum weighting selected, namely weighting 0.2. The results of detection of out-of-control causal variables using the EWMA control chart showed 1 variable had an out-of-control observation at the 46th observation, namely at Manganese levels. Abstrak. Pengendalian kualitas Statistik merupakan aplikasi dari teknik statistik dalam pengendalian suatu proses yang berguna untuk mencapai stabilitas proses dan meningkatkan kemampuan melalui pengurangan variabilitas mutu. Alat bantu untuk mengendalikan kualitas, salah satunya adalah diagram kendali. Dalam praktiknya, diagram kendali yang sering digunakan dalam kasus univariat adalah Shewhart, Cumulative Sum (CUSUM) dan Exponentially Weighted Moving Average (EWMA). Namun ketika terdapat lebih dari satu karakteristik mutu (karakteristik mutivariat), maka pengontrolan secara simultan diperlukan. Dalam skripsi dibahas prosedur diagram kendali Multivariate Exponentially Weighted Moving Average (MEWMA). Keunikan diagram kendali MEWMA yaitu bersifat robust terhadap normal yaitu apabila data yang digunakan tidak berdistribusi normal, maka diagram kendali MEWMA masih bisa dilakukan. Diagram kendali MEWMA akan digunakan untuk mengontrol Kualitas Air PDAM. Data yang digunakan yaitu kualitas air minum pelanggan pada bulan Januari-Februari 2022 Perumda Air Minum Tugu Tirta Kota Malang yang berjumlah 50 pengamatan dengan 5 karakteristik yang diamati diantaranya pH, nitrit (NO2), besi (Fe), Mangan dan sisa klor (Cl2). Berdasarkan hasil analisis MEWMA menunjukan berada dalam kondisi tidak terkendali secara
摘要统计质量控制是统计技术在控制过程中的应用,它有助于通过减少质量可变性来实现过程稳定性和提高能力。用于质量控制的工具,其中之一就是控制图。在实践中,单变量情况下经常使用的控制图是Shewhart、累积和(CUSUM)和指数加权移动平均(EWMA)。然而,当有一个以上的质量特征(多变量特征)时,需要同时控制。本文讨论了多元指数加权移动平均(MEWMA)控制图程序。MEWMA控制图的独特之处在于它对正态分布具有鲁棒性,这意味着如果使用的数据不是正态分布,那么MEWMA控制图仍然可以完成。MEWMA控制图将用于控制PDAM水质。使用的数据是2022年1 - 2月马朗市Perumda Tugu Tirta饮用水的客户饮用水质量,共50个观测值,包括pH值、亚硝酸盐、铁(Fe)、锰和余氯(Cl2) 5个特征。MEWMA分析结果表明,由于权重为0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9,即在第46个观测值中存在超出控制极限的观测值,因此处于统计不可控状态。以及选取的最优权重,即权重0.2。使用EWMA控制图检测失控因果变量的结果显示,1个变量在第46次观测时出现失控观测,即锰水平。Abstrak。彭根大连质量统计与应用技术统计:彭根大连质量统计与分析:彭根大连质量统计与分析:彭根大连质量统计与分析:彭根大连质量统计与分析:彭根大连质量统计与分析:彭根大连质量统计与分析:彭根大连质量统计与分析Alat bantu untuk mengendalikan kualitas, salah satunya adalah diagram kendali。Dalam praktiknya,图kendali yang sering digunakan Dalam kasus一元adalah Shewhart,累积和(CUSUM)和指数加权移动平均(EWMA)。Namun ketika terdapat lebih dari satu karakteristik mutu (karakteristik多元),maka pengontrolan secara simultan diperlukan。多元指数加权移动平均(MEWMA)。Keunikan图kendali MEWMA yitar稳健,正态yitar稳健,正态yitar稳健,正态yitar稳健,正态分布,maka图kendali MEWMA masih偏态dilakukan。图kendali MEWMA akan digunakan untuk mengcontrol Kualitas Air PDAM。数据yang digunakan yaitu kualitas air minum pelanggan pada bulan 2022年1 - 2月Perumda air minum Tugu Tirta Kota Malang yang berjumlah 50 pengamatan dengan 5 karakteristik yang diamati diantaranya pH, nitrit (NO2), besi (Fe), Mangan dan sisa klor (Cl2)。Berdasarkan hasil分析MEWMA menunjukan berada dalam kondisi tidak terkendali secara统计karena untuk phembobot 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 dan 0.9 terdapat pengamatan yang berada diluar batas kendali, yakni pada pengamatan ke-46。Serta pembobot优化yang dipilih yitu pembobot 0.2。1变量memiliki pengamatan失控的pada pengamatan ke-46
{"title":"Penerapan Diagram Kendali Multivariate Exponentially Weighted Moving Average (MEWMA) dalam Mengontrol Kualitas Air PDAM","authors":"Renaldi, Suwanda","doi":"10.29313/bcss.v3i2.9343","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.9343","url":null,"abstract":"Abstract. Statistical quality control is the application of statistical techniques in controlling a process that is useful for achieving process stability and increasing ability through reducing quality variability. Tools for quality control, one of which is the control chart. In practice, control charts often used in univariate cases are Shewhart, Cumulative Sum (CUSUM) and Exponentially Weighted Moving Average (EWMA). However, when there is more than one quality characteristic (mutivariate characteristics), simultaneous control is required. The thesis discusses the Multivariate Exponentially Weighted Moving Average (MEWMA) control chart procedure. The uniqueness of the MEWMA control chart is that it is robust to normal which means that if the data used is not normally distributed, then the MEWMA control chart can still be done. MEWMA control chart will be used to control PDAM Water Quality. The data used is the quality of customer drinking water in January-February 2022 Perumda Tugu Tirta Drinking Water Malang City which amounted to 50 observations with 5 characteristics observed including pH, nitrite, iron (Fe), manganese and residual chlorine (Cl2). Based on the results of MEWMA analysis shows that it is in a statistically uncontrolled condition because for weighting 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8 and 0.9 there are observations that are beyond the control limit, namely in the 46th observation. As well as the optimum weighting selected, namely weighting 0.2. The results of detection of out-of-control causal variables using the EWMA control chart showed 1 variable had an out-of-control observation at the 46th observation, namely at Manganese levels. \u0000Abstrak. Pengendalian kualitas Statistik merupakan aplikasi dari teknik statistik dalam pengendalian suatu proses yang berguna untuk mencapai stabilitas proses dan meningkatkan kemampuan melalui pengurangan variabilitas mutu. Alat bantu untuk mengendalikan kualitas, salah satunya adalah diagram kendali. Dalam praktiknya, diagram kendali yang sering digunakan dalam kasus univariat adalah Shewhart, Cumulative Sum (CUSUM) dan Exponentially Weighted Moving Average (EWMA). Namun ketika terdapat lebih dari satu karakteristik mutu (karakteristik mutivariat), maka pengontrolan secara simultan diperlukan. Dalam skripsi dibahas prosedur diagram kendali Multivariate Exponentially Weighted Moving Average (MEWMA). Keunikan diagram kendali MEWMA yaitu bersifat robust terhadap normal yaitu apabila data yang digunakan tidak berdistribusi normal, maka diagram kendali MEWMA masih bisa dilakukan. Diagram kendali MEWMA akan digunakan untuk mengontrol Kualitas Air PDAM. Data yang digunakan yaitu kualitas air minum pelanggan pada bulan Januari-Februari 2022 Perumda Air Minum Tugu Tirta Kota Malang yang berjumlah 50 pengamatan dengan 5 karakteristik yang diamati diantaranya pH, nitrit (NO2), besi (Fe), Mangan dan sisa klor (Cl2). Berdasarkan hasil analisis MEWMA menunjukan berada dalam kondisi tidak terkendali secara ","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"63 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127496601","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Abstract. Hybrid cluster analysis is a combination of hierarchical and non-hierarchical clusters, which has a goal as an alternative method. The advantage of hybrid cluster analysis is that it can determine k-clusters for the process of making non-hierarchical clusters through the results of making hierarchical cluster methods, which will produce the right k-clusters. With the advantages of the hybrid cluster analysis, this research will combine the single linkage method with k-means, then the ward method with k-means. The purpose of this study was to determine the grouping of districts/cities in West Java Province with the most optimal combination method based on poverty in 2022. Based on the results of hybrid cluster analysis using a combination of k-means clusters and single linkage, 4 clusters were obtained. While the results of hybrid cluster analysis using a combination of k-means clusters and the ward method obtained 3 clusters. Among the hybrid cluster analysis using a combination of k-means and single linkage clusters as well as a combination of k-means cluster and ward method, it can be said that the method with a combination of k-means and single linkage is the best or most optimal method with the smallest standard deviation ratio value of 88.38%. Abstrak. Analisis cluster hybrid merupakan kombinasi antara cluster hierarki dan non-hierarki, dimana memiliki tujuan sebagai metode alternatif. Kelebihan analisis cluster hybrid adalah dapat menentukan k-klaster untuk proses pembuatan cluster non-hierarki melalui hasil dari pembuatan cluster metode hierarki, dimana akan menghasilkan k-klaster yang tepat. Dengan kelebihan analisis cluster hybrid tersebut, maka dalam penelitian ini akan mengkombinasikan metode single linkage dengan k-means, kemudian ward method dengan k-means. Tujuan penelitian ini adalah dapat mengetahui pengelompokan Kabupaten/Kota di Provinsi Jawa Barat dengan metode kombinasi yang paling optimal berdasarkan kemiskinan tahun 2022. Berdasarkan hasil analisis cluster hybrid dengan menggunakan kombinasi cluster k-means dan single linkage diperoleh 4 cluster. Sedangkan hasil analisis cluster hybrid dengan menggunakan kombinasi cluster k-means dan ward method diperoleh 3 cluster. Diantara analisis cluster hybrid dengan menggunakan kombinasi cluster k-means dan single linkage serta kombinasi cluster k-means dan ward method, dapat dikatakan bahwa metode dengan kombinasi k-means dan single linkage merupakan metode terbaik atau yang paling optimal dengan nilai rasio simpangan baku terkecil yaitu sebesar 88,38%.
摘要。混合聚类分析是层次聚类和非层次聚类的结合,其目标是作为一种替代方法。混合聚类分析的优点在于,它可以通过分层聚类方法的聚类结果来确定非分层聚类过程中的k-聚类,从而产生正确的k-聚类。本研究利用混合聚类分析的优势,将单链接法与k-means结合,再将ward法与k-means结合。本研究的目的是根据2022年的贫困情况,采用最优组合方法确定西爪哇省的区/市分组。结合k-means聚类和单链接的混合聚类分析结果,得到4个聚类。而混合聚类分析结果采用k-means聚类和ward方法相结合的方法得到3个聚类。在k-means与单链接聚类相结合以及k-means聚类与ward方法相结合的混合聚类分析中,k-means与单链接相结合的方法可以说是最佳或最优的方法,其标准差比值最小,为88.38%。Abstrak。分析聚类杂交merupakan kombinasi antara聚类hierarki与非hierarki, dimana memiliki tujuan sebagai方法的交替。Kelebihan分析聚类杂交adalah dapat menentukan k-klaster untuk提出了pembuatan聚类非分层次melalui hasil dari分层次,dimana akan menghasilkan k-klaster yang tepat。Dengan kelebihan分析聚类杂交tersebut, maka dalam penelitian ini akan mengkombinasikan方法单链Dengan k-means, kemudian ward方法Dengan k-means。图juan penelitian ini adalah dapat mengetahui penelompokan Kabupaten/Kota di province Jawa Barat dengan metde kombinasi yang paling最佳berdasarkan kemiskinan tahun 2022。Berdasarkan hasil分析聚类杂交dengan menggunakan kombinasi聚类k-means dan单链diperoleh 4聚类。Sedangkan hasil分析聚类混合dengan menggunakan kombinasi聚类k-means dan ward方法diperoleh 3聚类。Diantara分析聚类杂交dengan menggunakan kombinasi聚类k-means dan单链serta kombinasi聚类k-means dan ward方法,dapat dikatakan bahwa方法dengan kombinasi k-means dan单链merupakan方法terbaik atau yang paling最优dengan nilai rasio simpangan baku terkecil yatu sebesar 88,38%。
{"title":"Penerapan Analisis Cluster Hybrid untuk Pengelompokan Kabupaten/Kota di Provinsi Jawa Barat Berdasarkan Indikator Kemiskinan Tahun 2022","authors":"Wardah Fauziyah, Anneke Iswani Achmad","doi":"10.29313/bcss.v3i2.8610","DOIUrl":"https://doi.org/10.29313/bcss.v3i2.8610","url":null,"abstract":"Abstract. Hybrid cluster analysis is a combination of hierarchical and non-hierarchical clusters, which has a goal as an alternative method. The advantage of hybrid cluster analysis is that it can determine k-clusters for the process of making non-hierarchical clusters through the results of making hierarchical cluster methods, which will produce the right k-clusters. With the advantages of the hybrid cluster analysis, this research will combine the single linkage method with k-means, then the ward method with k-means. The purpose of this study was to determine the grouping of districts/cities in West Java Province with the most optimal combination method based on poverty in 2022. Based on the results of hybrid cluster analysis using a combination of k-means clusters and single linkage, 4 clusters were obtained. While the results of hybrid cluster analysis using a combination of k-means clusters and the ward method obtained 3 clusters. Among the hybrid cluster analysis using a combination of k-means and single linkage clusters as well as a combination of k-means cluster and ward method, it can be said that the method with a combination of k-means and single linkage is the best or most optimal method with the smallest standard deviation ratio value of 88.38%. \u0000Abstrak. Analisis cluster hybrid merupakan kombinasi antara cluster hierarki dan non-hierarki, dimana memiliki tujuan sebagai metode alternatif. Kelebihan analisis cluster hybrid adalah dapat menentukan k-klaster untuk proses pembuatan cluster non-hierarki melalui hasil dari pembuatan cluster metode hierarki, dimana akan menghasilkan k-klaster yang tepat. Dengan kelebihan analisis cluster hybrid tersebut, maka dalam penelitian ini akan mengkombinasikan metode single linkage dengan k-means, kemudian ward method dengan k-means. Tujuan penelitian ini adalah dapat mengetahui pengelompokan Kabupaten/Kota di Provinsi Jawa Barat dengan metode kombinasi yang paling optimal berdasarkan kemiskinan tahun 2022. Berdasarkan hasil analisis cluster hybrid dengan menggunakan kombinasi cluster k-means dan single linkage diperoleh 4 cluster. Sedangkan hasil analisis cluster hybrid dengan menggunakan kombinasi cluster k-means dan ward method diperoleh 3 cluster. Diantara analisis cluster hybrid dengan menggunakan kombinasi cluster k-means dan single linkage serta kombinasi cluster k-means dan ward method, dapat dikatakan bahwa metode dengan kombinasi k-means dan single linkage merupakan metode terbaik atau yang paling optimal dengan nilai rasio simpangan baku terkecil yaitu sebesar 88,38%.","PeriodicalId":337947,"journal":{"name":"Bandung Conference Series: Statistics","volume":"7 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-08-02","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"125351967","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}