F. Azmi, Kevin Utama, Oki Thomas Gurning, Syukurman Ndraha
{"title":"Initial Centroid Optimization of K-Means Algorithm Using Cosine Similarity","authors":"F. Azmi, Kevin Utama, Oki Thomas Gurning, Syukurman Ndraha","doi":"10.31289/jite.v3i2.3211","DOIUrl":null,"url":null,"abstract":"Clustering salah satu metode yang sering digunakan di berbagai bidang yang melakukan analisis data, termasuk penggalian data, pengambilan dokumen, segmentasi gambar, dan klasifikasi pola. Adapaun tujuan dari metode tersebut adalah untuk mengelompokkan data ke dalam suatu cluster sehingga kesamaan antara anggota data dalam suatu data informasi yang telah di- cluster yang sama adalah maksimal, di sisi lain untuk kesamaan di antara anggota data yang lain berbeda cluster minimal. Ada beberapa pendekatan metode untuk mengurangi kesalahan pada saat centroid awal yang dipilih selama proses pengelompokan berlangsung. Disini data yang digunakan adalah data acak yang dibuat secara manual yatu 30 data dan 5 atribut, sehingga diperoleh hasil akurasi clustering dalam centroid dengan menggunakan metode K-Means memiliki signifikan 86.67%, sedangkan menggunakan K-Means dengan cosine similarity tidak jauh berbeda yaitu sebesar 89.7%, maka dari itu hasilnya cukup baik.","PeriodicalId":0,"journal":{"name":"","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2020-01-20","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.31289/jite.v3i2.3211","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 2
Abstract
Clustering salah satu metode yang sering digunakan di berbagai bidang yang melakukan analisis data, termasuk penggalian data, pengambilan dokumen, segmentasi gambar, dan klasifikasi pola. Adapaun tujuan dari metode tersebut adalah untuk mengelompokkan data ke dalam suatu cluster sehingga kesamaan antara anggota data dalam suatu data informasi yang telah di- cluster yang sama adalah maksimal, di sisi lain untuk kesamaan di antara anggota data yang lain berbeda cluster minimal. Ada beberapa pendekatan metode untuk mengurangi kesalahan pada saat centroid awal yang dipilih selama proses pengelompokan berlangsung. Disini data yang digunakan adalah data acak yang dibuat secara manual yatu 30 data dan 5 atribut, sehingga diperoleh hasil akurasi clustering dalam centroid dengan menggunakan metode K-Means memiliki signifikan 86.67%, sedangkan menggunakan K-Means dengan cosine similarity tidak jauh berbeda yaitu sebesar 89.7%, maka dari itu hasilnya cukup baik.