Normalización en desempeño de k-means sobre datos climáticos

Juan Sebastián Ramírez Gómez, Néstor Darío Duque Méndez, Jorge Julián Vélez Upegui
{"title":"Normalización en desempeño de k-means sobre datos climáticos","authors":"Juan Sebastián Ramírez Gómez, Néstor Darío Duque Méndez, Jorge Julián Vélez Upegui","doi":"10.14483/2322939x.15550","DOIUrl":null,"url":null,"abstract":"El análisis de clúster sobre datos climatológicos es usado en diversas investigaciones dado que permite obtener resultados interesantes para cada enfoque propuesto. Por tanto, en este trabajo se presenta la evaluación de desempeño del algoritmo de agrupamiento K-Means a partir del uso de normalización aplicada a un conjunto de datos con cuatro variables climatológicas (temperatura, precipitación, humedad relativa y radiación solar) para una estación ubicada en la ciudad de Manizales, Colombia. Esto con el fin de determinar el efecto de aplicar, o no, la normalización en la calidad de los clústeres y evaluar el costo computacional del algoritmo según las características establecidas. Para ello se definen seis escenarios de ejecución para 2, 3 y 5 clústeres con diferente cantidad y agrupación de variables utilizando distancia euclidiana como medida de alejamiento, Davies-Bouldin como método evaluación de calidad de los clústeres y la aplicación de normalización con Z-transformation y Range transformation. Se concluye que, a través de una comparación con k-medoides y aplicación STFT (Transformada de Fourier de Tiempo Reducido), la normalización mejora los resultados y con Z-transformation se obtienen los mejores desempeños de agrupamiento según el índice de Davis-Bouldin.","PeriodicalId":33457,"journal":{"name":"Revista Vinculos","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2019-06-12","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista Vinculos","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.14483/2322939x.15550","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

El análisis de clúster sobre datos climatológicos es usado en diversas investigaciones dado que permite obtener resultados interesantes para cada enfoque propuesto. Por tanto, en este trabajo se presenta la evaluación de desempeño del algoritmo de agrupamiento K-Means a partir del uso de normalización aplicada a un conjunto de datos con cuatro variables climatológicas (temperatura, precipitación, humedad relativa y radiación solar) para una estación ubicada en la ciudad de Manizales, Colombia. Esto con el fin de determinar el efecto de aplicar, o no, la normalización en la calidad de los clústeres y evaluar el costo computacional del algoritmo según las características establecidas. Para ello se definen seis escenarios de ejecución para 2, 3 y 5 clústeres con diferente cantidad y agrupación de variables utilizando distancia euclidiana como medida de alejamiento, Davies-Bouldin como método evaluación de calidad de los clústeres y la aplicación de normalización con Z-transformation y Range transformation. Se concluye que, a través de una comparación con k-medoides y aplicación STFT (Transformada de Fourier de Tiempo Reducido), la normalización mejora los resultados y con Z-transformation se obtienen los mejores desempeños de agrupamiento según el índice de Davis-Bouldin.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
气候数据K-means性能的标准化
气候数据聚类分析用于各种研究,因为它可以为每种提出的方法获得有趣的结果。因此,本文介绍了K-means聚类算法的性能评估,该算法基于对哥伦比亚马尼萨雷斯市一个站点的一组具有四个气候变量(温度、降水、相对湿度和太阳辐射)的数据进行归一化。这是为了确定是否应用归一化对集群质量的影响,并根据所建立的特征评估算法的计算成本。为此,使用欧几里德距离作为距离测量,戴维斯-博尔丁作为聚类质量评估方法,并应用Z变换和距离变换进行归一化,为2、3和5个不同数量的集群定义了6个执行场景,并对变量进行了分组。得出的结论是,通过与K-Medoides和STFT(缩短时间傅立叶变换)应用的比较,归一化改善了结果,并根据Davis-Bouldin指数通过Z变换获得了最佳的聚类性能。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
审稿时长
7 weeks
期刊最新文献
Consideraciones para fortalecer la vinculación universitaria en territorios rurales. Reflexiones con base en el estudio de sistemas de producción Diagnóstico y perspectivas de fomento del emprendimiento como instrumento de desarrollo en el cantón San Pedro de Pelileo Nivel de conocimiento de protocolos de primeros auxilios en docentes de educación inicial y preparatoria de instituciones educativas de la ciudad de Quito Análisis comparativo de la formación de los docentes de idiomas en la educación superior ecuatoriana: la importancia de la Psicología El juego-trabajo como estrategia de enseñanza-aprendizaje en Educación Inicial
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1