Metodología de desarrollo de técnicas de agrupamiento de datos usando aprendizaje automático

Tecnura Pub Date : 2022-04-01 DOI:10.14483/22487638.17246
Ghiordy Ferney Contreras Contreras, Byron Medina Delgado, Brayan Rene Acevedo Jaimes, Dinael Guevara Ibarra
{"title":"Metodología de desarrollo de técnicas de agrupamiento de datos usando aprendizaje automático","authors":"Ghiordy Ferney Contreras Contreras, Byron Medina Delgado, Brayan Rene Acevedo Jaimes, Dinael Guevara Ibarra","doi":"10.14483/22487638.17246","DOIUrl":null,"url":null,"abstract":"Contexto: Hoy en día, el uso de grandes cantidades de datos adquiridos desde diversos dispositivos y equipos electrónicos, ópticos u otra tecnología de medición, generan un problema de análisis de datos en el momento de extraer la información de interés desde las muestras adquiridas. En ellos, agrupar correctamente los datos es necesario para obtener información relevante y precisa para evidenciar el fenómeno físico que se desea abordar.\nMetodología: El trabajo presenta la evolución de una metodología de cinco etapas para el desarrollo de una técnica de agrupamiento de datos, a través de técnicas de aprendizaje automático e inteligencia artificial. Esta se compone de cinco fases denominadas análisis, diseño, desarrollo, evaluación y distribución, con estándares de código abierto y fundamentadas en los lenguajes unificados para la interpretación del software en ingeniería.\nResultados: La validación de la metodología se ha desarrollado mediante la creación de dos métodos de análisis de datos, con un tiempo de ejecución promedio de 20 semanas, obteniendo valores de precisión 40 % y 29 % superiores con los algoritmos clásicos de agrupamiento de datos de k-means y fuzzy c-means. Adicionalmente, se encuentra una metodología de experimentación masiva sobre pruebas unitarias automatizadas, las cuales lograron agrupar, etiquetar y validar 3,6 millones de muestras, acumulado un total de 100 ejecuciones de grupos de 900 muestras, en aproximadamente 2 horas.\nConclusiones: Con los resultados de la investigación se ha determinado que la metodología pretende orientar el desarrollo sistemático de técnicas de agrupamiento de datos, en problemas específicos para bases integradas por muestras con atributos cuantitativos, como los casos de parámetros de canal en un sistema de comunicaciones o la segmentación de imágenes usando los valoras RGB de los pixeles; incluso, cuando se desarrolla software y hardware, la ejecución será más versátil que en casos con aplicaciones teóricas.","PeriodicalId":30372,"journal":{"name":"Tecnura","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2022-04-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Tecnura","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.14483/22487638.17246","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1

Abstract

Contexto: Hoy en día, el uso de grandes cantidades de datos adquiridos desde diversos dispositivos y equipos electrónicos, ópticos u otra tecnología de medición, generan un problema de análisis de datos en el momento de extraer la información de interés desde las muestras adquiridas. En ellos, agrupar correctamente los datos es necesario para obtener información relevante y precisa para evidenciar el fenómeno físico que se desea abordar. Metodología: El trabajo presenta la evolución de una metodología de cinco etapas para el desarrollo de una técnica de agrupamiento de datos, a través de técnicas de aprendizaje automático e inteligencia artificial. Esta se compone de cinco fases denominadas análisis, diseño, desarrollo, evaluación y distribución, con estándares de código abierto y fundamentadas en los lenguajes unificados para la interpretación del software en ingeniería. Resultados: La validación de la metodología se ha desarrollado mediante la creación de dos métodos de análisis de datos, con un tiempo de ejecución promedio de 20 semanas, obteniendo valores de precisión 40 % y 29 % superiores con los algoritmos clásicos de agrupamiento de datos de k-means y fuzzy c-means. Adicionalmente, se encuentra una metodología de experimentación masiva sobre pruebas unitarias automatizadas, las cuales lograron agrupar, etiquetar y validar 3,6 millones de muestras, acumulado un total de 100 ejecuciones de grupos de 900 muestras, en aproximadamente 2 horas. Conclusiones: Con los resultados de la investigación se ha determinado que la metodología pretende orientar el desarrollo sistemático de técnicas de agrupamiento de datos, en problemas específicos para bases integradas por muestras con atributos cuantitativos, como los casos de parámetros de canal en un sistema de comunicaciones o la segmentación de imágenes usando los valoras RGB de los pixeles; incluso, cuando se desarrolla software y hardware, la ejecución será más versátil que en casos con aplicaciones teóricas.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
使用机器学习开发数据聚类技术的方法
背景:今天,使用从各种电子、光学或其他测量技术的设备和设备中采集的大量数据,在从采集的样本中提取感兴趣的信息时,会产生数据分析问题。在其中,正确分组数据对于获得相关和准确的信息以证明想要解决的物理现象是必要的。方法:该论文介绍了通过机器学习和人工智能技术开发数据聚类技术的五阶段方法的演变。它由五个阶段组成,称为分析、设计、开发、评估和分发,采用开源标准,并以工程中解释软件的统一语言为基础。结果:该方法的验证是通过创建两种数据分析方法进行的,平均运行时间为20周,与经典的K-means和模糊C-means数据聚类算法相比,精度分别提高了40%和29%。此外,还发现了一种关于自动化单元测试的大规模实验方法,该方法成功地对360万个样本进行了分组、标记和验证,在大约2小时内累计执行了100次900个样本的分组。结论:研究结果表明,该方法旨在指导数据聚类技术的系统开发,解决由具有定量属性的样本组成的数据库的具体问题,例如通信系统中的信道参数案例或使用像素的RGB值进行图像分割;即使在开发软件和硬件时,执行也将比理论应用程序更具通用性。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
29
审稿时长
40 weeks
期刊最新文献
Determinantes de la Transferencia Tecnológica Universitaria en Colombia Evaluación de un residuo de la combustión de carbón como reemplazo parcial de arena en la producción de ladrillos cerámicos Optimal integration of D-STATCOMs in electrical distribution systems for investment and operating cost reduction by using a Master-Slave Methodology between GA/PSO El conocimiento previo cultural como factor de influencia en la interculturalidad y movilidad estudiantil universitaria Análisis energético de edificios, mediante termografía infrarroja aplicada con un dron cuadricóptero Parrot Anafi thermal
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1