Модель та засоби збирання та оброблення даних з використанням машинного навчання

Naukovii visnik NLTU Ukrayini Pub Date : 2023-05-25 DOI:10.36930/40330315

V. V. Petryna, A. V. Doroshenko, R. V. Sydorenko, V. Teslyuk

{"title":"Модель та засоби збирання та оброблення даних з використанням машинного навчання","authors":"V. V. Petryna, A. V. Doroshenko, R. V. Sydorenko, V. Teslyuk","doi":"10.36930/40330315","DOIUrl":null,"url":null,"abstract":"Досліджено вплив ітеративного методу зважування даних респондентів на підставі певних факторів на точність навчання моделі машинного навчання для вирішення завдань класифікації. Збір та оброблення даних є критичним етапом в процесі розроблення та використання моделей машинного навчання, оскільки якість та наочність даних безпосередньо впливають на точність та ефективність моделей. Проаналізовано математичне забезпечення алгоритмів моделей класифікації. Здійснено огляд літературних джерел, пов'язаних із тематикою статті. Проаналізовано набори даних, доступні у мережі для вирішення завдань класифікації. Розроблено програмне забезпечення для роботи із моделями машинного навчання. Проведено попередню підготовку вхідних даних для навчання та тестування вибраних моделей. Використано такі моделі класифікації, як наївний класифікатор Байєса, класифікатор випадкового лісу, наївний байєсів класифікатор Гауса, а також ітеративний метод зважування даних. Ці моделі інтегровано у програмне забезпечення, розроблене для оброблення, підготовки, зберігання даних. Досліджено обрані моделі із використанням попередньо підготовлених даних за допомогою програмного забезпечення відповідно до визначених сценаріїв. Згідно з результатами дослідження виявлено позитивний тренд на якість навчання моделей за коректної підготовки даних і вибору відповідних змінних для зважування даних респондентів. Показники ефективності, точності навчання алгоритму показують позитивну динаміку порівняно з результатами тестування моделей без використання зважування даних. Результатами дослідження підтверджується значущий вплив ітеративного методу зважування даних на результати навчання, тренування та тестування моделей машинного навчання, а саме мультиплікативного класифікатора Байєса.","PeriodicalId":33529,"journal":{"name":"Naukovii visnik NLTU Ukrayini","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-05-25","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Naukovii visnik NLTU Ukrayini","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.36930/40330315","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

Досліджено вплив ітеративного методу зважування даних респондентів на підставі певних факторів на точність навчання моделі машинного навчання для вирішення завдань класифікації. Збір та оброблення даних є критичним етапом в процесі розроблення та використання моделей машинного навчання, оскільки якість та наочність даних безпосередньо впливають на точність та ефективність моделей. Проаналізовано математичне забезпечення алгоритмів моделей класифікації. Здійснено огляд літературних джерел, пов'язаних із тематикою статті. Проаналізовано набори даних, доступні у мережі для вирішення завдань класифікації. Розроблено програмне забезпечення для роботи із моделями машинного навчання. Проведено попередню підготовку вхідних даних для навчання та тестування вибраних моделей. Використано такі моделі класифікації, як наївний класифікатор Байєса, класифікатор випадкового лісу, наївний байєсів класифікатор Гауса, а також ітеративний метод зважування даних. Ці моделі інтегровано у програмне забезпечення, розроблене для оброблення, підготовки, зберігання даних. Досліджено обрані моделі із використанням попередньо підготовлених даних за допомогою програмного забезпечення відповідно до визначених сценаріїв. Згідно з результатами дослідження виявлено позитивний тренд на якість навчання моделей за коректної підготовки даних і вибору відповідних змінних для зважування даних респондентів. Показники ефективності, точності навчання алгоритму показують позитивну динаміку порівняно з результатами тестування моделей без використання зважування даних. Результатами дослідження підтверджується значущий вплив ітеративного методу зважування даних на результати навчання, тренування та тестування моделей машинного навчання, а саме мультиплікативного класифікатора Байєса.

查看原文

微信好友朋友圈 QQ好友复制链接

本刊更多论文

使用机器学习收集和处理数据的模型和工具

研究了加权分量的迭代方法对学习机器学习模型以解决分类任务的准确性的影响。数据收集和处理是开发和使用机器学习模型过程中的关键步骤，因为数据的质量和准确性直接影响模型的准确性和有效性。分析了分类模型算法的数学规定。看看与这篇文章相关的文学资料。已经分析了在线可用于解决分类任务的数据集。设计用于机器学习模型的软件。先前准备的输入数据用于学习和测试选定的模型。使用了贝叶斯天真分类器、随机森林分类器、高斯天真分类器等分类模型，以及加权数据的迭代方法。这些模型集成到设计用于处理、准备和存储数据的软件中。根据定义的场景，使用预先准备好的数据，使用软件对选定的模型进行调查。根据研究结果，在模型的质量方面发现了一个积极的趋势，即正确的数据准备和选择适当的变量来衡量成分。与没有数据加权的模型测试结果相比，功效指标、算法学习准确性显示出积极的动态。结果证实了加权数据的迭代方法对机器学习模型的学习、训练和测试的显著影响，它是贝叶斯的乘法分类器。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文去求助

来源期刊

Naukovii visnik NLTU Ukrayini

自引率

0.00%

发文量

审稿时长

4 weeks