Надія Олександрівна Кушнір, Тамара Миколаївна Локтікова, Андрій Васильович Морозов, Владислав Олегович Юрченко
{"title":"使用基于网格的神经元对图像进行识别和分类","authors":"Надія Олександрівна Кушнір, Тамара Миколаївна Локтікова, Андрій Васильович Морозов, Владислав Олегович Юрченко","doi":"10.26642/ten-2022-1(89)-93-100","DOIUrl":null,"url":null,"abstract":"Досліджується застосування штучних нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень. Розглядається класична задача класифікації об’єктів на зображенні, а саме визначення статі особи за її обличчям. Це зумовлено тим, що існує вдалий набір даних, який складається з 47009 зображень облич чоловіків та жінок для навчання та 11649 зображень облич для тестування штучної нейронної мережі. Запропоновано використання згорткової нейронної мережі. Такий підхід дозволяє зменшити обсяг інформації, що зберігається у пам’яті, а також ієрархічно виділити та агрегувати ознаки вхідних даних. Згорткова нейронна мережа складається з декількох блоків згорткових й агрегувального шарів, шару вирівнювання, шарів повнозв’язних нейронів, вихідного нейрона. Пороговою активаційною функцію для всіх нейронів, окрім вихідного, обрано функцію «ReLU». Активаційною функцією вихідного нейрона є сигмоїдальна. Здійснено побудову нейронної мережі, її навчання та тестування із застосуванням бібліотеки «TensorFlow», API «Keras.NET», а також розробленої бібліотеки методів на базі платформи «.NET Standard 2.0». Для візуального відображення налаштування відповідних процесів розроблено віконний додаток на базі платформ «.NET 6.0» та «WPF». Для побудови необхідних графіків використано бібліотеку «OxyPlot». Досліджено якість роботи пропонованої згорткової нейронної мережі залежно від кількості блоків та розмірів фільтра згортки. Найкращі результати роботи досягаються із 3 блоками згорткових та агрегувального шарів та розмірами фільтра згортки 3 x 3 пікселів. Оптимальної точності класифікації об’єктів зображень мережа набуває при її навчанні протягом 14 епох.","PeriodicalId":33761,"journal":{"name":"Tekhnichna inzheneriia","volume":"1 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-07-07","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Використання згорткових нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень\",\"authors\":\"Надія Олександрівна Кушнір, Тамара Миколаївна Локтікова, Андрій Васильович Морозов, Владислав Олегович Юрченко\",\"doi\":\"10.26642/ten-2022-1(89)-93-100\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Досліджується застосування штучних нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень. Розглядається класична задача класифікації об’єктів на зображенні, а саме визначення статі особи за її обличчям. Це зумовлено тим, що існує вдалий набір даних, який складається з 47009 зображень облич чоловіків та жінок для навчання та 11649 зображень облич для тестування штучної нейронної мережі. Запропоновано використання згорткової нейронної мережі. Такий підхід дозволяє зменшити обсяг інформації, що зберігається у пам’яті, а також ієрархічно виділити та агрегувати ознаки вхідних даних. Згорткова нейронна мережа складається з декількох блоків згорткових й агрегувального шарів, шару вирівнювання, шарів повнозв’язних нейронів, вихідного нейрона. Пороговою активаційною функцію для всіх нейронів, окрім вихідного, обрано функцію «ReLU». Активаційною функцією вихідного нейрона є сигмоїдальна. Здійснено побудову нейронної мережі, її навчання та тестування із застосуванням бібліотеки «TensorFlow», API «Keras.NET», а також розробленої бібліотеки методів на базі платформи «.NET Standard 2.0». Для візуального відображення налаштування відповідних процесів розроблено віконний додаток на базі платформ «.NET 6.0» та «WPF». Для побудови необхідних графіків використано бібліотеку «OxyPlot». Досліджено якість роботи пропонованої згорткової нейронної мережі залежно від кількості блоків та розмірів фільтра згортки. Найкращі результати роботи досягаються із 3 блоками згорткових та агрегувального шарів та розмірами фільтра згортки 3 x 3 пікселів. Оптимальної точності класифікації об’єктів зображень мережа набуває при її навчанні протягом 14 епох.\",\"PeriodicalId\":33761,\"journal\":{\"name\":\"Tekhnichna inzheneriia\",\"volume\":\"1 1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-07-07\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Tekhnichna inzheneriia\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.26642/ten-2022-1(89)-93-100\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Tekhnichna inzheneriia","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26642/ten-2022-1(89)-93-100","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
摘要
研究了人工神经网络在图像对象识别和分类中的应用。考虑对图像中的对象进行分类的经典任务,即确定人脸后面的人的状态。这是因为有一组成功的数据,包括47009张用于学习的男性和女性面部图像,以及11649张用于测试人工神经网络的面部图像。建议使用网格。这种方法允许您减少存储在内存中的信息量,并分层选择和聚合输入标签。网格由几个网格块和聚合层、对齐层、完全连接的神经元层、输出神经元组成。选择除输出之外的所有神经元的条件激活函数作为“ReLU”函数。输出神经元的激活函数是对称的。使用TensorFlow库Keras API构建、教授和测试了神经网络。NET“以及一个基于平台的方法库”。NET标准2.0’。已经开发了一个基于平台的窗口插件,可以直观地显示进程的配置。NET 6.0和WPF。OxyPlot库用于构建必要的图形。根据块的数量和网格滤波器的大小来研究所提出的网格的工作质量。使用3块折叠和聚集层和3 x 3像素滤波器尺寸可获得最佳结果。网络图像对象分类的最佳精度是通过学习14个世纪来实现的。
Використання згорткових нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень
Досліджується застосування штучних нейронних мереж у задачах розпізнавання та класифікації об’єктів зображень. Розглядається класична задача класифікації об’єктів на зображенні, а саме визначення статі особи за її обличчям. Це зумовлено тим, що існує вдалий набір даних, який складається з 47009 зображень облич чоловіків та жінок для навчання та 11649 зображень облич для тестування штучної нейронної мережі. Запропоновано використання згорткової нейронної мережі. Такий підхід дозволяє зменшити обсяг інформації, що зберігається у пам’яті, а також ієрархічно виділити та агрегувати ознаки вхідних даних. Згорткова нейронна мережа складається з декількох блоків згорткових й агрегувального шарів, шару вирівнювання, шарів повнозв’язних нейронів, вихідного нейрона. Пороговою активаційною функцію для всіх нейронів, окрім вихідного, обрано функцію «ReLU». Активаційною функцією вихідного нейрона є сигмоїдальна. Здійснено побудову нейронної мережі, її навчання та тестування із застосуванням бібліотеки «TensorFlow», API «Keras.NET», а також розробленої бібліотеки методів на базі платформи «.NET Standard 2.0». Для візуального відображення налаштування відповідних процесів розроблено віконний додаток на базі платформ «.NET 6.0» та «WPF». Для побудови необхідних графіків використано бібліотеку «OxyPlot». Досліджено якість роботи пропонованої згорткової нейронної мережі залежно від кількості блоків та розмірів фільтра згортки. Найкращі результати роботи досягаються із 3 блоками згорткових та агрегувального шарів та розмірами фільтра згортки 3 x 3 пікселів. Оптимальної точності класифікації об’єктів зображень мережа набуває при її навчанні протягом 14 епох.