ADVERSARIAL LEARNING IN IMAGE SEGMENTATION

А.Ф. Гайнетдинов
{"title":"ADVERSARIAL LEARNING IN IMAGE SEGMENTATION","authors":"А.Ф. Гайнетдинов","doi":"10.25699/sssb.2023.51.5.005","DOIUrl":null,"url":null,"abstract":"В статье рассматриваются методы нейронных сетей для сегментации изображений транспортных средств. Метод. Использовалось 3 нейронных сети: сверточная нейронная сеть (CNN), специализированные глубокие сверточные сети (TDCNN), сеть CowOut/CowMix, а также генеративно-состязательная сеть (GAN). В качестве объектов исследования были выбраны изображения автомобилей, автобусов, мотоциклов и велосипедов. Для обучения использовали разное количество изображений из выборки: от 30 до 300. Результаты работы.Все испытуемые модели показывают высокий процент эффективности. Значения показателей значительно увеличиваются с ростом количества данных для обучения во всех случаях. Минимальные результаты наблюдались при использовании типичной модели CNN и других нейронных сетей, тогда как генеративно-состязательная была наиболее результативной. В конечном итоге, показатели для классов «автомобиль», «автобус», «велосипед» и «мотоцикл» соответственно: IoU = 70,9%, 71,2%, 65,7%, 70,4%; dice = 96,0%, 97,3%, 94,7%, 96,7%; precision = 85,2%, 85,4%, 78,9%, 82,4%; specificity = 79,5%, 79,2%, 68,9%, 75,2%; accuracy = 80,3%, 80,3%, 75,3%, 79,7%. Выводы. Таким образом, применение состязательной сети является эффективным методом сегментации изображений транспортных средств, особенно автомобилей и автобосув, что может быть использовано в машинном зрении. This article discusses different methods of vehicle image segmentation based on neural network. A total of four neural networks were employed: the Convolutional Neural Network (CNN), the Tailored Deep Convolutional Neural Network (TDCNN), the CowOut/CowMix Network, and the Generative Adversarial Network (GAN). The dataset contained images of cars, buses, motorcycles and bicycles. The training datasets comprised 30 to 300 images. All models under testing show high efficiency. As the training data size increased, the values of the indicators also increased significantly; this is true for all cases. The typical CNN model and other neural networks performed poorer than the GAN model, which proved to be the most effective. For the datasets “car”, “bus”, “bicycle” and “motorcycle”, the following indicators were obtained: IoU = 70.9%, 71.2%, 65.7%, and 70.4%; dice = 96.0%, 97.3%, 94.7%, and 96.7%; precision = 85.2%, 85.4%, 78.9%, and 82.4%; specificity = 79.5%, 79.2%, 68.9%, and 75.2%; accuracy = 80.3%, 80.3%, 75.3%, and 79.7%, respectively. Based on the research, adversarial training is an effective method to segment out vehicles, especially cars and trucks, which can be used in machine vision.","PeriodicalId":133432,"journal":{"name":"Южно-Сибирский научный вестник","volume":"43 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-10-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Южно-Сибирский научный вестник","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25699/sssb.2023.51.5.005","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

В статье рассматриваются методы нейронных сетей для сегментации изображений транспортных средств. Метод. Использовалось 3 нейронных сети: сверточная нейронная сеть (CNN), специализированные глубокие сверточные сети (TDCNN), сеть CowOut/CowMix, а также генеративно-состязательная сеть (GAN). В качестве объектов исследования были выбраны изображения автомобилей, автобусов, мотоциклов и велосипедов. Для обучения использовали разное количество изображений из выборки: от 30 до 300. Результаты работы.Все испытуемые модели показывают высокий процент эффективности. Значения показателей значительно увеличиваются с ростом количества данных для обучения во всех случаях. Минимальные результаты наблюдались при использовании типичной модели CNN и других нейронных сетей, тогда как генеративно-состязательная была наиболее результативной. В конечном итоге, показатели для классов «автомобиль», «автобус», «велосипед» и «мотоцикл» соответственно: IoU = 70,9%, 71,2%, 65,7%, 70,4%; dice = 96,0%, 97,3%, 94,7%, 96,7%; precision = 85,2%, 85,4%, 78,9%, 82,4%; specificity = 79,5%, 79,2%, 68,9%, 75,2%; accuracy = 80,3%, 80,3%, 75,3%, 79,7%. Выводы. Таким образом, применение состязательной сети является эффективным методом сегментации изображений транспортных средств, особенно автомобилей и автобосув, что может быть использовано в машинном зрении. This article discusses different methods of vehicle image segmentation based on neural network. A total of four neural networks were employed: the Convolutional Neural Network (CNN), the Tailored Deep Convolutional Neural Network (TDCNN), the CowOut/CowMix Network, and the Generative Adversarial Network (GAN). The dataset contained images of cars, buses, motorcycles and bicycles. The training datasets comprised 30 to 300 images. All models under testing show high efficiency. As the training data size increased, the values of the indicators also increased significantly; this is true for all cases. The typical CNN model and other neural networks performed poorer than the GAN model, which proved to be the most effective. For the datasets “car”, “bus”, “bicycle” and “motorcycle”, the following indicators were obtained: IoU = 70.9%, 71.2%, 65.7%, and 70.4%; dice = 96.0%, 97.3%, 94.7%, and 96.7%; precision = 85.2%, 85.4%, 78.9%, and 82.4%; specificity = 79.5%, 79.2%, 68.9%, and 75.2%; accuracy = 80.3%, 80.3%, 75.3%, and 79.7%, respectively. Based on the research, adversarial training is an effective method to segment out vehicles, especially cars and trucks, which can be used in machine vision.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
图像分割中的对抗学习
本文讨论了用于车辆图像分割的神经网络方法。方法。使用了 3 种神经网络:卷积神经网络(CNN)、专用深度卷积网络(TDCNN)、CowOut/CowMix 网络和生成对抗网络(GAN)。研究对象包括汽车、公共汽车、摩托车和自行车。样本中不同数量的图像被用于训练:从 30 到 300 幅图像不等。性能结果:所有测试模型都显示出很高的性能百分比。在所有情况下,随着训练数据数量的增加,性能值都有明显提高。典型的 CNN 模型和其他神经网络的性能最低,而生成-对抗模型的性能最高。最终,"汽车"、"公共汽车"、"自行车 "和 "摩托车 "类别的性能分别为IoU=70.9%、71.2%、65.7%、70.4%;骰子=96.0%、97.3%、94.7%、96.7%;精确度=85.2%、85.4%、78.9%、82.4%;特异度=79.5%、79.2%、68.9%、75.2%;准确度=80.3%、80.3%、75.3%、79.7%。结论因此,应用对抗网络是分割车辆图像(尤其是汽车和车身)的有效方法,可用于机器视觉。 本文讨论了基于神经网络的不同车辆图像分割方法。本文共使用了四种神经网络:卷积神经网络(CNN)、定制深度卷积神经网络(TDCNN)、CowOut/CowMix 网络和生成对抗网络(GAN)。数据集包含汽车、公共汽车、摩托车和自行车的图像。训练数据集包括 30 至 300 张图像。测试中的所有模型都表现出很高的效率。随着训练数据量的增加,指标值也显著增加;所有情况都是如此。典型的 CNN 模型和其他神经网络的表现不如 GAN 模型,而 GAN 模型被证明是最有效的。对于 "汽车"、"公共汽车"、"自行车 "和 "摩托车 "数据集,得到了以下指标:IoU = 70.9%、71.2%、65.7% 和 70.4%;骰子 = 96.0%、97.3%、94.7% 和 96.7%;精确度 = 85.2%、85.4%、78.9% 和 82.4%;特异度 = 79.5%、79.2%、68.9% 和 75.2%;准确度 = 80.3%、80.3%、75.3% 和 79.7%。根据研究结果,对抗训练是一种有效的车辆分割方法,尤其是汽车和卡车,可用于机器视觉。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
SELF-PROPROPAGING HIGH-TEMPERATURE SYNTHESIS of almgb14 ceramic ANALYSIS OF METHODS FOR CONTROL OF OIL AND PETROLEUM PRODUCTS CONTENT IN SOIL SOFTWARE AND INFORMATION SUPPORT FOR INFORMATION AND MEASURING SYSTEM FOR BENCH TESTING OF SPECIAL CHEMICAL PRODUCTS DEVELOPMENT OF EXPERIMENTAL RESEARCH UNIT "DEFORM-RPN" FOR STUDY OF DEFORMATION OF FIRE HOSE WALLS UNDER INTERNAL PRESSURE PROMISING ROCKET FUEL COMPONENTS. II. FUEL ADDITIVES (REVIEW)
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1