NeRF IN REINFORCEMENT LEARNING FOR IMAGE RECOGNITION

А.Ф. Гайнетдинов
{"title":"NeRF IN REINFORCEMENT LEARNING FOR IMAGE RECOGNITION","authors":"А.Ф. Гайнетдинов","doi":"10.25699/sssb.2023.48.2.011","DOIUrl":null,"url":null,"abstract":"Актуальность. В статье рассматриваются методы распознавания изображений с использованием нейронных сетей разной архитектуры, в том числе обучения с подкреплением Q-Learning. Метод. Для обучения алгоритмов и их тестирования использовались наборы изображений 6 классов лесных животных. Изучалось 6 вариаций наборов данных, отличие в которых обусловлено разной долей обучающей выборки: от 40 до 80%. Проанализировано семь методик распознавания: CNN-AE и два подхода визуального управления (NeRF-RL, DRQ-V2) обучались на основе двух- и трехмерной сверточной нейросети и Q-Learning. Результаты работы. Все испытуемые модели показывают высокий процент точности независимо от соотношения обучающей и тренирующей выборки. Минимальные результаты были зафиксированы при использовании CNN-AE, тогда как NeRF-RL и DRQ-V2 на основе двухмерных и трехмерных CNN были более точными. Обучение методов NeRF-RL и DRQ-V2 используя метод Q-Learning привел к получению наиболее точных результатов. Использование Q-Learning для обучения алгоритма NeRF-RL позволяет достичь максимальных результатов. Эта архитектура была применена для распознавания животных и распределения изображений по классам. Выводы. Таким образом, объединение алгоритмов NeRF и обучения с подкреплением является эффективным и перспективным методом распознавания изображений для использования в обработке информации со скрытых камер с целью обнаружении лесных животных.\n This study discusses image recognition methods that exploit different neural networks, including Q-Learning. The algorithms were trained and tested on images depicting 6 different classes of forest animals. A total of 6 image datasets with different amount of training data (40 to 80%) were taken. Here, seven image recognition techniques were analyzed: CNN-AE and two algorithms for visual continuous control (NeRF-RL and DRQ-V2), all trained on a two- and three-dimensional convolution neural network (CNN), as well as Q-Learning. All models had high accuracy; CNN-AE exhibited the lowest recognition accuracy, whilst NeRF-RL and DRQ-V2 based on 2D and 3D CNNs were more accurate. NeRF-RL and DRQ-V2 trained on data using the Q-Learning method yielded the highest accuracy. The use of Q-Learning to train the NeRF-RL algorithm provided the best result. This architecture has been applied for animal recognition and image classification into classes. Based on the research, the combination of NeRF algorithms and reinforcement learning is an effective and promising image recognition method for detecting forest animals in camera-trap images.","PeriodicalId":133432,"journal":{"name":"Южно-Сибирский научный вестник","volume":"86 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-04-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Южно-Сибирский научный вестник","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25699/sssb.2023.48.2.011","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Актуальность. В статье рассматриваются методы распознавания изображений с использованием нейронных сетей разной архитектуры, в том числе обучения с подкреплением Q-Learning. Метод. Для обучения алгоритмов и их тестирования использовались наборы изображений 6 классов лесных животных. Изучалось 6 вариаций наборов данных, отличие в которых обусловлено разной долей обучающей выборки: от 40 до 80%. Проанализировано семь методик распознавания: CNN-AE и два подхода визуального управления (NeRF-RL, DRQ-V2) обучались на основе двух- и трехмерной сверточной нейросети и Q-Learning. Результаты работы. Все испытуемые модели показывают высокий процент точности независимо от соотношения обучающей и тренирующей выборки. Минимальные результаты были зафиксированы при использовании CNN-AE, тогда как NeRF-RL и DRQ-V2 на основе двухмерных и трехмерных CNN были более точными. Обучение методов NeRF-RL и DRQ-V2 используя метод Q-Learning привел к получению наиболее точных результатов. Использование Q-Learning для обучения алгоритма NeRF-RL позволяет достичь максимальных результатов. Эта архитектура была применена для распознавания животных и распределения изображений по классам. Выводы. Таким образом, объединение алгоритмов NeRF и обучения с подкреплением является эффективным и перспективным методом распознавания изображений для использования в обработке информации со скрытых камер с целью обнаружении лесных животных. This study discusses image recognition methods that exploit different neural networks, including Q-Learning. The algorithms were trained and tested on images depicting 6 different classes of forest animals. A total of 6 image datasets with different amount of training data (40 to 80%) were taken. Here, seven image recognition techniques were analyzed: CNN-AE and two algorithms for visual continuous control (NeRF-RL and DRQ-V2), all trained on a two- and three-dimensional convolution neural network (CNN), as well as Q-Learning. All models had high accuracy; CNN-AE exhibited the lowest recognition accuracy, whilst NeRF-RL and DRQ-V2 based on 2D and 3D CNNs were more accurate. NeRF-RL and DRQ-V2 trained on data using the Q-Learning method yielded the highest accuracy. The use of Q-Learning to train the NeRF-RL algorithm provided the best result. This architecture has been applied for animal recognition and image classification into classes. Based on the research, the combination of NeRF algorithms and reinforcement learning is an effective and promising image recognition method for detecting forest animals in camera-trap images.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
图像识别中的强化学习
相关。这篇文章讨论了使用不同建筑的神经网络来识别图像的方法,包括强化Q-Learning的培训。方法。研究算法和测试使用了6类森林动物的图像集。研究了6个不同的数据集集,不同的是学习样本的不同部分:40到80%。CNN-AE分析了七种识别方法:CNN-AE和两种视觉控制方法(NeRF-RL, DRQ-V2)。工作成果。所有测试模型都显示了高精度,不管教学样本和训练样本的比例如何。CNN-AE的最低结果是记录在案的,而NeRF-RL和DRQ-V2基于二维和三维CNN更准确。NeRF-RL和DRQ-V2的培训使用Q-Learning方法产生了最精确的结果。使用Q-Learning来学习NeRF-RL算法可以达到最大的结果。这是一种用于动物识别和分组图像的建筑。结论。因此,将NeRF算法和培训与备份结合起来,是一种有效而有前途的识别图像的方法,用于利用隐藏摄像头的信息来识别森林动物。这个工作室的形象重建是由不同的新网络,including Q-Learning。《森林动物》中的六部不同的经典之作。在taken的40到80%的地方有6个不同的图像数据。在这里,七个想象中的技术问题:CNN-AE和两个algorithms (NeRF-RL和DRQ-V2)。所有的模特都有高水平的accuracy;CNN-AE揭露了最失败的功利主义,whilst NeRF-RL和DRQ-V2基础2D和3D CNNs更多。NeRF-RL和DRQ-V2在最高的accuracy上运行。《Q-执着》是《NeRF-RL algorithm provided最佳反应》。这是一种建筑,为动物重建和形象经典。在研究的基础上,NeRF algorithms和reinforcent是研究对象和研究森林动物的视觉治疗。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
SELF-PROPROPAGING HIGH-TEMPERATURE SYNTHESIS of almgb14 ceramic ANALYSIS OF METHODS FOR CONTROL OF OIL AND PETROLEUM PRODUCTS CONTENT IN SOIL SOFTWARE AND INFORMATION SUPPORT FOR INFORMATION AND MEASURING SYSTEM FOR BENCH TESTING OF SPECIAL CHEMICAL PRODUCTS DEVELOPMENT OF EXPERIMENTAL RESEARCH UNIT "DEFORM-RPN" FOR STUDY OF DEFORMATION OF FIRE HOSE WALLS UNDER INTERNAL PRESSURE PROMISING ROCKET FUEL COMPONENTS. II. FUEL ADDITIVES (REVIEW)
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1