Pub Date : 2024-03-11DOI: 10.18690/um.feri.1.2024.2
Domen Tabernik, Peter Mlakar, Jakob Božič, Luka Čehovin Zajc, Vid Rijavec, Danijel Skočaj
V zadnjih letih so metode globokega učenja postale ključno orodje za reševanje raznolikih praktičnih izzivov. Kljub temu pa potencial takih metod pogosto ostaja slabo razumljiv širši javnosti zaradi pogostega ločevanja razvoja in demonstracije algoritmov od dejanskih praktičnih problemov, ki jih algoritmi naslavljajo. V tem članku predstavljamo demonstracijsko celico, ki združuje strojno in programsko opremo ter algoritme globokega učenja, omogočajoč enostavno prikazovanje delovanja teh metod v različnih aplikativnih domenah. Celica vključuje kamere, grafični vmesnik in pet demonstracijskih programov, ki demonstrirajo klasifikacijo lesenih desk, detekcijo površinskih anomalij, štetje polipov, detekcijo prometnih znakov in detekcijo vogalov tekstilnih izdelkov. Implementiran modularni pristop omogoča enostavno integracijo različnih algoritmov globokega učenja. Sistem omogoča boljše razumevanje in uporabo teh metod v praktičnih scenarijih ter prispeva k razvoju inovativnih rešitev na področju globokega učenja.
{"title":"Demonstracijska celica za prikaz globokega učenja v praktičnih aplikacijah","authors":"Domen Tabernik, Peter Mlakar, Jakob Božič, Luka Čehovin Zajc, Vid Rijavec, Danijel Skočaj","doi":"10.18690/um.feri.1.2024.2","DOIUrl":"https://doi.org/10.18690/um.feri.1.2024.2","url":null,"abstract":"V zadnjih letih so metode globokega učenja postale ključno orodje za reševanje raznolikih praktičnih izzivov. Kljub temu pa potencial takih metod pogosto ostaja slabo razumljiv širši javnosti zaradi pogostega ločevanja razvoja in demonstracije algoritmov od dejanskih praktičnih problemov, ki jih algoritmi naslavljajo. V tem članku predstavljamo demonstracijsko celico, ki združuje strojno in programsko opremo ter algoritme globokega učenja, omogočajoč enostavno prikazovanje delovanja teh metod v različnih aplikativnih domenah. Celica vključuje kamere, grafični vmesnik in pet demonstracijskih programov, ki demonstrirajo klasifikacijo lesenih desk, detekcijo površinskih anomalij, štetje polipov, detekcijo prometnih znakov in detekcijo vogalov tekstilnih izdelkov. Implementiran modularni pristop omogoča enostavno integracijo različnih algoritmov globokega učenja. Sistem omogoča boljše razumevanje in uporabo teh metod v praktičnih scenarijih ter prispeva k razvoju inovativnih rešitev na področju globokega učenja.","PeriodicalId":517885,"journal":{"name":"ROSUS 2024 - Računalniška obdelava slik in njena uporaba v Sloveniji 2024: Zbornik 18. strokovne konference","volume":"29 33","pages":""},"PeriodicalIF":0.0,"publicationDate":"2024-03-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"140396045","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2024-03-11DOI: 10.18690/um.feri.1.2024.9
Milan Bajić, B. Potočnik
There is currently no recommended procedure for acquiring endmembers in hyperspectral target detection when targets are larger than a single pixel. What is the best approach when multiple cameras are available for a dataset construction? This study examines the differences between hyperspectral cameras Specim IQ and Specim Imspector V9 that recorded the same surfaces under the same lighting conditions. A white balance card and a mortar mine are considered. As calibration procedures for cameras differ, raw data without processing are compared, and the same wavelength range is chosen. Clear differences are noticed between the spectra of the two cameras. Finally, guidelines for selecting statistically reliable endmembers and constructing an endmember dataset are provided based on the obtained results.
当目标大于单个像素时,高光谱目标检测中目前还没有推荐的获取内涵的程序。当有多台相机可用于数据集构建时,最佳方法是什么?本研究考察了高光谱相机 Specim IQ 和 Specim Imspector V9 在相同照明条件下记录相同表面时的差异。研究考虑了白平衡卡和砂浆矿。由于相机的校准程序不同,因此对未经处理的原始数据进行了比较,并选择了相同的波长范围。结果发现两台相机的光谱存在明显差异。最后,根据获得的结果,提供了选择统计上可靠的内含物和构建内含物数据集的指导原则。
{"title":"Spectral Response of Two Hyperspectral Cameras for UXO Endmember Selection","authors":"Milan Bajić, B. Potočnik","doi":"10.18690/um.feri.1.2024.9","DOIUrl":"https://doi.org/10.18690/um.feri.1.2024.9","url":null,"abstract":"There is currently no recommended procedure for acquiring endmembers in hyperspectral target detection when targets are larger than a single pixel. What is the best approach when multiple cameras are available for a dataset construction? This study examines the differences between hyperspectral cameras Specim IQ and Specim Imspector V9 that recorded the same surfaces under the same lighting conditions. A white balance card and a mortar mine are considered. As calibration procedures for cameras differ, raw data without processing are compared, and the same wavelength range is chosen. Clear differences are noticed between the spectra of the two cameras. Finally, guidelines for selecting statistically reliable endmembers and constructing an endmember dataset are provided based on the obtained results.","PeriodicalId":517885,"journal":{"name":"ROSUS 2024 - Računalniška obdelava slik in njena uporaba v Sloveniji 2024: Zbornik 18. strokovne konference","volume":"85 1","pages":""},"PeriodicalIF":0.0,"publicationDate":"2024-03-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"140284846","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2024-03-11DOI: 10.18690/um.feri.1.2024.8
Bine Markelj, Peter Peer, Borut Batagelj
V članku predstavimo postopke in tehnike generiranja globoko ponarejenih videoposnetkov ali krajše globokih ponaredkov (angl. deepfakes). To so videoposnetki, pri katerih je prišlo do manipulacij s tehnikami globokega učenja. Taki videoposnetki predstavljajo velik problem pri širjenju lažnih novic, politični propagandi, uničevanju podobe posameznikov, izdelavi pornografskih vsebin, izsiljevanju itd. V članku opišemo podatkovno zbirko FaceForensics++ in predstavimo lastno metodo za potencialno izdelavo podzbirke omenjene baze z uporabo najnovejših generativnih difuzijskih modelov. Uporabljene postopke eksperimenta predstavimo in analiziramo njihovo kvaliteto in uspešnost. Komentiramo tudi smiselnost uporabe in nevarnost, ki jo predstavljajo ponarejeni videoposnetki, izdelani z difuzijskimi modeli.
{"title":"Ustvarjanje ponarejenih videoposnetkov s pomočjo difuzijskih modelov","authors":"Bine Markelj, Peter Peer, Borut Batagelj","doi":"10.18690/um.feri.1.2024.8","DOIUrl":"https://doi.org/10.18690/um.feri.1.2024.8","url":null,"abstract":"V članku predstavimo postopke in tehnike generiranja globoko ponarejenih videoposnetkov ali krajše globokih ponaredkov (angl. deepfakes). To so videoposnetki, pri katerih je prišlo do manipulacij s tehnikami globokega učenja. Taki videoposnetki predstavljajo velik problem pri širjenju lažnih novic, politični propagandi, uničevanju podobe posameznikov, izdelavi pornografskih vsebin, izsiljevanju itd. V članku opišemo podatkovno zbirko FaceForensics++ in predstavimo lastno metodo za potencialno izdelavo podzbirke omenjene baze z uporabo najnovejših generativnih difuzijskih modelov. Uporabljene postopke eksperimenta predstavimo in analiziramo njihovo kvaliteto in uspešnost. Komentiramo tudi smiselnost uporabe in nevarnost, ki jo predstavljajo ponarejeni videoposnetki, izdelani z difuzijskimi modeli.","PeriodicalId":517885,"journal":{"name":"ROSUS 2024 - Računalniška obdelava slik in njena uporaba v Sloveniji 2024: Zbornik 18. strokovne konference","volume":"6 3","pages":""},"PeriodicalIF":0.0,"publicationDate":"2024-03-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"140396112","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2024-03-11DOI: 10.18690/um.feri.1.2024.6
Jan Šuklje, Peter Peer, Bojan Klemenc
Rubikova kocka je ena najbolj znanih igrač, tako za mlade kot tudi za starejše ljudi. Za začetnike je precej velik zalogaj, zato smo se odločili narediti aplikacijo, ki jo novincem pomaga rešiti. Primarno namen same aplikacije ni učenje reševanja Rubikove kocke, saj se uporabnik z njeno uporabo ne uči, temveč samo dela gibe, ki jih aplikacija pokaže. Njen cilj je pomagati, saj če se nekomu zaplete pri reševanju kocke, si lahko z aplikacijo pomaga in kocko vrne v prvotno rešeno stanje. Kar izstopa pri tej aplikaciji v primerjavi z drugimi orodji za reševanje Rubikove kocke, je uporaba kamere kot ključnega elementa. Namesto omejevanja uporabnika na 2D ali 3D grafični prikaz kocke, ki je lahko precej zamudna, ta aplikacija izkoristi kamero, ki omogoča uporabo toka videa kot podlago uporabniškega vmesnika. Uporabnik v realnem času vidi navodila za reševanje Rubikove kocke, kar olajša in pospeši celoten proces reševanja.
{"title":"Aplikacija računalniškega vida za reševanje Rubikove kocke v realnem času","authors":"Jan Šuklje, Peter Peer, Bojan Klemenc","doi":"10.18690/um.feri.1.2024.6","DOIUrl":"https://doi.org/10.18690/um.feri.1.2024.6","url":null,"abstract":"Rubikova kocka je ena najbolj znanih igrač, tako za mlade kot tudi za starejše ljudi. Za začetnike je precej velik zalogaj, zato smo se odločili narediti aplikacijo, ki jo novincem pomaga rešiti. Primarno namen same aplikacije ni učenje reševanja Rubikove kocke, saj se uporabnik z njeno uporabo ne uči, temveč samo dela gibe, ki jih aplikacija pokaže. Njen cilj je pomagati, saj če se nekomu zaplete pri reševanju kocke, si lahko z aplikacijo pomaga in kocko vrne v prvotno rešeno stanje. Kar izstopa pri tej aplikaciji v primerjavi z drugimi orodji za reševanje Rubikove kocke, je uporaba kamere kot ključnega elementa. Namesto omejevanja uporabnika na 2D ali 3D grafični prikaz kocke, ki je lahko precej zamudna, ta aplikacija izkoristi kamero, ki omogoča uporabo toka videa kot podlago uporabniškega vmesnika. Uporabnik v realnem času vidi navodila za reševanje Rubikove kocke, kar olajša in pospeši celoten proces reševanja.","PeriodicalId":517885,"journal":{"name":"ROSUS 2024 - Računalniška obdelava slik in njena uporaba v Sloveniji 2024: Zbornik 18. strokovne konference","volume":"9 43","pages":""},"PeriodicalIF":0.0,"publicationDate":"2024-03-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"140395994","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2024-03-11DOI: 10.18690/um.feri.1.2024.4
Sandra Rodríguez Domínguez, Janez Perš
V podvodnih okoljih predstavljajo spremenljiva osvetlitev, motnost vode in biološka raznolikost občutne ovire, zaradi katerih tradicionalne metode računalniškega vida ne delujejo dobro. Tudi učljive metode delujejo le, če uporabimo dovolj raznoliko zbirko podatkov, ki vsebuje vso pričakovano variabilnost podvodnega sveta. Zaradi narave samega podvodnega okolja pa je to lahko težavno, drago ali celo nemogoče, vsekakor pa zahteva veliko delovnih ur za označevanje objektov v učni množici. Ta problem smo naslovili z razvojem nove metodologije, ki na podlagi izjemno majhnega nabora sintetično generiranih slik objektov (10 v našem primeru) in večjega nabora ozadij brez objektov zanimanja (nekaj 100 slik) izdela učno bazo poljubne velikosti, primerno za učenje globokih metod zaznavanja objektov, ki ne zahteva nobenega ročnega označevanja. V našem primeru smo metodologijo uporabili za detekcijo ribe Acanthurus leucosternon, katere podobo za učenje smo generirali s pomočjo orodij DALL-E in Stable Diffusion. Naučen model smo preizkusili na realnih posnetkih tropskih koralnih grebenov z algoritmom zaznavanja objektov YoloV8, pri čemer dosežemo F1=0.6, ne da bi algoritem videl eno samo realistično sliko objekta v času učenja.
{"title":"Zaznavanje podvodnih objektov z uporabo generativnih modelov","authors":"Sandra Rodríguez Domínguez, Janez Perš","doi":"10.18690/um.feri.1.2024.4","DOIUrl":"https://doi.org/10.18690/um.feri.1.2024.4","url":null,"abstract":"V podvodnih okoljih predstavljajo spremenljiva osvetlitev, motnost vode in biološka raznolikost občutne ovire, zaradi katerih tradicionalne metode računalniškega vida ne delujejo dobro. Tudi učljive metode delujejo le, če uporabimo dovolj raznoliko zbirko podatkov, ki vsebuje vso pričakovano variabilnost podvodnega sveta. Zaradi narave samega podvodnega okolja pa je to lahko težavno, drago ali celo nemogoče, vsekakor pa zahteva veliko delovnih ur za označevanje objektov v učni množici. Ta problem smo naslovili z razvojem nove metodologije, ki na podlagi izjemno majhnega nabora sintetično generiranih slik objektov (10 v našem primeru) in večjega nabora ozadij brez objektov zanimanja (nekaj 100 slik) izdela učno bazo poljubne velikosti, primerno za učenje globokih metod zaznavanja objektov, ki ne zahteva nobenega ročnega označevanja. V našem primeru smo metodologijo uporabili za detekcijo ribe Acanthurus leucosternon, katere podobo za učenje smo generirali s pomočjo orodij DALL-E in Stable Diffusion. Naučen model smo preizkusili na realnih posnetkih tropskih koralnih grebenov z algoritmom zaznavanja objektov YoloV8, pri čemer dosežemo F1=0.6, ne da bi algoritem videl eno samo realistično sliko objekta v času učenja.","PeriodicalId":517885,"journal":{"name":"ROSUS 2024 - Računalniška obdelava slik in njena uporaba v Sloveniji 2024: Zbornik 18. strokovne konference","volume":"58 6","pages":""},"PeriodicalIF":0.0,"publicationDate":"2024-03-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"140284872","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2024-03-11DOI: 10.18690/um.feri.1.2024.7
Aleksandr Shishkov, Stevanče Nikoloski
V članku raziskujemo integracijo modela MobileNetV3 v ogrodju Flutter, osredotočajoč se na napredno klasifikacijo slik avtomobilov. Preučujemo večplasten pristop, ki vključuje uporabo raznolikih podatkovnih zbirk, fino prilagajanje modela ter njegovo brezhibno implementacijo v mobilno aplikacijo. S poudarkom na izboljšanju uporabniške izkušnje smo ustvarili tri specializirane modele z visoko stopnjo natančnosti (97%), ki prepoznajo ustrezne slike, klasificirajo tip slike (vozilo, armaturna plošča ali dokument) ter določajo stran avtomobila (spredaj, levo, desno, zadaj). Rezultati kažejo izjemno hitrost in odzivnost aplikacije, pri čemer MobileNetV3 zagotavlja natančno klasifikacijo v le 60 ms, kar prispeva k izjemni učinkovitosti celotnega sistema.
{"title":"Sprotna analiza slik vozil z metodami globokega učenja v ogrodju Flutter","authors":"Aleksandr Shishkov, Stevanče Nikoloski","doi":"10.18690/um.feri.1.2024.7","DOIUrl":"https://doi.org/10.18690/um.feri.1.2024.7","url":null,"abstract":"V članku raziskujemo integracijo modela MobileNetV3 v ogrodju Flutter, osredotočajoč se na napredno klasifikacijo slik avtomobilov. Preučujemo večplasten pristop, ki vključuje uporabo raznolikih podatkovnih zbirk, fino prilagajanje modela ter njegovo brezhibno implementacijo v mobilno aplikacijo. S poudarkom na izboljšanju uporabniške izkušnje smo ustvarili tri specializirane modele z visoko stopnjo natančnosti (97%), ki prepoznajo ustrezne slike, klasificirajo tip slike (vozilo, armaturna plošča ali dokument) ter določajo stran avtomobila (spredaj, levo, desno, zadaj). Rezultati kažejo izjemno hitrost in odzivnost aplikacije, pri čemer MobileNetV3 zagotavlja natančno klasifikacijo v le 60 ms, kar prispeva k izjemni učinkovitosti celotnega sistema.","PeriodicalId":517885,"journal":{"name":"ROSUS 2024 - Računalniška obdelava slik in njena uporaba v Sloveniji 2024: Zbornik 18. strokovne konference","volume":"10 11","pages":""},"PeriodicalIF":0.0,"publicationDate":"2024-03-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"140395982","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2024-03-11DOI: 10.18690/um.feri.1.2024.5
Vasja Lev Kirn, Žiga Emeršič, Gregor Hrastnik, Nataša Meh Peer, P. Peer
Rapidly advancing development of artificial intelligence technologies, including deep learning techniques in the field of computer vision, has encouraged the need for early education about artificial intelligence in schools. This paper briefly describes the development of a computer vision curriculum, part of the AIM@VET (Artificial Intelligence Modules for Vocational Education and Training) EU project, targeting VET high-school students. The introductory materials presented in this paper are structured in three main teaching units (TUs), covering object detection and image segmentation. Each TU consists of eight tasks and a final assignment, totaling approximately 10 hours of classroom work. The course material, prepared in both traditional learning materials and in Python notebooks, combines theoretical concepts with practical coding exercises, with separate teacher and student versions. Materials rely on interactive tools and open-source libraries such as OpenCV, facilitating hands-on learning and immediate application of computer vision concepts.
{"title":"Introductory Computer Vision Teaching Materials for VET Education","authors":"Vasja Lev Kirn, Žiga Emeršič, Gregor Hrastnik, Nataša Meh Peer, P. Peer","doi":"10.18690/um.feri.1.2024.5","DOIUrl":"https://doi.org/10.18690/um.feri.1.2024.5","url":null,"abstract":"Rapidly advancing development of artificial intelligence technologies, including deep learning techniques in the field of computer vision, has encouraged the need for early education about artificial intelligence in schools. This paper briefly describes the development of a computer vision curriculum, part of the AIM@VET (Artificial Intelligence Modules for Vocational Education and Training) EU project, targeting VET high-school students. The introductory materials presented in this paper are structured in three main teaching units (TUs), covering object detection and image segmentation. Each TU consists of eight tasks and a final assignment, totaling approximately 10 hours of classroom work. The course material, prepared in both traditional learning materials and in Python notebooks, combines theoretical concepts with practical coding exercises, with separate teacher and student versions. Materials rely on interactive tools and open-source libraries such as OpenCV, facilitating hands-on learning and immediate application of computer vision concepts.","PeriodicalId":517885,"journal":{"name":"ROSUS 2024 - Računalniška obdelava slik in njena uporaba v Sloveniji 2024: Zbornik 18. strokovne konference","volume":"37 5","pages":""},"PeriodicalIF":0.0,"publicationDate":"2024-03-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"140285005","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2024-03-11DOI: 10.18690/um.feri.1.2024.1
Ana Antunićević
V tem prispevku se avtorica osredotoča na vzpostavitev nove zakonodaje s področja varstva osebnih podatkov tako na ravni Evropske Unije (GDPR) kot tudi na ravni Slovenije (ZVOP-2) in njen vpliv na obdelavo osebnih podatkov v okviru biometrične tehnologije.
{"title":"Biometrija in varstvo osebnih podatkov: kako na tehnologijo gleda zakonodaja?","authors":"Ana Antunićević","doi":"10.18690/um.feri.1.2024.1","DOIUrl":"https://doi.org/10.18690/um.feri.1.2024.1","url":null,"abstract":"V tem prispevku se avtorica osredotoča na vzpostavitev nove zakonodaje s področja varstva osebnih podatkov tako na ravni Evropske Unije (GDPR) kot tudi na ravni Slovenije (ZVOP-2) in njen vpliv na obdelavo osebnih podatkov v okviru biometrične tehnologije.","PeriodicalId":517885,"journal":{"name":"ROSUS 2024 - Računalniška obdelava slik in njena uporaba v Sloveniji 2024: Zbornik 18. strokovne konference","volume":"32 4","pages":""},"PeriodicalIF":0.0,"publicationDate":"2024-03-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"140285210","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2024-03-11DOI: 10.18690/um.feri.1.2024.3
Uroš Mlakar
Globoke nevronske mreže so bile uspešno aplicirane že na mnogih področjih obdelave slik. Uspešnost mreže je vedno pogojena z njeno arhitekturo, ki pogosto zahteva ročno oblikovanje strokovnjaka z bogatim strokovnim znanjem. Takšen pristop je lahko v realnem svetu zamuden, morda tudi neizvedljiv, predvsem zaradi primanjkljaja izkušenj načrtovalcev oz. njihovega znanja. V tem članku smo predstavili postopek avtomatskega iskanja topologije globoke nevronske mreže v aplikaciji razvrščanja slik. Iskanje ustrezne topologije smo preslikali v optimizacijski problem, ki ga rešujemo z algoritmom diferencialne evolucije. Algoritem smo testirali nad podatkovnima zbirkama CIFAR10 in AffectNet. Dobljeni rezultati so obetavni in odpirajo novo mlado razsikovalno področje načrtovanja globokih mrež brez predhodnega ekspertnega znanja.
{"title":"Gradnja konvolucijskih nevronskih mrež za razvrščanje slik z uporabo evolucijskih algoritmov","authors":"Uroš Mlakar","doi":"10.18690/um.feri.1.2024.3","DOIUrl":"https://doi.org/10.18690/um.feri.1.2024.3","url":null,"abstract":"Globoke nevronske mreže so bile uspešno aplicirane že na mnogih področjih obdelave slik. Uspešnost mreže je vedno pogojena z njeno arhitekturo, ki pogosto zahteva ročno oblikovanje strokovnjaka z bogatim strokovnim znanjem. Takšen pristop je lahko v realnem svetu zamuden, morda tudi neizvedljiv, predvsem zaradi primanjkljaja izkušenj načrtovalcev oz. njihovega znanja. V tem članku smo predstavili postopek avtomatskega iskanja topologije globoke nevronske mreže v aplikaciji razvrščanja slik. Iskanje ustrezne topologije smo preslikali v optimizacijski problem, ki ga rešujemo z algoritmom diferencialne evolucije. Algoritem smo testirali nad podatkovnima zbirkama CIFAR10 in AffectNet. Dobljeni rezultati so obetavni in odpirajo novo mlado razsikovalno področje načrtovanja globokih mrež brez predhodnega ekspertnega znanja.","PeriodicalId":517885,"journal":{"name":"ROSUS 2024 - Računalniška obdelava slik in njena uporaba v Sloveniji 2024: Zbornik 18. strokovne konference","volume":"10 17","pages":""},"PeriodicalIF":0.0,"publicationDate":"2024-03-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"140395831","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}