{"title":"基于深度学习的视障人士产品分类系统","authors":"Fatma Betül Keskin, Nursena Bayğın, Işıl Karabey Aksakallı, Özlem Çomaklı Sökmen","doi":"10.28948/ngumuh.1375785","DOIUrl":null,"url":null,"abstract":"Görme yetersizliğine sahip bireylerin hayatını kolaylaştırmak ve diğer bireylere bağımlılıklarını en aza indirmek amacıyla market raflarının ve ürünlerin sınıflandırılması önem arz etmektedir. Ürünlerin sınıflandırılması ve ürün raflarının tanıtılması için çeşitli görüntü işleme yöntemleri halihazırda kullanılmaktadır. Yapılan araştırmalar doğrultusunda market raflarının ve ürünlerin sınıflandırılması için çoğunlukla geleneksel yöntemlerin kullanıldığı görülmektedir. Bu çalışmada market raflarındaki ürünler geleneksel görüntü işleme yöntemlerinden farklı olarak yüksek doğruluk ve hızda sonuç verebilen derin yapay sinir ağları kullanılarak sınıflandırılmıştır. Ayrıca bu çalışmada, görme bozukluğuna sahip bireylere kolaylık sağlaması açısından gündelik hayatta kullanılan akıllı cihazlara yüklenebilen ve tüm mobil işletim sistemlerini destekleyen flutter altyapısı kullanılmıştır. Bu sayede tüm mobil platformlarda ürün detaylarını sesli ve görsel olarak kullanıcılara aktarmak hedeflenmektedir. Uygulama Türkiye'nin Erzurum ilinde bulunan bir markette yapılmıştır. Veri kümesi söz konusu marketten alınan 14 farklı kategoriye ait toplam 2222 adet görüntüden oluşmaktadır. Bu görüntüler kullanılarak veri artırma işlemi yapılmış ve sonuç olarak toplam 4585 adet görüntü YOLOv8, EfficientDet D7TF2 ve YOLOv5 modellerinin eğitilmesi ile sınıflandırılmıştır. Yapılan deneyler sonucunda en yüksek performansı YOLOv8 modelinin gösterdiği saptanmıştır. YOLOv8 modeline ait doğruluk, hassasiyet, duyarlılık ve F1 skor oranları sırasıyla %92,8, %98,6, %95 ve %96,8 olarak bulunmuştur.","PeriodicalId":508079,"journal":{"name":"Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi","volume":" 37","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-07-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Görme yetersizliği olan bireyler için derin öğrenme tabanlı ürün sınıflandırma sistemi\",\"authors\":\"Fatma Betül Keskin, Nursena Bayğın, Işıl Karabey Aksakallı, Özlem Çomaklı Sökmen\",\"doi\":\"10.28948/ngumuh.1375785\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Görme yetersizliğine sahip bireylerin hayatını kolaylaştırmak ve diğer bireylere bağımlılıklarını en aza indirmek amacıyla market raflarının ve ürünlerin sınıflandırılması önem arz etmektedir. Ürünlerin sınıflandırılması ve ürün raflarının tanıtılması için çeşitli görüntü işleme yöntemleri halihazırda kullanılmaktadır. Yapılan araştırmalar doğrultusunda market raflarının ve ürünlerin sınıflandırılması için çoğunlukla geleneksel yöntemlerin kullanıldığı görülmektedir. Bu çalışmada market raflarındaki ürünler geleneksel görüntü işleme yöntemlerinden farklı olarak yüksek doğruluk ve hızda sonuç verebilen derin yapay sinir ağları kullanılarak sınıflandırılmıştır. Ayrıca bu çalışmada, görme bozukluğuna sahip bireylere kolaylık sağlaması açısından gündelik hayatta kullanılan akıllı cihazlara yüklenebilen ve tüm mobil işletim sistemlerini destekleyen flutter altyapısı kullanılmıştır. Bu sayede tüm mobil platformlarda ürün detaylarını sesli ve görsel olarak kullanıcılara aktarmak hedeflenmektedir. Uygulama Türkiye'nin Erzurum ilinde bulunan bir markette yapılmıştır. Veri kümesi söz konusu marketten alınan 14 farklı kategoriye ait toplam 2222 adet görüntüden oluşmaktadır. Bu görüntüler kullanılarak veri artırma işlemi yapılmış ve sonuç olarak toplam 4585 adet görüntü YOLOv8, EfficientDet D7TF2 ve YOLOv5 modellerinin eğitilmesi ile sınıflandırılmıştır. Yapılan deneyler sonucunda en yüksek performansı YOLOv8 modelinin gösterdiği saptanmıştır. YOLOv8 modeline ait doğruluk, hassasiyet, duyarlılık ve F1 skor oranları sırasıyla %92,8, %98,6, %95 ve %96,8 olarak bulunmuştur.\",\"PeriodicalId\":508079,\"journal\":{\"name\":\"Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi\",\"volume\":\" 37\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-07-17\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.28948/ngumuh.1375785\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.28948/ngumuh.1375785","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Görme yetersizliği olan bireyler için derin öğrenme tabanlı ürün sınıflandırma sistemi
Görme yetersizliğine sahip bireylerin hayatını kolaylaştırmak ve diğer bireylere bağımlılıklarını en aza indirmek amacıyla market raflarının ve ürünlerin sınıflandırılması önem arz etmektedir. Ürünlerin sınıflandırılması ve ürün raflarının tanıtılması için çeşitli görüntü işleme yöntemleri halihazırda kullanılmaktadır. Yapılan araştırmalar doğrultusunda market raflarının ve ürünlerin sınıflandırılması için çoğunlukla geleneksel yöntemlerin kullanıldığı görülmektedir. Bu çalışmada market raflarındaki ürünler geleneksel görüntü işleme yöntemlerinden farklı olarak yüksek doğruluk ve hızda sonuç verebilen derin yapay sinir ağları kullanılarak sınıflandırılmıştır. Ayrıca bu çalışmada, görme bozukluğuna sahip bireylere kolaylık sağlaması açısından gündelik hayatta kullanılan akıllı cihazlara yüklenebilen ve tüm mobil işletim sistemlerini destekleyen flutter altyapısı kullanılmıştır. Bu sayede tüm mobil platformlarda ürün detaylarını sesli ve görsel olarak kullanıcılara aktarmak hedeflenmektedir. Uygulama Türkiye'nin Erzurum ilinde bulunan bir markette yapılmıştır. Veri kümesi söz konusu marketten alınan 14 farklı kategoriye ait toplam 2222 adet görüntüden oluşmaktadır. Bu görüntüler kullanılarak veri artırma işlemi yapılmış ve sonuç olarak toplam 4585 adet görüntü YOLOv8, EfficientDet D7TF2 ve YOLOv5 modellerinin eğitilmesi ile sınıflandırılmıştır. Yapılan deneyler sonucunda en yüksek performansı YOLOv8 modelinin gösterdiği saptanmıştır. YOLOv8 modeline ait doğruluk, hassasiyet, duyarlılık ve F1 skor oranları sırasıyla %92,8, %98,6, %95 ve %96,8 olarak bulunmuştur.