{"title":"基于高分辨率人脸图像的手语识别评价","authors":"Takeshi Kajiyama, Yoshiaki Shishikui","doi":"10.3169/itej.77.788","DOIUrl":null,"url":null,"abstract":"手話認識技術は,手話を母語とするろう者のコミュニケーションを支援する技術として実現が期待されている.手話の理解には手指と腕だけでなく顔の表情も重要であり,判別に口や目眉の形が必要な単語や表現が存在する.手話認識ではこれらすべての身体部位を含む上半身画像を解析対象とするが,深層学習を用いる手話認識では計算量・メモリー量が制約となり解像度の高い上半身画像を扱えない.本論文では,口および目眉に限り解像度の高い画像を解析し,計算量・メモリー量の増加を抑えながら認識性能の向上を図る.実験により,基準となる低解像度な上半身画像の解析と2倍解像度の口画像の解析を併用することで,判別に口の形が必要な単語について認識の改善が確認された.一方,目眉については改善効果が確認されなかった.すべての単語を対象とした統計的な認識性能を評価した結果,2倍解像度の口画像の解析が認識性能向上に有効であることが確認された.","PeriodicalId":39325,"journal":{"name":"Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2023-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Evaluation of Sign Language Recognition with Higher Resolution Face Images\",\"authors\":\"Takeshi Kajiyama, Yoshiaki Shishikui\",\"doi\":\"10.3169/itej.77.788\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"手話認識技術は,手話を母語とするろう者のコミュニケーションを支援する技術として実現が期待されている.手話の理解には手指と腕だけでなく顔の表情も重要であり,判別に口や目眉の形が必要な単語や表現が存在する.手話認識ではこれらすべての身体部位を含む上半身画像を解析対象とするが,深層学習を用いる手話認識では計算量・メモリー量が制約となり解像度の高い上半身画像を扱えない.本論文では,口および目眉に限り解像度の高い画像を解析し,計算量・メモリー量の増加を抑えながら認識性能の向上を図る.実験により,基準となる低解像度な上半身画像の解析と2倍解像度の口画像の解析を併用することで,判別に口の形が必要な単語について認識の改善が確認された.一方,目眉については改善効果が確認されなかった.すべての単語を対象とした統計的な認識性能を評価した結果,2倍解像度の口画像の解析が認識性能向上に有効であることが確認された.\",\"PeriodicalId\":39325,\"journal\":{\"name\":\"Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers\",\"volume\":null,\"pages\":null},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-01-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.3169/itej.77.788\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q4\",\"JCRName\":\"Engineering\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.3169/itej.77.788","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"Engineering","Score":null,"Total":0}