Evaluation of Sign Language Recognition with Higher Resolution Face Images

Takeshi Kajiyama, Yoshiaki Shishikui
{"title":"Evaluation of Sign Language Recognition with Higher Resolution Face Images","authors":"Takeshi Kajiyama, Yoshiaki Shishikui","doi":"10.3169/itej.77.788","DOIUrl":null,"url":null,"abstract":"手話認識技術は,手話を母語とするろう者のコミュニケーションを支援する技術として実現が期待されている.手話の理解には手指と腕だけでなく顔の表情も重要であり,判別に口や目眉の形が必要な単語や表現が存在する.手話認識ではこれらすべての身体部位を含む上半身画像を解析対象とするが,深層学習を用いる手話認識では計算量・メモリー量が制約となり解像度の高い上半身画像を扱えない.本論文では,口および目眉に限り解像度の高い画像を解析し,計算量・メモリー量の増加を抑えながら認識性能の向上を図る.実験により,基準となる低解像度な上半身画像の解析と2倍解像度の口画像の解析を併用することで,判別に口の形が必要な単語について認識の改善が確認された.一方,目眉については改善効果が確認されなかった.すべての単語を対象とした統計的な認識性能を評価した結果,2倍解像度の口画像の解析が認識性能向上に有効であることが確認された.","PeriodicalId":39325,"journal":{"name":"Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2023-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.3169/itej.77.788","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"Engineering","Score":null,"Total":0}
引用次数: 0

Abstract

手話認識技術は,手話を母語とするろう者のコミュニケーションを支援する技術として実現が期待されている.手話の理解には手指と腕だけでなく顔の表情も重要であり,判別に口や目眉の形が必要な単語や表現が存在する.手話認識ではこれらすべての身体部位を含む上半身画像を解析対象とするが,深層学習を用いる手話認識では計算量・メモリー量が制約となり解像度の高い上半身画像を扱えない.本論文では,口および目眉に限り解像度の高い画像を解析し,計算量・メモリー量の増加を抑えながら認識性能の向上を図る.実験により,基準となる低解像度な上半身画像の解析と2倍解像度の口画像の解析を併用することで,判別に口の形が必要な単語について認識の改善が確認された.一方,目眉については改善効果が確認されなかった.すべての単語を対象とした統計的な認識性能を評価した結果,2倍解像度の口画像の解析が認識性能向上に有効であることが確認された.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
基于高分辨率人脸图像的手语识别评价
手语识别技术作为支援以手语为母语的聋人交流的技术,有望实现。手语的理解不仅需要手指和手臂,面部表情也很重要,有些词语和表达需要嘴巴、眼睛和眉毛的形状来判断。手语识别以包括上述所有身体部位的上半身图像为分析对象,但使用深度学习的手语识别由于计算量和内存量受限,无法处理分辨率高的上半身图像。本论文将分析仅限口和眼眉的高分辨率图像,在抑制计算量和内存增加的同时提高识别性能。实验结果表明,通过同时分析作为基准的低分辨率的上半身图像和2倍分辨率的嘴巴图像,改善了对需要口型来判断的单词的认识。另一方面,尚未确认眼眉方面的改善效果。以所有单词为对象,对其统计识别性能进行了评价,结果证实,解析2倍分辨率的口图像对提高识别性能具有显著效果。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
CiteScore
0.10
自引率
0.00%
发文量
11
期刊最新文献
Development of a 4K 240 fps Professional Video Camera Using 2/3 Type Four-CMOS Image Sensors with Color Separation Prism Chord Generation Corresponding to Melody using Deep Learning Development of "CLAPO", a File Upload Tool that Completes All Operations on a Web Browser TOREZO, Information Camera Recording System: Automatic preparation of information camera footages from all over Japan A Color Vibration Method Robust to Interframe Difference for Embedding Imperceptible Markers in Videos
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1