山东大学 刘琚Electronics Letters:核学习赋能轻量化视频Transformer方法
MaterialsViews
2025-01-05 08:30
文章摘要
本文针对现有视频Transformer方法计算复杂度高、模型参数量大的问题,提出了一种基于核学习的轻量化视频Transformer方法。通过重新表述Softmax自注意力机制和位置嵌入,设计复用方法和线性核变换矩阵压缩参数,改进了分离的空时注意力机制,增强了外观和运动特征之间的交互。同时,提出了自适应得分的位置编码模块,增强了位置嵌入的灵活性。实验结果表明,所提方法在计算效率和精度上均优于现有Transformer方法。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。