XÂY DỰNG HỆ THỐNG TỰ ĐỘNG GIẢI ĐÁP THẮC MẮC VỀ QUY ĐỊNH HỌC TẬP TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP BẰNG KỸ THUẬT HỌC SÂU

ĐẶNG THỊ PHÚC, Nguyễn Thanh Long, ĐẶNG VĂN NGHIÊM, TRẦN THỊ MINH KHOA
{"title":"XÂY DỰNG HỆ THỐNG TỰ ĐỘNG GIẢI ĐÁP THẮC MẮC VỀ QUY ĐỊNH HỌC TẬP TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP BẰNG KỸ THUẬT HỌC SÂU","authors":"ĐẶNG THỊ PHÚC, Nguyễn Thanh Long, ĐẶNG VĂN NGHIÊM, TRẦN THỊ MINH KHOA","doi":"10.46242/jstiuh.v61i07.4725","DOIUrl":null,"url":null,"abstract":"Hiện nay, đối với trường đại học có quy mô lớn như Đại học Công nghiệp TPHCM, số lượng quy định, quy chế, thông báo rất lớn và cập nhật thường xuyên dẫn đến việc tìm hiểu và nắm bắt nội dung trở nên khó khăn. Trong bài báo, chúng tôi xây dựng hệ thống tự động trả lời câu hỏi dựa trên nội dung của các file văn bản bằng kỹ thuật deep learning. Hệ thống trích chọn thông tin từ câu hỏi, đưa vào là các từ khoá và trả về đoạn văn bản liên quan bằng thuật toán BM25. Ứng với đoạn văn bản có độ liên quan cao nhất, mô hình deep learning được huấn luyện để trích xuất ra câu trả lời tương ứng. Mô hình được huấn luyện dựa trên bộ dữ liệu huấn luyện với 10000 và bộ dữ liệu test 1600 cặp câu hỏi và câu trả lời tương ứng từ các đoạn văn bản được lấy từ các thông báo, quy định, quy chế của nhà trường. Chúng tôi tinh chỉnh các mô hình deep learning để huấn luyện và đánh giá, dựa trên hiệu quả và độ chính xác để lựa chọn mô hình tối ưu nhất. Kết quả độ chính xác đạt được theo F1-score của mô hình BERT là 73.93%, RoBERTa là 75.59% PhoBERT là 45.13% và DistilBERT là 72.95%.  Mô hình RoBERTa được lựa chọn với tốc độ huấn luyện và độ chính xác cao nhất và được triển khai lên hệ thống để đánh giá kết quả.","PeriodicalId":16979,"journal":{"name":"Journal of Science and Technology - IUH","volume":"53 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-03-03","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of Science and Technology - IUH","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.46242/jstiuh.v61i07.4725","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Hiện nay, đối với trường đại học có quy mô lớn như Đại học Công nghiệp TPHCM, số lượng quy định, quy chế, thông báo rất lớn và cập nhật thường xuyên dẫn đến việc tìm hiểu và nắm bắt nội dung trở nên khó khăn. Trong bài báo, chúng tôi xây dựng hệ thống tự động trả lời câu hỏi dựa trên nội dung của các file văn bản bằng kỹ thuật deep learning. Hệ thống trích chọn thông tin từ câu hỏi, đưa vào là các từ khoá và trả về đoạn văn bản liên quan bằng thuật toán BM25. Ứng với đoạn văn bản có độ liên quan cao nhất, mô hình deep learning được huấn luyện để trích xuất ra câu trả lời tương ứng. Mô hình được huấn luyện dựa trên bộ dữ liệu huấn luyện với 10000 và bộ dữ liệu test 1600 cặp câu hỏi và câu trả lời tương ứng từ các đoạn văn bản được lấy từ các thông báo, quy định, quy chế của nhà trường. Chúng tôi tinh chỉnh các mô hình deep learning để huấn luyện và đánh giá, dựa trên hiệu quả và độ chính xác để lựa chọn mô hình tối ưu nhất. Kết quả độ chính xác đạt được theo F1-score của mô hình BERT là 73.93%, RoBERTa là 75.59% PhoBERT là 45.13% và DistilBERT là 72.95%.  Mô hình RoBERTa được lựa chọn với tốc độ huấn luyện và độ chính xác cao nhất và được triển khai lên hệ thống để đánh giá kết quả.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
建立自动化系统,解决工业大学学习规则的疑难问题
现在,对于像胡志明市工业大学这样规模较大的大学来说,大量的规章制度、规章制度、报告和经常性的更新导致学习和捕捉内容变得困难。在这篇文章中,我们根据深度学习技术的文本文件的内容构建了一个自动回答问题的系统。系统从问题中提取信息,输入关键字,并通过BM25算法返回相关文本。对于相关性最高的文本,深度学习模型被训练来提取相应的答案。基于训练数据集的训练模型,有10000个训练数据集和测试数据集,1600对问题和答案来自学校的通知、法规和规章。我们优化了深度学习模式,以培训和评估,基于效率和准确性,选择最佳模式。BERT模型F1-score的准确率为73.93%,RoBERTa为75.59%,PhoBERT为45.13%,severbert为72.95%。罗伯塔模型被选择以最高的训练速度和精确度,并被部署到系统中来评估结果。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
NGHIÊN CỨU ĐỘNG HỌC CỦA PHẢN ỨNG CO2 REFORMING CH4 SỬ DỤNG XÚC TÁC COBALT MANG TRÊN Al2O3 VỚI CHẤT XÚC TIẾN La2O3 NGHIÊN CỨU TỔNG HỢP VẬT LIỆU NANO COMPOSITE TiO2/Al2O3 ỨNG DỤNG XỬ LÝ ION Cr (VI) TRONG NƯỚC NGHIÊN CỨU KÉO DÀI TUỔI THỌ CỦA HOA HỒNG ĐỎ ĐÀ LẠT CẮT CÀNH BẰNG DỊCH CHIẾT LÁ CHÙM NGÂY ĐÁNH GIÁ HOẠT TÍNH GIẢM ĐAU CỦA CHIẾT XUẤT METHANOL TỪ LÁ CÂY DẠ CẨM (Oldenlandia capitellata Kuntze) TRÊN CHUỘT SWISS ALBINO KHẢO SÁT ĐIỀU KIỆN NUÔI CẤY CHO KHẢ NĂNG SINH TỔNG HỢP CELLULASE TỪ Bacillus subtilis TH-VK22
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1