- Book学术

Uporabna informatika Pub Date : 2022-10-17 DOI:10.31449/upinf.183

Marko Zeman, Jana Faganeli Pucer, Igor Kononenko, Zoran Bosnić

引用次数: 0

摘要

在许多机器学习应用中，例如在医疗保健、天气预报等领域，都会不断收集到新数据。即使不能无限期地存储所有数据，这一点也至关重要。持续机器学习面临的最大挑战是神经模型在一段时间后容易遗忘之前学习到的信息。为了减少模型遗忘，我们的前向学习方法使用了二进制上下文叠加，占用的额外内存几乎可以忽略不计。我们将重点放在变换器形式的神经网络上，并在一组自然语言处理分类任务中将我们的方法与几种著名的连续学习方法进行了比较。平均而言，我们取得了最佳结果：接收者操作特征曲线（ROC）下的面积提高了 4.6%，精确度-调用曲线（AUROC）下的面积和精确度-调用曲线（PRC）下的面积分别提高了 3.0%。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文

微信好友朋友圈 QQ好友复制链接

本刊更多论文

Nadaljevalno učenje s superpozicijo v transformerjih

V mnogih aplikacijah strojnega učenja se novi podatki nenehno zbirajo, npr. v zdravstvenem varstvu, za vremenske napovedi itd. Raziskovalci si pogosto želijo sistem, ki bi omogočal nadaljevalno učenje novih informacij. To je izjemnega pomeni tudi v primeru, ko vseh podatkov ni mogoče shranjevati v nedogled. Največji izziv pri nadaljevalnem strojnem učenju je težnja nevronskih modelov, da po določenem času pozabijo prej naučene informacije. Da bi zmanjšali pozabljanje modela, naša metoda nadaljevalnega učenja uporablja superpozicijo z binarnimi konteksti, ki zavzemajo zanemarljiv dodaten pomnilnik. Osredotočamo se na nevronske mreže v obliki transformerjev, pri čemer smo naš pristop primerjali z več vidnimi metodami nadaljevalnega učenja na nizu klasifikacijskih nalog obdelave naravnega jezika. V povprečju smo dosegli najboljše rezultate: 4,6% izboljšavo pri ploščini pod krivuljo ROC (angl. AUROC - area under the receiver operating characteristic) in 3,0% izboljšavo pri ploščini pod krivuljo PRC (angl. AUPRC - area under the precision-recall curve).

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Uporabna informatika

自引率

0.00%

发文量

期刊最新文献

Analiza uporabe aplikacije za sledenje stikov med mladimi: študija primera Nemčije ONLINE NOTES: sistem za razpoznavo govora in strojno prevajanje v realnem času na ravni univerzitetnih predavanj Metodologije za kvalitativno vrednotenje kakovosti odprtih podatkov Iz Islovarja Digitalne kompetence slovenskih študentov