Irene Sucameli, Alessandro Lenci, B. Magnini, M. Simi, Manuela Speranza
{"title":"Becoming JILDA","authors":"Irene Sucameli, Alessandro Lenci, B. Magnini, M. Simi, Manuela Speranza","doi":"10.4000/books.aaccademia.8915","DOIUrl":null,"url":null,"abstract":"English. The difficulty in finding useful dialogic data to train a conversational agent is an open issue even nowadays, when chatbots and spoken dialogue systems are widely used. For this reason we decided to build JILDA, a novel data collection of chat-based dialogues, produced by Italian native speakers and related to the job-offer domain. JILDA is the first dialogue collection related to this domain for the Italian language. Because of its collection modalities, we believe that JILDA can be a useful resource not only for the Italian research community, but also for the international one. Italiano. Negli ultimi anni l’utilizzo di chatbot e sistemi dialogici è diventato sempre più comune; tuttavia, il reperimento di dati di apprendimento adeguati per addestrare agenti conversazionali costituisce ancora una questione irrisolta. Per questo motivo abbiamo deciso di produrre JILDA, un nuovo dataset di dialoghi relativi al dominio della ricerca del lavoro e realizzati via chat da parlanti nativi italiani. JILDA costituisce la prima collezione di dialoghi relativi a questo dominio, in lingua italiana. Per gli aspetti metodologici e la modalità di raccolta dei dati, riteniamo che una simile risorsa possa essere utile ed interessante non solo per la comunità di ricerca italiana ma anche per quella internazionale.","PeriodicalId":300279,"journal":{"name":"Proceedings of the Seventh Italian Conference on Computational Linguistics CLiC-it 2020","volume":"31 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"1900-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Proceedings of the Seventh Italian Conference on Computational Linguistics CLiC-it 2020","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.4000/books.aaccademia.8915","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 2
摘要
英语。即使在聊天机器人和口语对话系统被广泛使用的今天,寻找有用的对话数据来训练会话代理的困难也是一个悬而未决的问题。出于这个原因,我们决定建立JILDA,这是一个基于聊天对话的新颖数据集,由意大利语母语人士制作,与工作招聘领域相关。JILDA是第一个与此领域相关的意大利语对话集。由于其收集方式,我们相信JILDA不仅可以成为意大利研究界的有用资源,而且可以成为国际研究界的有用资源。意大利语。最后,我想说的是,我将利用聊天的方式与系统对话è进行交流più交流;土耳其,将要求在对话构成和任何问题上都有足够的能力,并要求在对话构成和任何问题上都有足够的能力。根据JILDA的提问动机(question to motivo abbiamo decisiiso di produrre),新的数据集(dataset)和对话(relative dominio)、数据集(ricerca)和数据集(lavori)通过对话(chat da parlanti native italani)得以实现。JILDA以意大利语组成了一个主要的学院,就有关问题进行对话。从方法论的角度看,从数据的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从方法的角度看,从社会的角度看,从方法的角度看,意大利的角度看,国际上的角度看,都是非常有用的。
English. The difficulty in finding useful dialogic data to train a conversational agent is an open issue even nowadays, when chatbots and spoken dialogue systems are widely used. For this reason we decided to build JILDA, a novel data collection of chat-based dialogues, produced by Italian native speakers and related to the job-offer domain. JILDA is the first dialogue collection related to this domain for the Italian language. Because of its collection modalities, we believe that JILDA can be a useful resource not only for the Italian research community, but also for the international one. Italiano. Negli ultimi anni l’utilizzo di chatbot e sistemi dialogici è diventato sempre più comune; tuttavia, il reperimento di dati di apprendimento adeguati per addestrare agenti conversazionali costituisce ancora una questione irrisolta. Per questo motivo abbiamo deciso di produrre JILDA, un nuovo dataset di dialoghi relativi al dominio della ricerca del lavoro e realizzati via chat da parlanti nativi italiani. JILDA costituisce la prima collezione di dialoghi relativi a questo dominio, in lingua italiana. Per gli aspetti metodologici e la modalità di raccolta dei dati, riteniamo che una simile risorsa possa essere utile ed interessante non solo per la comunità di ricerca italiana ma anche per quella internazionale.