Clasificación de tragedias y comedias en las comedias nuevas de Calderón de la Barca

Jörg Lehmann, Sebastian Padó
{"title":"Clasificación de tragedias y comedias en las comedias nuevas de Calderón de la Barca","authors":"Jörg Lehmann, Sebastian Padó","doi":"10.5944/rhd.vol.7.2022.34588","DOIUrl":null,"url":null,"abstract":"El objetivo de este estudio es clasificar 112 dramas escritos por Calderón de la Barca, comedias y tragedias, utilizando procedimientos computacionales basados en la semántica distribucional. Quince de estas comedias nuevas ya han sido clasificadas cualitativamente por investigadores especialistas como tragedias o comedias; para otros 82 dramas no había datos sobre su clasificación. En este artículo exploramos cuatro métodos independientes de document embedding que difieren entre sí, por un lado, en la creación y reducción de la matriz de rasgos y, por otro lado, en el cálculo de las matrices de similitud o distancia. Los mejores resultados medidos con respecto a los dramas clasificados manualmente se obtienen mediante el procedimiento de clasificación que aplica la reducción de información más compleja en la matriz de rasgos. Además, se lleva a cabo un análisis contrastivo de vocabulario con word embeddings. Aquí se comparan dos subcorpus que contienen obras de teatro clasificadas de manera manual y se utilizan tanto las listas de palabras producidas por los cuatro métodos probados o mediante la distribución de probabilidad log-likelihood. Este paso permite identificar 130 términos que distinguen entre comedias y tragedias. El resultado muestra que los métodos explorados identifican las tragedias con mayor precisión que las comedias, lo que indica que las primeras tienen más rasgos distintivos. También se hace evidente que se podrían considerar más adecuadamente clasificaciones como tragedia y comedia como polos de un espectro entre los que se pueden observar diferencias graduales, por lo que la zona de transición resultante contiene comedias nuevas (que han sido descritas en investigaciones anteriores como tragicomedias) o comedias mitológicas. ","PeriodicalId":362365,"journal":{"name":"Revista de Humanidades Digitales","volume":"53 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-04-12","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista de Humanidades Digitales","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5944/rhd.vol.7.2022.34588","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

El objetivo de este estudio es clasificar 112 dramas escritos por Calderón de la Barca, comedias y tragedias, utilizando procedimientos computacionales basados en la semántica distribucional. Quince de estas comedias nuevas ya han sido clasificadas cualitativamente por investigadores especialistas como tragedias o comedias; para otros 82 dramas no había datos sobre su clasificación. En este artículo exploramos cuatro métodos independientes de document embedding que difieren entre sí, por un lado, en la creación y reducción de la matriz de rasgos y, por otro lado, en el cálculo de las matrices de similitud o distancia. Los mejores resultados medidos con respecto a los dramas clasificados manualmente se obtienen mediante el procedimiento de clasificación que aplica la reducción de información más compleja en la matriz de rasgos. Además, se lleva a cabo un análisis contrastivo de vocabulario con word embeddings. Aquí se comparan dos subcorpus que contienen obras de teatro clasificadas de manera manual y se utilizan tanto las listas de palabras producidas por los cuatro métodos probados o mediante la distribución de probabilidad log-likelihood. Este paso permite identificar 130 términos que distinguen entre comedias y tragedias. El resultado muestra que los métodos explorados identifican las tragedias con mayor precisión que las comedias, lo que indica que las primeras tienen más rasgos distintivos. También se hace evidente que se podrían considerar más adecuadamente clasificaciones como tragedia y comedia como polos de un espectro entre los que se pueden observar diferencias graduales, por lo que la zona de transición resultante contiene comedias nuevas (que han sido descritas en investigaciones anteriores como tragicomedias) o comedias mitológicas. 
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
卡尔德隆·德拉·巴萨新喜剧中的悲剧和喜剧分类
本研究的目的是利用分布语料库的计算程序,对calderon de la Barca创作的112部戏剧、喜剧和悲剧进行分类。其中15部新喜剧已经被专家研究人员定性地归类为悲剧或喜剧;另外82部电视剧没有分类数据。在本文中,我们探讨了四种独立的文档嵌入方法,它们在创建和简化特征矩阵和计算相似性或距离矩阵方面各不相同。与人工分类的戏剧相比,最好的测量结果是通过分类程序获得的,该程序将更复杂的信息简化到特征矩阵中。此外,还进行了词汇与单词嵌入的对比分析。本文比较了包含手工分类的戏剧作品的两个子语料库,并使用了四种测试方法产生的单词列表或对数似是而非的概率分布。这一步可以识别出130个区分喜剧和悲剧的术语。本研究的目的是确定戏剧和喜剧之间的关系,以及戏剧和喜剧之间的关系。显然还可以考虑更适当的多极光谱分类作为悲剧和喜剧之间观察到菜单,因此差异所产生的过渡区含有喜剧新(在以前的研究中已被视为tragicomedias)或喜剧mitológicas。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
Inteligencia artificial para la transcripción de letra itálica española del siglo XVIII Poblaciones: Plataforma Abierta de Datos Espaciales de la Argentina DEL RIO RIANDE, Gimena (Coord.). La cultura de los datos: Actas del II Congreso Internacional de la Asociación Argentina de Humanidades Digitales. Universidad de La Plata. Facultad de Humanidades y Ciencias de la Educación, La Plata, 2019. VUILLERMOZ, Marc (dir.). Les idées du théâtre, 2016-2019. JENSTAD, Janelle (Dir.). Map of Early Modern London (MOEML). University of Windsor, Ontario, 1999-Actualidad.
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1