Los índices de relatividad, densidad y eficiencia informativa en las lenguas: estudio de las correlaciones matemáticas entre palabras y fonemas

IF 0.1 0 LANGUAGE & LINGUISTICS Estudios de Linguistica-Universidad de Alicante-ELUA Pub Date : 2022-03-21 DOI:10.14198/elua.18583
E. J. Vercher García, Manuel Bullejos Lorenzo
{"title":"Los índices de relatividad, densidad y eficiencia informativa en las lenguas: estudio de las correlaciones matemáticas entre palabras y fonemas","authors":"E. J. Vercher García, Manuel Bullejos Lorenzo","doi":"10.14198/elua.18583","DOIUrl":null,"url":null,"abstract":"El presente artículo recoge y analiza en 459 lenguas del mundo el número de palabras (tokens) y el número de sonidos y fonemas (unidades fónicas convencionales de token o UFCT) que emplean dichas lenguas para expresar una misma información (en el análisis central de nuestro estudio el texto fuente empleado, en concreto, son los 10 primeros artículos de la Declaración Universal de los Derechos Humanos). Asimismo, estudia las correlaciones matemáticas existentes entre tokens, unidades fónicas convencionales de token y contenido informativo; correlaciones que dan lugar a los denominados índice de relatividad informativa (coeficiente resultante de dividir el número de tokens entre el número de UFCT), índice de densidad informativa (coeficiente resultante de dividir el número de UFCT entre el número de tokens), índice de eficiencia informativa léxica (coeficiente resultante de dividir 100 entre el número de tokens) e índice de eficiencia informativa fónica (coeficiente resultante de dividir 100 entre el número de UFCT). El objetivo del análisis es aportar algo más de luz a los principios matemáticos del lenguaje, a la denominada economía del lenguaje y al conocimiento sobre las características de las distintas lenguas según su tipología morfológica. La investigación se centra en analizar la relación existente entre estos índices y la tipología morfológica predominante de cada lengua. El resultado es una gran cantidad de datos y estadísticas de las que extraemos una serie de conclusiones referidas al uso de recursos léxicos y fónicos en las lenguas: 1) los índices de relatividad informativa y de densidad informativa tienen una relación directa con el tipo morfológico; 2) el número total de UFCT empleadas para expresar un mismo contenido de información no depende del tipo morfológico; 3) la diferencia entre el número total de UFCT empleadas por distintas lenguas puede ser muy elevada; 4) la correlación entre número de tokens y valor medio de UFCT por token muestra una relación lineal negativa (es decir, a mayor número de palabras, las longitudes de las palabras disminuyen); 5) a mayor número de tokens totales empleado para expresar una misma información corresponde por regla general un mayor número de UFCT totales (a mayor número de palabras totales, mayor número de fonemas totales); 6) la denominada economía del lenguaje no parece funcionar de igual manera en todas las lenguas, al menos en lo que a uso de recursos (fonemas) se refiere. El presente trabajo introduce como nuevos factores de estudio y descripción de las lenguas los citados índices, así como una serie de herramientas de estudio que podrían ser aplicadas en el futuro a otras investigaciones lingüísticas.","PeriodicalId":40982,"journal":{"name":"Estudios de Linguistica-Universidad de Alicante-ELUA","volume":"19 1","pages":""},"PeriodicalIF":0.1000,"publicationDate":"2022-03-21","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Estudios de Linguistica-Universidad de Alicante-ELUA","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.14198/elua.18583","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"0","JCRName":"LANGUAGE & LINGUISTICS","Score":null,"Total":0}
引用次数: 0

Abstract

El presente artículo recoge y analiza en 459 lenguas del mundo el número de palabras (tokens) y el número de sonidos y fonemas (unidades fónicas convencionales de token o UFCT) que emplean dichas lenguas para expresar una misma información (en el análisis central de nuestro estudio el texto fuente empleado, en concreto, son los 10 primeros artículos de la Declaración Universal de los Derechos Humanos). Asimismo, estudia las correlaciones matemáticas existentes entre tokens, unidades fónicas convencionales de token y contenido informativo; correlaciones que dan lugar a los denominados índice de relatividad informativa (coeficiente resultante de dividir el número de tokens entre el número de UFCT), índice de densidad informativa (coeficiente resultante de dividir el número de UFCT entre el número de tokens), índice de eficiencia informativa léxica (coeficiente resultante de dividir 100 entre el número de tokens) e índice de eficiencia informativa fónica (coeficiente resultante de dividir 100 entre el número de UFCT). El objetivo del análisis es aportar algo más de luz a los principios matemáticos del lenguaje, a la denominada economía del lenguaje y al conocimiento sobre las características de las distintas lenguas según su tipología morfológica. La investigación se centra en analizar la relación existente entre estos índices y la tipología morfológica predominante de cada lengua. El resultado es una gran cantidad de datos y estadísticas de las que extraemos una serie de conclusiones referidas al uso de recursos léxicos y fónicos en las lenguas: 1) los índices de relatividad informativa y de densidad informativa tienen una relación directa con el tipo morfológico; 2) el número total de UFCT empleadas para expresar un mismo contenido de información no depende del tipo morfológico; 3) la diferencia entre el número total de UFCT empleadas por distintas lenguas puede ser muy elevada; 4) la correlación entre número de tokens y valor medio de UFCT por token muestra una relación lineal negativa (es decir, a mayor número de palabras, las longitudes de las palabras disminuyen); 5) a mayor número de tokens totales empleado para expresar una misma información corresponde por regla general un mayor número de UFCT totales (a mayor número de palabras totales, mayor número de fonemas totales); 6) la denominada economía del lenguaje no parece funcionar de igual manera en todas las lenguas, al menos en lo que a uso de recursos (fonemas) se refiere. El presente trabajo introduce como nuevos factores de estudio y descripción de las lenguas los citados índices, así como una serie de herramientas de estudio que podrían ser aplicadas en el futuro a otras investigaciones lingüísticas.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
语言中的相对性、密度和信息效率指标:单词和音素之间数学相关性的研究
本条收集和分析459语种文字世界的数量(令牌)和常规部队数量fónicas声音和语素(令牌或UFCT相同)使用这种语言,表达一种信息(全文分析我们研究中央前10名雇员,特别是,消息来源是世界人权宣言》的文章)。它还研究了代币、传统语音代币单位和信息内容之间的数学相关性;指数映射导致所谓的相对论简报(令牌的数量划分造成的系数简报UFCT)的数量、密度指数(UFCT人数划分造成的系数令牌)的数量、效率指数léxica简报(100划分造成的系数令牌的数量指数和效率fónica简报(100划分造成的系数UFCT)的数量。本文的目的是对语言的数学原理、所谓的语言经济学以及根据形态类型学对不同语言特征的认识提供更多的见解。研究的重点是分析这些指标与每种语言的主要形态类型之间的关系。结果是大量的数据和统计数据,从中我们可以得出一些关于语言词汇和语音资源使用的结论:1)信息相变指数和信息密度与形态类型有直接关系;2)用于表达相同信息内容的ctfs总数不依赖于形态类型;3)不同语言使用的ctfs总数之间的差异可能非常大;4)令牌数量与每个令牌的平均UFCT值之间的相关性呈负线性关系(即单词数量越大,单词长度越短);5)用于表达相同信息的总令牌数量越多,通常对应的总fct数量就越多(总单词数量越多,总音素数量就越多);6)所谓的语言经济似乎并不适用于所有语言,至少在资源(音素)的使用方面是这样。本文介绍了这些索引作为研究和描述语言的新因素,以及一些可以应用于未来语言学研究的研究工具。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
37
期刊最新文献
Reseña del libro: Vela Delfa, Cristina y Cantamutto, Lucía (2021). Los emojis en la interacción digital escrita A vueltas con la oposición imperfecto / pretérito perfecto simple. Ventajas descriptivas y pedagógicas de un enfoque temporal-epistémico Riqueza léxica en la producción escrita en español de alumnos chinos: un estudio basado en la teoría de los sistemas dinámicos complejos La dependencia sintáctica y la correlación temporal como valores definitorios de las formas verbales en la enseñanza del español como lengua extranjera. El caso del pretérito perfecto de subjuntivo Los valores del pretérito perfecto compuesto y del simple en las áreas geográficas del español: variación diatópica y tratamiento en ELE
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1