Extracción y análisis de las causas de suicidio a través de marcadores lingüísticos en reportes periodísticos

IF 0.3 Q4 LINGUISTICS Linguamatica Pub Date : 2020-01-01 DOI:10.21814/lm.11.2.276
J. A. Reyes-Ortíz, M. Tovar
{"title":"Extracción y análisis de las causas de suicidio a través de marcadores lingüísticos en reportes periodísticos","authors":"J. A. Reyes-Ortíz, M. Tovar","doi":"10.21814/lm.11.2.276","DOIUrl":null,"url":null,"abstract":"espanolEl analisis automatico de informacion(textos) sobre el suicidio se ha convertido en un reto para el campo de investigacion en linguistica computacional, cada vez mas, son necesarias herramientas que ayuden a disminuir las tasas de suicidios, por ejemplo, extraer las causas para apoyar en su deteccion temprana. Los aspectos linguisticos en los textos en Espanol, tales como frases clave o partes de la oracion, pueden ayudar en dicha tarea. Por ello, en este articulo se presenta un enfoque computacional para la extraccion y analisis de causas a partir de cabeceras de reportes periodisticos sobre el suicidio en espanol. La tarea de extraccion automatica de causas de suicidio es llevada a cabo mediante marcadores linguisticos basados en verbos, conectores, preposiciones y conjunciones. Por su parte, el analisis de las causas de suicidio es realizado en dos enfoques: a) un analisis centrado en frases verbales y nominales, estudiando la presencia de la negacion; b) un analisis centrado en la frecuencia de los unigramas y bigramas de palabras. Ambos analisis muestran resultados prometedores, los cuales son utiles para conocer los motivos de los suicidios reportados en Mexico en un periodo determinado. Finalmente, se obtiene una coleccion de 581 causas del suicidio. EnglishThe automatic analysis of suicide data(texts) has become a challenge for the computational linguistics research field, increasingly, tools are needed to help reduce suicide rates, for example, by extracting the suicide causes in order to support their early detection. Linguistic aspects in Spanish texts, such as cue phrases or parts of speech, can help in this task. Therefore, this paper presents a computational approach to the extraction and analysis of suicide causes from news reports in Spanish. The automatic extraction of suicide causes is carried out through linguistic markers based on verbs, connectors, prepositions and conjunctions. On the other hand, the analysis of the suicides causes is performed in two approaches: a) an analysis focused on verbal and noun phrases, studying the presence of the negation; b) an analysis on the frequency about unigrams or bigrams of words. Both analyzes show promising and correlated results, which are useful for recognizing the suicide causes reported in Mexico in a given period. Finally, a corpus is obtained with a collection of 581 suicide causes.","PeriodicalId":41819,"journal":{"name":"Linguamatica","volume":"11 1","pages":"67-77"},"PeriodicalIF":0.3000,"publicationDate":"2020-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Linguamatica","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21814/lm.11.2.276","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"LINGUISTICS","Score":null,"Total":0}
引用次数: 0

Abstract

espanolEl analisis automatico de informacion(textos) sobre el suicidio se ha convertido en un reto para el campo de investigacion en linguistica computacional, cada vez mas, son necesarias herramientas que ayuden a disminuir las tasas de suicidios, por ejemplo, extraer las causas para apoyar en su deteccion temprana. Los aspectos linguisticos en los textos en Espanol, tales como frases clave o partes de la oracion, pueden ayudar en dicha tarea. Por ello, en este articulo se presenta un enfoque computacional para la extraccion y analisis de causas a partir de cabeceras de reportes periodisticos sobre el suicidio en espanol. La tarea de extraccion automatica de causas de suicidio es llevada a cabo mediante marcadores linguisticos basados en verbos, conectores, preposiciones y conjunciones. Por su parte, el analisis de las causas de suicidio es realizado en dos enfoques: a) un analisis centrado en frases verbales y nominales, estudiando la presencia de la negacion; b) un analisis centrado en la frecuencia de los unigramas y bigramas de palabras. Ambos analisis muestran resultados prometedores, los cuales son utiles para conocer los motivos de los suicidios reportados en Mexico en un periodo determinado. Finalmente, se obtiene una coleccion de 581 causas del suicidio. EnglishThe automatic analysis of suicide data(texts) has become a challenge for the computational linguistics research field, increasingly, tools are needed to help reduce suicide rates, for example, by extracting the suicide causes in order to support their early detection. Linguistic aspects in Spanish texts, such as cue phrases or parts of speech, can help in this task. Therefore, this paper presents a computational approach to the extraction and analysis of suicide causes from news reports in Spanish. The automatic extraction of suicide causes is carried out through linguistic markers based on verbs, connectors, prepositions and conjunctions. On the other hand, the analysis of the suicides causes is performed in two approaches: a) an analysis focused on verbal and noun phrases, studying the presence of the negation; b) an analysis on the frequency about unigrams or bigrams of words. Both analyzes show promising and correlated results, which are useful for recognizing the suicide causes reported in Mexico in a given period. Finally, a corpus is obtained with a collection of 581 suicide causes.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
通过新闻报道中的语言标记提取和分析自杀原因
关于自杀的信息(文本)的自动分析已经成为计算语言学研究领域的一个挑战,越来越需要帮助降低自杀率的工具,例如,提取原因,以支持其早期检测。在这种情况下,重要的是要记住,在祷告的时候,祷告的内容是非常重要的。因此,本文提出了一种计算方法来提取和分析西班牙语报纸报道的自杀原因。自动提取自杀原因的任务是通过基于动词、连接词、介词和连词的语言标记来完成的。对自杀原因的分析有两种方法:a)以口头和名义短语为中心的分析,研究否认的存在;b)以单词的单字和双字频率为中心的分析。这两种分析都显示出有希望的结果,这有助于了解墨西哥在特定时期报告的自杀原因。最后,收集了581个自杀原因。自杀数据(文本)的自动分析已经成为计算语言学研究领域的一个挑战,越来越需要工具来帮助降低自杀率,例如,提取自杀原因以支持早期检测。= =地理= =根据美国人口普查,这个县的面积为。因此,本文提出了一种从西班牙语新闻报道中提取和分析自杀原因的计算方法。The automatic提取的自杀造成is through linguistic markers based on verbs connectors, prepositions and conjunctions。另一方面,对自杀原因的分析采用两种方法:(a)着重于动词和名词句的分析,研究否定的存在;= =地理= =根据美国人口普查,该镇的土地面积为。这两种分析都显示出有希望和相关的结果,这些结果有助于确认墨西哥某一特定时期报告的自杀原因。最后,要的是取得with a collection of 581自杀造成的。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
Linguamatica
Linguamatica LINGUISTICS-
CiteScore
1.40
自引率
0.00%
发文量
4
审稿时长
6 weeks
期刊最新文献
A compilação e a análise de métricas textuais de um corpus de redações Classificação da qualidade da argumentação em tweets no domínio da política brasileira Extracção de Relações de Apoio e Oposição em Títulos de Notícias de Política em Português Pais, filhos e outras relações familiares no DIP DIP - Desafio de Identificação de Personagens: objectivo, organização, recursos e resultados
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1