Julio Enrique Muñoz Burbano, Pablo Emilio Jojoa Gómez, Fausto Miguel Castro Caicedo
{"title":"Implementación de un sistema de reconocimiento de voz en el lenguaje Nasa Yuwe basado en Redes Neuronales Convolusionales","authors":"Julio Enrique Muñoz Burbano, Pablo Emilio Jojoa Gómez, Fausto Miguel Castro Caicedo","doi":"10.16925/2357-6014.2023.01.01","DOIUrl":null,"url":null,"abstract":"Introducción: Este artículo presenta la Implementación de un algoritmo para el reconocimiento de voz en el lenguaje Nasa Yuwe basado en Redes Neuronales Convolusionales (RNC), desarrollado en la Universidad del Cauca en el año 2022.\nProblema: La riqueza fonética del lenguaje Nasa Yuwe es grande, al poseer 32 vocales, y 34 consonantes, lo que lleva a confusiones en la pronunciación y por lo tanto a dificultades en el reconocimiento de patrones de voz.\nObjetivo: Implementar un algoritmo de reconocimiento de voz, para el lenguaje Nasa Yuwe soportado en RNC.\nMetodología: Se realizó el preprocesamiento de las señales de audio para posteriormente obtener las características por medio de los escalogramas de los coeficientes de Mel. Finalmente se propone una arquitectura de la RNC para el proceso de clasificación.\nResultados: Se construye un DataSet a partir de los escalograma de los patrones de voz, y se realiza el proceso de entrenamiento de la RNC.\nConclusión: La implementación de un SRV basado RNC, proporciona bajos márgenes de error en el proceso de clasificación de palabras del lenguaje Nasa Yuwe.\nOriginalidad: El sistema de reconocimiento de voz planteado es el primero y único en su clase que se ha realizado hasta el momento, con el propósito de colaborar en el proceso de enseñanza, conservación y aprendizaje del lenguaje Nasa Yuwe.\nLimitaciones: Se requiere aumentar el número de patrones de voz aportados por hablantes nativos, y se plantea la necesidad de implementar otras herramientas tecnologías que permitan la conservación y difusión del lenguaje Nasa Yuwe.","PeriodicalId":41023,"journal":{"name":"Ingenieria Solidaria","volume":null,"pages":null},"PeriodicalIF":0.4000,"publicationDate":"2023-01-22","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Ingenieria Solidaria","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.16925/2357-6014.2023.01.01","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"ENGINEERING, MULTIDISCIPLINARY","Score":null,"Total":0}
引用次数: 0
Abstract
Introducción: Este artículo presenta la Implementación de un algoritmo para el reconocimiento de voz en el lenguaje Nasa Yuwe basado en Redes Neuronales Convolusionales (RNC), desarrollado en la Universidad del Cauca en el año 2022.
Problema: La riqueza fonética del lenguaje Nasa Yuwe es grande, al poseer 32 vocales, y 34 consonantes, lo que lleva a confusiones en la pronunciación y por lo tanto a dificultades en el reconocimiento de patrones de voz.
Objetivo: Implementar un algoritmo de reconocimiento de voz, para el lenguaje Nasa Yuwe soportado en RNC.
Metodología: Se realizó el preprocesamiento de las señales de audio para posteriormente obtener las características por medio de los escalogramas de los coeficientes de Mel. Finalmente se propone una arquitectura de la RNC para el proceso de clasificación.
Resultados: Se construye un DataSet a partir de los escalograma de los patrones de voz, y se realiza el proceso de entrenamiento de la RNC.
Conclusión: La implementación de un SRV basado RNC, proporciona bajos márgenes de error en el proceso de clasificación de palabras del lenguaje Nasa Yuwe.
Originalidad: El sistema de reconocimiento de voz planteado es el primero y único en su clase que se ha realizado hasta el momento, con el propósito de colaborar en el proceso de enseñanza, conservación y aprendizaje del lenguaje Nasa Yuwe.
Limitaciones: Se requiere aumentar el número de patrones de voz aportados por hablantes nativos, y se plantea la necesidad de implementar otras herramientas tecnologías que permitan la conservación y difusión del lenguaje Nasa Yuwe.