M. Morales-Morales, Jhonatan W. Durán-Cazar, Eduardo J. Tandazo-Gaona, Santiago Morales Cardoso
{"title":"Rendimiento de bases de datos columnares","authors":"M. Morales-Morales, Jhonatan W. Durán-Cazar, Eduardo J. Tandazo-Gaona, Santiago Morales Cardoso","doi":"10.17163/INGS.N22.2019.05","DOIUrl":null,"url":null,"abstract":"En la actualidad para el éxito de las empresas es decisiva la capacidad de procesar de manera eficiente una considerable cantidad de datos de una amplia gama de fuentes en cualquier lugar y momento. El análisis de datos se convierte en una estrategia clave para la mayoría de las grandes organizaciones para lograr una ventaja competitiva. Por tanto, surgen nuevas cuestiones a ser tomadas en cuenta a la hora de almacenar y consultar cantidades masivas de datos que, en general, las bases de datos relacionales tradicionales no pueden abarcar. Estas cuestiones incluyen desde la capacidad de distribuir y escalar el procesamiento o el almacenamiento físico, hasta la posibilidad de utilizar esquemas o tipos de datos no usuales. El objetivo principal de la investigación es evaluar el rendimiento de las bases de datos columnares en analítica de datos. Efectuar una comparación con bases de datos de tipo relacional, para determinar su eficiencia, realizando mediciones en distintos escenarios de pruebas. El presente estudio pretende proporcionar (evidencia científica) un instrumento que facilite a los profesionales interesados en la analítica de datos una base para sus conocimientos, al incluir cuadros y tablas comparativos con datos cuantitativos con los que se pueda sustentar las conclusiones de esta investigación. Se usa una metodología aplicada y de diseño descriptivo cuantitativo-comparativo al ser el que mejor se ajusta al estudio de características de eficiencia de bases de datos. En la medición se usa el método de promedios para n número de tomas y se soporta en la herramienta Aqua Data Studio que garantiza una alta confiabilidad al ser un programa especializado para la administración de bases de datos. Finalmente, se ha logrado determinar que las bases columnares tienen un mejor rendimiento en ambientes de análisis de datos.","PeriodicalId":53899,"journal":{"name":"Ingenius-Revista de Ciencia y Tecnologia","volume":"33 1","pages":""},"PeriodicalIF":0.4000,"publicationDate":"2019-06-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Ingenius-Revista de Ciencia y Tecnologia","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.17163/INGS.N22.2019.05","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"ENGINEERING, MULTIDISCIPLINARY","Score":null,"Total":0}
引用次数: 1
Abstract
En la actualidad para el éxito de las empresas es decisiva la capacidad de procesar de manera eficiente una considerable cantidad de datos de una amplia gama de fuentes en cualquier lugar y momento. El análisis de datos se convierte en una estrategia clave para la mayoría de las grandes organizaciones para lograr una ventaja competitiva. Por tanto, surgen nuevas cuestiones a ser tomadas en cuenta a la hora de almacenar y consultar cantidades masivas de datos que, en general, las bases de datos relacionales tradicionales no pueden abarcar. Estas cuestiones incluyen desde la capacidad de distribuir y escalar el procesamiento o el almacenamiento físico, hasta la posibilidad de utilizar esquemas o tipos de datos no usuales. El objetivo principal de la investigación es evaluar el rendimiento de las bases de datos columnares en analítica de datos. Efectuar una comparación con bases de datos de tipo relacional, para determinar su eficiencia, realizando mediciones en distintos escenarios de pruebas. El presente estudio pretende proporcionar (evidencia científica) un instrumento que facilite a los profesionales interesados en la analítica de datos una base para sus conocimientos, al incluir cuadros y tablas comparativos con datos cuantitativos con los que se pueda sustentar las conclusiones de esta investigación. Se usa una metodología aplicada y de diseño descriptivo cuantitativo-comparativo al ser el que mejor se ajusta al estudio de características de eficiencia de bases de datos. En la medición se usa el método de promedios para n número de tomas y se soporta en la herramienta Aqua Data Studio que garantiza una alta confiabilidad al ser un programa especializado para la administración de bases de datos. Finalmente, se ha logrado determinar que las bases columnares tienen un mejor rendimiento en ambientes de análisis de datos.
如今,在任何时间、任何地点有效地处理来自各种来源的大量数据的能力对企业的成功至关重要。数据分析成为大多数大型组织获得竞争优势的关键战略。因此,在存储和查询大量数据时需要考虑新的问题,而传统关系数据库通常无法处理这些数据。这些问题包括分布和扩展处理或物理存储的能力,以及使用非常规模式或数据类型的可能性。本研究的主要目的是评估列数据库在数据分析中的性能。与关系数据库进行比较,以确定它们的效率,在不同的测试场景中进行测量。本研究旨在提供(科学证据)一种工具,通过包括定量数据的比较表格和表格,为数据分析专业人员的知识提供基础,以支持本研究的结论。本研究采用描述性定量比较设计的应用方法,最适合数据库效率特征的研究。在测量中使用了n个点的平均方法,并由Aqua Data Studio工具支持,作为数据库管理的专门程序,保证了高可靠性。最后,我们确定柱基在数据分析环境中具有更好的性能。