M. Purss, P. Peterson, P. Strobl, Clinton Dow, Z. Sabeur, R. Gibb, J. Ben
{"title":"Datacubes: A Discrete Global Grid Systems Perspective","authors":"M. Purss, P. Peterson, P. Strobl, Clinton Dow, Z. Sabeur, R. Gibb, J. Ben","doi":"10.3138/CART.54.1.2018-0017","DOIUrl":null,"url":null,"abstract":"ABSTRACT:Datacubes are increasingly being implemented to manage big data workflows efficiently, particularly those for processing geospatial data. However, there is confusion in both the definition of the term \"datacube\" and the choices for how it is implemented. This and the conventional approach to managing spatial data (i.e., in map-projected data sets) have led to a restricted set of datacube implementations that are each tightly coupled to the spatial constraints of the data and how they are stored on disc–resulting in barriers to interoperability, particularly on global scales. This article discusses options and how it is possible to implement a datacube based on discrete global grid systems, while using the same topologies as conventional datacubes. These provide a flexible spatial data infrastructure that leverages the same topological advantages as conventional geospatial datacubes, while reducing barriers to data interoperability of both raster and vector data and providing additional functionality. Also, they potentially provide a very efficient approach to connecting to big data sources in order to extract datasets on demand prior to proceeding to multi-level intelligent big data processing, mining, machine learning, and visualizations.RÉSUMÉ:Les cubes de données sont de plus en plus utilisés pour gérer de manière efficace les flux de mégadonnées, en particulier dans le traitement des données géospatiales. Il existe cependant une certaine confusion tant dans la définition de « cube de données » que dans le choix du mode de mise au point de ces bases de données. Cette situation et la méthode classique de gestion des données spatiales (au moyen de la projection cartographique d'ensembles de données) ont conduit à une quantité restreinte de mises au point de cubes de données qui sont, dans chaque cas, étroitement liés aux contraintes spatiales caractérisant les données et la façon dont elles sont stockées sur disque—ce qui fait obstacle à l'interopérabilité, en particulier aux échelles mondiales. Les auteurs traitent des options en matière de cubes de données et de la façon dont il est possible d'envisager leur mise au point à partir de systèmes de grilles globales discrètes (DGGS), tout en utilisant les mêmes topologies que pour les cubes de données traditionnels. L'on obtient ainsi une infrastructure de données spatiales souple dotée des mêmes avantages topologiques que ceux des cubes de données géospatiales traditionnels, tout en réduisant les obstacles à l'interopérabilité tant des données matricielles que des données vectorielles et en gagnant une fonctionnalité supplémentaire. Il s'agit également d'une méthode très efficace pour relier les sources de mégadonnées afin d'extraire des jeux de données à la demande avant de procéder au traitement, à l'exploration, à l'apprentissage machine et à la visualisation de mégadonnées intelligentes multiniveaux.","PeriodicalId":46104,"journal":{"name":"Cartographica","volume":"25 1","pages":"63 - 71"},"PeriodicalIF":0.7000,"publicationDate":"2019-03-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"25","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Cartographica","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.3138/CART.54.1.2018-0017","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"GEOGRAPHY","Score":null,"Total":0}
引用次数: 25
Abstract
ABSTRACT:Datacubes are increasingly being implemented to manage big data workflows efficiently, particularly those for processing geospatial data. However, there is confusion in both the definition of the term "datacube" and the choices for how it is implemented. This and the conventional approach to managing spatial data (i.e., in map-projected data sets) have led to a restricted set of datacube implementations that are each tightly coupled to the spatial constraints of the data and how they are stored on disc–resulting in barriers to interoperability, particularly on global scales. This article discusses options and how it is possible to implement a datacube based on discrete global grid systems, while using the same topologies as conventional datacubes. These provide a flexible spatial data infrastructure that leverages the same topological advantages as conventional geospatial datacubes, while reducing barriers to data interoperability of both raster and vector data and providing additional functionality. Also, they potentially provide a very efficient approach to connecting to big data sources in order to extract datasets on demand prior to proceeding to multi-level intelligent big data processing, mining, machine learning, and visualizations.RÉSUMÉ:Les cubes de données sont de plus en plus utilisés pour gérer de manière efficace les flux de mégadonnées, en particulier dans le traitement des données géospatiales. Il existe cependant une certaine confusion tant dans la définition de « cube de données » que dans le choix du mode de mise au point de ces bases de données. Cette situation et la méthode classique de gestion des données spatiales (au moyen de la projection cartographique d'ensembles de données) ont conduit à une quantité restreinte de mises au point de cubes de données qui sont, dans chaque cas, étroitement liés aux contraintes spatiales caractérisant les données et la façon dont elles sont stockées sur disque—ce qui fait obstacle à l'interopérabilité, en particulier aux échelles mondiales. Les auteurs traitent des options en matière de cubes de données et de la façon dont il est possible d'envisager leur mise au point à partir de systèmes de grilles globales discrètes (DGGS), tout en utilisant les mêmes topologies que pour les cubes de données traditionnels. L'on obtient ainsi une infrastructure de données spatiales souple dotée des mêmes avantages topologiques que ceux des cubes de données géospatiales traditionnels, tout en réduisant les obstacles à l'interopérabilité tant des données matricielles que des données vectorielles et en gagnant une fonctionnalité supplémentaire. Il s'agit également d'une méthode très efficace pour relier les sources de mégadonnées afin d'extraire des jeux de données à la demande avant de procéder au traitement, à l'exploration, à l'apprentissage machine et à la visualisation de mégadonnées intelligentes multiniveaux.
摘要:数据管越来越多地被用于高效管理大数据工作流程,特别是地理空间数据处理。然而,在术语“数据集”的定义和如何实现它的选择中都存在混淆。这种方法和管理空间数据的传统方法(例如,在地图投影数据集中)导致了一组受限制的数据立方体实现,这些实现都与数据的空间约束以及它们如何存储在磁盘上紧密耦合,从而导致互操作性的障碍,特别是在全球范围内。本文讨论了各种选项,以及如何实现基于离散全局网格系统的数据集,同时使用与传统数据集相同的拓扑结构。它们提供了灵活的空间数据基础设施,利用了与传统地理空间数据立方体相同的拓扑优势,同时减少了栅格和矢量数据的数据互操作性障碍,并提供了额外的功能。此外,它们可能提供一种非常有效的方法来连接到大数据源,以便在进行多层次智能大数据处理、挖掘、机器学习和可视化之前按需提取数据集。RÉSUMÉ:三种不同的薪金薪金和三种不同的薪金薪金、三种不同的薪金薪金、三种不同的薪金薪金、三种不同的薪金薪金、三种不同的薪金薪金、三种不同的薪金薪金、三种不同的薪金薪金。将存在一些不确定的情况,例如,将"立方体"定义为"模数转换器",将"模数转换器"的模式选择为模数转换器"。这个情况等方法典型的德行为数据作为平均(au de la投影cartographique d 'ensembles数据)汽水管道有一个数量restreinte de de数据立方体是米塞斯盟点,在每中科院etroitement谎言辅助contraintes作为caracterisant莱斯这样数据而拉不它们是stockees苏尔disque-ce,做障碍l 'interoperabilite, en particulier辅助中阶梯光栅全世界范围的。在未来的时间里,我们将为您提供更多的选择,例如:在未来的时间里,我们将为您提供更多的选择,例如:在未来的时间里,我们将为您提供更多的选择,例如:在未来的时间里,我们将为您提供更多的选择,例如:在未来的时间里,我们将提供更多的选择。在基础设施方面,空间和空间方面的优势是:拓扑结构方面,空间和空间方面的优势是:空间和空间方面的优势是:空间和空间方面的优势是:空间和空间方面的优势是:空间和空间方面的优势是:空间和空间方面的优势是:空间和空间方面的优势是:空间和空间方面的障碍是:空间和空间方面的障碍是:空间和空间方面的障碍是:空间和空间方面的障碍是:空间和空间方面的障碍是:空间和空间方面的障碍;它是一个简单的例子,它是一个简单的例子,它是一个简单的例子,它是一个简单的例子,它是一个简单的例子,它是一个简单的例子,它是一个简单的例子,它是一个简单的例子。
期刊介绍:
Cartographica is dedicated to publishing articles on all aspects of cartographic and geovisualization research while maintaining its tradition of publishing material on cartographic thought, the history of cartography, and cartography and society. Cartographica also plans to consolidate its trend towards publishing research contributions that focus primarily on geographic information. Each volume of Cartographica is comprised of four issues: two or three regular issues and one or two single-topic monographs. These special monograph issues, accommodating book-length manuscripts, provide an extensive look at one particular area of cartography.