Data Mining-Konzepte und graphentheoretische Methoden zur Analyse hypertextueller Daten

LDV Forum Pub Date : 2005-07-01 DOI:10.21248/jlcl.20.2005.71

Matthias Dehmer

{"title":"Data Mining-Konzepte und graphentheoretische Methoden zur Analyse hypertextueller Daten","authors":"Matthias Dehmer","doi":"10.21248/jlcl.20.2005.71","DOIUrl":null,"url":null,"abstract":"Der vorliegende Artikel hat das Hauptziel, eine verständliche Übersicht bezüglich der Einsetzbarkeit von Data Mining-Konzepten auf hypertextuellen Daten zu geben, wobei insbesondere graphentheoretische Methoden fokussiert werden. Die Anwendung von klassischen Data Mining-Konzepten, wie z.B. die Clusterund die Klassifikationsanalyse, auf webbasierte Daten wird als Web Mining bezeichnet. Ein Teilbereich des Web Mining, der in dieser Arbeit besonders im Vordergrund steht, ist das Web Structure Mining, welches die Aufdeckung und die Erforschung von strukturellen Aspekten webbasierter Hypertextstrukturen zum Ziel hat. Die strukturelle Untersuchung von Hypertexten und speziell deren graphentheoretische Analyse hat sich besonders durch die Entwicklung des World Wide Web (WWW) zu einem eigenständigen Forschungsbereich im Hypertextumfeld entwickelt. Vergleicht man den aktuellen Forschungsstand dieses Bereiches jedoch aus der Sicht der Informationssysteme im Hypertextumfeld – den Hypertextsystemen – so fällt auf, dass die Entwicklung und Erforschung der Hypertextsysteme deutlich stärker und schneller fortgeschritten ist als die der strukturellen Analyse. Mit der Bedeutung der multimedialen Kommunikation stellen aber gerade graphentheoretische Methoden ein hohes Analysepotenzial zur Verfügung. Es besteht jedoch noch eine Herausforderung in der Entwicklung aussagekräftigerer, graphbasierter Modelle und graphentheoretischer Analysealgorithmen, die webbasierte Dokumentstrukturen ohne großen Strukturverlust verarbeiten können. Dieser Artikel ist wie folgt strukturiert: In Kapitel (2) wird zunächst eine kurze Zusammenfassung der Grundlagen bezüglich Hypertext und Hypermedia gegeben. Während in Kapitel (3) Data Mining-Konzepte und die Teilgebiete des Web Mining vorgestellt werden, gibt Kapitel (4) einen Überblick über bestehende Arbeiten der graphentheoretischen Analyse von Hypertexten. Kapitel (5) stellt Struktur entdeckende Verfahren, die Clusteringverfahren, vor, die hier insbesondere als Motivation zur Anwendung auf Ergebnisse zu sehen sind, welche mit graphbasierten Methoden des Web Structure Mining erzielt werden.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"19 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2005-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"4","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"LDV Forum","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21248/jlcl.20.2005.71","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 4

Abstract

Der vorliegende Artikel hat das Hauptziel, eine verständliche Übersicht bezüglich der Einsetzbarkeit von Data Mining-Konzepten auf hypertextuellen Daten zu geben, wobei insbesondere graphentheoretische Methoden fokussiert werden. Die Anwendung von klassischen Data Mining-Konzepten, wie z.B. die Clusterund die Klassifikationsanalyse, auf webbasierte Daten wird als Web Mining bezeichnet. Ein Teilbereich des Web Mining, der in dieser Arbeit besonders im Vordergrund steht, ist das Web Structure Mining, welches die Aufdeckung und die Erforschung von strukturellen Aspekten webbasierter Hypertextstrukturen zum Ziel hat. Die strukturelle Untersuchung von Hypertexten und speziell deren graphentheoretische Analyse hat sich besonders durch die Entwicklung des World Wide Web (WWW) zu einem eigenständigen Forschungsbereich im Hypertextumfeld entwickelt. Vergleicht man den aktuellen Forschungsstand dieses Bereiches jedoch aus der Sicht der Informationssysteme im Hypertextumfeld – den Hypertextsystemen – so fällt auf, dass die Entwicklung und Erforschung der Hypertextsysteme deutlich stärker und schneller fortgeschritten ist als die der strukturellen Analyse. Mit der Bedeutung der multimedialen Kommunikation stellen aber gerade graphentheoretische Methoden ein hohes Analysepotenzial zur Verfügung. Es besteht jedoch noch eine Herausforderung in der Entwicklung aussagekräftigerer, graphbasierter Modelle und graphentheoretischer Analysealgorithmen, die webbasierte Dokumentstrukturen ohne großen Strukturverlust verarbeiten können. Dieser Artikel ist wie folgt strukturiert: In Kapitel (2) wird zunächst eine kurze Zusammenfassung der Grundlagen bezüglich Hypertext und Hypermedia gegeben. Während in Kapitel (3) Data Mining-Konzepte und die Teilgebiete des Web Mining vorgestellt werden, gibt Kapitel (4) einen Überblick über bestehende Arbeiten der graphentheoretischen Analyse von Hypertexten. Kapitel (5) stellt Struktur entdeckende Verfahren, die Clusteringverfahren, vor, die hier insbesondere als Motivation zur Anwendung auf Ergebnisse zu sehen sind, welche mit graphbasierten Methoden des Web Structure Mining erzielt werden.

查看原文

微信好友朋友圈 QQ好友复制链接

本刊更多论文

数据的概念和图像分析超文本数据的悲悯方法

本文的主要目标是阐明数据基于超文本的概念使用情况，特别是强调用于测绘的方法。传统概念的应用，例如集群和分类分析，被认为是基于网页的数据。本文主要探讨的部分是网络运钞机，它可以揭露和研究基于网络的超文本结构的结构。特别是通过万维网的发展，对超文本环境的结构性研究和胚胎分析已经成为一个独立的研究对象。相比当前研究这个,但是,从信息的角度在Hypertextumfeld Hypertextsystemen——好像注意到发展和研究Hypertextsysteme和更快的速度远远高于先进时,人们.结构分析但是，由于多媒体通讯的重要性，多媒体方法提供了巨大的分析潜力。然而，我们还面临另一个挑战，即开发更有效的、基于数值的模型和用于分析的算法，以便处理基于网页的文档结构而不遭受重大结构损失。本文的组织结构如下:第2章(2)节先简述有双曲或超媒体跟进的基本内容。本文在第三章介绍了网络探讨的概念及相关领域时，介绍了对超文本笔录分析的当前工作情况。第5章(第5章)介绍了一套被发现的集群式技术，这些工作已经被认为是对结果进行弃正式开发的一种动机。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文去求助

来源期刊

LDV Forum

自引率

0.00%

发文量

期刊最新文献

Satzlänge: Definitionen, Häufigkeiten, Modelle (Am Beispiel slowenischer Prosatexte) A hybrid approach to resolve nominal anaphora Evaluating the Quality of Automatically Extracted Synonymy Information OWL ontologies as a resource for discourse parsing An ontology of linguistic annotations