Pub Date : 2003-07-01DOI: 10.21248/jlcl.18.2003.27
C. Chiarcos
1991) und – des Denkens überhaupt (Britton et al. 2001).
1991年
{"title":"Eine Satzplanungskomponente für die Textgenerierung","authors":"C. Chiarcos","doi":"10.21248/jlcl.18.2003.27","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.27","url":null,"abstract":"1991) und – des Denkens überhaupt (Britton et al. 2001).","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"18 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"128981135","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2003-07-01DOI: 10.21248/jlcl.18.2003.35
K. Eberle
Anaphernresolution ist wichtig für Retrieval und Textklassifikation, weil sie erlaubt, bei der Auszählung der Häufigkeit der Benennung eines Objekts, oder eines Objekttyps, eines Begriffs, die Ergebnisse durch die Anzahl der entsprechenden anaphorischen Verwendungen zu korrigieren. Bei der Maschinellen Übersetzung ist in der Regel durch diesen Bezug erst die korrekte Übersetzung von Pronomen möglich, aber auch bei anderen Kennzeichnungen leistet der Bezug eine wichtige Funktion bei der für die korrekte Übersetzung eventuell notwendigen Desambiguierung.
{"title":"Anaphernresolution in flach analysierten Texten für Recherche und Übersetzung","authors":"K. Eberle","doi":"10.21248/jlcl.18.2003.35","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.35","url":null,"abstract":"Anaphernresolution ist wichtig für Retrieval und Textklassifikation, weil sie erlaubt, bei der Auszählung der Häufigkeit der Benennung eines Objekts, oder eines Objekttyps, eines Begriffs, die Ergebnisse durch die Anzahl der entsprechenden anaphorischen Verwendungen zu korrigieren. Bei der Maschinellen Übersetzung ist in der Regel durch diesen Bezug erst die korrekte Übersetzung von Pronomen möglich, aber auch bei anderen Kennzeichnungen leistet der Bezug eine wichtige Funktion bei der für die korrekte Übersetzung eventuell notwendigen Desambiguierung.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"27 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127814613","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2003-07-01DOI: 10.21248/jlcl.18.2003.42
R. Rapp
Nachteile der Vorgehensweise diskutiert und es wird ein Ausblick gegeben.
并有一个想法
{"title":"Die Erkennung semantischer Mehrdeutigkeiten mittels Unabhängigkeitsanalyse","authors":"R. Rapp","doi":"10.21248/jlcl.18.2003.42","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.42","url":null,"abstract":"Nachteile der Vorgehensweise diskutiert und es wird ein Ausblick gegeben.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"58 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"131499613","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2003-07-01DOI: 10.21248/jlcl.18.2003.39
V. Kubon
If someone would collect opinions among the computational linguists what had been the most important trend in linguistics in the last decade, it is highly probable that the majority would answer that it was the massive use of large natural language corpora in many linguistic fields. The concept of collecting large amounts of written or spoken natural language data has become extremely important for several linguistic research fields. The majority of large corpora used by linguists are monolingual, although there are several examples of bilingual corpora (e.g. Hansard corpus). This paper would like to present evidence that even the monolingual corpora can be useful for multilingual applications.
{"title":"Multilingual Aspects of Monolingual Corpora","authors":"V. Kubon","doi":"10.21248/jlcl.18.2003.39","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.39","url":null,"abstract":"If someone would collect opinions among the computational linguists what had been the most important trend in linguistics in the last decade, it is highly probable that the majority would answer that it was the massive use of large natural language corpora in many linguistic fields. The concept of collecting large amounts of written or spoken natural language data has become extremely important for several linguistic research fields. The majority of large corpora used by linguists are monolingual, although there are several examples of bilingual corpora (e.g. Hansard corpus). This paper would like to present evidence that even the monolingual corpora can be useful for multilingual applications.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"104 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116435558","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2003-07-01DOI: 10.21248/jlcl.18.2003.37
Thomas Mandl, C. Womser-Hacker
Zusammenfassung: In empirischen Evaluierungsstudien im Information Retrieval stellt sich immer wieder Frage nach der Validität der Ergebnisse. Eine Analyse der Topics des Cross Language Evaluation Forum (CLEF) sollte zeigen, ob linguistische Eigenschaften der Formulierungen der Topics Rückschlüsse auf die Qualität von Retrievalergebnisse zulassen. Für die englischen Topics konnten nur schwache Korrelationen zwischen durchschnittlicher Retrievalqualität und der Gesamtanzahl linguistischer Phänomene nachgewiesen werden. Für die Kombination von Retrievalsystemen, ihren Eigenschaften und den Eigenschaften den CLEF-Topics konnten keine Beziehungen gefunden werden.
{"title":"Eigenschaften von natürlichsprachlichen Topics in Information Retrieval Experimenten","authors":"Thomas Mandl, C. Womser-Hacker","doi":"10.21248/jlcl.18.2003.37","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.37","url":null,"abstract":"Zusammenfassung: In empirischen Evaluierungsstudien im Information Retrieval stellt sich immer wieder Frage nach der Validität der Ergebnisse. Eine Analyse der Topics des Cross Language Evaluation Forum (CLEF) sollte zeigen, ob linguistische Eigenschaften der Formulierungen der Topics Rückschlüsse auf die Qualität von Retrievalergebnisse zulassen. Für die englischen Topics konnten nur schwache Korrelationen zwischen durchschnittlicher Retrievalqualität und der Gesamtanzahl linguistischer Phänomene nachgewiesen werden. Für die Kombination von Retrievalsystemen, ihren Eigenschaften und den Eigenschaften den CLEF-Topics konnten keine Beziehungen gefunden werden.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"151 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127283572","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2003-07-01DOI: 10.21248/jlcl.18.2003.38
Ursula Fissgus, Elke Bachmann, Michael Hentze, Katja Kislow, Michael Kutz, K. Müller, Katrin Nörenberg, U. Siggelkow, Susann Woetzel
Zusammenfassung: Das Internet wird als ein internationaler Informationsraum, an dem jeder partizipieren und von dem jeder profitieren kann, angesehen. Es wurde untersucht, inwieweit im Internet verfügbare Suchmaschinen, Online-Wörterbücher und OPAC Systeme ihre Dienste einem internationalen Nutzerkreis zugänglich machen. Der hier untersuchte Aspekt betrifft die multilinguale Recherche, bei der eine Transliterierung von sprachabhängigen Sonderzeichen erforderlich ist. Die Frage, die es zu beantworten galt, war, wie wird Transliterierung eingesetzt und welche Qualität die Ergebnisse haben, wenn Nutzer nur einen eingeschränkten Zeichensatz verwenden und Sonderzeichen transliterieren (müssen). Die Untersuchungen haben gezeigt, dass Transliterierung, sogar innerhalb einer Anwendung, uneinheitlich eingesetzt wird und damit auch die Qualität der erzielten Rechercheergebnisse sehr unterschiedlich ist.
{"title":"Einsatz der Transliterierung in der multilingualen Recherche","authors":"Ursula Fissgus, Elke Bachmann, Michael Hentze, Katja Kislow, Michael Kutz, K. Müller, Katrin Nörenberg, U. Siggelkow, Susann Woetzel","doi":"10.21248/jlcl.18.2003.38","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.38","url":null,"abstract":"Zusammenfassung: Das Internet wird als ein internationaler Informationsraum, an dem jeder partizipieren und von dem jeder profitieren kann, angesehen. Es wurde untersucht, inwieweit im Internet verfügbare Suchmaschinen, Online-Wörterbücher und OPAC Systeme ihre Dienste einem internationalen Nutzerkreis zugänglich machen. Der hier untersuchte Aspekt betrifft die multilinguale Recherche, bei der eine Transliterierung von sprachabhängigen Sonderzeichen erforderlich ist. Die Frage, die es zu beantworten galt, war, wie wird Transliterierung eingesetzt und welche Qualität die Ergebnisse haben, wenn Nutzer nur einen eingeschränkten Zeichensatz verwenden und Sonderzeichen transliterieren (müssen). Die Untersuchungen haben gezeigt, dass Transliterierung, sogar innerhalb einer Anwendung, uneinheitlich eingesetzt wird und damit auch die Qualität der erzielten Rechercheergebnisse sehr unterschiedlich ist.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"18 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"128667268","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2003-07-01DOI: 10.21248/jlcl.18.2003.46
Ulrike Gut, J. Milde, Karola Pitsch
Zusammenfassung: Dieser Beitrag beschreibt die TASX-Korpusumgebung, ein XMLbasiertes System zur Erstellung und Auswertung von grosen Sprachkorpora. Das Time Aligned Signal Data Exchange Format (TASX) wurde speziell entwickelt fur die Annotation zeitlich geordneter, multimodaler Sprachdaten. Anhand zweier exemplarisch vorgestellter multimodaler, multilingualer Korpora gesprochener Sprache werden die Anforderungen unterschiedlicher linguistischer Forschungsbereiche an die technische Unterstutzung bei Korpusannotation, Korpuserstellung und Korpusdissemination diskutiert und die Losungen in der TASX-Korpusumgebung prasentiert.
{"title":"Multimodale bilinguale Korpora gesprochener Sprache: Korpuserstellung, -analyse und -dissemination in der TASX-Umgebung","authors":"Ulrike Gut, J. Milde, Karola Pitsch","doi":"10.21248/jlcl.18.2003.46","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.46","url":null,"abstract":"Zusammenfassung: Dieser Beitrag beschreibt die TASX-Korpusumgebung, ein XMLbasiertes System zur Erstellung und Auswertung von grosen Sprachkorpora. Das Time Aligned Signal Data Exchange Format (TASX) wurde speziell entwickelt fur die Annotation zeitlich geordneter, multimodaler Sprachdaten. Anhand zweier exemplarisch vorgestellter multimodaler, multilingualer Korpora gesprochener Sprache werden die Anforderungen unterschiedlicher linguistischer Forschungsbereiche an die technische Unterstutzung bei Korpusannotation, Korpuserstellung und Korpusdissemination diskutiert und die Losungen in der TASX-Korpusumgebung prasentiert.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"5 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124174865","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2003-07-01DOI: 10.21248/jlcl.18.2003.41
Alexander Mehler
Zusammenfassung: Der Beitrag beschreibt eine Variante des Kompositionalitatsprinzips der Bedeutung als Grundprinzip fur die numerische Analyse unsystematischer Sinnrelationen komplexer Zeichen, das uber das Phanomen der perspektivischen Interpretation hinaus gebrauchssemantische Bedeutungsaspekte berucksichtigt. Ziel ist es, ein theoretisches Fundament fur korpusanalytische Ansatze in der Semantik, die oftmals die linguistische Interpretierbarkeit ihrer Analyseergebnisse vermissen lassen, zu umreisen. Die Spezifikation des Kompositionalitatsprinzips erfolgt unter Rekurs auf das Modell eines hierarchisch geordneten Constraint-Satisfaction-Prozesses. Hiermit ist das langerfristige Ziel verbunden, das Problem einer defizitaren numerischen Textreprasentation sowie die mangelnde Integration von propositionaler und strukturaler bzw. korpusanalytischer Semantik anzugehen. Die Erorterungen dieses Beitrags sind primar konzeptioneller Natur; sie betreffen die Konzeption einer numerischen Textsemantik zur Vermeidung von Defiziten bestehender Ansatze.
{"title":"Ein Kompositionalitätsprinzip für numerische Textsemantiken","authors":"Alexander Mehler","doi":"10.21248/jlcl.18.2003.41","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.41","url":null,"abstract":"Zusammenfassung: Der Beitrag beschreibt eine Variante des Kompositionalitatsprinzips der Bedeutung als Grundprinzip fur die numerische Analyse unsystematischer Sinnrelationen komplexer Zeichen, das uber das Phanomen der perspektivischen Interpretation hinaus gebrauchssemantische Bedeutungsaspekte berucksichtigt. Ziel ist es, ein theoretisches Fundament fur korpusanalytische Ansatze in der Semantik, die oftmals die linguistische Interpretierbarkeit ihrer Analyseergebnisse vermissen lassen, zu umreisen. Die Spezifikation des Kompositionalitatsprinzips erfolgt unter Rekurs auf das Modell eines hierarchisch geordneten Constraint-Satisfaction-Prozesses. Hiermit ist das langerfristige Ziel verbunden, das Problem einer defizitaren numerischen Textreprasentation sowie die mangelnde Integration von propositionaler und strukturaler bzw. korpusanalytischer Semantik anzugehen. Die Erorterungen dieses Beitrags sind primar konzeptioneller Natur; sie betreffen die Konzeption einer numerischen Textsemantik zur Vermeidung von Defiziten bestehender Ansatze.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"24 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126298755","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2003-07-01DOI: 10.21248/jlcl.18.2003.50
M. Kunze, D. Rösner
Zusammenfassung: Die aktuellen Entwicklungen zur Aufbereitung von Dokumenten – z.B. für das Semantic Web – und der technologische Fortschritt erfordern einen schnellen und problembezogenen Zugriff auf Informationen in Dokumentbeständen. In diesem Beitrag wird der aktuelle Stand der Document Suite XDOC vorgestellt. XDOC nutzt Methoden der Computerlinguistik und der Wissensverarbeitung, um Voraussetzungen für den Umgang mit großen Dokumentbeständen, z.B. für effektives Information Retrieval (IR) und Informationsextraktion (IE) zu schaffen.
{"title":"Die Document Suite XDOC: ein Fortschrittsbericht","authors":"M. Kunze, D. Rösner","doi":"10.21248/jlcl.18.2003.50","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.50","url":null,"abstract":"Zusammenfassung: Die aktuellen Entwicklungen zur Aufbereitung von Dokumenten – z.B. für das Semantic Web – und der technologische Fortschritt erfordern einen schnellen und problembezogenen Zugriff auf Informationen in Dokumentbeständen. In diesem Beitrag wird der aktuelle Stand der Document Suite XDOC vorgestellt. XDOC nutzt Methoden der Computerlinguistik und der Wissensverarbeitung, um Voraussetzungen für den Umgang mit großen Dokumentbeständen, z.B. für effektives Information Retrieval (IR) und Informationsextraktion (IE) zu schaffen.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"87 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"128274889","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2003-07-01DOI: 10.21248/jlcl.18.2003.33
A. Abel, L. Voltmer
Der Fachbereich „Sprache & Recht“ der Europäischen Akademie Bozen hat für die beiden Datenbanken von ELDIT und BISTRO zwei verschiedene italienisch-deutsche Internetschnittstellen entwickelt. Obwohl es bedeutende Gemeinsamkeiten gibt, sind Aussehen und Funktion völlig unterschiedlich. In diesem Beitrag werden beide Systeme kurz vorgestellt, die Funktionalitäten verglichen und die zugrunde liegenden Variablen und Parameter diskutiert.
{"title":"Variablen multilingualer Kommunikation an der Benutzerschnittstelle","authors":"A. Abel, L. Voltmer","doi":"10.21248/jlcl.18.2003.33","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.33","url":null,"abstract":"Der Fachbereich „Sprache & Recht“ der Europäischen Akademie Bozen hat für die beiden Datenbanken von ELDIT und BISTRO zwei verschiedene italienisch-deutsche Internetschnittstellen entwickelt. Obwohl es bedeutende Gemeinsamkeiten gibt, sind Aussehen und Funktion völlig unterschiedlich. In diesem Beitrag werden beide Systeme kurz vorgestellt, die Funktionalitäten verglichen und die zugrunde liegenden Variablen und Parameter diskutiert.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":"33 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127859447","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}