首页 > 最新文献

LDV Forum最新文献

英文 中文
Ein Vokabeltrainer auf der Grundlage von GermaNet und Mapa - Mapping Architecture for People's Associations 听过德国人杰瑞米和英国人协会数学教练
Pub Date : 2004-07-01 DOI: 10.21248/jlcl.19.2004.56
K. Beck
{"title":"Ein Vokabeltrainer auf der Grundlage von GermaNet und Mapa - Mapping Architecture for People's Associations","authors":"K. Beck","doi":"10.21248/jlcl.19.2004.56","DOIUrl":"https://doi.org/10.21248/jlcl.19.2004.56","url":null,"abstract":"","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2004-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129101771","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 2
Using EuroWordNet within the Speech Operated System EMBASSI 在语音操作系统中使用EuroWordNet
Pub Date : 2004-07-01 DOI: 10.21248/jlcl.19.2004.52
I. Thabet, Bernd Ludwig, Frank-Peter Schweinberger, K. Bücher, Günther Görz
In natural language processing, incremental semantic composition is one of the most prominent issues. In the past, numerous approaches have been developed for assigning meaning to noun and verb phrases and their complements and modifiers. However, their inferential power is often too weak to be applied to practical applications, or the expressiveness of the representation language is so complex, that it leads to intractable inference procedures. As an answer to these problems, we have developed an approach that relies on Description Logics (DL) for handling semantic construction. First, we will discuss this appraoch and show how a semantic knowledge base can be setup dependant on EUROWORDNET 1 (EWN) as a linguistic ontology. Subsequently we will outline our experience with and demands on EWN. 1 What is EMBASSI and its Objective? EMBASSI (”Elektronische Multimediale Bedienund Service-Assistenz”) has been http://www.illc.uva.nl/EuroWordNet/ a German joint project sponsored by the German Fed. Ministery of Research2. Our contribution to this project consists mainly of three components: the dialogue manager, formal ontologies for several multilingual application domains, and the language generation component to communicate system utterances to the user. The long-term goal of our research is to design and implement a generic dialogue system for rational (spoken) dialogues that helps a user to achieve certain goals in terms of operations of a technical application system – e.g. an information system, a system for controlling devices, or any other kind of problem solving systems. One of its design criteria is the ability to recognize users’ intentions in order to establish corresponding subgoals and control their processing. Furthermore, it should enable mixed-initiative, flexible and cooperative conversations, provide a high level of robustness as well as scalability at the linguistic and application dimensions, and easy portability to new domains. In addition, it should be possible to integrate multilingual linguistic interaction with multimodal It aims to provide easy access for everybody to complex technical systems (A/V home theatre, car devices, and public terminals), encouraging multimodal as well as multilingual user input. forms of input and output such as graphical user interfaces, and – by means of appropriate devices – the recognition of deictic actions. 2 DL Models of Applications Applications are characterized by a DL terminology which models the concepts used for making propositions about application situations. Basically, EMBASSI’s knowledge base is composed of two parts: the EWN ontology, which encodes the linguistic meaning of words determined on an empirical basis, and the STANDARD UPPER ONTOLOGY (SUMO) (NP01), which is used as a generic base model for concepts of the application domain (see (Lu02)). 3 Semantic Construction This section discusses the issue of semantic construction during analyzing natural language input. We are using a
在自然语言处理中,增量语义组合是一个非常突出的问题。在过去,已经发展了许多方法来确定名词和动词短语及其补语和修饰语的意义。然而,它们的推理能力往往太弱而无法应用于实际应用,或者表示语言的表达性太复杂,导致推理过程难以处理。作为这些问题的答案,我们开发了一种依赖于描述逻辑(DL)来处理语义构造的方法。首先,我们将讨论这种方法,并展示如何建立一个依赖于EUROWORDNET 1 (EWN)作为语言本体的语义知识库。随后,我们将概述我们在EWN方面的经验和需求。1什么是大使馆及其目标?使馆(“电子多媒体Bedienund服务辅助”)是http://www.illc.uva.nl/EuroWordNet/由德国联邦研究部赞助的一个德国联合项目。我们对这个项目的贡献主要包括三个组件:对话管理器、用于多个多语言应用领域的正式本体,以及用于向用户传达系统话语的语言生成组件。我们研究的长期目标是设计和实现一个通用的对话系统,用于理性(口语)对话,帮助用户在技术应用系统(例如信息系统、控制设备的系统或任何其他类型的问题解决系统)的操作方面实现某些目标。其设计标准之一是识别用户意图的能力,以便建立相应的子目标并控制其处理。此外,它应该支持混合主动、灵活和协作的对话,在语言和应用程序维度上提供高水平的健壮性以及可伸缩性,并且易于移植到新领域。此外,应该有可能将多语言的语言交互与多模式结合起来。它旨在为每个人提供方便的访问复杂的技术系统(A/V家庭影院、汽车设备和公共终端),鼓励多模式和多语言的用户输入。输入和输出的形式,如图形用户界面,以及-通过适当的设备-指示动作的识别。应用程序的深度学习模型应用程序的特征是一个深度学习术语,它对用于提出有关应用程序情况的命题的概念进行建模。基本上,使馆的知识库由两部分组成:EWN本体,它对经验基础上确定的单词的语言含义进行编码,以及标准上层本体(SUMO) (NP01),它被用作应用领域概念的通用基础模型(见图2)。本节讨论在分析自然语言输入时的语义结构问题。我们正在使用一种增量方法来组合语义表示。我们方法的主干是-DRT (Fis96)。解析器增量地构建话语表示结构(drs) (KaR93)并将它们映射到ABoxes3(参见BLG02)。这里的主要问题是如何将EWN方面的领域独立映射到领域模型方面的应用程序特定语言使用。在话语域中,指称通常指应用程序域中的实例。这种话语指涉和相应的dl系统的一般特征是,知识库由两个部分组成:一个是内涵部分,称为TBox,另一个是外延部分,称为ABox。TBox是一个通用模式,描述了要表示的个体的类、它们的一般属性和相互关系,而ABox是该模式的部分实例化,包含与个体与类或个体与彼此相关的断言。因此,给定一个概念语言L, L中的abox语句具有一种形式(DL96): C(a)概念隶属断言R(a, b)角色隶属断言,其中C是一个L概念,R是一个L角色,a, b是个体。姿态通过一个称为has-lex的特殊角色来表示。例如,在定义AvEvent has-lex Program1中,声称AvEvent4与Program1的话语引用相关。因此,所有在EWN中被指定为Program1的单词,在应用程序域中指定AvEvent的实例。DRS:
{"title":"Using EuroWordNet within the Speech Operated System EMBASSI","authors":"I. Thabet, Bernd Ludwig, Frank-Peter Schweinberger, K. Bücher, Günther Görz","doi":"10.21248/jlcl.19.2004.52","DOIUrl":"https://doi.org/10.21248/jlcl.19.2004.52","url":null,"abstract":"In natural language processing, incremental semantic composition is one of the most prominent issues. In the past, numerous approaches have been developed for assigning meaning to noun and verb phrases and their complements and modifiers. However, their inferential power is often too weak to be applied to practical applications, or the expressiveness of the representation language is so complex, that it leads to intractable inference procedures. As an answer to these problems, we have developed an approach that relies on Description Logics (DL) for handling semantic construction. First, we will discuss this appraoch and show how a semantic knowledge base can be setup dependant on EUROWORDNET 1 (EWN) as a linguistic ontology. Subsequently we will outline our experience with and demands on EWN. 1 What is EMBASSI and its Objective? EMBASSI (”Elektronische Multimediale Bedienund Service-Assistenz”) has been http://www.illc.uva.nl/EuroWordNet/ a German joint project sponsored by the German Fed. Ministery of Research2. Our contribution to this project consists mainly of three components: the dialogue manager, formal ontologies for several multilingual application domains, and the language generation component to communicate system utterances to the user. The long-term goal of our research is to design and implement a generic dialogue system for rational (spoken) dialogues that helps a user to achieve certain goals in terms of operations of a technical application system – e.g. an information system, a system for controlling devices, or any other kind of problem solving systems. One of its design criteria is the ability to recognize users’ intentions in order to establish corresponding subgoals and control their processing. Furthermore, it should enable mixed-initiative, flexible and cooperative conversations, provide a high level of robustness as well as scalability at the linguistic and application dimensions, and easy portability to new domains. In addition, it should be possible to integrate multilingual linguistic interaction with multimodal It aims to provide easy access for everybody to complex technical systems (A/V home theatre, car devices, and public terminals), encouraging multimodal as well as multilingual user input. forms of input and output such as graphical user interfaces, and – by means of appropriate devices – the recognition of deictic actions. 2 DL Models of Applications Applications are characterized by a DL terminology which models the concepts used for making propositions about application situations. Basically, EMBASSI’s knowledge base is composed of two parts: the EWN ontology, which encodes the linguistic meaning of words determined on an empirical basis, and the STANDARD UPPER ONTOLOGY (SUMO) (NP01), which is used as a generic base model for concepts of the application domain (see (Lu02)). 3 Semantic Construction This section discusses the issue of semantic construction during analyzing natural language input. We are using a","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2004-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"117271135","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 2
Modellierung eines Terminologienetzes für das automatische Linking auf der Grundlage von WordNet 基于WordNet的自动连接方法模型
Pub Date : 2004-07-01 DOI: 10.21248/jlcl.19.2004.62
Michael Beißwenger, Angelika Storrer, Maren Runte
Dieser Beitrag skizziert die Konzeption eines im Projekt „Hypertextualisierung auf textgrammtischer Grundlage“ (HyTex) modellierten terminologischen Wortnetzes (TermNet) zu den Fachtextdomanen Texttechnologie und Hypermedia. Schwerpunkt des Beitrags ist es zum einen, die Modellierung von TermNet in Hinblick auf fachsprachenund domanenspezifische Merkmale vorzustellen, und zum anderen, die Anwendung von TermNet fur die Generierung von Linkangeboten zur Rekonstruktion terminologiebedingter Wissensvoraussetzungen zu erortern. 1 Projektrahmen und Motivation des Ansatzes Unter Hypertextualisierung versteht man die Aufbereitung von Dokumenten fur die selektiven, interaktiven Nutzungsformen in einem Hypertextsystem, z.B. dem World Wide Web. Das Projekt HyTex 1 (Hypertextualisierung auf textgrammatischer Grundlage) sucht nach textgrammatisch geleiteten Verfahren fur eine hypertextadaquate Aufbereitung selektiv organisierter Fachtexte (wissenschaftliche Artikel, technische Spezifikationen), d.h. eine Aufbereitung, die hypertexttypischen selektiven Rezeptionsformen optimal entgegenkommt. Auf der technischen Seite benotigt man fur diese Aufgabe Konversionstools; auf der konzeptionellen Seite benotigt man Strategien und Verfahren fur die folgenden beiden Teilaufgaben der Hypertextualisierung: – Segmentierung (Zerlegung der Dokumente in Module). 1 HyTex wird seit April 2002 an der Universitat Dortmund durchgefuhrt (www.hytex.info) und ist ein Teilprojekt der Forschergruppe „Texttechnologische Informationsmodellierung“ (www.text-technology.de), die sich mit den theoretischen Grundlagen und Methoden der Modellierung von Sprachdaten mit Markup-Sprachen (insbesondere XML und Tochterstandards) beschaftigt. – Linking (Verknupfung der Module durch Hyperlinks). Fur die in HyTex entwickelte textgrammatisch geleitete Herangehensweise an diese Aufgaben gibt es zwei Leitlinien: (a) Reversibilitat und (b) Hypertextualisierung nach Koharenzkriterien. Ad a): Reversibilitat bedeutet, dass wir HypertextSichten auf lineare Dokumente als zusatzliche Sichten generieren, die regelgeleitet aus textgrammatischem Markup und anderen Wissensquellen – z.B. aus dem in diesem Papier beschriebenen Terminologienetz – abgeleitet werden. Die sequentielle Struktur und der Originalwortlaut eines Dokuments bleiben dabei als eine mogliche Sicht auf das Dokument erhalten. Damit geben wir dem Rezipienten die Moglichkeit, einen Text in der ursprunglichen linearen Form und Abfolge zu rezipieren, wenn er die Zeit dazu hat; die Hypertextsichten sind als zusatzliche Angebote fur den eiligen Querleser gedacht. Ad b): Das Ziel der Hypertextualisierung in unserem Ansatz ist es, Koharenzbildungsprozesse beim selektiven Querlesen besser zu unterstutzen als dies in Printmedien moglich ist und damit das Mehrwertpotenzial von Hypertexten auszureizen. Im Hinblick auf diese Zielsetzung spielen bei der Segmentierung und beim Linking Koharenzkriterien eine zentrale Rolle. Hypertextualisierung nach Koharenzkriterie
针对特定应用情况的行动需求制定方案让用户在紧迫的情况下争相掌握专业知识,但这些专业知识本已掌握,又不是专家。尽管如此,其中的例子也包括跨学科项目、科学新闻、专业词典、以及跨学科的学习和研究。在这类情况下,wifi和超文本都不能改变使用者只能通过不同选择性地阅读部分内容。现在它们原则上接受对文本的重写,并提供不同的搜索和导航选项。如果编辑带过文本被使用的是正式的文本,那么选择性掠夺性剪辑类型的正确理解就可能缺乏关键的基础。简单地说,每个模块的组成部分继续通过传统的阅读方式对整座塔编排文字。这种超文本的救市难题就是“知识为种的林金”战略类型,即通过链接和三三拨的补充三节。(2002年)4一三六.(Storrer 2002) .以及强制的观点(比如imf,反对反对。第四章所开发的战略是从三层不同的层面处理信息,图一,并提出了各种后果:开放式的讲习班模拟用户
{"title":"Modellierung eines Terminologienetzes für das automatische Linking auf der Grundlage von WordNet","authors":"Michael Beißwenger, Angelika Storrer, Maren Runte","doi":"10.21248/jlcl.19.2004.62","DOIUrl":"https://doi.org/10.21248/jlcl.19.2004.62","url":null,"abstract":"Dieser Beitrag skizziert die Konzeption eines im Projekt „Hypertextualisierung auf textgrammtischer Grundlage“ (HyTex) modellierten terminologischen Wortnetzes (TermNet) zu den Fachtextdomanen Texttechnologie und Hypermedia. Schwerpunkt des Beitrags ist es zum einen, die Modellierung von TermNet in Hinblick auf fachsprachenund domanenspezifische Merkmale vorzustellen, und zum anderen, die Anwendung von TermNet fur die Generierung von Linkangeboten zur Rekonstruktion terminologiebedingter Wissensvoraussetzungen zu erortern. 1 Projektrahmen und Motivation des Ansatzes Unter Hypertextualisierung versteht man die Aufbereitung von Dokumenten fur die selektiven, interaktiven Nutzungsformen in einem Hypertextsystem, z.B. dem World Wide Web. Das Projekt HyTex 1 (Hypertextualisierung auf textgrammatischer Grundlage) sucht nach textgrammatisch geleiteten Verfahren fur eine hypertextadaquate Aufbereitung selektiv organisierter Fachtexte (wissenschaftliche Artikel, technische Spezifikationen), d.h. eine Aufbereitung, die hypertexttypischen selektiven Rezeptionsformen optimal entgegenkommt. Auf der technischen Seite benotigt man fur diese Aufgabe Konversionstools; auf der konzeptionellen Seite benotigt man Strategien und Verfahren fur die folgenden beiden Teilaufgaben der Hypertextualisierung: – Segmentierung (Zerlegung der Dokumente in Module). 1 HyTex wird seit April 2002 an der Universitat Dortmund durchgefuhrt (www.hytex.info) und ist ein Teilprojekt der Forschergruppe „Texttechnologische Informationsmodellierung“ (www.text-technology.de), die sich mit den theoretischen Grundlagen und Methoden der Modellierung von Sprachdaten mit Markup-Sprachen (insbesondere XML und Tochterstandards) beschaftigt. – Linking (Verknupfung der Module durch Hyperlinks). Fur die in HyTex entwickelte textgrammatisch geleitete Herangehensweise an diese Aufgaben gibt es zwei Leitlinien: (a) Reversibilitat und (b) Hypertextualisierung nach Koharenzkriterien. Ad a): Reversibilitat bedeutet, dass wir HypertextSichten auf lineare Dokumente als zusatzliche Sichten generieren, die regelgeleitet aus textgrammatischem Markup und anderen Wissensquellen – z.B. aus dem in diesem Papier beschriebenen Terminologienetz – abgeleitet werden. Die sequentielle Struktur und der Originalwortlaut eines Dokuments bleiben dabei als eine mogliche Sicht auf das Dokument erhalten. Damit geben wir dem Rezipienten die Moglichkeit, einen Text in der ursprunglichen linearen Form und Abfolge zu rezipieren, wenn er die Zeit dazu hat; die Hypertextsichten sind als zusatzliche Angebote fur den eiligen Querleser gedacht. Ad b): Das Ziel der Hypertextualisierung in unserem Ansatz ist es, Koharenzbildungsprozesse beim selektiven Querlesen besser zu unterstutzen als dies in Printmedien moglich ist und damit das Mehrwertpotenzial von Hypertexten auszureizen. Im Hinblick auf diese Zielsetzung spielen bei der Segmentierung und beim Linking Koharenzkriterien eine zentrale Rolle. Hypertextualisierung nach Koharenzkriterie","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2004-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"130884067","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 12
Textauszeichnung im Original und in der Übersetzung: Schemasprachen und mehr 原文和翻译:中文及其他
Pub Date : 2003-07-01 DOI: 10.21248/jlcl.18.2003.36
Felix Sasaki
Der vorliegende Artikel behandelt Forschungsarbeiten, die in der Forschergruppe TEXTTECHNOLOGISCHE INFORMATIONSMODELLIERUNG, im Rahmen des Projekts SEKIMO (Sekundare Informationsstrukturierung und vergleichende Diskursanalyse) entstehen. Im Projekt Sekimo werden u. a. Schemasprachen fur einen korpusbasierten Vergleich sprachlicher Funktionen (z. B. Koreferenz) und ihren Realisierungsformen in typologisch verschiedenen Sprachen eingesetzt. In diesem Artikel werden Moglichkeiten von Schemasprachen und komplementaren Ansatze bzw. Methoden, die sich innerhalb der Projektarbeit fur den Sprachvergleich als hilfreich erwiesen haben, hinsichtlich ihrer Eignung als Mittel zur Wahrung und Analyse von Konsistenz textuell ausgezeichneter Dokumente untersucht. Die Dokumente stehen in einer Ubersetzungsrelation zueinander. D. h. sie liegen in einer Ausgangssprache (AS) und in einer oder mehreren Zielsprache(n) (ZS) vor. Abbildung 1 zeigt einen mittels HTML ausgezeichneten Ausschnitt der Beschreibung des XML-Standards, der XML-Empfehlung (vgl. Bray et al. 2000), in der ausgangssprachlichen, englischen Version, und einer zielsprachlichen, deutschen Version. Die Darstellung entspricht einer Browserausgabe. Die Textauszeichnungen oft auch als Annotation bezeichnet in AS und ZS stehen in bestimmten, in dreifacher Weise differenzierbaren Beziehungen zueinander. (1) Es wird eventuell ein gemeinsames Auszeichnungsvokabular verwendet. Im Beispiel ist dies HTML, da der Text in beiden Sprachen im gleichen Ausgabemedium prasentiert werden soll. (2) Es kann von Gemeinsamkeiten bei der Strukturierung der Dokumente in AS und ZS ausgegangen werden, was z. B. die Trennung und Anordnung der Uberschriften, Absatze, Fusnoten etc. anbetrifft.
本论文介绍了一个研究小组,在“SEKIMO”项目中进行的文本技术信息模拟,这个项目是“文化背景研究和比较分析”的一部分。塞基莫项目包括用视质语言进行比较,以以肤色为基础的语言(如韩国语)及其可以通过具体语言实现的情况。本文检视了在言语对称性项目中有益的模拟语言和互补攻击方式,以及它们是否适合用来维持和分析连贯标准文件。这些文件关系密切。h)可用一种指定的语言(AS)和一种或多种目标语言(n)表达。图1显示了对xml标准,即xml推荐的用“HTML”辩护。(布雷等2000)法语的英语版本和德语版本。显示的图像相当于一个浏览器这些歌词有时也被称为附言。1)有可能使用一个共同记录词。在例子中,这是“HTML”,即用两种语言传输文本。2)可能您可以理解阿斯山和ZS山文献的构造构造方面的常见原因,例如,本书、剪辑、子等等。
{"title":"Textauszeichnung im Original und in der Übersetzung: Schemasprachen und mehr","authors":"Felix Sasaki","doi":"10.21248/jlcl.18.2003.36","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.36","url":null,"abstract":"Der vorliegende Artikel behandelt Forschungsarbeiten, die in der Forschergruppe TEXTTECHNOLOGISCHE INFORMATIONSMODELLIERUNG, im Rahmen des Projekts SEKIMO (Sekundare Informationsstrukturierung und vergleichende Diskursanalyse) entstehen. Im Projekt Sekimo werden u. a. Schemasprachen fur einen korpusbasierten Vergleich sprachlicher Funktionen (z. B. Koreferenz) und ihren Realisierungsformen in typologisch verschiedenen Sprachen eingesetzt. In diesem Artikel werden Moglichkeiten von Schemasprachen und komplementaren Ansatze bzw. Methoden, die sich innerhalb der Projektarbeit fur den Sprachvergleich als hilfreich erwiesen haben, hinsichtlich ihrer Eignung als Mittel zur Wahrung und Analyse von Konsistenz textuell ausgezeichneter Dokumente untersucht. Die Dokumente stehen in einer Ubersetzungsrelation zueinander. D. h. sie liegen in einer Ausgangssprache (AS) und in einer oder mehreren Zielsprache(n) (ZS) vor. Abbildung 1 zeigt einen mittels HTML ausgezeichneten Ausschnitt der Beschreibung des XML-Standards, der XML-Empfehlung (vgl. Bray et al. 2000), in der ausgangssprachlichen, englischen Version, und einer zielsprachlichen, deutschen Version. Die Darstellung entspricht einer Browserausgabe. Die Textauszeichnungen oft auch als Annotation bezeichnet in AS und ZS stehen in bestimmten, in dreifacher Weise differenzierbaren Beziehungen zueinander. (1) Es wird eventuell ein gemeinsames Auszeichnungsvokabular verwendet. Im Beispiel ist dies HTML, da der Text in beiden Sprachen im gleichen Ausgabemedium prasentiert werden soll. (2) Es kann von Gemeinsamkeiten bei der Strukturierung der Dokumente in AS und ZS ausgegangen werden, was z. B. die Trennung und Anordnung der Uberschriften, Absatze, Fusnoten etc. anbetrifft.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"115693890","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Simple Signals for Complex Rhetorics: On Rhetorical Analysis with Rich-Feature Support Vector Models 复杂修辞学的简单信号:基于多特征支持向量模型的修辞学分析
Pub Date : 2003-07-01 DOI: 10.21248/jlcl.18.2003.26
D. Reitter
Most text displays an internal coherence structure, which can be analyzed as a tree structure of relations that hold between short segments of text. We present a machinelearning governed approach to such an analysis in the framework of Rhetorical Structure Theory. Our rhetorical analyzer observes a variety of textual properties, such as cue phrases, part-of-speech information, rhetorical context and lexical chaining. A two-stage parsing algorithm uses local and global optimization to find an analysis. Decisions during parsing are driven by an ensemble of support vector classifiers. This training method allows for a non-linear separation of samples with many relevant features. We define a chain of annotation tools that profits from a new underspecified representation of rhetorical structure. Classifiers are trained on a newly introduced German language corpus, as well as on a large English one. We present evaluation data for the recognition of rhetorical relations.
大多数文本都具有内部连贯结构,可以将其分析为文本短段之间的关系树状结构。我们在修辞结构理论的框架内提出了一种机器学习控制的方法来进行这种分析。我们的修辞分析器观察各种文本属性,如提示短语、词性信息、修辞语境和词汇链。两阶段解析算法使用局部和全局优化来查找分析。解析过程中的决策由支持向量分类器的集合驱动。这种训练方法允许对具有许多相关特征的样本进行非线性分离。我们定义了一系列注释工具,这些工具受益于修辞结构的新的未指定表示。分类器在新引入的德语语料库以及大型英语语料库上进行训练。我们提供了修辞关系识别的评价数据。
{"title":"Simple Signals for Complex Rhetorics: On Rhetorical Analysis with Rich-Feature Support Vector Models","authors":"D. Reitter","doi":"10.21248/jlcl.18.2003.26","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.26","url":null,"abstract":"Most text displays an internal coherence structure, which can be analyzed as a tree structure of relations that hold between short segments of text. We present a machinelearning governed approach to such an analysis in the framework of Rhetorical Structure Theory. Our rhetorical analyzer observes a variety of textual properties, such as cue phrases, part-of-speech information, rhetorical context and lexical chaining. A two-stage parsing algorithm uses local and global optimization to find an analysis. Decisions during parsing are driven by an ensemble of support vector classifiers. This training method allows for a non-linear separation of samples with many relevant features. We define a chain of annotation tools that profits from a new underspecified representation of rhetorical structure. Classifiers are trained on a newly introduced German language corpus, as well as on a large English one. We present evaluation data for the recognition of rhetorical relations.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126627066","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 53
Für einen erfolgreichen Einsatz von Sprachtechnologien im Lokalisierungsbereich 都成功地利用了基因技术
Pub Date : 2003-07-01 DOI: 10.21248/jlcl.18.2003.29
Reinhard Schäler
Die Lokalisierungsindustrie ist einer der Motoren, die die Entwicklung der multilingualen Informationsgesellschaft antreiben. Als solche muss sie in der Lage sein, grose Mengen digitaler Inhalte, die in einer Sprache entwickelt wurden, in kurzester Zeit mit einem angemessenen Aufwand und in ausreichender Qualitat auch fur eine Reihe anderer Sprachen bereitzustellen. Dies ist in der Praxis nur moglich mit Hilfe von Werkzeugen und Technologien aus dem Bereich der linguistischen Datenverarbeitung. Dieser Beitrag gibt zunachst einen Uberblick uber die Lokalisierungsindustrie und definiert den Begriff Lokalisierung, wie er im Weiteren verwendet wird. Der Beitrag beschreibt dann ein typisches Lokalisierungsprojekt und die Abfolge der Arbeitsvorgange in einem solchen Projekt. Auf diesem Hintergrund untersucht der Beitrag die Beruhrungspunkte und Abhangigkeiten zwischen Sprachtechnologien und Lokalisierung. Welche Probleme in Bezug auf die Verarbeitung menschlicher Sprache treten wahrend der Lokalisierung auf und in welchem Zusammenhang? Welche Sprachtechnologien und Werkzeuge bieten sich fur eine Losung dieser Probleme an? Welche werden in der Praxis bereits eingesetzt, welche befinden sich noch im Entwicklungsstadium? Welche Hindernisse es fur einen erfolgreichen Einsatz von Sprachtechnologien in der Lokalisierung gibt, diskutiert der Beitrag in seinem abschliesenden Teil und bietet zugleich Strategien zur Uberwindung dieser Hindernisse an.
地方产业是推动多民粹主义信息社会发展的引擎之一。这就是说,它必须能够在最短时的时间提供用一种语言创造的大量数字内容,并有足够的力度和足够的趣味覆盖不同语言。只有使用语言学领域的工具和技术才能实现这种效果。这篇文章提供了对所在地产业的参考并定义了法律如何维持它。然后描述了一个典型的定位项目和类似项目的工作流程在此背景下,本文回顾了文字设计和地点之间的触地点和纹理。在追踪人类语言方面有什么问题?哪些文字和工具有助于解决上述问题?哪些正在采取行动,哪些还在发育阶段?在论文的末尾讨论了在位置上成功使用文字技术的障碍是什么,同时提出了攻防性障碍的战略。
{"title":"Für einen erfolgreichen Einsatz von Sprachtechnologien im Lokalisierungsbereich","authors":"Reinhard Schäler","doi":"10.21248/jlcl.18.2003.29","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.29","url":null,"abstract":"Die Lokalisierungsindustrie ist einer der Motoren, die die Entwicklung der multilingualen Informationsgesellschaft antreiben. Als solche muss sie in der Lage sein, grose Mengen digitaler Inhalte, die in einer Sprache entwickelt wurden, in kurzester Zeit mit einem angemessenen Aufwand und in ausreichender Qualitat auch fur eine Reihe anderer Sprachen bereitzustellen. Dies ist in der Praxis nur moglich mit Hilfe von Werkzeugen und Technologien aus dem Bereich der linguistischen Datenverarbeitung. Dieser Beitrag gibt zunachst einen Uberblick uber die Lokalisierungsindustrie und definiert den Begriff Lokalisierung, wie er im Weiteren verwendet wird. Der Beitrag beschreibt dann ein typisches Lokalisierungsprojekt und die Abfolge der Arbeitsvorgange in einem solchen Projekt. Auf diesem Hintergrund untersucht der Beitrag die Beruhrungspunkte und Abhangigkeiten zwischen Sprachtechnologien und Lokalisierung. Welche Probleme in Bezug auf die Verarbeitung menschlicher Sprache treten wahrend der Lokalisierung auf und in welchem Zusammenhang? Welche Sprachtechnologien und Werkzeuge bieten sich fur eine Losung dieser Probleme an? Welche werden in der Praxis bereits eingesetzt, welche befinden sich noch im Entwicklungsstadium? Welche Hindernisse es fur einen erfolgreichen Einsatz von Sprachtechnologien in der Lokalisierung gibt, diskutiert der Beitrag in seinem abschliesenden Teil und bietet zugleich Strategien zur Uberwindung dieser Hindernisse an.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116365849","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Query von Multiebenenannotierten XML-Dokumenten mit Prolog 来自于不同级别的xml文件
Pub Date : 2003-07-01 DOI: 10.21248/jlcl.18.2003.45
Daniela Goecke, Daniel Naber, A. Witt
In dem Beitrag wird ein Ansatz vorgestellt, XML-Dokumente zu analysieren, die hinsichtlich mehrerer Ebenen annotiert sind. Die Arbeiten stehen in Zusammenhang mit einem Projekt, in dem sprachliche Funktionen (insbesondere Koreferenz) in Beziehung gesetzt werden zu den sprachlichen Ausdrucksmitteln der untersuchten typologisch unterschiedlichen Sprachen. Derartige Untersuchungen bilden für eine multilingual ausgerichtete Sprachtechnologie eine wichtige Grundlage. So ist es z.B. für maschinelle Übersetzungen unabdingbar, Kenntnisse über eine angemessene Versprachlichung einer in einer Quellsprache als Pronomen realisierten koreferenten Einheit zu besitzen. Als Beispiel für die Relevanz der Verknüpfung von verschiedenen Ebenen soll in dem vorliegenden Beitrag jedoch eine andere Anwendung der hier vorgestellten Query-Möglichkeiten beschrieben werden, die ebenfalls für Arbeiten im Bereich der maschinellen Übersetzung sehr relevant ist, nämlich die Kontrollierte Sprache (vgl. Lehrndorfer 1996). Bei der Analyse von XML-Dokumenten liegt unser Schwerpunkt auf dem Vergleich von Annotationsebenen, existierende Query-Sprachen (vgl. Bonifati & Lee, 2001) legen jedoch zumeist den Schwerpunkt auf die Analyse einer einzelnen Annotationsebene. In Sprachen wie XQuery 1.0 oder XPath 1.0 werden Anfragen in XMLSyntax formuliert. Das Datenmodell ist eine Baumstruktur, Inklusionsrelationen zwischen Elementen, die durch die hierarchische Struktur der Daten gegeben sind, können einfach erfragt werden. Die Query-Sprachen erlauben zwar die Verknüpfung von verteilten Annotationen, überlappende Elemente lassen sich jedoch nicht darstellen, da für deren Modellierung eine parallele Sicht auf die Primärdaten notwendig ist. Um eine parallele Sicht zu ermöglichen, wird das Datenmodell um zusätzliche Informationen erweitert, die eine Verknüpfung der verschiedenen Annotationsebenen erlauben. Für die Realisierung dieses Ansatzes wird der Inferenzmechanismus der Programmiersprache Prolog verwendet.
本文介绍了分析xml不同层次文件的方法。这项工作有一个项目,其中主要有语言功能(特别是韩朝)和被调查不同语言的语言表达手段有关。这些研究为多方语言学的发声系统提供了重要的基础。例如,机器翻译必须学会对以源代码为代名词的韩语单元适当表述语言。不过,本论文介绍了一个说明各个级别之间相关性的另一种应用,这一说明同时也与机械翻译相关:稳态语言(参本)。Lehrndorfer 1996) .我们将天天将不同的“正统”语言命名为三合会。“但部族线和部族线在2001年的首次捐赠中都着重分析…一个首次捐赠的层次以XQuery 1.0或XPath 1.0这样的语言提问就会用xml词汇来表达数据模型是一种树结构,数据背景所传递的元素都具有包容性,可以很容易地询问。尽管横切语言允许了分裂同点之间的相互联系,但覆盖元素仍然不被显示,因为他们模拟时需要对原始数据采取平行的视角。正是因此,为了构建平行视野,数据模型通过添加额外信息,将不同的诊断周期串联起来。其实,这种方法是以宝洛语的内涵机制实现的。
{"title":"Query von Multiebenenannotierten XML-Dokumenten mit Prolog","authors":"Daniela Goecke, Daniel Naber, A. Witt","doi":"10.21248/jlcl.18.2003.45","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.45","url":null,"abstract":"In dem Beitrag wird ein Ansatz vorgestellt, XML-Dokumente zu analysieren, die hinsichtlich mehrerer Ebenen annotiert sind. Die Arbeiten stehen in Zusammenhang mit einem Projekt, in dem sprachliche Funktionen (insbesondere Koreferenz) in Beziehung gesetzt werden zu den sprachlichen Ausdrucksmitteln der untersuchten typologisch unterschiedlichen Sprachen. Derartige Untersuchungen bilden für eine multilingual ausgerichtete Sprachtechnologie eine wichtige Grundlage. So ist es z.B. für maschinelle Übersetzungen unabdingbar, Kenntnisse über eine angemessene Versprachlichung einer in einer Quellsprache als Pronomen realisierten koreferenten Einheit zu besitzen. Als Beispiel für die Relevanz der Verknüpfung von verschiedenen Ebenen soll in dem vorliegenden Beitrag jedoch eine andere Anwendung der hier vorgestellten Query-Möglichkeiten beschrieben werden, die ebenfalls für Arbeiten im Bereich der maschinellen Übersetzung sehr relevant ist, nämlich die Kontrollierte Sprache (vgl. Lehrndorfer 1996). Bei der Analyse von XML-Dokumenten liegt unser Schwerpunkt auf dem Vergleich von Annotationsebenen, existierende Query-Sprachen (vgl. Bonifati & Lee, 2001) legen jedoch zumeist den Schwerpunkt auf die Analyse einer einzelnen Annotationsebene. In Sprachen wie XQuery 1.0 oder XPath 1.0 werden Anfragen in XMLSyntax formuliert. Das Datenmodell ist eine Baumstruktur, Inklusionsrelationen zwischen Elementen, die durch die hierarchische Struktur der Daten gegeben sind, können einfach erfragt werden. Die Query-Sprachen erlauben zwar die Verknüpfung von verteilten Annotationen, überlappende Elemente lassen sich jedoch nicht darstellen, da für deren Modellierung eine parallele Sicht auf die Primärdaten notwendig ist. Um eine parallele Sicht zu ermöglichen, wird das Datenmodell um zusätzliche Informationen erweitert, die eine Verknüpfung der verschiedenen Annotationsebenen erlauben. Für die Realisierung dieses Ansatzes wird der Inferenzmechanismus der Programmiersprache Prolog verwendet.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126800111","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 8
Extraktion von semantischen Relationen aus natürlichsprachlichem Text mit Hilfe von maschinellem Lernen 通过机器学习直接从自然语言文本中取意义
Pub Date : 2003-07-01 DOI: 10.21248/jlcl.18.2003.24
Chris Biemann
Zusammenfassung: Inhalt der vorliegenden Arbeit ist die Entwicklung eines Lernverfahrens, das aus großen Textkorpora semantische Relationen automatisch extrahiert. Den Kern des Verfahrens bildet die Iteration von Suchschritt und Verifikationsschritt, in denen in gesuchter Relation stehende Wörter gefunden und überprüft werden. Auf diese Weise ist es möglich, mit wenigen bekannten Wörtern eine große Anzahl in derselben Relation stehende Wörter zu gewinnen. So können mit wenig Aufwand große Listen von Wörtern erstellt werden, die in einem semantischen Zusammenhang stehen. Nach der Skizzierung des Algorithmus werden theoretische Vorhersagen bezüglich der für das Verfahren geeigneten Relationen getroffen, sowie der Ablauf modelliert. Einige mit einer Implementierung des Verfahrens erzielte Ergebnisse werden für die Relation der Personennamen vorgestellt, evaluiert und diskutiert, des Weiteren werden Ausblicke und Verbesserungsmöglichkeiten angegeben.
总结:本项研究的内容是一种学习方法的开发,是从引用的词语义中自动提取出来的。过程的核心是搜寻和核查步骤是找到并审查预期词汇。这样,鲜有在世的单词就能联想到大量类似的词语了。因此可以轻而易举地编写出与语义相关的单词的大列表。在研究这一算法之后,在进程中找到适当的理论预测,然后建模过程。介绍、评价和讨论了整个过程中人名数量最多的几个结果,并提供了前景和改进方法。
{"title":"Extraktion von semantischen Relationen aus natürlichsprachlichem Text mit Hilfe von maschinellem Lernen","authors":"Chris Biemann","doi":"10.21248/jlcl.18.2003.24","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.24","url":null,"abstract":"Zusammenfassung: Inhalt der vorliegenden Arbeit ist die Entwicklung eines Lernverfahrens, das aus großen Textkorpora semantische Relationen automatisch extrahiert. Den Kern des Verfahrens bildet die Iteration von Suchschritt und Verifikationsschritt, in denen in gesuchter Relation stehende Wörter gefunden und überprüft werden. Auf diese Weise ist es möglich, mit wenigen bekannten Wörtern eine große Anzahl in derselben Relation stehende Wörter zu gewinnen. So können mit wenig Aufwand große Listen von Wörtern erstellt werden, die in einem semantischen Zusammenhang stehen. Nach der Skizzierung des Algorithmus werden theoretische Vorhersagen bezüglich der für das Verfahren geeigneten Relationen getroffen, sowie der Ablauf modelliert. Einige mit einer Implementierung des Verfahrens erzielte Ergebnisse werden für die Relation der Personennamen vorgestellt, evaluiert und diskutiert, des Weiteren werden Ausblicke und Verbesserungsmöglichkeiten angegeben.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123845267","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 5
MÜ-Lexikografie
Pub Date : 2003-07-01 DOI: 10.21248/jlcl.18.2003.32
N. Weber
Das Lexikon 1 oder Wörterbuch ist eine zentrale und dynamische Komponente in Systemen zur Maschinellen Übersetzung (MÜ). Es ist in der Regel die einzige Komponente, die den Benutzern solcher Systeme in irgendeiner Form dargestellt wird und in der – mit Einschränkungen – Änderungen vorgenommen werden können. Die Lexikonkomponente stellt somit, neben der Text-Einund Ausgabe, eine Schnittstelle zwischen System und Benutzern dar. Der Zweck dieser Schnittstelle ist, die Benutzer Einfluss auf den Übersetzungsprozess nehmen zu lassen. Die systematischwissenschaftliche Beschäftigung mit MÜ-Lexika nenne ich MÜ-Lexikografie (MT lexicography). Sie ist eine Subdisziplin der maschinellen oder Computer-Lexikografie (computational lexicography). Die Informationseinheit in MÜ-Lexika – etwa vergleichbar dem Wörterbuchartikel – bezeichne ich im Folgenden als lexikalische Äquivalent-Angabe (LÄA). Außer der Äquivalentsetzung zwischen lexikalischen Einheiten einer Ausgangssprache (AS) und einer Zielsprache (ZS) können darin einzelsprachbezogene grammatische und semantische Angaben kodiert sein. Diese stellen zusätzliche Selektionskriterien für die Äquivalentsetzung im Übersetzungsprozess dar. Benutzer können LÄAn hinzufügen oder bestehende LÄAn modifizieren, gegebenenfalls auch löschen. Ein typischer Anlass zum Hinzufügen einer LÄA wäre, dass ein MÜ-System nach Benutzerbeobachtung eine AS-Zeichenkette nicht oder nicht korrekt identifiziert. Natürlich können die lexikalischen Ressourcen eines Systems auch durch Mengen von LÄAn, etwa Fachoder Firmenterminologie, erweitert werden. Ein Anlass zur Modifikation einer LÄA wäre etwa, dass ein MÜ-System nach Benutzereinschätzung eine nicht zufriedenstellende Übersetzung eines Satzes produziert. Die Hinzufügung oder Modifikation einer LÄA in einem MÜ-Lexikon bezeichne ich auch informell als Lexikon-Eintrag (LE). Ein
《辞典》1是机器翻译系统的中心而有力的信息。事实上,开发银行通常是向这些系统的用户介绍、以任何形式出现的客户们的唯一元素,而且可以在“一丝约束”的前提下以改进的形式出现。事实上,字典的组件显示了系统和用户之间的接口除了文本输入和输出这个界面的目的是使用户能够控制翻译过程。我把“沙丘百科全书”的系统研究称为“沙丘百科全书”。它符合计算机计算机学的学科。在这节经文中,我把词典上的资讯单位称为词典文章的对应词。除了把取自同一首语言(AS)和目标语言(ZS)的词组区分为对应的词组之外,这两个词也可以编码成单数的语词和语词。这些代表了在翻译过程中等价的额外选择标准。用户可添加或修改损坏路径,如有必要则可删除。可能再加上莉亚的话,一个很可能的原因就是从用户观察之后觉醒系统未能正确识别传递的字符串。当然,系统中的词汇资源也可以通过许多衬语词,例如专业或公司的术语加以扩充。约书亚的一个原因是,根据用户评价,一个疲惫系统可能会产生一个句子没有满意的翻译。在《弥赛亚书》中,是否也将莉亚经加入或修订,我也将其正式名称列为“LE”。一个
{"title":"MÜ-Lexikografie","authors":"N. Weber","doi":"10.21248/jlcl.18.2003.32","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.32","url":null,"abstract":"Das Lexikon 1 oder Wörterbuch ist eine zentrale und dynamische Komponente in Systemen zur Maschinellen Übersetzung (MÜ). Es ist in der Regel die einzige Komponente, die den Benutzern solcher Systeme in irgendeiner Form dargestellt wird und in der – mit Einschränkungen – Änderungen vorgenommen werden können. Die Lexikonkomponente stellt somit, neben der Text-Einund Ausgabe, eine Schnittstelle zwischen System und Benutzern dar. Der Zweck dieser Schnittstelle ist, die Benutzer Einfluss auf den Übersetzungsprozess nehmen zu lassen. Die systematischwissenschaftliche Beschäftigung mit MÜ-Lexika nenne ich MÜ-Lexikografie (MT lexicography). Sie ist eine Subdisziplin der maschinellen oder Computer-Lexikografie (computational lexicography). Die Informationseinheit in MÜ-Lexika – etwa vergleichbar dem Wörterbuchartikel – bezeichne ich im Folgenden als lexikalische Äquivalent-Angabe (LÄA). Außer der Äquivalentsetzung zwischen lexikalischen Einheiten einer Ausgangssprache (AS) und einer Zielsprache (ZS) können darin einzelsprachbezogene grammatische und semantische Angaben kodiert sein. Diese stellen zusätzliche Selektionskriterien für die Äquivalentsetzung im Übersetzungsprozess dar. Benutzer können LÄAn hinzufügen oder bestehende LÄAn modifizieren, gegebenenfalls auch löschen. Ein typischer Anlass zum Hinzufügen einer LÄA wäre, dass ein MÜ-System nach Benutzerbeobachtung eine AS-Zeichenkette nicht oder nicht korrekt identifiziert. Natürlich können die lexikalischen Ressourcen eines Systems auch durch Mengen von LÄAn, etwa Fachoder Firmenterminologie, erweitert werden. Ein Anlass zur Modifikation einer LÄA wäre etwa, dass ein MÜ-System nach Benutzereinschätzung eine nicht zufriedenstellende Übersetzung eines Satzes produziert. Die Hinzufügung oder Modifikation einer LÄA in einem MÜ-Lexikon bezeichne ich auch informell als Lexikon-Eintrag (LE). Ein","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122113632","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 3
Kohyponymie in elektronischen Wörterbüchern
Pub Date : 2003-07-01 DOI: 10.21248/jlcl.18.2003.31
S. Langer
Zusammenfassung: Die Kodierung der Hyponymierelation in elektronischen Wörterbüchern und Wortdatenbanken zeigt zahlreiche Inkonsistenzen, für die hier Lösungen vorgeschlagen werden sollen. Ich beginne mit einer Analyse der Probleme bei der Kodierung der Hyponymierelation für Nomina in existierenden Wörterbüchern, namentlich die fehlende Trennung verschiedener Ebenen der Spezifität und die Vermischung unterschiedlicher Unterordnungskriterien. Beides lässt sich in der Analyse lexikografischer Praxis vor allem an der Heterogenität von kodierten Kohyponymen festmachen. Im Anschluss an die Problemanalyse werden Strategien zur korrekteren lexikografischen Erfassung der Hyponymierelation aufgezeigt. Zentrale Idee dabei ist eine lokale Etikettierung der Hyponymierelation. Ein wichtiges Kriterium für die Erarbeitung der Vorschläge war die einfache lexikografische Umsetzbarkeit.
摘要:电子词典和词汇数据库中对催眠的编码显示了许多的一致性,本文建议了可用的解决方案。我现在要开始分析在现有字典中对“特征”和“特征”的编码方面有一些问题,包括没有区分不同的基准和混合不同的解释标准。其实,分类代表一种行之有效的方法,但我们首先可以分类的矶异性为依据。法务问题分析以后,为查明更准确的催眠测序方法,列出了各项战略。我们的主要想法是由地方贴标签的催眠疗法。拟订建议的一个重要标准是简单的词典可行性。
{"title":"Kohyponymie in elektronischen Wörterbüchern","authors":"S. Langer","doi":"10.21248/jlcl.18.2003.31","DOIUrl":"https://doi.org/10.21248/jlcl.18.2003.31","url":null,"abstract":"Zusammenfassung: Die Kodierung der Hyponymierelation in elektronischen Wörterbüchern und Wortdatenbanken zeigt zahlreiche Inkonsistenzen, für die hier Lösungen vorgeschlagen werden sollen. Ich beginne mit einer Analyse der Probleme bei der Kodierung der Hyponymierelation für Nomina in existierenden Wörterbüchern, namentlich die fehlende Trennung verschiedener Ebenen der Spezifität und die Vermischung unterschiedlicher Unterordnungskriterien. Beides lässt sich in der Analyse lexikografischer Praxis vor allem an der Heterogenität von kodierten Kohyponymen festmachen. Im Anschluss an die Problemanalyse werden Strategien zur korrekteren lexikografischen Erfassung der Hyponymierelation aufgezeigt. Zentrale Idee dabei ist eine lokale Etikettierung der Hyponymierelation. Ein wichtiges Kriterium für die Erarbeitung der Vorschläge war die einfache lexikografische Umsetzbarkeit.","PeriodicalId":346957,"journal":{"name":"LDV Forum","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2003-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127153567","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
期刊
LDV Forum
全部 Acc. Chem. Res. ACS Applied Bio Materials ACS Appl. Electron. Mater. ACS Appl. Energy Mater. ACS Appl. Mater. Interfaces ACS Appl. Nano Mater. ACS Appl. Polym. Mater. ACS BIOMATER-SCI ENG ACS Catal. ACS Cent. Sci. ACS Chem. Biol. ACS Chemical Health & Safety ACS Chem. Neurosci. ACS Comb. Sci. ACS Earth Space Chem. ACS Energy Lett. ACS Infect. Dis. ACS Macro Lett. ACS Mater. Lett. ACS Med. Chem. Lett. ACS Nano ACS Omega ACS Photonics ACS Sens. ACS Sustainable Chem. Eng. ACS Synth. Biol. Anal. Chem. BIOCHEMISTRY-US Bioconjugate Chem. BIOMACROMOLECULES Chem. Res. Toxicol. Chem. Rev. Chem. Mater. CRYST GROWTH DES ENERG FUEL Environ. Sci. Technol. Environ. Sci. Technol. Lett. Eur. J. Inorg. Chem. IND ENG CHEM RES Inorg. Chem. J. Agric. Food. Chem. J. Chem. Eng. Data J. Chem. Educ. J. Chem. Inf. Model. J. Chem. Theory Comput. J. Med. Chem. J. Nat. Prod. J PROTEOME RES J. Am. Chem. Soc. LANGMUIR MACROMOLECULES Mol. Pharmaceutics Nano Lett. Org. Lett. ORG PROCESS RES DEV ORGANOMETALLICS J. Org. Chem. J. Phys. Chem. J. Phys. Chem. A J. Phys. Chem. B J. Phys. Chem. C J. Phys. Chem. Lett. Analyst Anal. Methods Biomater. Sci. Catal. Sci. Technol. Chem. Commun. Chem. Soc. Rev. CHEM EDUC RES PRACT CRYSTENGCOMM Dalton Trans. Energy Environ. Sci. ENVIRON SCI-NANO ENVIRON SCI-PROC IMP ENVIRON SCI-WAT RES Faraday Discuss. Food Funct. Green Chem. Inorg. Chem. Front. Integr. Biol. J. Anal. At. Spectrom. J. Mater. Chem. A J. Mater. Chem. B J. Mater. Chem. C Lab Chip Mater. Chem. Front. Mater. Horiz. MEDCHEMCOMM Metallomics Mol. Biosyst. Mol. Syst. Des. Eng. Nanoscale Nanoscale Horiz. Nat. Prod. Rep. New J. Chem. Org. Biomol. Chem. Org. Chem. Front. PHOTOCH PHOTOBIO SCI PCCP Polym. Chem.
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1