IBK- und Social Media-Korpora am Leibniz-Institut für Deutsche Sprache

H. Lüngen, M. Kupietz
{"title":"IBK- und Social Media-Korpora am Leibniz-Institut für Deutsche Sprache","authors":"H. Lüngen, M. Kupietz","doi":"10.1515/9783110679885-016","DOIUrl":null,"url":null,"abstract":"Der Beitrag untersucht vorhandene Lösungen und neue Möglichkeiten des Korpusausbaus aus Social Mediaund internetbasierter Kommunikation (IBK) für das Deutsche Referenzkorpus (DeReKo). DeReKo ist eine Sammlung gegenwartssprachlicher Schriftkorpora am IDS, die der sprachwissenschaftlichen Öffentlichkeit über die Korpusschnittstellen COSMAS II und KorAP angeboten wird. Anhand von Definitionen und Beispielen gehen wir zunächst auf die Extensionen und Überlappungen der Konzepte Social Media, Internetbasierte Kommunikation und Computer-mediated Communication ein. Wir betrachten die rechtlichen Voraussetzungen für einen Korpusausbau aus Sozialen Medien, die sich aus dem kürzlich in relevanten Punkten reformierten deutschen Urheberrecht, aus Persönlichkeitsrechten wie der europäischen Datenschutz-Grundverordnung ergeben und stellen Konsequenzen sowie mögliche und tatsächliche Umsetzungen dar. Der Aufbau von Social Media-Korpora in großen Textmengen unterliegt außerdem korpustechnologischen Herausforderungen, die für traditionelle Schriftkorpora als gelöst galten oder gar nicht erst bestanden. Wir berichten, wie Fragen der Datenaufbereitung, des Korpus-Encoding, der Anonymisierung oder der linguistischen Annotation von Social Media-Korpora für DeReko angegangen wurden und welche Herausforderungen noch bestehen. Wir betrachten die Korpuslandschaft verfügbarer deutschsprachiger IBKund Social Media-Korpora und geben einen Überblick über den Bestand an IBKund Social Media-Korpora und ihre Charakteristika (Chat-, Wiki Talkund Forenkorpora) in DeReKo sowie von laufenden Projekten in diesem Bereich. Anhand korpuslinguistischer Mikround Makro-Analysen von Wikipedia-Diskussionen im Vergleich mit dem Gesamtbestand von DeReKo zeigen wir charakterisierende sprachliche Eigenschaften von Wikipedia-Diskussionen auf und bewerten ihren Status als Repräsentant von IBK-Korpora. 1 Einleitung: Definitionen Die drei Konzepte Social Media, Internetbasierte Kommunikation und Computermediated Communication werden in der Forschung auf den ersten Blick nebeneinander scheinbar für ein und dasselbe Kommunikationsgenre verwendet. Auch auf der Jahrestagung des Leibniz-Instituts für Deutsche Sprache (IDS) 2019 werden https://doi.org/10.1515/9783110679885-016 Erschienen in: Marx, Konstanze/Lobin, Henning/Schmidt, Axel (Hrsg.): Deutsch in Sozialen Medien: Interaktiv – multimodal – vielfältig. Berlin/Boston: de Gruyter, 2020. S. 319-342. (Jahrbuch des Leibniz-Instituts für Deutsche Sprache 2019) DOI: https://doi.org/10.1515/9783110679885-016 320 Harald Lüngen/Marc Kupietz alle drei Begriffe gebraucht, wobei einzelne Forscher oder Forscherinnen in der Regel einen von ihnen primär verwenden. Inwieweit stimmen die drei Konzepte genau überein, und worin unterscheiden sie sich möglicherweise? Im Social Media Guide for Researchers definieren Cann/Dimitriou/Hooley (2011) Social Media als „Internet services where the online content is generated by the users of the service“. Im Erläuterungstext werden zwei weitere Merkmale angeführt, die wir auch als definitorisch verstehen: Erstens handelt es sich bei Social Media um Dienste des sogenannten Web 2.0, welches seit dem ersten Jahrzehnt dieses Jahrhunderts existiert – ältere Formen wie Internet Relay Chat (IRC), Usenet News oder E-Mail sind somit ausgeschlossen. Und zweitens handelt es sich um Dienste, die der Kommunikation, der Kollaboration oder dem Teilen und Rezipieren von multimedialen Inhalten dienen.1 Als internetbasierte Kommunikation (IBK) bezeichnet Angelika Storrer (2018) den „Forschungsgegenstand, der sich mit Technologien, Prozessen und Produkten der Kommunikation unter Nutzung der technischen Infrastruktur des Internets beschäftigt“. Somit ist der Gegenstand von IBK weiter gefasst als der von Social Media, da IBK auf das Internet, d.h. auf diejenigen Technologien, die auf dem Protokoll TCP-IP beruhen, verweist, welche neben dem World Wide Web (WWW) auch E-Mail und das Usenet umfassen. Auf der anderen Seite zählen Technologien wie SMS, die auf dem Telefonnetz beruhen, nicht zu IBK, wie auch nicht zu Social Media. Ebenso stellen wir fest, dass in Storrers Definition nur die Kategorie Kommunikation angeführt wird, während in der Definition von Social Media wie oben wiedergegeben außerdem Kollaboration und Multimedia-Inhalte eine Rolle spielen. Der älteste der drei Begriffe ist Computer-mediated Communication, er wurde von Susan Herring geprägt. Ihre Definition in Herring (2007) lautet: CMC ist „predominantly text-based human-human interaction mediated by networked computer or mobile telephony“. Zwei Aspekte erscheinen hier wichtig, erstens verweist „networked Computer“ nicht zwingend nur auf das Internet als Netzwerk, und zweitens wird Telefonie explizit eingeschlossen.2 1 Wir danken den Kolleginnen und Kollegen aus der IDS-Abteilung Digitale Sprachwissenschaft, die uns mit ihrer Expertise und mit Ergebnissen für diesen Beitrag unterstützt haben: Peter Fankhauser, Peter M. Fischer, Paweł Kamocki und Eliza Margaretha-Illig. 2 In früheren Versionen der Definition wurde Telefonie nicht eigens genannt, z.B. Herring (2004, S. 27). IBKund Social Media-Korpora am Leibniz-Institut für Deutsche Sprache 321 Abb. 1: Extensionen von CMC, IBK und Social Media In Abbildung 1 haben wir diejenigen Plattformen bzw. Kommunikationsformen, von denen im weiteren Verlauf des Artikels hauptsächlich die Rede sein soll, einmal diesen drei Konzepten zugeordnet. Auf der linken Seite ist zu sehen, dass IBK im Prinzip deckungsgleich mit CMC ist, mit der Ausnahme, dass SMS-Kommunikation streng genommen nicht zu IBK gehört. Social Media ist aber erkennbar nicht synonym zu CMC, erstens weil die älteren Dienste Usenet, E-Mail und IRC auf der linken Seite nicht unter Social Media fallen, und zweitens weil Wiki als klassisches Web 2.0-Medium für das kollaborative Verfassen von Wiki-Seiten bzw. -Artikeln standardmäßig als Social Media verstanden wird, als IBK/CMC aber nur die Kommunikationskomponente Wiki Talk (auf Deutsch meist: Wiki-Diskussionen) – daher die Außenstellung von Wiki-Artikeln in Abbildung 1. Soweit unser Verständnis dieser drei Termini insbesondere im Hinblick auf Korpora. In der Praxis verwenden wir IBK auch als deutsche Übersetzung von CMC. 2 Voraussetzungen für IBK-Korpora in DEREKO In diesem Abschnitt untersuchen wir die Voraussetzungen und Möglichkeiten von Korpora Internetbasierter Kommunikation am IDS, genauer gesagt, für die Korpora der deutschen Schriftsprache der Gegenwart, die unter dem Namen Deutsches Referenzkorpus (DeReKo) durch den Programmbereich Korpuslinguistik angeboten werden. Im Rahmen der Schriftkorpora sind solche Korpora Internetbasierter Kommunikation und Sozialer Medien interessant, die nicht auf 322 Harald Lüngen/Marc Kupietz (Transkripten von) Audiooder Video-Inhalten beruhen – derartige Korpora werden in der IDS-Abteilung Pragmatik aufgebaut und genutzt (vgl. Marx/Schmidt/ Neise in diesem Band). DeReKo ist die größte linguistisch motivierte Sammlung deutschsprachiger Texte mit über 42 Milliarden Tokens (Stand Juli 2019) aus Presse, Belletristik, wissenschaftlichen und populärwissenschaftlichen Artikeln, Gebrauchstexten, Plenardebattenprotokollen und vielen weiteren Genres. Sie wird seit 1964 kontinuierlich aufgebaut und enthält Texte der Gegenwartssprache, die 1956 oder später verfasst wurden. DeReKo ist mehrfach morphosyntaktisch und syntaktisch annotiert (z.B. POS-Tagging, Konstituenzund Dependenzanalysen). DeReKo ist rechtlich abgesichert durch mehr als 120 Lizenzverträge mit Rechteinhabern, 98% der Daten sind über die Korpusrechercheschnittstellen für wissenschaftliche Zwecke weltweit öffentlich nutzbar. DeReKo stellt somit eine Stichprobe des gegenwärtigen Schriftsprachgebrauchs dar und dient der germanistischen Sprachwissenschaft als empirische Grundlage überall dort, wo die Sprache der Gegenwart und jüngeren Vergangenheit Gegenstand der Forschung ist, vor allem in quantitativen Untersuchungen, die große Korpora benötigen (Kupietz et al. 2018). Für die meisten Nutzer erfolgt der Zugriff auf DeReKo über die beiden Korpusrechercheschnittstellen des IDS, COSMAS II (Abb. 2; seit 1994, vgl. Bodmer Mory 2014) und KorAP (Abb. 3; seit 2016, vgl. Diewald et al. 2016). Abb. 2: Korpusrechercheschnittstelle COSMAS II IBKund Social Media-Korpora am Leibniz-Institut für Deutsche Sprache 323 Abb. 3: Korpusrechercheschnittstelle KorAP DeReKo möchte Daten Internetbasierter Kommunikation sampeln, die rechtlich einwandfrei als Korpus einem erweiterten, wissenschaftlichen Nutzerkreis zur Verfügung gestellt werden können. Der Aufbau derartiger Korpora tangiert Urheberrechte und allgemeine Persönlichkeitsrechte in besonderer Weise und anders als traditionelle Pressekorpora (Kamocki/Kinder-Kurlanda/Kupietz 2016). Im Folgenden stellen wir die rechtlichen Voraussetzungen für IBK-Korpora dar und untersuchen die wichtigsten deutschsprachigen frei verfügbaren IBK-Korpora sowie einige einschlägige IBK-Korpora anderer europäischer Sprachen daraufhin, wie mit diesen Voraussetzungen strategisch und technisch umgegangen wird. 2.1 Urheberrechtliche Voraussetzungen Auch IBK-Nutzerbeiträge (Posts) sind potenziell durch das Urheberrecht geschützt. Voraussetzung dafür ist, dass ein Post eine Schöpfungshöhe erreicht, also für sich ein „Werk” darstellt (§ 2 UrhG). Ob ein Text eine Schöpfungshöhe aufweist, hängt nicht unbedingt von seiner Länge ab, dies kann letztlich nur aufgrund seines konkreten Inhalts beurteilt werden. Für bestimmte Genres kann man aber Tendenzen aufzeigen. In dem Rechtsgutachten, das im Projekt zur Kuratierung des Dortmunder Chatkorpus für CLARIN-D-Infrastrukturen erstellt wurde, kamen die Anwälte zu dem Schluss, dass Chat-Posts in der Regel keine Schöpfungshöhe aufweisen, da sie nicht individuell genug sind (Beißwenger et al. 2017a). Twitter324 Harald Lüngen/Marc Kupietz Kommunikation scheint aber stärker zur Schöpfungshöhe zu neigen, schon allein dadurch dass Twitter grundsätzlich öffentlich ist. T","PeriodicalId":360047,"journal":{"name":"Deutsch in Sozialen Medien","volume":"11 18 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2020-02-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Deutsch in Sozialen Medien","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.1515/9783110679885-016","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1

Abstract

Der Beitrag untersucht vorhandene Lösungen und neue Möglichkeiten des Korpusausbaus aus Social Mediaund internetbasierter Kommunikation (IBK) für das Deutsche Referenzkorpus (DeReKo). DeReKo ist eine Sammlung gegenwartssprachlicher Schriftkorpora am IDS, die der sprachwissenschaftlichen Öffentlichkeit über die Korpusschnittstellen COSMAS II und KorAP angeboten wird. Anhand von Definitionen und Beispielen gehen wir zunächst auf die Extensionen und Überlappungen der Konzepte Social Media, Internetbasierte Kommunikation und Computer-mediated Communication ein. Wir betrachten die rechtlichen Voraussetzungen für einen Korpusausbau aus Sozialen Medien, die sich aus dem kürzlich in relevanten Punkten reformierten deutschen Urheberrecht, aus Persönlichkeitsrechten wie der europäischen Datenschutz-Grundverordnung ergeben und stellen Konsequenzen sowie mögliche und tatsächliche Umsetzungen dar. Der Aufbau von Social Media-Korpora in großen Textmengen unterliegt außerdem korpustechnologischen Herausforderungen, die für traditionelle Schriftkorpora als gelöst galten oder gar nicht erst bestanden. Wir berichten, wie Fragen der Datenaufbereitung, des Korpus-Encoding, der Anonymisierung oder der linguistischen Annotation von Social Media-Korpora für DeReko angegangen wurden und welche Herausforderungen noch bestehen. Wir betrachten die Korpuslandschaft verfügbarer deutschsprachiger IBKund Social Media-Korpora und geben einen Überblick über den Bestand an IBKund Social Media-Korpora und ihre Charakteristika (Chat-, Wiki Talkund Forenkorpora) in DeReKo sowie von laufenden Projekten in diesem Bereich. Anhand korpuslinguistischer Mikround Makro-Analysen von Wikipedia-Diskussionen im Vergleich mit dem Gesamtbestand von DeReKo zeigen wir charakterisierende sprachliche Eigenschaften von Wikipedia-Diskussionen auf und bewerten ihren Status als Repräsentant von IBK-Korpora. 1 Einleitung: Definitionen Die drei Konzepte Social Media, Internetbasierte Kommunikation und Computermediated Communication werden in der Forschung auf den ersten Blick nebeneinander scheinbar für ein und dasselbe Kommunikationsgenre verwendet. Auch auf der Jahrestagung des Leibniz-Instituts für Deutsche Sprache (IDS) 2019 werden https://doi.org/10.1515/9783110679885-016 Erschienen in: Marx, Konstanze/Lobin, Henning/Schmidt, Axel (Hrsg.): Deutsch in Sozialen Medien: Interaktiv – multimodal – vielfältig. Berlin/Boston: de Gruyter, 2020. S. 319-342. (Jahrbuch des Leibniz-Instituts für Deutsche Sprache 2019) DOI: https://doi.org/10.1515/9783110679885-016 320 Harald Lüngen/Marc Kupietz alle drei Begriffe gebraucht, wobei einzelne Forscher oder Forscherinnen in der Regel einen von ihnen primär verwenden. Inwieweit stimmen die drei Konzepte genau überein, und worin unterscheiden sie sich möglicherweise? Im Social Media Guide for Researchers definieren Cann/Dimitriou/Hooley (2011) Social Media als „Internet services where the online content is generated by the users of the service“. Im Erläuterungstext werden zwei weitere Merkmale angeführt, die wir auch als definitorisch verstehen: Erstens handelt es sich bei Social Media um Dienste des sogenannten Web 2.0, welches seit dem ersten Jahrzehnt dieses Jahrhunderts existiert – ältere Formen wie Internet Relay Chat (IRC), Usenet News oder E-Mail sind somit ausgeschlossen. Und zweitens handelt es sich um Dienste, die der Kommunikation, der Kollaboration oder dem Teilen und Rezipieren von multimedialen Inhalten dienen.1 Als internetbasierte Kommunikation (IBK) bezeichnet Angelika Storrer (2018) den „Forschungsgegenstand, der sich mit Technologien, Prozessen und Produkten der Kommunikation unter Nutzung der technischen Infrastruktur des Internets beschäftigt“. Somit ist der Gegenstand von IBK weiter gefasst als der von Social Media, da IBK auf das Internet, d.h. auf diejenigen Technologien, die auf dem Protokoll TCP-IP beruhen, verweist, welche neben dem World Wide Web (WWW) auch E-Mail und das Usenet umfassen. Auf der anderen Seite zählen Technologien wie SMS, die auf dem Telefonnetz beruhen, nicht zu IBK, wie auch nicht zu Social Media. Ebenso stellen wir fest, dass in Storrers Definition nur die Kategorie Kommunikation angeführt wird, während in der Definition von Social Media wie oben wiedergegeben außerdem Kollaboration und Multimedia-Inhalte eine Rolle spielen. Der älteste der drei Begriffe ist Computer-mediated Communication, er wurde von Susan Herring geprägt. Ihre Definition in Herring (2007) lautet: CMC ist „predominantly text-based human-human interaction mediated by networked computer or mobile telephony“. Zwei Aspekte erscheinen hier wichtig, erstens verweist „networked Computer“ nicht zwingend nur auf das Internet als Netzwerk, und zweitens wird Telefonie explizit eingeschlossen.2 1 Wir danken den Kolleginnen und Kollegen aus der IDS-Abteilung Digitale Sprachwissenschaft, die uns mit ihrer Expertise und mit Ergebnissen für diesen Beitrag unterstützt haben: Peter Fankhauser, Peter M. Fischer, Paweł Kamocki und Eliza Margaretha-Illig. 2 In früheren Versionen der Definition wurde Telefonie nicht eigens genannt, z.B. Herring (2004, S. 27). IBKund Social Media-Korpora am Leibniz-Institut für Deutsche Sprache 321 Abb. 1: Extensionen von CMC, IBK und Social Media In Abbildung 1 haben wir diejenigen Plattformen bzw. Kommunikationsformen, von denen im weiteren Verlauf des Artikels hauptsächlich die Rede sein soll, einmal diesen drei Konzepten zugeordnet. Auf der linken Seite ist zu sehen, dass IBK im Prinzip deckungsgleich mit CMC ist, mit der Ausnahme, dass SMS-Kommunikation streng genommen nicht zu IBK gehört. Social Media ist aber erkennbar nicht synonym zu CMC, erstens weil die älteren Dienste Usenet, E-Mail und IRC auf der linken Seite nicht unter Social Media fallen, und zweitens weil Wiki als klassisches Web 2.0-Medium für das kollaborative Verfassen von Wiki-Seiten bzw. -Artikeln standardmäßig als Social Media verstanden wird, als IBK/CMC aber nur die Kommunikationskomponente Wiki Talk (auf Deutsch meist: Wiki-Diskussionen) – daher die Außenstellung von Wiki-Artikeln in Abbildung 1. Soweit unser Verständnis dieser drei Termini insbesondere im Hinblick auf Korpora. In der Praxis verwenden wir IBK auch als deutsche Übersetzung von CMC. 2 Voraussetzungen für IBK-Korpora in DEREKO In diesem Abschnitt untersuchen wir die Voraussetzungen und Möglichkeiten von Korpora Internetbasierter Kommunikation am IDS, genauer gesagt, für die Korpora der deutschen Schriftsprache der Gegenwart, die unter dem Namen Deutsches Referenzkorpus (DeReKo) durch den Programmbereich Korpuslinguistik angeboten werden. Im Rahmen der Schriftkorpora sind solche Korpora Internetbasierter Kommunikation und Sozialer Medien interessant, die nicht auf 322 Harald Lüngen/Marc Kupietz (Transkripten von) Audiooder Video-Inhalten beruhen – derartige Korpora werden in der IDS-Abteilung Pragmatik aufgebaut und genutzt (vgl. Marx/Schmidt/ Neise in diesem Band). DeReKo ist die größte linguistisch motivierte Sammlung deutschsprachiger Texte mit über 42 Milliarden Tokens (Stand Juli 2019) aus Presse, Belletristik, wissenschaftlichen und populärwissenschaftlichen Artikeln, Gebrauchstexten, Plenardebattenprotokollen und vielen weiteren Genres. Sie wird seit 1964 kontinuierlich aufgebaut und enthält Texte der Gegenwartssprache, die 1956 oder später verfasst wurden. DeReKo ist mehrfach morphosyntaktisch und syntaktisch annotiert (z.B. POS-Tagging, Konstituenzund Dependenzanalysen). DeReKo ist rechtlich abgesichert durch mehr als 120 Lizenzverträge mit Rechteinhabern, 98% der Daten sind über die Korpusrechercheschnittstellen für wissenschaftliche Zwecke weltweit öffentlich nutzbar. DeReKo stellt somit eine Stichprobe des gegenwärtigen Schriftsprachgebrauchs dar und dient der germanistischen Sprachwissenschaft als empirische Grundlage überall dort, wo die Sprache der Gegenwart und jüngeren Vergangenheit Gegenstand der Forschung ist, vor allem in quantitativen Untersuchungen, die große Korpora benötigen (Kupietz et al. 2018). Für die meisten Nutzer erfolgt der Zugriff auf DeReKo über die beiden Korpusrechercheschnittstellen des IDS, COSMAS II (Abb. 2; seit 1994, vgl. Bodmer Mory 2014) und KorAP (Abb. 3; seit 2016, vgl. Diewald et al. 2016). Abb. 2: Korpusrechercheschnittstelle COSMAS II IBKund Social Media-Korpora am Leibniz-Institut für Deutsche Sprache 323 Abb. 3: Korpusrechercheschnittstelle KorAP DeReKo möchte Daten Internetbasierter Kommunikation sampeln, die rechtlich einwandfrei als Korpus einem erweiterten, wissenschaftlichen Nutzerkreis zur Verfügung gestellt werden können. Der Aufbau derartiger Korpora tangiert Urheberrechte und allgemeine Persönlichkeitsrechte in besonderer Weise und anders als traditionelle Pressekorpora (Kamocki/Kinder-Kurlanda/Kupietz 2016). Im Folgenden stellen wir die rechtlichen Voraussetzungen für IBK-Korpora dar und untersuchen die wichtigsten deutschsprachigen frei verfügbaren IBK-Korpora sowie einige einschlägige IBK-Korpora anderer europäischer Sprachen daraufhin, wie mit diesen Voraussetzungen strategisch und technisch umgegangen wird. 2.1 Urheberrechtliche Voraussetzungen Auch IBK-Nutzerbeiträge (Posts) sind potenziell durch das Urheberrecht geschützt. Voraussetzung dafür ist, dass ein Post eine Schöpfungshöhe erreicht, also für sich ein „Werk” darstellt (§ 2 UrhG). Ob ein Text eine Schöpfungshöhe aufweist, hängt nicht unbedingt von seiner Länge ab, dies kann letztlich nur aufgrund seines konkreten Inhalts beurteilt werden. Für bestimmte Genres kann man aber Tendenzen aufzeigen. In dem Rechtsgutachten, das im Projekt zur Kuratierung des Dortmunder Chatkorpus für CLARIN-D-Infrastrukturen erstellt wurde, kamen die Anwälte zu dem Schluss, dass Chat-Posts in der Regel keine Schöpfungshöhe aufweisen, da sie nicht individuell genug sind (Beißwenger et al. 2017a). Twitter324 Harald Lüngen/Marc Kupietz Kommunikation scheint aber stärker zur Schöpfungshöhe zu neigen, schon allein dadurch dass Twitter grundsätzlich öffentlich ist. T
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
国际图书及社交媒体协会德国莱布尼兹语言研究学院
本文研究了德国参照医学工具(derek)现有的对策和基于社会介质和网络的传媒发展新方法。戴佛科是IDS上一间近代的集体书体组织,在互联网条款第二部和科勒电影中向公众提供的内容。基于不同的定义,我们就立刻接收到各种概念的接发和重叠——社交媒体、基于网络的通讯和计算机媒体通讯。我们认为进化社交媒体的法律先决条件是经改革后的德国版权、像《欧洲隐私规则》等个性权利。大量字体的社交媒体社团也面临着这一大字挑战,它被认为是解决了的,甚至根本没有通过。我们报告娱乐部门对derek的数据处理、密码处理、没名化或语言解读问题以及仍然存在的挑战。我们考察了可以使用的经商商和社会媒体代理公司(信用信贷和社会媒体代理公司)在derek的仪表及其特性(Chat talk talk和foren社团),以及该领域正在进行的项目。基于维基百科原本就矛盾语微观和宏观分析(wikiko)与申科公司总人口数的比较),我们列出了维基百科讨论的语言特征并标注了他们作为ibm公司代表的地位。第1篇前言:三个概念的定义——社会媒体、基于互联网的通讯和电脑媒体通讯在研究中似乎同时使用同一种通信类型。在2019年布莱尼兹德语研究所(IDS)的年会中,lisval讨好了也在:Marx,康斯坦茨/洛宾,Henning/施密特,Axel(出版):社交媒体中的德语:互相沟通、多态柏林/波士顿:2020年。s 319-342 .(2019年莱布尼茨德语学院年鉴)DOI: bec此行和dot15 / 979 / 9976 / 9976 / 99,210只使用上述三个词,少数研究员或研究者通常都是以其中之一为主人翁。这三个概念究竟有多协调?它们之间可能有什么不同?在《财务研究的社交媒体评论》(2011年)中,社交媒体被定义为“网络服务于在线用户收取的服务”。Erläuterungstext中又有两个特点的领导下我们也了解作为definitorisch:首先是为了服务社会媒体所谓的多媒体,哪个在本世纪第一个十年后,年长的形式存在于像互联网Relay聊天(IRC)、Usenet新闻或邮件因此排除.其次,这些或者是服务,为交流,合作,或分享和重温多媒体内容提供服务安吉卡·斯托尔说,2018年是“利用互联网技术基础设施研究通讯技术、流程和产品的研究对象”。因此ibm的目标比社会媒体更广义,因为ibm支持互联网——根据协议的互联网技术——包括电子邮件和isenet等。但社交媒体在技术上,类似简讯这种基于电话网络的技术同样,我们注意到storer的定义仅仅指向了交流范畴,而社交媒体和上述网站的定义同时也反映了合作和多媒体内容的作用。在另外三个词中,最大的一个就是“电脑媒体通讯”,它就来自Susan Herring。在Herring(2007),她在床上的定义是:CMC以纯文字为基础的计算机或者手机为基础。在这里,两个问题显得很重要。首先,“网际网路”不一定只指网络;其次,它也明确定义了电话的使用。21我们感谢ids数码语言学部门的一些同事和专家,他们以专业知识和成果支持我们做出这方面的贡献: 费雪,PawełKamocki和伊丽莎Margaretha-Illig .2例如,在本定义的早期版本中,“电话”这个词并不特别出现在拉丁语里。(综上所述,我们在图一中已经列出了上述三大概念的相关渠道:面向德语莱布尼茨学院321图一:CMC、IBK与社会媒体的接发。在左方,国际商业信贷银行从本质上与CMC是同步的,不过除了其本质上说这并不属于ibmCMC是社会媒体明显不是同义词,首先因为Usenet老年人服务、电子邮件和IRC左侧不低于属于社会媒体,其次因为百科作为典型Web 2.0-Medium kollaborative写的Wiki-Seiten / . -Artikeln默认理解为社会媒体将比IBK / CMC通常只有Kommunikationskomponente谈话中乌伽(德语:Wiki-Diskussionen),因此由Wiki-Artikeln Außenstellung图1 .我们对这三种安排的了解,特别是关于下士的我想你们会同意2条件IBK-Korpora DEREKO在本节中,我们探究的条件和潜力的Korpora Internetbasierter沟通的代日,确切地说,是德国人Korpora,语言的存在之名的德国Referenzkorpus (DEREKO)穿过Programmbereich Korpuslinguistik提供.软下来的社团对那些基于网络的通讯和社交媒体很有兴趣,这类社团不是基于322年的Harald /马克·库皮茨(记录了影像内容)——这类社团在ids实用部建立并使用(参路三合会)。马克思/施密特/尼尔森乐队)德里克是最好的语言学文字汇编,2019年7月写成,从报纸、贝利亚文、科学和流行文章、使用记录、全体会议记录和其他类型的出版物中获得超过420亿份。这份报告自1964年以来一直被编写,其中包含了1956年及以后编写的当代词汇。derek多使用吗啡和合成法(即做戏和合伙分析)。derek在与版权所有人签订的120多份合约的基础上得到了法律保护,98%的数据是通过皮肤接口系统在全球范围内用于科学目的的。DeReKo指出,说明当前Schriftsprachgebrauchs的抽样调查和作为germanistischen语言学的实证基础的地方就是现在和近期的语言研究的对象,特别是在量化研究的重要Korpora需要(Kupietz等人2018 .).与此同时,大多数用户都是通过IDS、COSMAS II(图2)的顶突设备取得想象力的。1994年的事与图三从2016年开始《2016年》图三. 2:Korpusrechercheschnittstelle COSMAS二IBKund社交Media-Korpora Leibniz-Institut日为德语323图一. 3:Korpusrechercheschnittstelle KorAP DeReKo想数据Internetbasierter沟通sampeln法律道德的琴作为扩大后,提供科学Nutzerkreis .下层组织正在侵蚀版权和大个人权利,这与传统出版社非常不同。(卡马基/儿童库皮茨/库皮茨,2016年)这里介绍的是ibm协会的法律要求,并研究主要欧洲国家语言的ibm协会以及其他欧洲语言的相关协会。2.1版权要求包括ibm用户付费电话,可能受到版权保护。而这一切的前提是,本身就是一个邮件Schöpfungshöhe达成,所以代表着一个“作品”(§2 UrhG) .文本的高度不一定取决于它的长度,但可以根据其具体的内容来判断。但在某些类型上可以指出一些趋势律师们在为克雷因德基础设施调阅“多门学院”项目进行的法律咨询意见中认定,由于查普特邮件不具有个人特色,因此通常不会产生高度创造力(一种称为2017a)。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
Inhalt IBK- und Social Media-Korpora am Leibniz-Institut für Deutsche Sprache Die Webkorpora im DWDS – Strategien des Korpusaufbaus und Nutzungsmöglichkeiten Vorwort Frontmatter
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1