首页 > 最新文献

Rasprave最新文献

英文 中文
Slovenska terminološka spletišča in njihove zasnove 斯洛文尼亚术语网站及其概念
IF 0.2 0 LANGUAGE & LINGUISTICS Pub Date : 2020-10-30 DOI: 10.31724/rihjj.46.2.13
Mateja Jemec Tomazin, Mojca Žagar Karer
V razpravi so predstavljena in analizirana slovenska prostodostopna terminološka spletišča in spletne strani nekaterih terminoloških slovarskih projektov, ki se razlikujejo po številu virov oziroma strokovnih področij, zasnovi, številu avtorjev, obsežnosti itd. Glavni namen je bil ugotoviti možnosti predstavitve raznolikih terminoloških virov v novem terminološkem portalu, pri čemer je treba upoštevati, da imajo različni uporabniki terminologije različne potrebe.
讨论介绍并分析了斯洛文尼亚免费访问的术语网站和一些术语词典项目的网站,这些网站在专业知识来源或领域的数量、设计、作者数量、范围等方面有所不同。主要目的是确定在新的术语门户网站中提供不同术语来源的可能性,同时考虑到不同的术语用户有不同的需求。
{"title":"Slovenska terminološka spletišča in njihove zasnove","authors":"Mateja Jemec Tomazin, Mojca Žagar Karer","doi":"10.31724/rihjj.46.2.13","DOIUrl":"https://doi.org/10.31724/rihjj.46.2.13","url":null,"abstract":"V razpravi so predstavljena in analizirana slovenska prostodostopna terminološka spletišča in spletne strani nekaterih terminoloških slovarskih projektov, ki se razlikujejo po številu virov oziroma strokovnih področij, zasnovi, številu avtorjev, obsežnosti itd. Glavni namen je bil ugotoviti možnosti predstavitve raznolikih terminoloških virov v novem terminološkem portalu, pri čemer je treba upoštevati, da imajo različni uporabniki terminologije različne potrebe.","PeriodicalId":51986,"journal":{"name":"Rasprave","volume":"46 1","pages":"229-252"},"PeriodicalIF":0.2,"publicationDate":"2020-10-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"69769458","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Corpus-Based Syntactic-Semantic Graph Analysis 基于语料库的句法语义图分析
IF 0.2 0 LANGUAGE & LINGUISTICS Pub Date : 2020-10-30 DOI: 10.31724/rihjj.46.2.27
Benedikt Perak, Tajana Ban Kirigin
UDK 811.163.42:811.111’322 Prethodno priopćenje Rukopis primljen 5. XI. 2019. Prihvaćen za tisak 10. VI. 2020. doi.org/10.31724/rihjj.46.2.27 Benedikt Perak Cultural Studies Department, Faculty of Humanities and Social Sciences, University of Rijeka Sveučilišna avenija 4, HR-51000 Rijeka bperak@uniri.hr Tajana Ban Kirigin Department of Mathematics, University of Rijeka Ulica Radmile Matejčić 2, HR-51000 Rijeka bank@math.uniri.hr
UDC 811.163.42:811.111'322收到Rukopis的初步通知5。XI。2019.已接受新闻稿10。VI、 2020年。doi.org/10.31724/rihjj.46.2.27人文与社会科学学院Benedikt Perak文化研究系bperak@uniri.hrTajana Ban Kirigin里耶卡大学数学系Ulica Radmile Matejčić2,HR-51000里耶卡bank@math.uniri.hr
{"title":"Corpus-Based Syntactic-Semantic Graph Analysis","authors":"Benedikt Perak, Tajana Ban Kirigin","doi":"10.31724/rihjj.46.2.27","DOIUrl":"https://doi.org/10.31724/rihjj.46.2.27","url":null,"abstract":"UDK 811.163.42:811.111’322 Prethodno priopćenje Rukopis primljen 5. XI. 2019. Prihvaćen za tisak 10. VI. 2020. doi.org/10.31724/rihjj.46.2.27 Benedikt Perak Cultural Studies Department, Faculty of Humanities and Social Sciences, University of Rijeka Sveučilišna avenija 4, HR-51000 Rijeka bperak@uniri.hr Tajana Ban Kirigin Department of Mathematics, University of Rijeka Ulica Radmile Matejčić 2, HR-51000 Rijeka bank@math.uniri.hr","PeriodicalId":51986,"journal":{"name":"Rasprave","volume":"14 1","pages":"957-996"},"PeriodicalIF":0.2,"publicationDate":"2020-10-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://sci-hub-pdf.com/10.31724/rihjj.46.2.27","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"69769507","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 3
Uporaba novih medijev v narečnem slovaropisju na primeru Slovarja starega orodja v govoru Loškega Potoka 方言词典中新媒体的使用——以洛什基波托克语中的《旧工具词典》为例
IF 0.2 0 LANGUAGE & LINGUISTICS Pub Date : 2020-10-30 DOI: 10.31724/rihjj.46.2.30
V. Smole, Helena Gabrijelčič Tomc, Alenka Kavčič
V prispevku so predstavljeni zasnova in uresničitev narečnega tematskega slovarja, ki mu nove tehnološke možnosti omogočajo, da je spletni oziroma e-slovar, interaktivni (z multimedijskimi vsebinami) in rastoči (dopolnjujoči), poleg tega pa ima tudi estetsko celostno grafično podobo, kar vse vpliva na potencialne uporabnike.
本文介绍了辩证主题词典的设计和实现,新的技术可能性使其成为在线或电子词典,具有互动性(与多媒体内容)和成长性(互补性),并具有美学集成的图形图像,所有这些都会影响潜在用户。
{"title":"Uporaba novih medijev v narečnem slovaropisju na primeru Slovarja starega orodja v govoru Loškega Potoka","authors":"V. Smole, Helena Gabrijelčič Tomc, Alenka Kavčič","doi":"10.31724/rihjj.46.2.30","DOIUrl":"https://doi.org/10.31724/rihjj.46.2.30","url":null,"abstract":"V prispevku so predstavljeni zasnova in uresničitev narečnega tematskega slovarja, ki mu nove tehnološke možnosti omogočajo, da je spletni oziroma e-slovar, interaktivni (z multimedijskimi vsebinami) in rastoči (dopolnjujoči), poleg tega pa ima tudi estetsko celostno grafično podobo, kar vse vpliva na potencialne uporabnike.","PeriodicalId":51986,"journal":{"name":"Rasprave","volume":"46 1","pages":"1039-1057"},"PeriodicalIF":0.2,"publicationDate":"2020-10-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"69769332","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Tvorba brojevnih riječi u Hrvatskome mrežnom rječniku – Mrežniku
IF 0.2 0 LANGUAGE & LINGUISTICS Pub Date : 2020-10-30 DOI: 10.31724/rihjj.46.2.22
Ivana Matas Ivanković
Brojevi su raznolika vrsta riječi, mogu biti jednočlani i višečlani, neki su sklonjivi, neki su nesklonjivi, u brojeve se ubrajaju i brojevne imenice i brojevni pridjevi, pa se i tipovi sklonidbe razlikuju. unatoč tome, opisu njihove tvorbe posvećeno je malo prostora. Babić u Tvorbi riječi u hrvatskome književnome jeziku to tumači ovako: „Koliko među zamjenicama, brojevima, prijedlozima i veznicima i ima tvorbenih riječi, to ih je samo nekoliko i tipovi više nisu plodni. To su većinom za tvorbu riječi zatvoreni sustavi, jer nema novih osnova, često s malim brojem jedinica...ˮ (Babić 2002: 15). u Hrvatskome mrežnom rječniku – Mrežniku predviđeno je da se obradi i tvorba riječi, no pri obradi brojeva i riječi motiviranih brojevima pokazalo se da dosadašnji opisi tvorbe koji se nalaze u gramatikama ne nude sva rješenja, što ih čini manjkavima. u radu će se analizirati tvorba brojeva i riječi tvorenih od brojeva koje su obrađene u Mrežniku.
{"title":"Tvorba brojevnih riječi u Hrvatskome mrežnom rječniku – Mrežniku","authors":"Ivana Matas Ivanković","doi":"10.31724/rihjj.46.2.22","DOIUrl":"https://doi.org/10.31724/rihjj.46.2.22","url":null,"abstract":"Brojevi su raznolika vrsta riječi, mogu biti jednočlani i višečlani, neki su sklonjivi, neki su nesklonjivi, u brojeve se ubrajaju i brojevne imenice i brojevni pridjevi, pa se i tipovi sklonidbe razlikuju. unatoč tome, opisu njihove tvorbe posvećeno je malo prostora. Babić u Tvorbi riječi u hrvatskome književnome jeziku to tumači ovako: „Koliko među zamjenicama, brojevima, prijedlozima i veznicima i ima tvorbenih riječi, to ih je samo nekoliko i tipovi više nisu plodni. To su većinom za tvorbu riječi zatvoreni sustavi, jer nema novih osnova, često s malim brojem jedinica...ˮ (Babić 2002: 15). u Hrvatskome mrežnom rječniku – Mrežniku predviđeno je da se obradi i tvorba riječi, no pri obradi brojeva i riječi motiviranih brojevima pokazalo se da dosadašnji opisi tvorbe koji se nalaze u gramatikama ne nude sva rješenja, što ih čini manjkavima. u radu će se analizirati tvorba brojeva i riječi tvorenih od brojeva koje su obrađene u Mrežniku.","PeriodicalId":51986,"journal":{"name":"Rasprave","volume":"105 1","pages":""},"PeriodicalIF":0.2,"publicationDate":"2020-10-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"82957543","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Building Croatian Medical Dictionary from Medical Corpus 从医学语料库构建克罗地亚医学词典
IF 0.2 0 LANGUAGE & LINGUISTICS Pub Date : 2020-10-30 DOI: 10.31724/rihjj.46.2.17
Kristina Kocijan, Silvia Kurolt, Linda Mijic
The overall objective of this project is to define linguistic models at the lexical and syntactic levels that appear in the health domain, depending on the type of corpus. In the first phase of the project, the texts forming the medical corpus A – MedCorA (2,232 pharmaceutical instructions for medicaments available in Croatia) were prepared. The terminology found in this corpus was analyzed and the semantic subdomains (anatomy, condition, microorganism, chemistry, etc.) within the medical domain were defined and added to the dictionary entries. These dictionary resources were used as the foundation for the second phase in which NooJ morphological grammars were built allowing annotation of medical terminology in the corpus. Said grammars were built to allow for recognizing Latinisms, as well as Latin expressions written with Croatian case endings, not only Croatian words. Prepared resources are made available to a broader scientific community via Sketch Engine for further research in the field of medicine enabling additional research and development of algorithms for, among others, medical documents classification, medical texts’ information retrieval or machine translation of medical documentation, taking into account quality and reliability as well as terminology variability.
该项目的总体目标是根据语料库的类型,在健康领域的词汇和句法层面定义语言模型。在该项目的第一阶段,编制了医学语料库A - MedCorA的文本(克罗地亚现有药物的2,232项药物说明)。对语料库中发现的术语进行分析,定义医学领域内的语义子域(解剖学、病症、微生物、化学等)并将其添加到词典条目中。这些词典资源被用作第二阶段的基础,在第二阶段中,构建NooJ形态学语法,允许在语料库中注释医学术语。所述语法的建立是为了允许识别拉丁字母,以及以克罗地亚大小写结尾的拉丁表达式,而不仅仅是克罗地亚单词。准备好的资源可以通过Sketch Engine提供给更广泛的科学界,用于医学领域的进一步研究,从而能够进一步研究和开发算法,其中包括医疗文件分类、医学文本信息检索或医疗文件的机器翻译,同时考虑到质量和可靠性以及术语的可变性。
{"title":"Building Croatian Medical Dictionary from Medical Corpus","authors":"Kristina Kocijan, Silvia Kurolt, Linda Mijic","doi":"10.31724/rihjj.46.2.17","DOIUrl":"https://doi.org/10.31724/rihjj.46.2.17","url":null,"abstract":"The overall objective of this project is to define linguistic models at the lexical and syntactic levels that appear in the health domain, depending on the type of corpus. In the first phase of the project, the texts forming the medical corpus A – MedCorA (2,232 pharmaceutical instructions for medicaments available in Croatia) were prepared. The terminology found in this corpus was analyzed and the semantic subdomains (anatomy, condition, microorganism, chemistry, etc.) within the medical domain were defined and added to the dictionary entries. These dictionary resources were used as the foundation for the second phase in which NooJ morphological grammars were built allowing annotation of medical terminology in the corpus. Said grammars were built to allow for recognizing Latinisms, as well as Latin expressions written with Croatian case endings, not only Croatian words. Prepared resources are made available to a broader scientific community via Sketch Engine for further research in the field of medicine enabling additional research and development of algorithms for, among others, medical documents classification, medical texts’ information retrieval or machine translation of medical documentation, taking into account quality and reliability as well as terminology variability.","PeriodicalId":51986,"journal":{"name":"Rasprave","volume":"6 1","pages":""},"PeriodicalIF":0.2,"publicationDate":"2020-10-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"83729601","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 4
Word Embedding Based on Large-Scale Web Corpora as a Powerful Lexicographic Tool 基于大规模Web语料库的词嵌入:一种强大的词典编纂工具
IF 0.2 0 LANGUAGE & LINGUISTICS Pub Date : 2020-10-30 DOI: 10.31724/rihjj.46.2.8
R. Garabík
The Aranea Project offers a set of comparable corpora for two dozens of (mostly European) languages providing a convenient dataset for nLP applications that require training on large amounts of data. The article presents word embedding models trained on the Aranea corpora and an online interface to query the models and visualize the results. The implementation is aimed towards lexicographic use but can be also useful in other fields of linguistic study since the vector space is a plausible model of semantic space of word meanings. Three different models are available – one for a combination of part of speech and lemma, one for raw word forms, and one based on fastText algorithm uses subword vectors and is not limited to whole or known words in finding their semantic relations. The article is describing the interface and major modes of its functionality; it does not try to perform detailed linguistic analysis of presented examples.
Aranea项目为二十多种语言(主要是欧洲语言)提供了一套可比较的语料库,为需要训练大量数据的nLP应用程序提供了方便的数据集。本文介绍了在Aranea语料库上训练的词嵌入模型,以及一个查询模型和可视化结果的在线界面。实现的目的是词典编纂的使用,但也可以用于其他领域的语言学研究,因为向量空间是一个似是而非的词的语义空间模型。有三种不同的模型可用—一种用于词性和引理的组合,一种用于原始单词形式,另一种基于fastText算法,它使用子词向量,并且在查找语义关系时不限于完整或已知的单词。本文描述了其界面和主要功能模式;它并不试图对所提出的例子进行详细的语言分析。
{"title":"Word Embedding Based on Large-Scale Web Corpora as a Powerful Lexicographic Tool","authors":"R. Garabík","doi":"10.31724/rihjj.46.2.8","DOIUrl":"https://doi.org/10.31724/rihjj.46.2.8","url":null,"abstract":"The Aranea Project offers a set of comparable corpora for two dozens of (mostly European) languages providing a convenient dataset for nLP applications that require training on large amounts of data. The article presents word embedding models trained on the Aranea corpora and an online interface to query the models and visualize the results. The implementation is aimed towards lexicographic use but can be also useful in other fields of linguistic study since the vector space is a plausible model of semantic space of word meanings. Three different models are available – one for a combination of part of speech and lemma, one for raw word forms, and one based on fastText algorithm uses subword vectors and is not limited to whole or known words in finding their semantic relations. The article is describing the interface and major modes of its functionality; it does not try to perform detailed linguistic analysis of presented examples.","PeriodicalId":51986,"journal":{"name":"Rasprave","volume":"122 1","pages":""},"PeriodicalIF":0.2,"publicationDate":"2020-10-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"77077593","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 2
Varijantni frazemi u e-rječniku
IF 0.2 0 LANGUAGE & LINGUISTICS Pub Date : 2020-10-30 DOI: 10.31724/rihjj.46.2.26
Jelena Parizoska, Ivana Filipović Petrović
U ovome se radu prikazuje leksikografska obrada varijantnih frazema u mrežnome Frazeološkom rječniku hrvatskoga jezika koji je u izradi, a utemeljen je na podatcima iz računalnoga korpusa hrWaC. U tome se rječniku varijante različitih vrsta (leksičke, tvorbene i sintaktičke) bilježe u istoj natuknici jer imaju zajedničku konceptualnu osnovu. To odražava kognitivnolingvistički pristup frazemima, u kojem se varijante promatraju kao jezične manifestacije različitih konceptualizacija iste situacije, a među kojima zbog toga mogu postojati razlike u leksičkom sastavu, strukturi, značenju i upotrebi. Također, varijantni oblici istoga frazema mogu se razlikovati po stupnju konvencionaliziranosti, pa se redoslijed njihova navođenja u tome e-rječniku temelji na frekvenciji upotrebe prema podatcima iz hrWaC-a. Takva leksikografska obrada frazeološke varijantnosti odražava stvarnu upotrebu, a korisnici dobivaju potpunu i preciznu informaciju o različitim oblicima frazema i njihovim značenjima u suvremenome hrvatskome jeziku.
{"title":"Varijantni frazemi u e-rječniku","authors":"Jelena Parizoska, Ivana Filipović Petrović","doi":"10.31724/rihjj.46.2.26","DOIUrl":"https://doi.org/10.31724/rihjj.46.2.26","url":null,"abstract":"U ovome se radu prikazuje leksikografska obrada varijantnih frazema u mrežnome Frazeološkom rječniku hrvatskoga jezika koji je u izradi, a utemeljen je na podatcima iz računalnoga korpusa hrWaC. U tome se rječniku varijante različitih vrsta (leksičke, tvorbene i sintaktičke) bilježe u istoj natuknici jer imaju zajedničku konceptualnu osnovu. To odražava kognitivnolingvistički pristup frazemima, u kojem se varijante promatraju kao jezične manifestacije različitih konceptualizacija iste situacije, a među kojima zbog toga mogu postojati razlike u leksičkom sastavu, strukturi, značenju i upotrebi. Također, varijantni oblici istoga frazema mogu se razlikovati po stupnju konvencionaliziranosti, pa se redoslijed njihova navođenja u tome e-rječniku temelji na frekvenciji upotrebe prema podatcima iz hrWaC-a. Takva leksikografska obrada frazeološke varijantnosti odražava stvarnu upotrebu, a korisnici dobivaju potpunu i preciznu informaciju o različitim oblicima frazema i njihovim značenjima u suvremenome hrvatskome jeziku.","PeriodicalId":51986,"journal":{"name":"Rasprave","volume":"22 1","pages":""},"PeriodicalIF":0.2,"publicationDate":"2020-10-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"81402197","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Glagolsko-imeničke kolokacije hrvatskoga, njemačkoga i engleskoga općeznanstvenog jezika u općoj dvojezičnoj e-leksikografiji
IF 0.2 0 LANGUAGE & LINGUISTICS Pub Date : 2020-10-30 DOI: 10.31724/rihjj.46.2.34
Mirjana Šnjarić, Mirjana Borucinsky
Ovaj rad bavi se leksičkim sredstvima standardnoga jezika preuzetim u jezik znanstvene komunikacije. Zbog razlike u kolokacijskim značenjima koja se ostvaruju u hrvatskome, njemačkome i engleskome jeziku, čestih značenjskih dvojbi prevoditelja znanstvene literature i autora znanstvenih tekstova kao i nedovoljne pokrivenosti toga područja leksika i leksičkih relacija u hrvatsko-njemačkim i hrvatsko-engleskim općim dvojezičnim rječnicima rad upozorava na činjenicu da za korisnika s hrvatskim kao izvornim jezikom ostaje nedostupan jedan važan sloj leksika znanstvenoga jezika. Autorice upućuju na nedostatak pokrivenosti općeznanstvenih glagolsko-imeničkih kolokacija u postojećim tiskanim općim dvojezičnim rječnicima s hrvatskim jezikom kao izvornim jezikom rječnika te na potrebu poboljšanja leksikografskoga prikaza kolokacija u strukturi rječničkoga članka. Prijedlozi autorica mogu pridonijeti poboljšanju leksikografskoga prikaza kolokacija u postojećim dvojezičnim rječnicima, a pohranjivanje popisanih i opisanih općeznanstvenih glagolskoimeničkih kolokacijskih obrazaca u elektroničkome repozitoriju podataka odabranih za prikaz u trojezičnoj usporedbi hrvatskoga, njemačkoga i engleskoga jezika može poslužiti kao temelj dorade postojećih dvojezičnih rječnika, ali i kao temelj izrade budućih dvojezičnih i trojezičnih mrežnih rječnika specijaliziranih za općeznanstveni jezik u kojima bi kolokacijama pripadalo izdvojeno mjesto. Na odabranim primjerima glagolsko-imeničkih kolokacija iz područja humanističkih znanosti (npr. Belege heranziehen, razmotriti znanstvene dokaze, to consider facts; Theorie herausarbeiten, razviti teoriju, to develop / to formulate a theory) i njihovoj međujezičnoj usporedbi ilustrirat će se razlike u značenjima i nejasnoće s kojima se suočava hrvatski korisnik. Takve bi se značenjske nedoumice i nedorečenosti leksikografskoga prikaza mogle izbjeći izradom novih mrežnih dvojezičnih i trojezičnih rječnika općeznanstvenoga hrvatskog, njemačkog i engleskog jezika u kojima bi glagolsko-imeničke općeznanstvene kolokacije bile bolje obuhvaćene i leksikografski prikazane. Takva otvorena elektronička baza podataka dozvoljavala bi stalnu aktualizaciju i doradu rječnika, moderniziranje čestom provjerom u suvremenome korpusu hrvatskoga znanstvenog jezika i nadopunom novim pojavama u jeziku znanstvene komunikacije.
{"title":"Glagolsko-imeničke kolokacije hrvatskoga, njemačkoga i engleskoga općeznanstvenog jezika u općoj dvojezičnoj e-leksikografiji","authors":"Mirjana Šnjarić, Mirjana Borucinsky","doi":"10.31724/rihjj.46.2.34","DOIUrl":"https://doi.org/10.31724/rihjj.46.2.34","url":null,"abstract":"Ovaj rad bavi se leksičkim sredstvima standardnoga jezika preuzetim u jezik znanstvene komunikacije. Zbog razlike u kolokacijskim značenjima koja se ostvaruju u hrvatskome, njemačkome i engleskome jeziku, čestih značenjskih dvojbi prevoditelja znanstvene literature i autora znanstvenih tekstova kao i nedovoljne pokrivenosti toga područja leksika i leksičkih relacija u hrvatsko-njemačkim i hrvatsko-engleskim općim dvojezičnim rječnicima rad upozorava na činjenicu da za korisnika s hrvatskim kao izvornim jezikom ostaje nedostupan jedan važan sloj leksika znanstvenoga jezika. Autorice upućuju na nedostatak pokrivenosti općeznanstvenih glagolsko-imeničkih kolokacija u postojećim tiskanim općim dvojezičnim rječnicima s hrvatskim jezikom kao izvornim jezikom rječnika te na potrebu poboljšanja leksikografskoga prikaza kolokacija u strukturi rječničkoga članka. Prijedlozi autorica mogu pridonijeti poboljšanju leksikografskoga prikaza kolokacija u postojećim dvojezičnim rječnicima, a pohranjivanje popisanih i opisanih općeznanstvenih glagolskoimeničkih kolokacijskih obrazaca u elektroničkome repozitoriju podataka odabranih za prikaz u trojezičnoj usporedbi hrvatskoga, njemačkoga i engleskoga jezika može poslužiti kao temelj dorade postojećih dvojezičnih rječnika, ali i kao temelj izrade budućih dvojezičnih i trojezičnih mrežnih rječnika specijaliziranih za općeznanstveni jezik u kojima bi kolokacijama pripadalo izdvojeno mjesto. Na odabranim primjerima glagolsko-imeničkih kolokacija iz područja humanističkih znanosti (npr. Belege heranziehen, razmotriti znanstvene dokaze, to consider facts; Theorie herausarbeiten, razviti teoriju, to develop / to formulate a theory) i njihovoj međujezičnoj usporedbi ilustrirat će se razlike u značenjima i nejasnoće s kojima se suočava hrvatski korisnik. Takve bi se značenjske nedoumice i nedorečenosti leksikografskoga prikaza mogle izbjeći izradom novih mrežnih dvojezičnih i trojezičnih rječnika općeznanstvenoga hrvatskog, njemačkog i engleskog jezika u kojima bi glagolsko-imeničke općeznanstvene kolokacije bile bolje obuhvaćene i leksikografski prikazane. Takva otvorena elektronička baza podataka dozvoljavala bi stalnu aktualizaciju i doradu rječnika, moderniziranje čestom provjerom u suvremenome korpusu hrvatskoga znanstvenog jezika i nadopunom novim pojavama u jeziku znanstvene komunikacije.","PeriodicalId":51986,"journal":{"name":"Rasprave","volume":"1 1","pages":""},"PeriodicalIF":0.2,"publicationDate":"2020-10-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"83031724","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Bog u leksikografskoj mreži 词典编纂网格中的上帝
IF 0.2 0 LANGUAGE & LINGUISTICS Pub Date : 2020-10-30 DOI: 10.31724/rihjj.46.2.6
Teodora Fonović Cvijanović, Blaženka Martinović, Vanessa Vitković Marčeta
Suvremena hrvatska leksikografija plodna je i raznovrsna, no postoje dvojbe koje se preslikavaju iz izdanja u izdanje (što je, dijelom, neizbježno u otvorenome sustavu kao što je leksik). Leksikografske dvojbe množe se i novima kad se leksik izmjesti u novi medij, u e-rječnik ili mrežni rječnik (primjerice otvara se pitanje korpusne utemeljenosti te ozvučivanja leksičkih jedinica ili audiorječnika). U ovome se radu suvremene dvojbe oprimjeruju leksičkim jedinicama sa sastavnicom „bog” jer donose cijelu paletu otvorenih pitanja, naime dotičemo se pravopisne (kako bog/Bog zapovijeda), gramatičke (npr. bog kao imenica i kao uzvik), leksičke (žali Bože / žalibože) i prozodijske (bogtepítaj ili bogtepȋtaj) norme. Dakle, iako je riječ o dvojbama koje se zasigurno odnose na opsežniji korpus (kao što je pitanje gramatikalizacije, pragmatike oblika, (de)onimizacije i frazeologizacije), sužava se pogled na jednu tvorbenu porodicu koji ipak analogijom može iznjedriti općenitija rješenja. Nudi se i primjer mogućega zvučnog zapisa u budućim mrežnim rječnicima te se preispituje korpusna utemeljenost sadašnjih leksikografskih rješenja.
目前,克罗地亚的讲座内容丰富多样,但也有一些替身被禁止出版(这在一定程度上是医学等开放系统中不可避免的)。当医学被转移到一种新的媒介,即电子语言或网络语言时,词典学替身越来越新(例如,企业诚信和演讲单位或审计师的词汇问题是公开的)。同时,这两个立法单位都配备了“上帝”的组成部分,因为它们提出了整个开放式问题调色板,我们处理的是法律定律(按照上帝/上帝的命令)、语法定律(例如,上帝作为名字和声音)、讲座定律(后悔上帝/后悔)和黄道十二宫定律(富有或富有52x13;等)。因此,尽管这是关于两件肯定与更模糊的主体有关的事情(如语法、语用形式、(去)名词化和语法语法),但很难找到一个可以通过类比消除解决方案选项的家族。还提供了一个未来网络语言中可能的声音记录的例子,并考察了当前词汇解决方案的复杂性。
{"title":"Bog u leksikografskoj mreži","authors":"Teodora Fonović Cvijanović, Blaženka Martinović, Vanessa Vitković Marčeta","doi":"10.31724/rihjj.46.2.6","DOIUrl":"https://doi.org/10.31724/rihjj.46.2.6","url":null,"abstract":"Suvremena hrvatska leksikografija plodna je i raznovrsna, no postoje dvojbe koje se preslikavaju iz izdanja u izdanje (što je, dijelom, neizbježno u otvorenome sustavu kao što je leksik). Leksikografske dvojbe množe se i novima kad se leksik izmjesti u novi medij, u e-rječnik ili mrežni rječnik (primjerice otvara se pitanje korpusne utemeljenosti te ozvučivanja leksičkih jedinica ili audiorječnika). U ovome se radu suvremene dvojbe oprimjeruju leksičkim jedinicama sa sastavnicom „bog” jer donose cijelu paletu otvorenih pitanja, naime dotičemo se pravopisne (kako bog/Bog zapovijeda), gramatičke (npr. bog kao imenica i kao uzvik), leksičke (žali Bože / žalibože) i prozodijske (bogtepítaj ili bogtepȋtaj) norme. Dakle, iako je riječ o dvojbama koje se zasigurno odnose na opsežniji korpus (kao što je pitanje gramatikalizacije, pragmatike oblika, (de)onimizacije i frazeologizacije), sužava se pogled na jednu tvorbenu porodicu koji ipak analogijom može iznjedriti općenitija rješenja. Nudi se i primjer mogućega zvučnog zapisa u budućim mrežnim rječnicima te se preispituje korpusna utemeljenost sadašnjih leksikografskih rješenja.","PeriodicalId":51986,"journal":{"name":"Rasprave","volume":"46 1","pages":"567-587"},"PeriodicalIF":0.2,"publicationDate":"2020-10-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"49251305","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Označavanje pogrešaka u CroLTeC-u (računalnom učeničkom korpusu hrvatskog kao stranog jezika) CroLTeC(克罗地亚语作为外语的计算机学生群体)中的标记错误
IF 0.2 0 LANGUAGE & LINGUISTICS Pub Date : 2020-10-30 DOI: 10.31724/rihjj.46.2.24
Nives Mikelić Preradović
The paper describes the error-tagging scheme developed for the CroLTeC learner corpus (http://nlp.ffzg.hr/resources/corpora/croltec/) – the first electronic learner corpus of Croatian as a foreign language. CroLTeC contains essays collected from 755 students with 36 different mother tongues, among which the most prominent were Spanish, English, German, Polish, Chinese, French, and Arabic. It consists of 4,747 essays, out of which 1,217 were digitally born, while 3530 essays were scanned, transcribed in RTF format, Mikelić Preradović.indd 919 4.11.2020. 11:30:22 920 Rasprave 46/2 (2020.) str. 899–920 and converted into XML format. CroLTeC has a total of 1,054,287 tokens, and essays have been collected on all 6 levels of Common European Framework of Reference for Languages (CEFR) at Croaticum – Center for Croatian as Second and Foreign Language at the Faculty of Humanities and Social Sciences in Zagreb, Department of Information Sciences, Natural Language Processing group. All CroLTeC essays contain metadata about the title, number, and type of essay (homework, part of an exam or field class, etc.). Data were lemmatized and annotated with morphosyntactic tags with the ReLDI tagger (Ljubešić et al., 2016). Also, the corpus is searchable by age, sex, language proficiency level, and the mother tongue of the learner. The error-tagging scheme is partially based on Šolar (the scheme of Developmental corpus of Slovene) and the error-coding of the Cambridge Learner Corpus and further tailored to the Croatian language. The goal of the development of the error-tagging scheme is to build a sub-corpus that will serve as a repository of authentic data about the learner’s interlanguage. It should enable researchers and teachers of Croatian as a foreign language to explore the interlanguage, to discover the aspects of the grammar that are the most difficult to master and to tailor teaching materials to different groups of learners (not only according to their Croatian language proficiency level but also to their first language). Finally, the error-tagged sub-corpus should also serve as a starting point for designing computer-aided tools to correct lexical errors, misuse of verbal tenses, phrasal verbs, and collocations. Ključne riječi: učenički korpusi, CroLTeC, obilježavanje pogrešaka, ispravljanje pogrešaka, normalizacija
本文描述了为CroLTeC学习者语料库(http://nlp.ffzg.hr/resources/corpora/croltec/)开发的错误标记方案-克罗地亚语作为外语的第一个电子学习者语料库。CroLTeC收录了来自36种不同母语的755名学生的论文,其中最重要的是西班牙语、英语、德语、波兰语、汉语、法语和阿拉伯语。它由4747篇文章组成,其中1217篇是数字生成的,而3530篇文章被扫描,以RTF格式转录。2020年4月11日。11:30:22 920 Rasprave 46/2 (2020.) str. 899-920并转换为XML格式。CroLTeC共有1,054,287个代币,论文已在萨格勒布人文和社会科学学院克罗地亚语作为第二语言和外语中心的克罗地亚语共同欧洲语言参考框架(CEFR)的所有六个级别上收集,信息科学系,自然语言处理小组。CroLTeC的所有论文都包含有关标题、数量和论文类型(家庭作业、考试的一部分或实地课程等)的元数据。使用ReLDI标记器对数据进行语义化和形态句法标注(Ljubešić et al., 2016)。此外,语料库可以根据学习者的年龄、性别、语言熟练程度和母语进行搜索。错误标记方案部分基于Šolar(斯洛文尼亚语发展语料库方案)和剑桥学习者语料库的错误编码,并进一步针对克罗地亚语进行了调整。开发错误标记方案的目标是建立一个子语料库,作为学习者中介语的真实数据库。它应使克罗地亚语作为外语的研究人员和教师能够探索中介语,发现语法中最难掌握的方面,并为不同的学习者群体量身定制教材(不仅根据他们的克罗地亚语熟练程度,而且根据他们的第一语言)。最后,错误标记的子语料库也应该作为设计计算机辅助工具的起点,以纠正词汇错误、动词时态、短语动词和搭配的误用。klju nerije i: u eni ki korpusi, CroLTeC, obilježavanje pogrešaka, ispravljanje pogrešaka, normalizacija
{"title":"Označavanje pogrešaka u CroLTeC-u (računalnom učeničkom korpusu hrvatskog kao stranog jezika)","authors":"Nives Mikelić Preradović","doi":"10.31724/rihjj.46.2.24","DOIUrl":"https://doi.org/10.31724/rihjj.46.2.24","url":null,"abstract":"The paper describes the error-tagging scheme developed for the CroLTeC learner corpus (http://nlp.ffzg.hr/resources/corpora/croltec/) – the first electronic learner corpus of Croatian as a foreign language. CroLTeC contains essays collected from 755 students with 36 different mother tongues, among which the most prominent were Spanish, English, German, Polish, Chinese, French, and Arabic. It consists of 4,747 essays, out of which 1,217 were digitally born, while 3530 essays were scanned, transcribed in RTF format, Mikelić Preradović.indd 919 4.11.2020. 11:30:22 920 Rasprave 46/2 (2020.) str. 899–920 and converted into XML format. CroLTeC has a total of 1,054,287 tokens, and essays have been collected on all 6 levels of Common European Framework of Reference for Languages (CEFR) at Croaticum – Center for Croatian as Second and Foreign Language at the Faculty of Humanities and Social Sciences in Zagreb, Department of Information Sciences, Natural Language Processing group. All CroLTeC essays contain metadata about the title, number, and type of essay (homework, part of an exam or field class, etc.). Data were lemmatized and annotated with morphosyntactic tags with the ReLDI tagger (Ljubešić et al., 2016). Also, the corpus is searchable by age, sex, language proficiency level, and the mother tongue of the learner. The error-tagging scheme is partially based on Šolar (the scheme of Developmental corpus of Slovene) and the error-coding of the Cambridge Learner Corpus and further tailored to the Croatian language. The goal of the development of the error-tagging scheme is to build a sub-corpus that will serve as a repository of authentic data about the learner’s interlanguage. It should enable researchers and teachers of Croatian as a foreign language to explore the interlanguage, to discover the aspects of the grammar that are the most difficult to master and to tailor teaching materials to different groups of learners (not only according to their Croatian language proficiency level but also to their first language). Finally, the error-tagged sub-corpus should also serve as a starting point for designing computer-aided tools to correct lexical errors, misuse of verbal tenses, phrasal verbs, and collocations. Ključne riječi: učenički korpusi, CroLTeC, obilježavanje pogrešaka, ispravljanje pogrešaka, normalizacija","PeriodicalId":51986,"journal":{"name":"Rasprave","volume":"46 1","pages":"899-920"},"PeriodicalIF":0.2,"publicationDate":"2020-10-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"47257015","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
期刊
Rasprave
全部 Acc. Chem. Res. ACS Applied Bio Materials ACS Appl. Electron. Mater. ACS Appl. Energy Mater. ACS Appl. Mater. Interfaces ACS Appl. Nano Mater. ACS Appl. Polym. Mater. ACS BIOMATER-SCI ENG ACS Catal. ACS Cent. Sci. ACS Chem. Biol. ACS Chemical Health & Safety ACS Chem. Neurosci. ACS Comb. Sci. ACS Earth Space Chem. ACS Energy Lett. ACS Infect. Dis. ACS Macro Lett. ACS Mater. Lett. ACS Med. Chem. Lett. ACS Nano ACS Omega ACS Photonics ACS Sens. ACS Sustainable Chem. Eng. ACS Synth. Biol. Anal. Chem. BIOCHEMISTRY-US Bioconjugate Chem. BIOMACROMOLECULES Chem. Res. Toxicol. Chem. Rev. Chem. Mater. CRYST GROWTH DES ENERG FUEL Environ. Sci. Technol. Environ. Sci. Technol. Lett. Eur. J. Inorg. Chem. IND ENG CHEM RES Inorg. Chem. J. Agric. Food. Chem. J. Chem. Eng. Data J. Chem. Educ. J. Chem. Inf. Model. J. Chem. Theory Comput. J. Med. Chem. J. Nat. Prod. J PROTEOME RES J. Am. Chem. Soc. LANGMUIR MACROMOLECULES Mol. Pharmaceutics Nano Lett. Org. Lett. ORG PROCESS RES DEV ORGANOMETALLICS J. Org. Chem. J. Phys. Chem. J. Phys. Chem. A J. Phys. Chem. B J. Phys. Chem. C J. Phys. Chem. Lett. Analyst Anal. Methods Biomater. Sci. Catal. Sci. Technol. Chem. Commun. Chem. Soc. Rev. CHEM EDUC RES PRACT CRYSTENGCOMM Dalton Trans. Energy Environ. Sci. ENVIRON SCI-NANO ENVIRON SCI-PROC IMP ENVIRON SCI-WAT RES Faraday Discuss. Food Funct. Green Chem. Inorg. Chem. Front. Integr. Biol. J. Anal. At. Spectrom. J. Mater. Chem. A J. Mater. Chem. B J. Mater. Chem. C Lab Chip Mater. Chem. Front. Mater. Horiz. MEDCHEMCOMM Metallomics Mol. Biosyst. Mol. Syst. Des. Eng. Nanoscale Nanoscale Horiz. Nat. Prod. Rep. New J. Chem. Org. Biomol. Chem. Org. Chem. Front. PHOTOCH PHOTOBIO SCI PCCP Polym. Chem.
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1