Pub Date : 2019-04-18DOI: 10.4312/SLO2.0.2019.1.65-77
Kristina Š. Despot, Lana Hudeček, Tomislav Stojanov, N. Ljubešić
In this minireview, the state of the art of the Croatian monolingual lexicography is presented. A brief overview and classification of all existing lexicographic resources is provided in the firts part of the minireview, followed by somewhat more detailed insight into the existing Croatian monolingual dictionaries and monolingual lexicographic projects, orthography dictionaries, and dictionary writing systems used.
{"title":"State-of-the-art on monolingual lexicography for Croatia (Croatian)","authors":"Kristina Š. Despot, Lana Hudeček, Tomislav Stojanov, N. Ljubešić","doi":"10.4312/SLO2.0.2019.1.65-77","DOIUrl":"https://doi.org/10.4312/SLO2.0.2019.1.65-77","url":null,"abstract":"In this minireview, the state of the art of the Croatian monolingual lexicography is presented. A brief overview and classification of all existing lexicographic resources is provided in the firts part of the minireview, followed by somewhat more detailed insight into the existing Croatian monolingual dictionaries and monolingual lexicographic projects, orthography dictionaries, and dictionary writing systems used.","PeriodicalId":371035,"journal":{"name":"Slovenščina 2.0: empirical, applied and interdisciplinary research","volume":"139 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2019-04-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"132717327","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2019-04-18DOI: 10.4312/SLO2.0.2019.1.53-64
K. Ceberio, A. Gurrutxaga
In this article, we give an overview of the evolution of Basque lexicography to the present, pointing out its main achievements and shortcomings, as well as its challenges for the future. Basque lexicography has a relatively short history, but a considerable amount of resources have been produced in the last 50 years, since the standardisation process began. After years of lexicographic work by different groups and publishers, a remarkable achievement is the Dictionary of the Academy (Euskaltzaindiaren Hiztegia), a prescriptive updated dictionary recently published and based on historical and contemporary corpora. Although the number of monolingual products is noticeably increasing in the last years, Basque dictionary making has been specially productive for bilingual purposes, due probably to the sociolinguistic status of the language. On the other hand, specialized lexicography and terminology have been very active from the beginning of the standadisartion process. Since the beginning of the XXI. century, use of corpora has known an increasing impulse. Many Basque dictionaries are freely available on the Internet.
{"title":"State-of-the-art on monolingual lexicography for Basque (Basque)","authors":"K. Ceberio, A. Gurrutxaga","doi":"10.4312/SLO2.0.2019.1.53-64","DOIUrl":"https://doi.org/10.4312/SLO2.0.2019.1.53-64","url":null,"abstract":"In this article, we give an overview of the evolution of Basque lexicography to the present, pointing out its main achievements and shortcomings, as well as its challenges for the future. Basque lexicography has a relatively short history, but a considerable amount of resources have been produced in the last 50 years, since the standardisation process began. After years of lexicographic work by different groups and publishers, a remarkable achievement is the Dictionary of the Academy (Euskaltzaindiaren Hiztegia), a prescriptive updated dictionary recently published and based on historical and contemporary corpora. Although the number of monolingual products is noticeably increasing in the last years, Basque dictionary making has been specially productive for bilingual purposes, due probably to the sociolinguistic status of the language. On the other hand, specialized lexicography and terminology have been very active from the beginning of the standadisartion process. Since the beginning of the XXI. century, use of corpora has known an increasing impulse. Many Basque dictionaries are freely available on the Internet.","PeriodicalId":371035,"journal":{"name":"Slovenščina 2.0: empirical, applied and interdisciplinary research","volume":"44 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2019-04-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116483032","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2019-01-31DOI: 10.4312/slo2.0.2018.2.206-226
Jerica Snoj
V prispevku se obravnava besednovrstna kategorizacija s stališča navajanja besednovrstnih oznak v slovarskem opruiročniku za slovenski jezik na splošni ravni, veljavni ne glede na določeni slovarski koncept. Uvodoma je prikazana svojskost besednovrstnega kategoriziranja v slovnični teoriji, čemur sledi ponazoritev vloge besednovrstnega določanja leksikalnih enot znotraj slovarskega pomenskega opisa. Ob primerih za povedkovnik, členek in izdeležniške tvorjenke je prikazan razvoj besednovrstnega kategoriziranja v doslejšnjih slovenskih slovarjih in na osnovi tega so podane smernice za besednovrstno označevanje leksikalnih enot v prihodnjih slovenskih slovarskih priročnikih.
{"title":"Besednovrstna kategoriziacija kot slovnični temelj pomenskega opisa v slovarju","authors":"Jerica Snoj","doi":"10.4312/slo2.0.2018.2.206-226","DOIUrl":"https://doi.org/10.4312/slo2.0.2018.2.206-226","url":null,"abstract":"V prispevku se obravnava besednovrstna kategorizacija s stališča navajanja besednovrstnih oznak v slovarskem opruiročniku za slovenski jezik na splošni ravni, veljavni ne glede na določeni slovarski koncept. Uvodoma je prikazana svojskost besednovrstnega kategoriziranja v slovnični teoriji, čemur sledi ponazoritev vloge besednovrstnega določanja leksikalnih enot znotraj slovarskega pomenskega opisa. Ob primerih za povedkovnik, členek in izdeležniške tvorjenke je prikazan razvoj besednovrstnega kategoriziranja v doslejšnjih slovenskih slovarjih in na osnovi tega so podane smernice za besednovrstno označevanje leksikalnih enot v prihodnjih slovenskih slovarskih priročnikih.","PeriodicalId":371035,"journal":{"name":"Slovenščina 2.0: empirical, applied and interdisciplinary research","volume":"13 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2019-01-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"132082113","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2019-01-31DOI: 10.4312/SLO2.0.2018.2.154-185
Eva Pori, Iztok Kosem
V leksikogramatični raziskavi so predstavljeni rezultati analiz struktur s prislovi, ki so bile izvedene v okviru temeljnega raziskovalnega projekta Kolokacije kot temelj jezikovnega opisa: semantični in časovni vidiki (KOLOS; J6-8255). Na podlagi rezultatov predhodno izvedene pilotne množičenjske naloge, v kateri so označevalci jezikoslovci ocenjevali avtomatsko izluščene kolokacijske kandidate iz korpusa Gigafida in se opredeljevali do tega, kaj je in kaj ni slovarsko relevantna kolokacija, smo analizirali vse kolokacijsko produktivne strukture s prislovi. Namen analiziranja je bil opredeliti kolokacijo kot semantično relevantno sopojavitev dveh (ali več) besed ter s tem tudi razliko med slovarsko relevantnimi kolokacijami in statistično prepoznanimi oz. šibkejšimi kolokacijami, ki ne opravljajo semantične funkcije in so posledično nerelevantne za kolokacijski slovar. Analize struktur s prislovi so pokazale, da se je o semantični relevantnosti in slovarski vključenosti pri posameznih primerih kolokacijskih kandidatov ali tipih kolokatorjev treba odločati na ravni posamezne strukture. Tovrstni primer so prislovi, ki lahko nastopajo v vlogi intenzifikatorja (tip kar pošteno [načeti]) ali pa semantično manj relevantni vlogi poudarnosti oz. členkovnosti (tip kar prekiniti). Podobne jezikoslovne obravnave so potrebne širše skupine števniškosti, kot je kratnost ali zaporedje (zaporednostni prislovi), ki jih zaradi raznolike semantične relevantnosti ne moremo strukturno omejiti (četrtič doktorirati proti stokrat povedati). Podatki, pridobljeni na podlagi opravljenih analiz, bodo omogočali podrobnejše ali nadaljnje analize, predvsem pa celovit opis vsake kolokacijske strukture in njene kolokativnosti. Na podlagi identificiranih napak zaradi avtomatskega označevanja strukture pa bo mogoče nadgraditi obstoječe vzorce za luščenje in predvsem izboljšati avtomatsko luščenje za problematične strukture. Podatki bodo zelo uporabni tudi pri nadaljnjem vključevanju in obravnavi novih struktur, prvotno izločenih zaradi precejšnjega šuma. Vse ugotovitve bo mogoče implementirati v leksikografski delotok in na ta način izboljšati podatke (stopenjskost gesel) v slovarju. Učno množico s 17.576 kandidati bo mogoče uporabiti tudi v drugih dejavnostih projekta KOLOS: za uvrščanje kolokatorjev v gruče, primerjavo sopomenk s kolokacijami in nenazadnje za proučevanje kolokacijskih trendov skozi čas.
本词法研究介绍了在基础研究项目 "搭配是语言描述的基础:语义和时间方面"(KOLOS;J6-8255)框架内对副词结构进行分析的结果。在之前进行的试点众包任务中,注释语言学家对从 Gigafida 语料库中自动提取的搭配候选语进行了评估,并对哪些是语法相关搭配、哪些不是语法相关搭配做出了判断,在此基础上,我们分析了所有带有副词的搭配性结构。分析的目的是将搭配定义为两个(或更多)词在语义上的相关并列,从而区分与词典相关的搭配和经统计确定的或较弱的搭配,这些搭配不具有语义功能,因此与搭配词典无关。对副词结构的分析表明,词组候选词或词组类型的语义相关性和词典收录必须在单个结构的层面上决定。例如,副词可以起加强语气的作用("相当[提高]"类型),也可以起语义相关性较低的强调或特殊作用("相当打断 "类型)。对于更广泛的数字词组,如短语或顺序(顺序副词),也需要类似的语言处理,由于它们的语义相关性不同(to doctor for the fourth time vs. to say for the hundredth time),因此不能在结构上加以限制。 通过分析获得的数据可以进行更详细或更深入的分析,最重要的是,可以对每种搭配结构及其搭配性进行全面的描述。根据已发现的结构自动标注的错误,可以对现有的剥离模式进行升级,特别是改进有问题结构的自动剥离。这些数据对于进一步纳入和处理最初因噪音较大而被排除在外的新结构也非常有用。所有研究结果都将应用于词典工作流程,从而改进词典中的数据(密码分级)。由 17,576 个候选词组成的训练集还将用于 KOLOS 项目的其他活动:对搭配词进行聚类,比较同义词和搭配词,最后但并非最不重要的是,研究搭配词的长期发展趋势。
{"title":"V iskanju slovarsko relevantne kolokacije na primeru struktur s prislovi","authors":"Eva Pori, Iztok Kosem","doi":"10.4312/SLO2.0.2018.2.154-185","DOIUrl":"https://doi.org/10.4312/SLO2.0.2018.2.154-185","url":null,"abstract":"V leksikogramatični raziskavi so predstavljeni rezultati analiz struktur s prislovi, ki so bile izvedene v okviru temeljnega raziskovalnega projekta Kolokacije kot temelj jezikovnega opisa: semantični in časovni vidiki (KOLOS; J6-8255). Na podlagi rezultatov predhodno izvedene pilotne množičenjske naloge, v kateri so označevalci jezikoslovci ocenjevali avtomatsko izluščene kolokacijske kandidate iz korpusa Gigafida in se opredeljevali do tega, kaj je in kaj ni slovarsko relevantna kolokacija, smo analizirali vse kolokacijsko produktivne strukture s prislovi. Namen analiziranja je bil opredeliti kolokacijo kot semantično relevantno sopojavitev dveh (ali več) besed ter s tem tudi razliko med slovarsko relevantnimi kolokacijami in statistično prepoznanimi oz. šibkejšimi kolokacijami, ki ne opravljajo semantične funkcije in so posledično nerelevantne za kolokacijski slovar. \u0000Analize struktur s prislovi so pokazale, da se je o semantični relevantnosti in slovarski vključenosti pri posameznih primerih kolokacijskih kandidatov ali tipih kolokatorjev treba odločati na ravni posamezne strukture. Tovrstni primer so prislovi, ki lahko nastopajo v vlogi intenzifikatorja (tip kar pošteno [načeti]) ali pa semantično manj relevantni vlogi poudarnosti oz. členkovnosti (tip kar prekiniti). Podobne jezikoslovne obravnave so potrebne širše skupine števniškosti, kot je kratnost ali zaporedje (zaporednostni prislovi), ki jih zaradi raznolike semantične relevantnosti ne moremo strukturno omejiti (četrtič doktorirati proti stokrat povedati). \u0000Podatki, pridobljeni na podlagi opravljenih analiz, bodo omogočali podrobnejše ali nadaljnje analize, predvsem pa celovit opis vsake kolokacijske strukture in njene kolokativnosti. Na podlagi identificiranih napak zaradi avtomatskega označevanja strukture pa bo mogoče nadgraditi obstoječe vzorce za luščenje in predvsem izboljšati avtomatsko luščenje za problematične strukture. Podatki bodo zelo uporabni tudi pri nadaljnjem vključevanju in obravnavi novih struktur, prvotno izločenih zaradi precejšnjega šuma. Vse ugotovitve bo mogoče implementirati v leksikografski delotok in na ta način izboljšati podatke (stopenjskost gesel) v slovarju. Učno množico s 17.576 kandidati bo mogoče uporabiti tudi v drugih dejavnostih projekta KOLOS: za uvrščanje kolokatorjev v gruče, primerjavo sopomenk s kolokacijami in nenazadnje za proučevanje kolokacijskih trendov skozi čas.","PeriodicalId":371035,"journal":{"name":"Slovenščina 2.0: empirical, applied and interdisciplinary research","volume":"58 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2019-01-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"134376549","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2019-01-31DOI: 10.4312/slo2.0.2018.2.67-95
Kaja Dobrovoljc
Številne empirične raziskave povezovanja besed v jeziku razkrivajo, da je jezik prepreden z večbesednimi vzorci, ki vsaj na neki točki jezikovne rabe delujejo kot nerazstavljiva celota. To potrjujejo tudi dosedanje raziskave večbesednih enot v slovenščini, ki se običajno osredotočajo predvsem na strukturno ali pomensko zaključene enote, kot so kolokacije, stalne besedne zveze ali frazemi. Da bi omogočili bolj celovit vpogled v obseg in naravo formulaičnega jezika v slovenščini, ki bi ga bilo smiselno vključevati tudi v bodoče leksikalne in slovnične opise, v članku raziščemo alternativni koncept formulaičnih besednih nizov, tj. neprekinjenih nizov dveh ali več besed z izstopajočo pogostostjo pojavljanja, ne glede na njihovo strukturno, pomensko ali zaznavno celovitost. Predstavimo postopek identifikacije formulaičnih besednih nizov v referenčnih korpusih pisne in govorjene slovenščine, jih kvantitativno in kvalitativno analiziramo ter primerjamo. Velik delež identificiranih formulaičnih nizov v obeh korpusih dokazuje določeno stopnjo formulaičnosti, še zlasti v govorjeni slovenščini. Čeprav v obeh oblikah jezikovne rabe prevladujejo predvsem strukturno nezaključeni nizi funkcijskih besed, ugotavljamo več pomembnih razlik v skladenjskih in funkcijskih lastnostih najpogostejših nizov pisne in govorjene slovenščine, ki potrjujejo vpliv specifičnih sporazumevalnih okoliščin in ciljev na razvoj in obseg formulaičnega jezika.
{"title":"Formulaičnost v slovenskem jeziku","authors":"Kaja Dobrovoljc","doi":"10.4312/slo2.0.2018.2.67-95","DOIUrl":"https://doi.org/10.4312/slo2.0.2018.2.67-95","url":null,"abstract":"Številne empirične raziskave povezovanja besed v jeziku razkrivajo, da je jezik prepreden z večbesednimi vzorci, ki vsaj na neki točki jezikovne rabe delujejo kot nerazstavljiva celota. To potrjujejo tudi dosedanje raziskave večbesednih enot v slovenščini, ki se običajno osredotočajo predvsem na strukturno ali pomensko zaključene enote, kot so kolokacije, stalne besedne zveze ali frazemi. Da bi omogočili bolj celovit vpogled v obseg in naravo formulaičnega jezika v slovenščini, ki bi ga bilo smiselno vključevati tudi v bodoče leksikalne in slovnične opise, v članku raziščemo alternativni koncept formulaičnih besednih nizov, tj. neprekinjenih nizov dveh ali več besed z izstopajočo pogostostjo pojavljanja, ne glede na njihovo strukturno, pomensko ali zaznavno celovitost. Predstavimo postopek identifikacije formulaičnih besednih nizov v referenčnih korpusih pisne in govorjene slovenščine, jih kvantitativno in kvalitativno analiziramo ter primerjamo. Velik delež identificiranih formulaičnih nizov v obeh korpusih dokazuje določeno stopnjo formulaičnosti, še zlasti v govorjeni slovenščini. Čeprav v obeh oblikah jezikovne rabe prevladujejo predvsem strukturno nezaključeni nizi funkcijskih besed, ugotavljamo več pomembnih razlik v skladenjskih in funkcijskih lastnostih najpogostejših nizov pisne in govorjene slovenščine, ki potrjujejo vpliv specifičnih sporazumevalnih okoliščin in ciljev na razvoj in obseg formulaičnega jezika.","PeriodicalId":371035,"journal":{"name":"Slovenščina 2.0: empirical, applied and interdisciplinary research","volume":"1 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2019-01-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129790603","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2019-01-31DOI: 10.4312/slo2.0.2018.2.127-153
Agnes Pisanski Peterlin, Tamara Mikolič Južnjič
S korpusno analizo je mogoče pridobiti relevantne podatke o slovničnih pojavih, na podlagi katerih se lahko oblikujejo poglobljeni slovnični opisi. Korpusna metodologija je posebej uporabna za slovnične raziskave, ki se osredotočajo na pragmatiko in variacije v rabi izbranih slovničnih elementov. Namen pričujoče raziskave je analizirati rabo osebnih zaimkov v funkciji osebka v slovenščini s pragmatičnega vidika in tako pridobiti nove podatke za bolj podroben opis rabe osebnega zaimka kot osebka v slovenščini. Slovenščina je jezik z opustljivim osebkom, kar pomeni, da osebka stavka v njej ni treba eksplicitno izraziti. Raziskava temelji na korpusni analizi korpusov Kres in Gos; narejena je bila s pomočjo spletne programske aplikacije za analizo besedil NoSketch Engine. Rezultati pokažejo precejšnjo razliko v pogostosti rabe osebnih zaimkov kot osebkov med govornim in pisnim diskurzom. Rezultati prav tako pokažejo, da število osebnih zaimkov upada z naraščanjem formalnosti. N podlagi funkcijske analize so izraženi osebni zaimki v najširšem smislu klasificirani v kategoriji razdvoumljanja in poudarjanja. V okviru razdvoumljanja na rabo osebnih zaimkov kot osebkov vplivajo oblikoslovni, skladenjski in diskurzni dejavniki, in tudi prenosnik. V kategoriji poudarjanja je prenosnik posebej relevanten dejavnik. Analiza pokaže, da je tematika osebnega zaimka kot osebka v slovenščini mnogo kompleksnejša, kot bi lahko sklepali iz dosedanjih opisov. Izsledki raziskave odpirajo nekatera zanimiva vprašanja glede rabe osebnega zaimka kot osebka v slovenščini v zvezi z dialektalno specifiko in v hibridnih internetnih žanrih, prav tako pa tudi vprašanja o vplivu lektorskih posegov in o vplivu usvajanja pismenosti.
{"title":"Osebni zaimki v funkciji osebka: pragmatični vidiki slovnične kategorije","authors":"Agnes Pisanski Peterlin, Tamara Mikolič Južnjič","doi":"10.4312/slo2.0.2018.2.127-153","DOIUrl":"https://doi.org/10.4312/slo2.0.2018.2.127-153","url":null,"abstract":"S korpusno analizo je mogoče pridobiti relevantne podatke o slovničnih pojavih, na podlagi katerih se lahko oblikujejo poglobljeni slovnični opisi. Korpusna metodologija je posebej uporabna za slovnične raziskave, ki se osredotočajo na pragmatiko in variacije v rabi izbranih slovničnih elementov. Namen pričujoče raziskave je analizirati rabo osebnih zaimkov v funkciji osebka v slovenščini s pragmatičnega vidika in tako pridobiti nove podatke za bolj podroben opis rabe osebnega zaimka kot osebka v slovenščini. Slovenščina je jezik z opustljivim osebkom, kar pomeni, da osebka stavka v njej ni treba eksplicitno izraziti. Raziskava temelji na korpusni analizi korpusov Kres in Gos; narejena je bila s pomočjo spletne programske aplikacije za analizo besedil NoSketch Engine. Rezultati pokažejo precejšnjo razliko v pogostosti rabe osebnih zaimkov kot osebkov med govornim in pisnim diskurzom. Rezultati prav tako pokažejo, da število osebnih zaimkov upada z naraščanjem formalnosti. N podlagi funkcijske analize so izraženi osebni zaimki v najširšem smislu klasificirani v kategoriji razdvoumljanja in poudarjanja. V okviru razdvoumljanja na rabo osebnih zaimkov kot osebkov vplivajo oblikoslovni, skladenjski in diskurzni dejavniki, in tudi prenosnik. V kategoriji poudarjanja je prenosnik posebej relevanten dejavnik. Analiza pokaže, da je tematika osebnega zaimka kot osebka v slovenščini mnogo kompleksnejša, kot bi lahko sklepali iz dosedanjih opisov. Izsledki raziskave odpirajo nekatera zanimiva vprašanja glede rabe osebnega zaimka kot osebka v slovenščini v zvezi z dialektalno specifiko in v hibridnih internetnih žanrih, prav tako pa tudi vprašanja o vplivu lektorskih posegov in o vplivu usvajanja pismenosti.","PeriodicalId":371035,"journal":{"name":"Slovenščina 2.0: empirical, applied and interdisciplinary research","volume":"123 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2019-01-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116027320","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2019-01-31DOI: 10.4312/slo2.0.2018.2.186-205
Mojca Smolej
V prispevku se najprej osredotočamo na različne tipe odvisniških stavkov in jih razdelimo v štiri osnovne skupine: v skupino odvisnikov, ki so del matičnega stavka, skupino odvisnikov, ki niso del jedrne propozicije matičnega stavka, skupino odvisnikov, ki so izhodiščno nestavčnočlenski, in skupino členkovnih odvisnikov. V nadaljevanju podrobno analiziramo zadnji dve skupini, saj sta bili do sedaj v slovenskem jezikoslovju skoraj popolnoma prezrti. Izhajajoč iz analize, predstavimo tudi možne nadaljnje teoretične obravnave odvisnikov.
{"title":"Skladenjske konstrukcije med podredjem in priredjem","authors":"Mojca Smolej","doi":"10.4312/slo2.0.2018.2.186-205","DOIUrl":"https://doi.org/10.4312/slo2.0.2018.2.186-205","url":null,"abstract":"V prispevku se najprej osredotočamo na različne tipe odvisniških stavkov in jih razdelimo v štiri osnovne skupine: v skupino odvisnikov, ki so del matičnega stavka, skupino odvisnikov, ki niso del jedrne propozicije matičnega stavka, skupino odvisnikov, ki so izhodiščno nestavčnočlenski, in skupino členkovnih odvisnikov. V nadaljevanju podrobno analiziramo zadnji dve skupini, saj sta bili do sedaj v slovenskem jezikoslovju skoraj popolnoma prezrti. Izhajajoč iz analize, predstavimo tudi možne nadaljnje teoretične obravnave odvisnikov.","PeriodicalId":371035,"journal":{"name":"Slovenščina 2.0: empirical, applied and interdisciplinary research","volume":"63 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2019-01-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"132809943","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2019-01-31DOI: 10.4312/SLO2.0.2018.2.96-126
Nataša Logar
V prispevku predstavljamo razumevanje besedotvorne produktivnosti, kakršnega je na korpusni metodologiji konec 80. in v začetku 90. let 20. stoletja utemeljil Harald Baayen. Baayenov način izračunavanja produktivnosti P smo preizkusili na desetih slovenskih priponskih obrazilih, ki tvorijo samostalniške navadne izpeljanke iz glagolov, in sicer izpeljanke moškega spola s pomenom človeškega vršilca dejanja. Šlo je za obrazila -vec, -telj, -ež, -uh, -avh, -ar, -lec, -ač, -aj in -ant. Polavtomatski postopek pridobivanja podatkov smo izvedli na korpusu pisne slovenščine Kres ter med drugim ugotovili, da sta število tvorjenk, katerih del je določeno obrazilo, in produktivnost P tega istega obrazila lahko (zelo) različna. Npr.: največ tvorjenk izmed naštetih je tvorilo obrazilo -lec, medtem ko je bil P najvišji pri obrazilu -ež. Na podlagi podatkov iz Kresa smo nato prikazali še seznam obravnavanih obrazil skupaj s tvorjenkami, tj. seznam, kakršen bi lahko bil del nove slovnice slovenščine, ter ga na kratko komentirali, v zaključni razpravi pa smo se nato opredelili še do nekaterih prednosti in slabosti prikazanega pristopa.
{"title":"Izpeljava samostalnikov iz glagolov: korpusna produktivnost in slovnični opis","authors":"Nataša Logar","doi":"10.4312/SLO2.0.2018.2.96-126","DOIUrl":"https://doi.org/10.4312/SLO2.0.2018.2.96-126","url":null,"abstract":"V prispevku predstavljamo razumevanje besedotvorne produktivnosti, kakršnega je na korpusni metodologiji konec 80. in v začetku 90. let 20. stoletja utemeljil Harald Baayen. Baayenov način izračunavanja produktivnosti P smo preizkusili na desetih slovenskih priponskih obrazilih, ki tvorijo samostalniške navadne izpeljanke iz glagolov, in sicer izpeljanke moškega spola s pomenom človeškega vršilca dejanja. Šlo je za obrazila -vec, -telj, -ež, -uh, -avh, -ar, -lec, -ač, -aj in -ant. Polavtomatski postopek pridobivanja podatkov smo izvedli na korpusu pisne slovenščine Kres ter med drugim ugotovili, da sta število tvorjenk, katerih del je določeno obrazilo, in produktivnost P tega istega obrazila lahko (zelo) različna. Npr.: največ tvorjenk izmed naštetih je tvorilo obrazilo -lec, medtem ko je bil P najvišji pri obrazilu -ež. Na podlagi podatkov iz Kresa smo nato prikazali še seznam obravnavanih obrazil skupaj s tvorjenkami, tj. seznam, kakršen bi lahko bil del nove slovnice slovenščine, ter ga na kratko komentirali, v zaključni razpravi pa smo se nato opredelili še do nekaterih prednosti in slabosti prikazanega pristopa.","PeriodicalId":371035,"journal":{"name":"Slovenščina 2.0: empirical, applied and interdisciplinary research","volume":"7 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2019-01-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124556611","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2019-01-31DOI: 10.4312/SLO2.0.2018.2.33-66
Špela Arhar Holdt, Jaka Čibej
Prispevek predstavlja prvi korak k dopolnjevanju leksikona Sloleks z oblikoslovnimi vzorci, in sicer na primeru samostalnikov. Vzorci so v prvem koraku strojno pridobljeni iz leksikona samega na osnovi izbranih razločevalnih lastnosti (oblikoskladenjskih oznak in spremenljivih delov besednih oblik). Sledi ročno razvrščanje, v katerem (a) ločimo sistemsko in v rabi utemeljene vzorce od primerov, ki se pojavljajo spričo šuma pri strojnem luščenju in nedoslednosti v leksikonu Sloleks; (b) uredimo skupine glede na vsebovanost in sorodnost; (c) poiščemo in natančneje opredelimo variantnost, tako pri standardnih kot nestandardnih oblikah; (d) začrtamo korake za nadaljnji razvoj programa in leksikonske nadgradnje. Rezultat je izhodiščni nabor formaliziranih oblikoslovnih vzorcev za (občno- in lastnoimenske) samostalnike, ki prinaša 10 skupin (64 vzorcev) za moški spol, 9 skupin (29 vzorcev) za ženski spol in 8 skupin (20 vzorcev) za srednji spol. Priprava nabora vzorcev je razkrila številne možnosti za izboljšavo leksikona, strojno namenski pogled na pregibanje pa priložnosti za dopolnitev slovničnega opisa slovenščine. V nadaljevanju dela bodo vzorci pripravljeni tudi za preostale besedne vrste in dopolnjeni s korpusnim gradivom. Končna nomenklatura bo vpisana v bazo leksikona Sloleks, v obliki strojno berljivih vzorcev pa bo objavljena tudi na repozitoriju Clarin.si.
{"title":"Oblikoslovni vzorci v leksikonu Sloleks: izhodiščni nabor za samostalnike","authors":"Špela Arhar Holdt, Jaka Čibej","doi":"10.4312/SLO2.0.2018.2.33-66","DOIUrl":"https://doi.org/10.4312/SLO2.0.2018.2.33-66","url":null,"abstract":"Prispevek predstavlja prvi korak k dopolnjevanju leksikona Sloleks z oblikoslovnimi vzorci, in sicer na primeru samostalnikov. Vzorci so v prvem koraku strojno pridobljeni iz leksikona samega na osnovi izbranih razločevalnih lastnosti (oblikoskladenjskih oznak in spremenljivih delov besednih oblik). Sledi ročno razvrščanje, v katerem (a) ločimo sistemsko in v rabi utemeljene vzorce od primerov, ki se pojavljajo spričo šuma pri strojnem luščenju in nedoslednosti v leksikonu Sloleks; (b) uredimo skupine glede na vsebovanost in sorodnost; (c) poiščemo in natančneje opredelimo variantnost, tako pri standardnih kot nestandardnih oblikah; (d) začrtamo korake za nadaljnji razvoj programa in leksikonske nadgradnje. Rezultat je izhodiščni nabor formaliziranih oblikoslovnih vzorcev za (občno- in lastnoimenske) samostalnike, ki prinaša 10 skupin (64 vzorcev) za moški spol, 9 skupin (29 vzorcev) za ženski spol in 8 skupin (20 vzorcev) za srednji spol. Priprava nabora vzorcev je razkrila številne možnosti za izboljšavo leksikona, strojno namenski pogled na pregibanje pa priložnosti za dopolnitev slovničnega opisa slovenščine. V nadaljevanju dela bodo vzorci pripravljeni tudi za preostale besedne vrste in dopolnjeni s korpusnim gradivom. Končna nomenklatura bo vpisana v bazo leksikona Sloleks, v obliki strojno berljivih vzorcev pa bo objavljena tudi na repozitoriju Clarin.si.","PeriodicalId":371035,"journal":{"name":"Slovenščina 2.0: empirical, applied and interdisciplinary research","volume":"48 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2019-01-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116423807","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}