Dorota Klimek-Jankowska, Krzysztof Hwaszcz, Justyna Wieczorek
{"title":"The Spectrum of Sense Remoteness in Polysemy: Bridging Computational and Theoretical Lexicography with Psycholinguistics (Part 1)","authors":"Dorota Klimek-Jankowska, Krzysztof Hwaszcz, Justyna Wieczorek","doi":"10.4467/23005920spl.22.002.15759","DOIUrl":null,"url":null,"abstract":"Ten dwuczęściowy artykuł konsoliduje fakty dotyczące polisemii z zakresu psycholingwistyki oraz leksykografii teoretycznej i obliczeniowej oraz prezentuje wyniki badań ilościowych i jakościowych przeprowadzonych na dużym zbiorze danych polisemicznych w języku polskim, na podstawie których proponujemy uszczegółowioną klasyfikację polisemii oraz opracowujemy poszerzone spektrum podobieństwa sensów słów wieloznacznych. W pierwszej części publikacji omówiono psycholingwistyczne modele reprezentacji polisemii w mentalnym leksykonie oraz wprowadzono podstawowe spektrum podobieństwa sensów, zaproponowane w literaturze przedmiotu. Przedstawiono też metodologię oraz wyniki badań ilościowych przeprowadzonych dla par sensów wyrazów polisemicznych losowo wybranych ze Słowosieci i pozyskanych dzięki wsparciu Centrum Technologii Językowych CLARIN-PL (polskiej sekcji europejskiej infrastruktury badawczej CLARIN ERIC). Wyniki naszego badania pokazują, że najczęściej reprezentowaną polisemią są następujące typy: polisemia gniazdowa, polisemia przez metaforę i polisemia przez metonimię. W drugiej części publikacji poszerzamy spektrum podobieństwa sensów i uszczegóławiamy klasyfikację polisemii na podstawie badania jakościowego. Przedstawiamy także nowe obserwacje na temat różnych typów polisemii wchodzących w skład tego spektrum, ze szczególnym uwzględnieniem polisemii gniazdowej.\n\nThis two-part paper bridges insights from psycholinguistics and from theoretical and computational lexicography to develop a fine-grained classification of polysemy organized along a wider spectrum of sense remoteness of ambiguous words in Polish based on the investigation of a large collection of linguistic data.1 In the first part, we equip readers with background knowledge on different psycholinguistic views on polysemy and we introduce the basic spectrum of sense remoteness proposed in earlier literature. We also present the methodology of our research and we report the results of our quantitative study based on a large sample of sense pairs randomly extracted from plWordNet This two-part paper bridges insights from psycholinguistics and from theoretical and computational lexicography to develop a fine-grained classification of polysemy organized along a wider spectrum of sense remoteness of ambiguous words in Polish based on the investigation of a large collection of linguistic data.1 In the first part, we equip readers with background knowledge on different psycholinguistic views on polysemy and we introduce the basic spectrum of sense remoteness proposed in earlier literature. We also present the methodology of our research and we report the results of our quantitative study based on a large sample of sense pairs randomly extracted from plWordNet (Słowosieć) thanks to the resources received from the CLARIN-PL Language Technology Center (the Polish section of the European research infrastructure CLARIN ERIC). We show that the most widely represented polysemy types are nested polysemy, polysemy by metaphor and polysemy by metonymy. The second part proposes an extended spectrum of sense remoteness and presents insights on different types of polysemy included in this spectrum with a special attention paid to nested polysemy.","PeriodicalId":37336,"journal":{"name":"Studies in Polish Linguistics","volume":"1 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-08-12","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Studies in Polish Linguistics","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.4467/23005920spl.22.002.15759","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q2","JCRName":"Arts and Humanities","Score":null,"Total":0}
引用次数: 0
Abstract
Ten dwuczęściowy artykuł konsoliduje fakty dotyczące polisemii z zakresu psycholingwistyki oraz leksykografii teoretycznej i obliczeniowej oraz prezentuje wyniki badań ilościowych i jakościowych przeprowadzonych na dużym zbiorze danych polisemicznych w języku polskim, na podstawie których proponujemy uszczegółowioną klasyfikację polisemii oraz opracowujemy poszerzone spektrum podobieństwa sensów słów wieloznacznych. W pierwszej części publikacji omówiono psycholingwistyczne modele reprezentacji polisemii w mentalnym leksykonie oraz wprowadzono podstawowe spektrum podobieństwa sensów, zaproponowane w literaturze przedmiotu. Przedstawiono też metodologię oraz wyniki badań ilościowych przeprowadzonych dla par sensów wyrazów polisemicznych losowo wybranych ze Słowosieci i pozyskanych dzięki wsparciu Centrum Technologii Językowych CLARIN-PL (polskiej sekcji europejskiej infrastruktury badawczej CLARIN ERIC). Wyniki naszego badania pokazują, że najczęściej reprezentowaną polisemią są następujące typy: polisemia gniazdowa, polisemia przez metaforę i polisemia przez metonimię. W drugiej części publikacji poszerzamy spektrum podobieństwa sensów i uszczegóławiamy klasyfikację polisemii na podstawie badania jakościowego. Przedstawiamy także nowe obserwacje na temat różnych typów polisemii wchodzących w skład tego spektrum, ze szczególnym uwzględnieniem polisemii gniazdowej.
This two-part paper bridges insights from psycholinguistics and from theoretical and computational lexicography to develop a fine-grained classification of polysemy organized along a wider spectrum of sense remoteness of ambiguous words in Polish based on the investigation of a large collection of linguistic data.1 In the first part, we equip readers with background knowledge on different psycholinguistic views on polysemy and we introduce the basic spectrum of sense remoteness proposed in earlier literature. We also present the methodology of our research and we report the results of our quantitative study based on a large sample of sense pairs randomly extracted from plWordNet This two-part paper bridges insights from psycholinguistics and from theoretical and computational lexicography to develop a fine-grained classification of polysemy organized along a wider spectrum of sense remoteness of ambiguous words in Polish based on the investigation of a large collection of linguistic data.1 In the first part, we equip readers with background knowledge on different psycholinguistic views on polysemy and we introduce the basic spectrum of sense remoteness proposed in earlier literature. We also present the methodology of our research and we report the results of our quantitative study based on a large sample of sense pairs randomly extracted from plWordNet (Słowosieć) thanks to the resources received from the CLARIN-PL Language Technology Center (the Polish section of the European research infrastructure CLARIN ERIC). We show that the most widely represented polysemy types are nested polysemy, polysemy by metaphor and polysemy by metonymy. The second part proposes an extended spectrum of sense remoteness and presents insights on different types of polysemy included in this spectrum with a special attention paid to nested polysemy.