A Characteristic of Text Mining and Application to the Rural Planning Study
S. Yamaguchi
{"title":"A Characteristic of Text Mining and Application to the Rural Planning Study","authors":"S. Yamaguchi","doi":"10.2750/arp.39.294","DOIUrl":null,"url":null,"abstract":"(1)本稿の目的 本稿で解説するテキストマイニングとは,計量的方法 を駆使して,形式化されていない膨大なテキストデータ から新たな知識を抽出するための方法であり,2000 年 代以降,学術面や実務面で数多く用いられている。 学術領域では,心理学,医療・看護学,教育学,経営 学など質的研究に取り組まれてきた分野を中心に導入が すすんでいる。農村計画研究で用いられる研究手法 は多岐にわたるが,インタビュー調査にもとづく質的デ ータを扱う研究も多い。そのため,本稿で取り上げるテ キストマイニングも農村計画研究の有望な分析ツールと なりうるのではないかと考える。そこで本稿では,テキ ストマイニングの手法としての特徴や実際に農村計画研 究に導入する上での方向性や留意点を提示することを目 的とする。具体的には,まずテキストマイニングの特徴 を整理し,分析プロセスについて解説する。そして,農 村計画および関連分野におけるテキストマイニングを用 いた研究例を概観し,当該分野におけるテキストマイニ ング導入の意義を考察する。 (2)テキストマイニングの特徴 学術分野でテキストマイニングの導入が進んだ背景 は,質的研究に付随する特性と関係が深い。質的研究で は,分析者自身の解釈を判断基準としてテキストデータ の内容を分析するため,分析者の主観や判断が無意識の うちに結果に反映される恐れがあり,分析の信頼性を担 保しづらい点が指摘されている 。また,テキスト 1つ 1つに目を通し内容を咀嚼していくため,大量のテキス トデータを扱うことは難しい。反面,テキストマイニン グでは,質的研究では扱えなかった大量のデータを定量 的に扱うため質的研究に内在していたこれらの問題を克 服することができる 。 一方,テキストマイニングの限界点も指摘されており, 藤井ら は,言葉には文脈によって複数の意味があるに もかかわらず,テキストマイニングでは一律に解釈され てしまうこと,言葉に人の感情や考えがストレートに反 映されているとは限らず文脈の中で解釈する必要がある が,機械的に分析をするテキストマイニングでは,これ ら文脈に配慮しながら分析を進めることはできないこと を指摘している。また,今井ら は,このようなテキス トマイニングの限界も踏まえ,質的分析とテキストマイ ニングが補完し合う混合分析法の有用性を示している。 次章では,こうした利点や課題を踏まえつつ,テキスト マイニングの標準的な分析プロセスを解説する。","PeriodicalId":272722,"journal":{"name":"JOURNAL OF RURAL PLANNING ASSOCIATION","volume":"1 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2020-12-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"JOURNAL OF RURAL PLANNING ASSOCIATION","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.2750/arp.39.294","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
(1)本稿の目的 本稿で解説するテキストマイニングとは,計量的方法 を駆使して,形式化されていない膨大なテキストデータ から新たな知識を抽出するための方法であり,2000 年 代以降,学術面や実務面で数多く用いられている。 学術領域では,心理学,医療・看護学,教育学,経営 学など質的研究に取り組まれてきた分野を中心に導入が すすんでいる。農村計画研究で用いられる研究手法 は多岐にわたるが,インタビュー調査にもとづく質的デ ータを扱う研究も多い。そのため,本稿で取り上げるテ キストマイニングも農村計画研究の有望な分析ツールと なりうるのではないかと考える。そこで本稿では,テキ ストマイニングの手法としての特徴や実際に農村計画研 究に導入する上での方向性や留意点を提示することを目 的とする。具体的には,まずテキストマイニングの特徴 を整理し,分析プロセスについて解説する。そして,農 村計画および関連分野におけるテキストマイニングを用 いた研究例を概観し,当該分野におけるテキストマイニ ング導入の意義を考察する。 (2)テキストマイニングの特徴 学術分野でテキストマイニングの導入が進んだ背景 は,質的研究に付随する特性と関係が深い。質的研究で は,分析者自身の解釈を判断基準としてテキストデータ の内容を分析するため,分析者の主観や判断が無意識の うちに結果に反映される恐れがあり,分析の信頼性を担 保しづらい点が指摘されている 。また,テキスト 1つ 1つに目を通し内容を咀嚼していくため,大量のテキス トデータを扱うことは難しい。反面,テキストマイニン グでは,質的研究では扱えなかった大量のデータを定量 的に扱うため質的研究に内在していたこれらの問題を克 服することができる 。 一方,テキストマイニングの限界点も指摘されており, 藤井ら は,言葉には文脈によって複数の意味があるに もかかわらず,テキストマイニングでは一律に解釈され てしまうこと,言葉に人の感情や考えがストレートに反 映されているとは限らず文脈の中で解釈する必要がある が,機械的に分析をするテキストマイニングでは,これ ら文脈に配慮しながら分析を進めることはできないこと を指摘している。また,今井ら は,このようなテキス トマイニングの限界も踏まえ,質的分析とテキストマイ ニングが補完し合う混合分析法の有用性を示している。 次章では,こうした利点や課題を踏まえつつ,テキスト マイニングの標準的な分析プロセスを解説する。
文本挖掘的特点及其在农村规划研究中的应用
(1)本文的目的本文所讲解的文本挖掘是指运用计数方法,从未形式化的庞大文本数据中提取新知识的方法。代以后,在学术和实务方面大量使用。在学术领域,以心理学、医疗·护理学、教育学、经营学等致力于质性研究的领域为中心,正在推进引进。在农村计划研究中所使用的研究方法多种多样,但也有很多研究基于访谈调查的质量差异。因此,笔者认为本文所涉及的文本挖掘也可以成为农村规划研究的有前途的分析工具。因此,本文的目的是提示作为针对性挖掘手法的特征和实际在农村计划研究中导入的方向性和注意点。具体来说,首先整理文本挖掘的特征,并对分析过程进行解说。然后,概观在农村计划及相关领域使用文本挖掘的研究例子,考察在该领域导入文本挖掘的意义。(2)文本挖掘的特征在学术领域引入文本挖掘的背景与质性研究的附带特性有着密切的关系。在质性研究中,由于以分析者自身的解释为判断基准来分析文本数据的内容,分析者的主观和判断可能会在无意识中反映到结果中,因此很难保证分析的可靠性。另外,由于要逐个浏览文本并领会内容,因此很难处理大量的文本和数据。相反,在文本研究中,由于定量地处理质性研究中无法处理的大量数据,所以能够解决质性研究中存在的这些问题。另一方面,文本挖掘的局限性也被指出。藤井等人认为,尽管语言根据上下文有多个意思,但在文本挖掘中却被一律解释,人的感情和想法直接与语言相反。虽然不一定是映出的,而是需要在上下文中进行解释,但在机械分析的文本挖掘中,无法一边考虑上下文一边进行分析。另外,今井等人还指出了质性分析和质性分析相辅相成的混合分析法的实用性。下一章将以上述优点和课题为基础,对文本挖掘的标准分析过程进行解说。
本文章由计算机程序翻译,如有差异,请以英文原文为准。