求助PDF
{"title":"基于隐主题马尔可夫模型的顾客购买行为分析研究","authors":"M. Hotoda, G. Kumoi, M. Goto","doi":"10.7232/IEMS.2021.20.1.48","DOIUrl":null,"url":null,"abstract":"1. はじめに 近年,ECサイトを通じたオンラインでの商品購買は広く 一般消費者に受け入れられるようになり,市場規模が拡大し ている [1].ECサイト上では,ユーザの各ページの閲覧行動 の詳細なログが取得可能であるため,これらのデータを活用 したWebマーケティング技術の重要性が高まっている.一 方,ECサイトにおける購買に至る割合(Conversion Rate ; CVR)は通常,高々数%であることが知られている [2]. そのため,多くの ECサイトで CVRを改善するための施 策が必要とされている.例えば,ユーザの購買意欲を把握す ることで効果的なタイミングで施策を打ったり,購買につな がりやすいページを把握することでそのページにユーザを誘 導したりすることにより,CVRの向上が見込める. 一般に,ユーザは商品を購入する前に ECサイト上の様々 なページを閲覧することが多い.したがって,ユーザの思考 状態(購買意欲の有無や嗜好,ニーズ等)の変化は ECサ イトのページ遷移傾向に反映されていると考えられる.その ため,閲覧履歴データを分析することで,ユーザの購買意欲 を抽出できれば,適切な施策の一助になると考えられる.こ の様な分析においては,ユーザの思考状態に依存して各閲覧 ページが生成されたと仮定することは極めて自然であり,観 測不可能な思考状態を観測可能な閲覧ページから推測できる と考えられる.そこで本研究では,ユーザのページ遷移の背 後に潜在トピック(潜在クラス)を仮定するモデルを提案 する. 従来の潜在クラスモデルをページ遷移データに適用すると, 連続的に閲覧した一連のページ全体に同じ潜在トピックを仮 定するか,または各ページに対し毎回異なる潜在トピック を仮定するかのどちらかである.しかし,閲覧中にユーザの 思考状態が変化する可能性は十分に考えられるため,連続的 に閲覧した一連のページ全体に同じ潜在トピックを仮定する ことは好ましくない.一方で,ページごとにユーザの思考状 態が頻繁に変わることもほとんどないと考えられるため,毎 ページ異なる潜在トピックを仮定したトピックモデルの適用 も好ましくない. そこで本研究では, Hidden Topic Markov Models (HTMM)[3]をベースとし,リアルタイムに閲覧履歴データ の分析を可能にした購買行動分析モデルを提案する.HTMM は,前後関係を考慮しない Latent Dirichlet Allocation (LDA)[4]に隠れマルコフモデル(Hidden Markov Chain model ; HMM)の考え方を援用したモデルである.HTMM は文書に対して複数の潜在トピックを想定するが,LDAと は異なり,文書中の文単位での潜在トピックを考える.す なわち,各文中の単語は同じ潜在トピックに存し,かつ連続 する文は同じ潜在トピックを持つ可能性が高いことを仮定す る.このため,文書を同じ統計的特徴を持つ複数の文群に分 割することができる.したがって HTMMを閲覧履歴デー タに援用し,ページ単位での潜在トピックの推定を行うこと で,閲覧履歴を同じ特徴を持つ複数の群に分割することがで きる.そのうえで実際の閲覧履歴データから得られる購買実 績を併用することで,各潜在トピックの購買確率を求めるこ とができる.提案モデルにより,ユーザの購買意思をリアル タイムで予測することが可能になると考えられる.加えて, 各ユーザの潜在トピックの変化点を検出することが可能にな り,ユーザの思考が変化する際にどのようなページ遷移が起 こっているかを理解することができる.本研究では,実閲覧 履歴データを用いて分析し,提案手法の有効性を検証する. 2. 関連研究 2.1. 隠れマルコフモデル Hidden Markov Model(HMM)は,観測不可能なマ ルコフ過程とその各状態に依存して生成されるシンボルの組 み合わせによって,シンボルの系列を表現するモデルである. HMMの対象となる系列データは,複数の状態を持ち,それ らの状態がある遷移確率により遷移するマルコフモデルと仮 定される.これを一次マルコフ性という. 2.2. Hidden Topic Markov Model Hidden Topic Markov Model(HTMM)は,LDAに HMMの考え方を援用した,文書生成モデルである.図 1に HTMMのグラフィカルモデルを示す.","PeriodicalId":45245,"journal":{"name":"Industrial Engineering and Management Systems","volume":"301 1","pages":"48-60"},"PeriodicalIF":0.6000,"publicationDate":"2021-03-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":"{\"title\":\"A Study on Customer Purchase Behavior Analysis Based on Hidden Topic Markov Models\",\"authors\":\"M. Hotoda, G. Kumoi, M. Goto\",\"doi\":\"10.7232/IEMS.2021.20.1.48\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"1. はじめに 近年,ECサイトを通じたオンラインでの商品購買は広く 一般消費者に受け入れられるようになり,市場規模が拡大し ている [1].ECサイト上では,ユーザの各ページの閲覧行動 の詳細なログが取得可能であるため,これらのデータを活用 したWebマーケティング技術の重要性が高まっている.一 方,ECサイトにおける購買に至る割合(Conversion Rate ; CVR)は通常,高々数%であることが知られている [2]. そのため,多くの ECサイトで CVRを改善するための施 策が必要とされている.例えば,ユーザの購買意欲を把握す ることで効果的なタイミングで施策を打ったり,購買につな がりやすいページを把握することでそのページにユーザを誘 導したりすることにより,CVRの向上が見込める. 一般に,ユーザは商品を購入する前に ECサイト上の様々 なページを閲覧することが多い.したがって,ユーザの思考 状態(購買意欲の有無や嗜好,ニーズ等)の変化は ECサ イトのページ遷移傾向に反映されていると考えられる.その ため,閲覧履歴データを分析することで,ユーザの購買意欲 を抽出できれば,適切な施策の一助になると考えられる.こ の様な分析においては,ユーザの思考状態に依存して各閲覧 ページが生成されたと仮定することは極めて自然であり,観 測不可能な思考状態を観測可能な閲覧ページから推測できる と考えられる.そこで本研究では,ユーザのページ遷移の背 後に潜在トピック(潜在クラス)を仮定するモデルを提案 する. 従来の潜在クラスモデルをページ遷移データに適用すると, 連続的に閲覧した一連のページ全体に同じ潜在トピックを仮 定するか,または各ページに対し毎回異なる潜在トピック を仮定するかのどちらかである.しかし,閲覧中にユーザの 思考状態が変化する可能性は十分に考えられるため,連続的 に閲覧した一連のページ全体に同じ潜在トピックを仮定する ことは好ましくない.一方で,ページごとにユーザの思考状 態が頻繁に変わることもほとんどないと考えられるため,毎 ページ異なる潜在トピックを仮定したトピックモデルの適用 も好ましくない. そこで本研究では, Hidden Topic Markov Models (HTMM)[3]をベースとし,リアルタイムに閲覧履歴データ の分析を可能にした購買行動分析モデルを提案する.HTMM は,前後関係を考慮しない Latent Dirichlet Allocation (LDA)[4]に隠れマルコフモデル(Hidden Markov Chain model ; HMM)の考え方を援用したモデルである.HTMM は文書に対して複数の潜在トピックを想定するが,LDAと は異なり,文書中の文単位での潜在トピックを考える.す なわち,各文中の単語は同じ潜在トピックに存し,かつ連続 する文は同じ潜在トピックを持つ可能性が高いことを仮定す る.このため,文書を同じ統計的特徴を持つ複数の文群に分 割することができる.したがって HTMMを閲覧履歴デー タに援用し,ページ単位での潜在トピックの推定を行うこと で,閲覧履歴を同じ特徴を持つ複数の群に分割することがで きる.そのうえで実際の閲覧履歴データから得られる購買実 績を併用することで,各潜在トピックの購買確率を求めるこ とができる.提案モデルにより,ユーザの購買意思をリアル タイムで予測することが可能になると考えられる.加えて, 各ユーザの潜在トピックの変化点を検出することが可能にな り,ユーザの思考が変化する際にどのようなページ遷移が起 こっているかを理解することができる.本研究では,実閲覧 履歴データを用いて分析し,提案手法の有効性を検証する. 2. 関連研究 2.1. 隠れマルコフモデル Hidden Markov Model(HMM)は,観測不可能なマ ルコフ過程とその各状態に依存して生成されるシンボルの組 み合わせによって,シンボルの系列を表現するモデルである. HMMの対象となる系列データは,複数の状態を持ち,それ らの状態がある遷移確率により遷移するマルコフモデルと仮 定される.これを一次マルコフ性という. 2.2. Hidden Topic Markov Model Hidden Topic Markov Model(HTMM)は,LDAに HMMの考え方を援用した,文書生成モデルである.図 1に HTMMのグラフィカルモデルを示す.\",\"PeriodicalId\":45245,\"journal\":{\"name\":\"Industrial Engineering and Management Systems\",\"volume\":\"301 1\",\"pages\":\"48-60\"},\"PeriodicalIF\":0.6000,\"publicationDate\":\"2021-03-31\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"2\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Industrial Engineering and Management Systems\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.7232/IEMS.2021.20.1.48\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q4\",\"JCRName\":\"ENGINEERING, INDUSTRIAL\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Industrial Engineering and Management Systems","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.7232/IEMS.2021.20.1.48","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"ENGINEERING, INDUSTRIAL","Score":null,"Total":0}
引用次数: 2
引用
批量引用
A Study on Customer Purchase Behavior Analysis Based on Hidden Topic Markov Models
1. はじめに 近年,ECサイトを通じたオンラインでの商品購買は広く 一般消費者に受け入れられるようになり,市場規模が拡大し ている [1].ECサイト上では,ユーザの各ページの閲覧行動 の詳細なログが取得可能であるため,これらのデータを活用 したWebマーケティング技術の重要性が高まっている.一 方,ECサイトにおける購買に至る割合(Conversion Rate ; CVR)は通常,高々数%であることが知られている [2]. そのため,多くの ECサイトで CVRを改善するための施 策が必要とされている.例えば,ユーザの購買意欲を把握す ることで効果的なタイミングで施策を打ったり,購買につな がりやすいページを把握することでそのページにユーザを誘 導したりすることにより,CVRの向上が見込める. 一般に,ユーザは商品を購入する前に ECサイト上の様々 なページを閲覧することが多い.したがって,ユーザの思考 状態(購買意欲の有無や嗜好,ニーズ等)の変化は ECサ イトのページ遷移傾向に反映されていると考えられる.その ため,閲覧履歴データを分析することで,ユーザの購買意欲 を抽出できれば,適切な施策の一助になると考えられる.こ の様な分析においては,ユーザの思考状態に依存して各閲覧 ページが生成されたと仮定することは極めて自然であり,観 測不可能な思考状態を観測可能な閲覧ページから推測できる と考えられる.そこで本研究では,ユーザのページ遷移の背 後に潜在トピック(潜在クラス)を仮定するモデルを提案 する. 従来の潜在クラスモデルをページ遷移データに適用すると, 連続的に閲覧した一連のページ全体に同じ潜在トピックを仮 定するか,または各ページに対し毎回異なる潜在トピック を仮定するかのどちらかである.しかし,閲覧中にユーザの 思考状態が変化する可能性は十分に考えられるため,連続的 に閲覧した一連のページ全体に同じ潜在トピックを仮定する ことは好ましくない.一方で,ページごとにユーザの思考状 態が頻繁に変わることもほとんどないと考えられるため,毎 ページ異なる潜在トピックを仮定したトピックモデルの適用 も好ましくない. そこで本研究では, Hidden Topic Markov Models (HTMM)[3]をベースとし,リアルタイムに閲覧履歴データ の分析を可能にした購買行動分析モデルを提案する.HTMM は,前後関係を考慮しない Latent Dirichlet Allocation (LDA)[4]に隠れマルコフモデル(Hidden Markov Chain model ; HMM)の考え方を援用したモデルである.HTMM は文書に対して複数の潜在トピックを想定するが,LDAと は異なり,文書中の文単位での潜在トピックを考える.す なわち,各文中の単語は同じ潜在トピックに存し,かつ連続 する文は同じ潜在トピックを持つ可能性が高いことを仮定す る.このため,文書を同じ統計的特徴を持つ複数の文群に分 割することができる.したがって HTMMを閲覧履歴デー タに援用し,ページ単位での潜在トピックの推定を行うこと で,閲覧履歴を同じ特徴を持つ複数の群に分割することがで きる.そのうえで実際の閲覧履歴データから得られる購買実 績を併用することで,各潜在トピックの購買確率を求めるこ とができる.提案モデルにより,ユーザの購買意思をリアル タイムで予測することが可能になると考えられる.加えて, 各ユーザの潜在トピックの変化点を検出することが可能にな り,ユーザの思考が変化する際にどのようなページ遷移が起 こっているかを理解することができる.本研究では,実閲覧 履歴データを用いて分析し,提案手法の有効性を検証する. 2. 関連研究 2.1. 隠れマルコフモデル Hidden Markov Model(HMM)は,観測不可能なマ ルコフ過程とその各状態に依存して生成されるシンボルの組 み合わせによって,シンボルの系列を表現するモデルである. HMMの対象となる系列データは,複数の状態を持ち,それ らの状態がある遷移確率により遷移するマルコフモデルと仮 定される.これを一次マルコフ性という. 2.2. Hidden Topic Markov Model Hidden Topic Markov Model(HTMM)は,LDAに HMMの考え方を援用した,文書生成モデルである.図 1に HTMMのグラフィカルモデルを示す.