上原 宏, 2010年 博士(経営学)
オンラインコミュニティ書込みにもとづく視聴者行動の特徴解析

1. はじめに

blog,SNS,掲示板など,ユーザー同士で情報を発信しあうサイト(以下,オンラインコミュニティ)が発展を見せている. オンラインコミュニティでは,何らかの事件やイベントをきっかけにして書込みが一時的に殺到する現象が見られる.それらは あたかもデモや暴動のような群集化の様相を示すことから,インターネットモブなど と呼ばれる.

本研究では,オンラインコミュニティで頻発する群衆行動を,特にその重要な契機とされているテレビとの関係に着目し, テレビの視聴者がオンラインコミュニティ上でどのような視聴行動を示すか,その特徴解析を試みる. オンラインコミュニティでの群衆行動が,従来の群衆行動と大きく異なる点は,そのライフサイクルが極端に 短いという点にある.最も短いものは,同一時間帯に参加者が一斉に書込む同期型と呼ばれるオンラインコミュニティ に見られる. 先行研究では,オンラインコミュニティを特徴解析するための様々な手法が提案されているが,このような短いサイクル での状態変化を捉えるために有効な手法は未だ提案されていない.そこで本研究では,従来手法 を拡張して,こうした短いライフサイクルを,関心度と呼ぶ尺度で測定する解析手法を提案する.この手法から 得られる視聴者行動の特徴は,関心の状態,すなわち関心の対象とその関心度であるが,更に,視聴者がテレビ 視聴を通じて形成する意見の特徴を抽出することを目的とした同手法の応用方法を示す.これらの手法を 同期型・非同期型と呼ばれる2種類のオンラインコミュニティに適用して,視聴者行動の特徴解析を試みる.

2. 先行研究

図に先行研究の類型を示す.

縦軸の同期型とはメンバーが同一時間帯に一斉に書込むオンラインコミュニティ,非同期型とは メンバーがそうした時間同期をとらずに書込むオンラインコミュニティを意味する.また横軸の話題特化型とは,特定の話題に 関する意見や情報交換を目的としたオンラインコミュニティ,日記型とは書き手の気分や情緒など自己表現を主目的とした オンラインコミュニティを意味する.これらの違いによって,特徴解析の手がかりとなる書込みの構文パターンやサイクルが大きく 異なり,それに応じて先行研究の解析アプローチもそれぞれ異なる.以下,各類型毎に概要を述べる.

図のとおり,先行研究のほとんどは,非同期型を解析対象としており,同期型を扱ったものはごく僅かである.単語の羅列で 構造パターンが捉えにくいことや,著しく短いサイクルで関心度が時間変動するといった同期型特有の性質が解析を困難に している.

3. 本研究の課題

上記,関心の時系列推移を捉える研究にて述べたバーストは オンラインコミュニティ上でのメンバー間での関心の一様性が現れる期間を意味しており,群衆行動の一般的概念と一致する. そこで本研究では,これら先行研究でバーストの特徴量として用いられた尺度,すなわち関心を呼んでいる話題を意味する語彙 の出現頻度の突出度合いを,群衆行動を測定する基本的な尺度として用いる.以降,この 突出度合いを関心度と呼び,関心を呼んでいる話題を意味する語彙集合とあわせて関心の状態と総称する.以下,本研究 での課題を述べる.

関心の状態測定に関する課題と解析手法の提案

関心の時系列推移解析に関する先行研究は,観測区間を均一な時間間隔に区切り,それぞれの時間間隔内での語彙の 出現頻度をカウントする手法にもとづく.しかし,この方法では,同期型における数秒単位の関心度の起伏を捉えることができない.すなわち, 時間間隔を数秒単位の小さな時間セグメントに設定して出現語彙をカウントしようとすると,取得できるサンプル数が小さくなりすぎて関心度 の挙動が捉えられないといった問題がある. こうした課題に対処するため,語彙の時間的な出現密度で関心度を測定する方法を提案する.この方法は,観測期間を固定した時間間隔 に区切る必要がないため上記のような問題を回避して,関心度の微細な振動を精度高く捉えることが期待できる.

同期型オンラインコミュニティにもとづく関心度の特徴解析}

提案手法を同期型オンラインコミュニティに適用し,関心の状態遷移に関する特徴解析を試みる.オンラインコミュニティの特徴解析 に関する先行研究のほとんどは非同期型を解析の対象としていたが,本研究では提案手法によりテレビ放送中に視聴者が書込むテレビ実況 掲示板を解析して,テレビ番組視聴中の関心の状態遷移の抽出を試みる(図 1)).


非同期型オンラインコミュニティにもとづく意見形成の特徴解析}

非同期型オンラインコミュニティでは,何らかの関心が高まるとそれを契機とした書き手の意見・行動が記述されることが多い.例えば, テレビCMで宣伝されたプロダクトが高い関心を呼んでいる場合,書き手は同じ文書中にそのプロダクトに対してどのようなイメージを 抱いたかといったことも記述する. 本研究では,こうした関心度の高い状態において形成される意見の特徴解析を行い,関心の状態と意見形成との関連性についての 特徴解析を試みる.先行研究では,共起性分析 や構文解析にもとづき評価対象と評価との関連性を特定する試みが見られるが,書込みにおいて関心を表明する語彙と,それに対する 意見を表明する語彙とは必ずしも近傍には出現せず,また構文パターンも一定しないことから,これらの手法の応用では関心度と意見形成 との関連性を特定できない. 本研究では,関心度を測定する提案手法を応用してこれらの関連性を捉える方法を提案する.この手法をプロダクトへの意見・感想を多く含む非同期型 オンラインコミュニティ(以下,クチコミサイト)に適用し,テレビCMへの関心とプロダクトへのイメージ形成との関連性を特徴解析する (図 2)).

4. 解析手法

提案手法は,「短い書込み間隔で同じ語彙が出現する程その語彙に関する関心度が高い」として関心度の時系列を 生成する.即ちこの手法は,語彙の時系列にそった偏り度合いを関心度として計算するもので,時間間隔内のサンプル数 に依存せずに細かな関心度の変化を捉えることが可能となる. 図に提案手法と先行研究での手法の違いを示す.

図中w_1 ~ w_9は,時間軸にそって出現する語彙 を表す.w_4 ~ w_7は,w_1 ~ w_3の3分の1程度の時間間隔で出現しているものとする.提案手法によれば, w_4を大きなバーストのスタートポイント(図中t)と捉えるため,実際のバーストの出現位置(T)を近似していることがわかる. また,最初の小さなバーストと次に現れる大きなバーストとの関心度の差が比較的大きくなるように計算される(図中の実線 グラフ). 一方,先行研究の手法にもとづき,観測区間を等間隔の時間セグメントa,b,cに区切りそれぞれの区間での語彙数をカウントした場合, バーストのスタートポイントはt_bで捉えられ,Tをうまく近似できていない.また,区間a,bそれぞれにおける出現語彙数 の差は1のため,両区間でのバーストの関心度の差は比較的小さくなる(図中の破線グラフ).時間セグメントを更に小さくする と各セグメントに納まる語彙数が更に小さくなり,各セグメント間での関心度の差異が更にわかりにくくなる. 以上のとおり,提案手法によれば,関心度の微細な振動を精度高く捉え,取得サンプル数によらずに各バーストの関心度 の差異を表現することができる.

5. 同期型オンラインコミュニティにもとづく関心度の特徴解析

提案手法をドラマ番組に関するテレビ実況掲示板に適用し,ドラマのシーン応じて短時間に変化する視聴者の関心の状態遷移を抽出し, ドラマ映像,および一般の視聴者の関心度の推移と比較してテレビ視聴中の視聴者行動の特徴を解析した.

視聴者の関心と番組の状態遷移との比較

提案手法に基づく視聴者の関心の状態遷移と番組の状態遷移とを比較するため,関心度の時系列 を可視化して番組映像に重畳するシステムを実装した.このシステムは,番組映像を再生すると同時に, 番組冒頭からの経過時間に対応する関心度をグラフ表示するものである.

このシステムを用いて,視聴率の異なる3種類のドラマを対象にそれぞれドラマ映像と,関心の状態遷移を視覚的に比較した. 表1に解析結果を示す.表が示すとおり,生成される関心度の時系列は,視聴 率の低下とともに少なくなる傾向が見られるが,視聴者の関心の状態は,対象となる番組シーンと視聴率に関わらずほぼ時間同期 しているという結果が得られた.

一般視聴者の関心との比較

次に,一般の視聴者の関心度との比較では,27人の一般視聴者に20分間のドラマ番組を視聴させ,関心を抱いた演出要 素と時間(番組冒頭からの相対時間)を記述させた.これと,提案 手法にもとづく関心度の時系列とを比較し,被験者が関心を示した区間と,関心度の時系列との時間的な一致性を分析 した.結果を表2に示す. ほとんどの係数は0.7-0.9の範囲に納まっており両者の関心の時間的一致性が確認できる. この結果は,実況掲示板の視聴者が示すテレビドラマへの関心が視聴スタイルの特殊性にもかかわらず,一般視聴 者のそれと類似していることを示している.

Actor A Actor B Actor C Actor D Actor E Actor F Actor G
0.7 0.7 0.9 0.9 0.9 0.9 0.6

6. 非同期型オンラインコミュニティにもとづく意見形成の特徴解析

テレビCM視聴を契機として視聴者の間でプロダクトイメージが形成される場合は,テレビCMへの関心度とプロダクトイメージを 表す語彙は何らかの相関を示すと 考えられる.そこで,提案手法にもとづきテレビCMを表象する語彙,およびプロダクトイメージを表す語彙それぞれの関心の 状態遷移を抽出し,相互の時系列相関を計算し,相関が認められたプロダクトイメージをテレビCMからのインパクトを 反映したイメージとして抽出した.抽出したプロダクトイメージが実際にテレビCMへの関心を契機として形成されたものかどうかを 確認するため,テレビCMへの関心とプロダクトイメージの類似性に関する特徴解析を試みた.

シリーズCMへの関心とプロダクトイメージとの相関分析

実験では,ある化粧品ブランドのシリーズCMに関するクチコサイトの書込みを解析対象とした.提案手法をクチコミサイトに適用する と,図5のようにシリーズの各CMの放送開始直後をピークに減衰する関心度の時系列が得られた. ただし,こうしたピークが出現しないCM(CM2,CM4,CM5)もある.これらは関心を呼ばなかったCMと見なすことができる. 図5のとおり,関心の対象は出演したタレントであり,関心を呼んだCMにおいて,特に高い関心度が示された タレントは,当該CMで主演したタレントとほぼ一致した.

次に,クチコミサイトから化粧品に対するイメージを意味する語彙を抽出し,これらに提案手法を適用して,上記CMへの関心度の時系列と の相関を計算し,相関が認められたものをCMからのインパクトを反映した化粧品イメージとして抽出した.

プロダクトイメージとCMイメージとの類似性分析

もし,これら化粧品のイメージが 実際にテレビCMからの影響を受けているならば,シリーズ各CMへの関心の状態と,その状態が継続した期間での化粧品イメージの特徴 は類似すると考えられる. このことを確かめるため,各CMそれぞれの期間で高い関心度を示した化粧品イメージを更に抽出し,それらを各CMへの関心の対象となった タレントのイメージと比較して類似性を解析した.クチコミサイトにはタレントのイメージに関する書込みはほとんど見られなため,別途タレントのファン が集まる掲示板から各タレントのイメージを表す語彙を集約した.図6にその結果を示す.図中,各タ レントの表示位置に近いイメージ語彙ほどそのタレントのイメージを強く表象している.

表3にタレントイメージと各CMにおける化粧品イメージとを比較した結果を示す.表中,タレントA〜Dの各列に表示 したイメージ語彙は,図6で各タレントの近傍に出現したイメージ語彙である.これらのイメージのうち,各CMで高い 関心度が得られた化粧品イメージと一致したものは○でマーキングしている.例えば,CM3での化粧品イメージは,タレント B,Cのイメージとの一致がみられるが,タレントB,CはCM3において主演したタレントである.このように,関心を呼んだCMにおける 化粧品イメージは主演したタレントのイメージとの類似性が見られた. 同様に,関心を呼ばなかったCMにおける化粧品イメージを解析したところ,このようなタレントイメージとの類似性は認められなかった. 以上の結果は,提案手法で抽出した化粧品イメージがCMからの影響を反映していることを裏付けている.

7. まとめ

本研究では,オンラインコミュニティで頻発する群衆行動のなかで,特にテレビ視聴者の行動に着目し, 関心度を尺度として特徴解析を試みた.番組視聴中における視聴者の関心は番組シーンの変化に応じて,短い周期で 振動を繰り返す.こうした短いサイクルの振動を精度高く捉えられるような特徴解析の手法を提案し,テレビ実況掲示板 に適用して,番組視聴中の視聴者行動の特徴解析を行った.次に,関心度にもとづく 特徴解析から発展して,関心度が高い期間において視聴者が形成した意見を特徴解析する方法を提案した.この手法 を用いて化粧品クチコミサイトのおける テレビCM視聴者のプロダクトイメージに関する特徴解析を試みた.以下に実験で得られた知見をまとめる.