2017.10.18
まもなく衆議院選挙!有権者はどこに注目している?Twitterでも繰り広げられる急展開の選挙戦!
とにかく展開が速い!
唐突な解散、新党旗揚げ、野党再編と怒涛の展開が続く2017年衆院選。自分が住んでいる選挙区に誰が立候補するのか、告示直前まで分からなかった方も多いのではないでしょうか?
ここまで急だと、選挙動向を調査しようにも「有権者のアンケートをExcelで分析していては追いつかない」とお嘆きのご担当者も多いかと思います。
その分析、Watson Explorerに任せてみてはいかがでしょうか?
選挙ツイートは巨大で複雑
今回は、告示直前の10月3日から10月10日の期間で「政党」に言及した投稿をWatson Explorerで分析してみます。
1週間ほどの短期間ですが、事実上選挙戦に突入しているため投稿数は10万件を超えます。また、2013年のインターネット選挙解禁以来、候補者、政党、支援団体が積極的にTwitterを活用しているため、投稿データには「当事者によるPR投稿」が大量に含まれています。
選挙についてのTwitter投稿を分析する場合、このように巨大で複雑なデータの中から、「有権者の生の声」を抽出することが重要になります。
Watson Explorerで有権者の反応を分析してみましょう!
文書クラスターで自動分析
通常のテキストマイニングでは、分析担当者がデータを様々な角度で掘り下げながら分析を進めます。しかし、今回のように巨大で複雑なデータを分析する場合、ベテラン分析官でもそれなりの時間がかかってしまいます。そこで便利なのが、分析対象データをカテゴリー別に分類してくれる「文書クラスター」機能です。ちなみに、クラスター(cluster)とは、英語で「集団」「群れ」などの意味です。
Watson Explorerの文書クラスター機能を使って、Twitter投稿を分析してみましょう。
ステップ1: 文書クラスター機能を有効にする
まず、文書クラスター機能を有効化しましょう。
ステップ2: 文書クラスターの作成
次は文書クラスターを作成します。
今回の分析では標準のLatent Dirichlet Allocationアルゴリズムと呼ばれるものを使用していますが、より分析精度の高いアルゴリズムは大量のメモリーを必要としますので、分析対象データのサイズと相談して選択してください。
アルゴリズムを決定したら開始ボタンを押して、Watson Explorerに文書クラスターを作成させます。
ステップ3: 分類クラスターの確認
数分後、文書クラスターが完成しますのでその内容を確認します。
下の図をご覧いただくと、この段階ではクラスター名に「クラスターを特徴づけるキーワードの羅列」が設定されているかと思います。一見でたらめに見えますが、プルダウンメニューから全単語リストを見ると関連するキーワードであることが分かりますね。
これらキーワードの順序を入れ替えて、クラスター名を人間が理解できる文章に調整することができます。
ステップ4: Twitter内の全データの分類
ここまでは、5000件のサンプルデータを使って文書クラスターを作成しました。これで、分類作業を行うための判断基準が確定しました。
続いて、Twitterに投稿されている全データをこの基準で分類します。
この際、「1データを1クラスターだけに分類」するのか、「1データを複数のクラスターに分類」するか設定することができます。
今回扱うのは、投稿が140文字に制限されるTwitterデータです。1つの投稿に複数のテーマを盛り込むことは難しいので、「1データを1クラスターだけに分類」しました。
分類条件を設定したら、Watson Explorerに全データを分類させます。
少々時間はかかりますがWatson Explorerが一人で頑張ってくれますので、あなたがランチから帰ってきたころには分析が完了しているでしょう!
分析結果:一番は話題のあの党
Watson Explorerの分析結果をチェック
結果は以下の通りとなりました。
新しく発足した「希望の党」の注目度の高さが伺えます。
多くの記事が分類されたクラスターは新聞社などのメディアが配信した記事投稿でした。
一方、投稿数の少ないクラスターには、特定団体がネット上での選挙活動として投稿したデータが検出されています。
人間が直接分析することなく、Watson Explorer単独でもここまでの分析ができます。
おまけ:地域による投稿テーマの差
2016年6月のイギリスEU脱退国民投票と2016年11月のアメリカ大統領選挙では、大都市部とそれ以外で投票結果が大きく分かれ国民の分断が懸念されました。
果たして、日本でも同様の分断が発生しうるのか?投稿テーマの分布から分析してみます。
有権者が暮らす地域で投稿テーマの分布に変化があるか確認するために、先のクラスター分布グラフを「大都市部」と「その他」の2つのグラフに分割します。
なお、「大都市部」には以下の人口100万人を超える12市、「その他」にはそれ以外の自治体を指定します。
- 東京都特別区部
- 横浜市
- 大阪市
- 名古屋市
- 札幌市
- 福岡市
- 神戸市
- 川崎市
- 京都市
- さいたま市
- 広島市
- 仙台市
100万人都市では、「各選挙区の候補者情報」と「選挙後の連立可能性」のクラスターがその他地域よりも多く投稿されていることがわかります。
「希望の党」は東京都など都市部を基盤としているため、自分が住む選挙区の候補者がどの党から立候補するのか、気にしている有権者が多いようです。また、「希望の党」と「日本維新の会」が候補者調整をしているため、「日本維新の会」が基盤とする大阪市などで選挙後の連立のあり方について注目されているようです。
一方、その他地域では、「新聞社が配信した選挙公約記事」、「政策論点の整理」、「ユリノミクスのネーミングセンス」のクラスターが100万人都市よりも多く投稿されています。
「新聞社が配信した選挙公約記事」と「政策論点の整理」では「希望の党」が発表した「花粉症ゼロ」政策などについて言及されているため、それらの政策が全国に波及するか注目されているようです。「ユリノミクスのネーミングセンス」のクラスターでは「ユリノミクスを英語で読むと誤解されるかも?」という少し柔らかい読み物が注目されています。
大都市と大都市以外の地域の間の明らかな温度差は今のところ見受けられませんが、選挙後の政府の動向によっては状況が変わる可能性はあるかと推察されます。選挙後も、世論の動向を注視していく必要があります。
このようにWatson Explorerを利用すれば、人の手では膨大なデータ量でも素早く分析することが可能となります。
データを分析する時間と人材が足りないとお困りのみなさま、Watson Explorerをクラウドで利用できるイーネットソリューションズのMagic Insightをぜひご検討ください。