IBM Watson Explorerを利用した コグニティブ プラットフォーム サービス Magic Insight for WEX

ブログ

2018.07.27

Watson Explorerで見る、蚊に刺されやすい血液型とは

Watson Explorerで見る、蚊に刺されやすい血液型とは

蚊は人類にとって最も有害な害虫であると言われています。
できれば刺されたくないのがみなさんの願いですね。
どの血液型が刺されやすいかについてはたびたび話題になっていますが、WatsonExplorerでも刺されやすい血液型ランキングを分析してみました。
今回はツイッターに投稿された「蚊」を含む30000件のデータを使いました。

ツイッターに投稿された「蚊」を含むデータの分析

蚊といえば?

投稿文章中の動詞を抽出した結果を見ると、「刺さる」ことを投稿した人が多いようです。

「蚊」を含む投稿文章中に含まれる動詞

刺されやすい血液型は?

どの血液型が刺されやすいのか(「刺されたと」ツイートしている人の血液型)を分析します。
まずは血液型の辞書を利用することで、投稿文章中の、血液型出現頻度ランキングを出します。

B型が多すぎますが、この結果は信頼できるのでしょうか?

こう見ると、B型がダントツで刺されているように見えますが、実は違うのです。
「B型」を含む文章を見てみると、次の文章が511件もリツイート(RT)されていたことがわかりました。
このリツイートが頻度を上げる原因になっていたようです。

B型のRT

このように、リツイート(RT)は時として分析の妨げになるケースがあります。
「RT」が含まれる文章を除外してもう一度、血液型ランキングを見てみましょう。

RTを除外したところ29982件が20190件に減りました。約1万件はリツイートであったことがわかります。

「刺さる」が投稿文章に含まれる血液型ランキング

蚊にさされやすい血液型、1位はO型でした!
蚊に最も刺されやすい、O型の投稿

「蚊」について投稿した人のTwitterプロフィールだけを分析してみる(おまけ)

先ほどは投稿された文章だけを分析していましたが、今度は投稿した人のTwitterプロフィールだけを分析します。

「蚊」について投稿した人のTwitterプロフィールの分析

Twitterプロフィールから抽出した血液型ランキングは次の通りでした。
「蚊」について投稿する人のうち、プロフィールに自分の血液型を書いている人はB型が多いという結果です。

「蚊」についての投稿をしたユーザのTwitterプロフィールに含まれる血液型ランキング

WatsonExplorerを使う上で、大切なことは、単純にWatsonが出した結果を真に受けてはいけないということです。
分析者の知識や経験を生かして、必要なデータだけに絞り込んでから分析していくという作業が、より信頼できる分析結果につながることをお伝えしたブログ記事でした。
次回もお楽しみに。

Top
eNetSolutions