トランプが勝つ(Googleトレンドによれば、だが)
2020米大統領選挙の投票日が迫っている。11月3日は投票日だ。BBCの調査では、バイデン候補がリードしており、プロの見立でもトランプ再選の可能性は極めて低いという記事が書かれている。私もその意見に賛成でバイデン候補が勝つと思っている。しかし、グーグルトレンドの検索頻度を見るとそれとは別の風景が見えてくる。この記事ではGoogleトレンドによる検索頻度の分析から2020年大統領選挙の結果を予測する。
- 時間がない人まとめ
- 誰もが嘘をついている
- "クリントン トランプ", "トランプ クリントン" どちらの検索が多いか?
- 2016年米大統領選挙 検索頻度調査
- 2020年米大統領選挙 検索頻度調査
- 過去2回の分析
- 過去3回とも、先に入力された候補が勝っている
- 精度はどのくらいあるのか?
- クローゼットの中の本音
- まとめ(上段のまとめと同じものです)
- FAQ
時間がない人まとめ
- 人々のGoogle検索頻度から2020年の大統領選挙当選者を予測した。
- グーグル検索の検索順に注目して分析した。過去三回の米大統領選で大統領選挙候補者を2つ並べて検索する場合、当選者は前に書かれている。
- 例えば2016年で言えば、「トランプ クリントン」の方が、「クリントン トランプ」より多い。
- 2008年、2012年の大統領選挙も同様に当選した方が先に書かれていた。
- 2020年のグーグルトレンドを調査すると、「トランプ バイデン」は「バイデン トランプ」より多い。
- 過去の例に従うなら、トランプが当選することになる。
- しかし、それは大半の世論調査とは異なる。
- この予測方法自体まだ歴史が浅いため、正しいかどうかはわからない。
- むしろこの予測が当たることで恐ろしいのは人は世論調査では本音を言わず、ただグーグルにのみ本心を打ち明けると明らかになることだ。
誰もが嘘をついている
セス・スティーヴンズ=ダヴィドウィッツ 「誰もが嘘をついている。」という書籍がある。グーグルトレンドを利用してGoogleユーザーが検索窓を通じて何を検索したかを調査した書籍だ。
誰もが嘘をついている~ビッグデータ分析が暴く人間のヤバい本性~
- 作者:セス・スティーヴンズ=ダヴィドウィッツ
- 発売日: 2018/04/27
- メディア: Kindle版
人はグーグル検索で何を検索しているか?その検索ワードから著者は様々なことを調査する。人は検索から様々な情報を得るが、著者にすれば、検索ワード自体が貴重な情報だ。 アメリカにはどのくらい人種差別があるか?失業者は何を検索しているか?etc。著者は検索ワードの統計(主にグーグルトレンド)を用いて、統計を取ることが難しいテーマのデータ分析をしていく。 この調査が最も威力を発揮するのは性癖や人種差別的な思考など人が対面では口にできないことに関することだ。何故ならば人は公共の場では体面を重んずるがGoogleの検索窓には本心を告白するからだ。そしてその口にできない本心に最近では政治信条も含まれる。
"クリントン トランプ", "トランプ クリントン" どちらの検索が多いか?
上記書籍に次のような記述がある。
p24
浮動票がトランプ側に傾く徴候さえあった。ガブリエルと私は、クリントンが勝つと見込まれた中西部の重要州では、「トランプ クリントン」検索のほうが「クリントン トランプ」検索よりはるかに多かったことを突き止めた。実際、この地域で世論調査の結果をひっくり返したことがトランプの勝因となった。
鍵を握るのは検索順だった。人は無意識のうちに自分が支持する候補を優先的に入力すると著者は仮定する。そのため「トランプ クリントン」とよく検索する人は、トランプ側に肩入れしている可能性が高く、逆に「クリントン トランプ」とよく検索する人は、クリントン候補を支持している可能性は高い。そのため、Google トレンドを使って、州単位で「トランプ クリントン」と「クリントン トランプ」どちらがより多く検索されているかを調べれば選挙結果を予測できると著者は考えた。
2016年米大統領選挙 検索頻度調査
実際にGoogle トレンドを使って 2016年、「クリントン トランプ」,「トランプ クリントン」、どちらの検索が多かったかを示した図がこちらだ。 青は、「クリントン トランプ」順の検索、赤は、「トランプ クリントン」順の検索を示す。 下の州の図はどちらの検索順が多かったによって色分けされている。先ほどと同様に、「クリントン トランプ」が優勢なら青、「トランプ クリントン」が優勢なら赤に塗られる。
僅差であるが「トランプ クリントン」の方が、「クリントン トランプ」より多かった。世論調査の結果とは異なりトランプを優先して入力していた。
世論調査ではほぼクリントンが高かったのに検索順はそれとは違う傾向を示していた。
RealClearPolitics - Election 2016 - General Election: Trump vs. Clinton
2020年米大統領選挙 検索頻度調査
では上記と同様の手法で2020年のアメリカ大統領選挙を分析してみよう。グーグルトレンドで、「バイデン トランプ」 「トランプ バイデン」と検索された頻度を調査する。
次のような図になる。2016年の時の同じように、青は、「バイデン トランプ」順の検索、赤は、「トランプ バイデン」順の検索を示す。
驚くべきことにあの数々の失政を行ってきたトランプの方が検索順では優勢になっている。州ごと見ても概ね「トランプ バイデン」の検索割合 70% 「バイデン トランプ」の検索割合 30%と「トランプ バイデン」の検索順のほうが優勢だ。
BBCの世論調査では一貫してバイデンのほうが支持率が高い、にも関わらず検索順に関して言えば、「トランプ バイデン」の方が優先して検索されている。
https://www.bbc.com/news/election-us-2020-53657174
過去2回の分析
Googleトレンドにおける2016年の大統領選挙の検索順の「トランプ クリントン」優位はたまたまかもしれない。そのため2008年,2012年と過去の大統領選挙でも調べてみよう。
2008年 オバマ マケイン
2008年の大統領選挙では、オバマとマケインが争った。そして、オバマが大統領になった。検索順を見てもオバマの方が優先して入力された。
2012年 オバマ ロムニー
2012年の大統領選挙では、オバマとロムニーが争った。オバマが大統領に再選された。検索順を見てもオバマのほうが優先して入力された。
過去3回とも、先に入力された候補が勝っている
過去3回の大統領選挙で、「オバマ マケイン」が優勢で、オバマが大統領になり、「オバマ ロムニー」が優勢でオバマが再選された。「トランプ クリントン」が優勢で、トランプが大統領になった。その筋でいえば、「トランプ バイデン」が優勢なら、あまり信じたくは無いが、トランプが再選されることになる。
精度はどのくらいあるのか?
インターネットが一般化しグーグルトレンドが作られてまだ十数年しか経っていない。そのためどのくらい精度がある予測なのかわからない。現にバイデン候補が優勢なカリフォルニア州でも、「トランプ バイデン」の方が70%検索され、「バイデン トランプ」の30%より多いため、単にトランプが有名なので前に来ている可能性は捨てきれない。
クローゼットの中の本音
実際のこの予測が当たるかどうかはわからない。しかしもしこの予測が当たった場合、人々は世論調査には本音を言わず、ただ誰も見ていないクローゼットの中でグーグルにのみ本音を打ち明けていることになる。米大統領という自分たちのリーダーを選ぶのにそれを秘匿しなければならないということ自体のほうが、大統領選挙そのものより民主主義にとって厄介かもしれない。
まとめ(上段のまとめと同じものです)
- 人々のGoogle検索頻度から、2020年の大統領選挙当選者を予測した。
- 過去三回の大統領選挙候補者を、2つ並べて検索した場合、当選した大統領が前に検索ワードがより多く検索されている。
- 例えば2016年で言えば、「トランプ クリントン」の方が、「クリントン トランプ」より多い。
- 2008年、2012年の大統領選挙も同様に、当選した方が先に言及されていた。
- 2020年のグーグルトレンドを調査すると、「トランプ バイデン」は「バイデン トランプ」より多い。
- 過去の例に従うなら、トランプが当選することになる。
- しかし、それは大半の世論調査とは異なる。
- この予測方法自体まだ歴史が浅いため、正しいかどうかはわからない。
- むしろこの予測が当たることで恐ろしいのは、人は世論調査では本音を言わず、ただグーグルにのみ本心を打ち明けると明らかになることだ。
FAQ
ここからは、読者から当然寄せられるであろう質問に予め答えておく
悪名は無名に勝るのでは?
Q:上記の調査は、検索順を元に、どちらの候補を支持しているかを見ている。しかし、必ずしも先に思いつくからと言ってその候補を支持しているのいるとは言えない という主張はありえる。例えば嫌っている候補で悪名が高いほうが先に書かれることは十分にありえる。
A: 私もそれはあり得ると思っている。検索順で前に来るからそちらを支持しているとは言えないという主張は説得力を持つ。特に、悪名が高いほうが先に思いつくために先に入力されるということはよくある。「トランプ バイデン」が優勢だがそれは悪名故にトランプが先に思いつかれているというケースであってほしいと思っている。
バイデンと比べるべくもない
Q: バイデンのほうが優れているのはわかりきっているので、「バイデン トランプ」と比べるべくもない。 A: その可能性はありえる。あくまで態度未決定の有権者だけが入力した可能性はありえる。
再現手法を教えてけれ
A: そんなに難しいことではないですが、再現実験の仕方を書きます。googleトレンドのサイトに行き、"Biden Trump" と検索します。「比較を追加」で"Trump Biden"を追加します。検索順を指定するためには、"" ダブルクォーテーション で括る必要があります。期間は、1年にして、該当年を入れるのが便利です。先に民主党の候補を入れたほうが、党のカラーと検索結果がマッチして便利です。
これは検索数ではないの?
Q: この100とかの数値は、検索数ですか? A: Googleは検索件数を公開していません。相対頻度による比較になります。