マスコミツイート横断比較を作った。マスコミは情報公開を進めよう。
この記事の言いたいこと
マスコミのツイートを検索していつどのようなツイートをしたかを、簡単に集計できるツールを作った。 マスコミツイート横断比較
このツールを作ったのは、マスコミは権力者でありながら、その権力行為(世論へ影響を与える行為)について調査をすることが難しいからだ。
私は次のように考えた。
- 権力者は、透明化を進め情報を公開すべきだ
- マスコミは権力者だ
- マスコミは、透明化を進め情報を公開すべきだ
マスコミも権力者として、その権力に見合う情報公開をしたほうが良いのではないかと思っている。
マスコミは政府や議員と同じく権力者である
マスコミはよく、政府や議員に対して、「権力者は透明性を高め、情報公開をすべきだ」と言う。それはその通りだ。政府は情報公開を進めるべきだ。何故なら、政府や議員は権力者だからだ。その権力の源泉は法である。
同様にマスコミも権力者だ。権力とは、辞書によると「ある人間(集団)が自己の意思に沿って他人(他集団)を行動させる」ことを言うそうだ1。マスコミは、世論を背景に、
- 議員を辞職させ
- 法案を廃案に追い込み
- 事業計画を撤回させ
- 事業を中止させる。
これらはマスコミの影響力無しには考えられない。つまりマスコミは権力者である。その権力の源泉は世論だ。マスコミは報道を通して、アジェンダの設定などの、世論に影響を与える。
しかし、マスコミは自分自身が権力者でありながら、自らに対しては、透明性を高め、情報公開せよ とは言わない。過去の記事は、市民はなかなかアクセスできない。図書館にある新聞の縮刷版は検索性に乏しい。自分たちは、権力者でありながら、透明性は低く、情報は簡単にはアクセス出来ない状態だ。
例えば、マスコミ各社が、10年前どのような論調だったか知るのはとても難しい。そのため、マスコミ各社の10年間のツイートから、どのような論調だったかや、どの時期にどのテーマに興味を持っていたか、類推出来るツールを作った。
マスコミツイート横断比較
マスコミの過去ツイートを検索し、かくメディアがどのような論調で何についてどのくらいの頻度で言及したかを手軽に可視化出来る(あくまでツイート上でだが)。
例えば、「安保法制」について検索する。
次のようなグラフが出る。
マスコミ各社のtweetを検索して、「安保法制」を含むツイートを抜き出し、何年にどのメディアが言及したかが分かる。 ツイート年と、メディアごとの件数をまとめることで、各メディアがいつどのような論調だったか分かる。
その他、言及数の比較も出来る。
例えば、福島での原発問題で、処理水と呼ばれるか、汚染水と呼ぶかでマスコミの言及の仕方が異なる。その推移などが見れたり比較できたりする。
注意してほしいのはこのツールはマスコミ各社のツイートを対象としており、新聞記事全ては網羅していない。このツールを使って実際の新聞記事を参照したくなった場合は、こちらのサイトが便利だ。
なぜこれを作ったのか?
こちらの記事 で書いたが、毎日新聞のHPVワクチンについての記事に疑問を持ったからだ。毎日新聞の記事では、HPVワクチンが問題視されたときにマスコミの主張はバラバラであったと書いてあった。しかし、その当時のツイートを見るとどうも、バラバラと言うよりはむしろ明らかにネガティブな論調であった?そして問題は、マスコミ各社の過去tweetを使わなければ、なかなか知ることが出来ない。
2013-2014年のマスコミ各社(NHK 朝日新聞 朝日新聞デジタル 読売オンライン 共同通信 日経 産経 時事通信 毎日新聞 毎日新聞ニュース ハフポスト日本版) のtweetを形態素解析して、頻出語をワードクラウドで表示した。
過去記事にアクセスできない
上記の調査は、マスコミのツイートを元に行った。本来は記事を当たるべきだろう。しかし、マスコミ各社はweb上の記事を消してしまう。
上記の2013-2016年のtweetから当時の記事にたどり着けるか確認してみよう。先に紹介したHPVワクチンに対するツイートを元にその記事にたどり着けるかを調査した。たどり着ければ o たどり着けなければ x とした。
2013年から2016年のツイート297件から20件ランダムに選択しし調査した。その結果、元記事にたどり着けたのは、20件中5件 25%であった。多くの記事は、404 Not Found になっていた。
公共財であるならば、透明性を高めるべきではないか?
新聞に関しては、消費税を8%に据え置くという低減税率導入の際に、新聞協会はこのように述べた。
「軽減税率で新聞協会が見解 - 公共財として責務果たす」と。
軽減税率で新聞協会が見解 - 公共財として責務果たすhttps://t.co/0OVdvIuvLE
— 共同通信公式 (@kyodo_official) 2019年9月30日
何かとマスコミに叩かれがちな政府や議員は、それでも公共財としての責務を果たしている(書類を捨てたりとか残念な点も多いが)。
彼らの発言は全て公開され全文を検索できるし、APIを通して利用できる。
この公開された議事のデータをAPIを使って、国会議員がどのような発言をしたかを俯瞰できる 国会採掘 という素晴らしいサイトも生まれた。
紹介はこちらが詳しい。
マスコミは、公共財としてこのようなデータを提供しているだろうか?日頃マスコミは、「政府や議員が透明性が無い、情報公開出来ていない」と批判するが、彼らは公共財として過去の記事にどれだけアクセスしやすくしているだろうか?政府や議員は権力者なりに、過去の発言を公開しそれにより歴史の審判を受ける。マスコミも権力者だ。過去の記事へアクセスしやすくすることで、過去の論調や判断に誤りがなかった常に確認される必要があるのではないか?
今度消費税が上がる際も、新聞は低減税率の適応を要求するだろう。その際は、低減税率の適応の条件に、過去記事のパブリックドメイン化を義務付けてはどうだろうか?2
取得マスコミアカウント
以下のマスコミのtweetを取得した。大手新聞5紙、通信社2社、NHK,webからハフポストを選択した。 フォロワーが、30万以上おり、累計で20万以上ツイートしているメディアを選んだ。
日本メディア
メディア名 | screen_name | 開始日 | ツイート数 | フォロー数 |
---|---|---|---|---|
NHK | nhk_news | 2010年10月 | 52万 | 306万 |
朝日新聞 | asahi | 2009年5月 | 32.8万 | 128万 |
朝日新聞デジタル | asahicom | 2009年6月 | 5.3万 | 6.1万 |
読売オンライン | Yomiuri_Online | 2010年1月 | 21万 | 76.9万 |
共同通信 | kyodo_official | 2013年3月 | 41.5万 | 427.2万 |
日経 | nikkei | 2010年7月 | 29.1万 | 319.6万 |
産経 | Sankei_news | 2012年4月 | 21.4万 | 55.8万 |
時事通信 | jijicom | 2010年5月 | 56.8万 | 24.5万 |
毎日新聞 | mainichi | 2009年6月 | 34.1万 | 91万 |
毎日新聞ニュース | mainichijpnews | 2009年6月 | 32万 | 39.7万 |
ハフポスト日本版 | HuffPostJapan | 2012年12月 | 23.4万 | 33.9万 |
米メディア
以下のマスコミのツイートを取得した。 アメリカのニュースメディアは詳しくないので、次のwikiを参照にした。
メディア名 | screen_name | 開始日 | ツイート数 | フォロー数 |
---|---|---|---|---|
ワシントン・ポスト | washingtonpost | 2007年3月 | 38万 | 1738万 |
ニューヨークタイムス | nytimes | 2007年3月 | 42万 | 4905万 |
フォックス・ニュース | FoxNews | 2007年3月 | 42万 | 2012万 |
ハフポスト | HuffPost | 2008年8月 | 57万 | 1146万 |
WSJ | WSJ | 2007年4月 | 35万 | 1904万 |
USA Today | USATODAY | 2008年8月 | 35万 | 444.2万 |
ABC news | ABC | 2009年4月 | 36万 | 1684万 |
CBS news | CBSNews | 2008年6月 | 31.1万 | 823万 |
まとめ
マスコミの過去ツイートから、その当時の論調や言及頻度を検索できる、マスコミツイート横断比較 というサイトを作った。作った背景は、マスコミが過去どのような論調であったかを検証しにくいため、それを少しでもやりやすくするためである。
再度、冒頭に述べたことを繰り返す。
- 権力者は、透明化を進め情報を公開すべきだ
- マスコミは権力者だ
- マスコミは、透明化を進め情報を公開すべきだ
権力者が、情報を公開することは素晴らしい。そして権力者にマスコミも含まれるのだ。
技術要素
技術要素は、以下
- mysql 全文検索エンジン mroonga:mysql-8.0-latest
- redis
- web フレームワーク flask
- 統計:pandas
- 可視化:plotly
- 形態素解析:mecab
- 形態素解析:mecab-ipadic-neologd
著作権
私はこのサイトを作りたいわけではない。マスコミ各社が共同で横断記事検索APIや上記のような可視化ツールを提供してくれるなら、このサイトを閉じたい。収益が上る見込みもなくサーバ代だけがかかる。しかし、待っていても誰もやらなそうなのでやってみることにした。
上に挙げた、国会採掘 の場合国会議員の発言に著作権は無い。そのため 国会採掘のようなサイトが作りやすい3。一方、メディア各社のツイートは著作物のため、著作権の扱いは難しい。このようなサイトをつくらなければこのように悩まなくて良い。しかしそれだと、市民がマスコミがどのように権力奮ったか(どのような論調で世論を作ったか)を知ることが出来ない。
各ツイートの著作権に関しては、記事の件数のグラフ化やワードクラウド、頻出語の抽出は、電子計算機による情報解析のための複製等の範囲に入るように思われる。 ツイート一覧は、情報処理の結果提供に付随する軽微利用ではないかと考える(マスコミ各社のツイートを横断で一覧できることで、新たな知見が得られるため)。
先の山口氏のブログで、聞蔵 https://database.asahi.com/index.shtmlや 中日新聞記事 https://business.nifty.com/gsh/QCNK/ 、 ヨミダス歴史館 https://database.yomiuri.co.jp/about/rekishikan/ を挙げているが、それらのサイトが上記の機能を取り入れてくれるとありがたい。
- コトバンクより 権力(けんりょく)とは? 意味や使い方 - コトバンク↩
- 公共財と言うと、私はパブリックドメインを思い出す。パブリックドメインはまさに著作物を、公共財することだ パブリック・ドメイン(ぱぶりっくどめいん)とは? 意味や使い方 - コトバンク↩
- 国会採掘とは別だが、最近は 各党の政治資金の流れをデータベース化する 政治資金データベース などがつくられた。↩