オタクと気持ち悪いという言葉

概要

  • Twitter上で「気持ち悪い」、「キモイ」という言葉が、どのように使われてるかと調査した。
  • 調査対象は、キモイ、気持ち悪いという言葉を含むtweet、約28万件
  • 時系列の変化を見るため、2018年と2019年で調査を行った
  • 気持ち悪いと言う言葉は、オタクへの言及とともに使われている
  • オタクを含んだtweetは、28万件中、14431件あった

調査結果

2018年調査

f:id:shioshio3:20191030005606p:plain
2018年に投稿されたツイート調査

調査期間 2018/01/09 - 2018/12/31
tweetソース元 Sample realtime Tweets API

2019年調査

f:id:shioshio3:20191030010712p:plain
2019年に投稿されたツィート調査

調査期間 2019/01/01- 2019/10/20
tweetソース元 Sample realtime Tweets API

気持ち悪いという言葉の特徴

  • 気持ち悪いという単語は、他者を侮蔑する意味と、身体的な感覚を表す言葉として使われる。
  • 身体的な感覚としては、赤い丸(寝る、頭、食べる)などと使われる。
  • 他人を侮蔑する表現としては、オタク、顔等の言葉として使われる。
  • 女、女の子、可愛いという言葉は、それ自体がキモイという意味ではなく、それを対象にすることがキモイと言う意味で使われる。

  • 用例として「あのオタク、可愛い女の子を見ていた、気持ち悪い」という表現が挙げられる。

属性や生物に対する言及

  • オタク以外の他の属性に関する「気持ち悪い」という言及は少なかった。外国人で、68件だった。
  • 虫に関する言及は、 684件だった。
  • 1万を超える属性への言及は、オタクのみだった

ハラスメントではないか?

  • ハラスメントとは、「他者に対する発言・行動等が本人の意図には関係なく、相手を不快にさせたり、尊厳を傷つけたり、不利益を与えたり、脅威を与えること」を言う。大阪医科大学
  • オタクは出身国や人種性別と言った変えられない属性ではないが、簡単に変えられる属性でもない。そのような属性に対して、人格を否定するようなtweetをするのは、ハラスメントといえるだろう。

調査を終えて

  • なんの気なしに、twitter上で、キモイとか気持ち悪いという用法がどのように使われるか調べようと考えた。調べてみたら、想定以上に、キモい、気持ち悪いという言葉は、オタクと結びつくワードになっていた。

以下、再現手法

  • これは社会調査なので、再現できることが重要だ。

次の方法で再現できる。

tweetの取得

twitter社は、投稿される全tweetのサンプルを提供している。 Sample stream — Twitter Developers

こちらを取得する。一年間で大体、2-3億ツイートが取得できる

キモイ、気持ち悪いという言葉を含むtweetの抽出

上記で取得したtweetBigQueryもしくは、Redshiftへ入れる。その後、キモい、気持ち悪いという言葉を含むtweetを抽出する。

私は、BigQuery上での次のSQLを実行した。

select id,created_at,text
from twitter.tweet
where
(text like "%キモイ%")
or
(text like "%キモい%")
or
(text like "%きもい%")
or
(text like "%気持ちわるい%")
or
(text like "%気持ちがわるい%")
or
(text like "%気持ち悪い%")
or
(text like "%気持ちが悪い%")

抽出したtweetをKH coderで分析し、共起ネットワークを描画する

  • 抽出したテキストは、2018年、2019年で分けた(それ以前はtweetを取得していない)。ハッシュタグ、RTでの個人への返信、URLは分析の邪魔になるので削除する。また、同一の内容を連投するボットがいるので、同じ内容のテキストは一つにまとめる。
  • kh coderを利用して、テキストを読み込む。
  • kh coderでテキストは、単語に分割する(形態素解析と呼ばれる)。 MeCab を利用して単語に分割する。 SNSの分析は新語やジャーゴンが多いので、neologd を利用して、単語に分割する。
  • kh-coderのメインメニューから、ツール->共起ネットワーク を利用して単語を描画する。

f:id:shioshio3:20191030014727p:plain
kh-coderを利用した共起ネットワークの描画

パラメータは、描画する単語は、100から120前後、関連するedgeは500程度、強い共起関係ほど濃い線に指定するときれいに描画されると感じている。