編集部イチオシ

トランプ大統領ツイートの統計的解析

トランプ大統領(@realDonaldTrump)のツイートを、時間、投稿に用いたクライアント、用いられている単語によって解析しました。結論として1)用いているクライアントに明らかな時間的な偏りが見られること、2)単語によって、マシンによる使用頻度の強い偏りが観測されること。一般的傾向として、Offensiveな単語は早朝のAndroidで発されると言える。
66
Galactica Magnum @Ranger_Oops

@TomoMachi @TrinityNYC @KS_1013 @kiichiro トランプ大統領のツイートを解析してみたところ、なかなか興味深いことが分かりましたのでご報告。 pic.twitter.com/UTJ1cMcFLS

2017-02-20 23:16:12
拡大
Galactica Magnum @Ranger_Oops

@TomoMachi @TrinityNYC @KS_1013 @kiichiro dev.twitter.com/docs を見れば詳しく書いていますが、Twitterはその内容だけじゃなくて、書かれた時刻や書いたクライアント(マシン)も保存されています。

2017-02-20 23:17:10
Galactica Magnum @Ranger_Oops

@TomoMachi @TrinityNYC @KS_1013 @kiichiro その内容を読み取って解析するプログラムを書けば、公開されている情報だけで、何時にどのような内容をどのマシンでTweetしたのかを知ることができます。

2017-02-20 23:17:58
Galactica Magnum @Ranger_Oops

@TomoMachi @TrinityNYC @KS_1013 @kiichiro で、結果がこの通り(詳細再掲)です。この図は大統領就任以来のこの1か月で、何時にどのマシーンを使っていくつTweetしたかを示しています。 pic.twitter.com/NfRA1wv1mW

2017-02-20 23:19:17
拡大
Galactica Magnum @Ranger_Oops

@TomoMachi @TrinityNYC @KS_1013 @kiichiro 実際にはもう少したくさんの種類を使っていますが、個数が少ないので無視しています。まず、6時ごろ起きてから猛然とアンドロイドを使って書き込みをしていることが一番上の図で分かります。

2017-02-20 23:20:06
Galactica Magnum @Ranger_Oops

@TomoMachi @TrinityNYC @KS_1013 @kiichiro で、9時ごろから夕方は数は少ないもののコンスタントにiPhoneを用いたTweetがおこなれていることが中段の図で分かります。夜間は両方で書かれています。PCはほとんど使われていません。 pic.twitter.com/K8v9QqzU1U

2017-02-20 23:21:14
拡大
Galactica Magnum @Ranger_Oops

@TomoMachi @TrinityNYC @KS_1013 @kiichiro そして、tweetで使われた言葉を、言語学でよく用いられているライブラリ(nltk)を用いて解析したみたのがこの図です。 pic.twitter.com/uDQ2IS4JNj

2017-02-20 23:22:03
拡大
Galactica Magnum @Ranger_Oops

TomoMachi @TrinityNYC @KS_1013 @kiichiro ここでは、適当に選んだ単語を含むTweetが、AndroidとiPhoneのどのマシンでTweetされたかの比を示しています。驚いたことに、明白な不均一が見られます。 pic.twitter.com/TZA0PqilLW

2017-02-20 23:22:56
拡大
Galactica Magnum @Ranger_Oops

(もう@は外して)"fake"や"news"は、圧倒的にAndroidで発せられています。ここでは発話時間の解析はしていませんが(プログラム書けば簡単にできます)、先の図と比較すれば、これらが朝一番の時間に発せられているものが多いと言っていいでしょう。

2017-02-20 23:23:50
Galactica Magnum @Ranger_Oops

ただ、これはサンプリング数がそれほど多いとは言えないので、念のため取得できる全てのTweetで同じ解析を試みたのがこれです。"again"の傾向が逆転するなど、ばらつきが見られますが、去年からの3240個のTweetでおおむね同様の傾向が観察されています。 pic.twitter.com/BNUhp8XJkz

2017-02-20 23:26:16
拡大
Galactica Magnum @Ranger_Oops

つまり、Androidは朝に攻撃的なTweetを、iPhoneは昼に比較的穏当なTweetを、するのに用いられていると言っていいでしょう。なぜでしょうか。二つの仮説が考えられます。

2017-02-20 23:26:34
Galactica Magnum @Ranger_Oops

一つは、同じアカウントを用いて別人が別の機種でTweetしていること。もう一つは、トランプ大統領の精神状態は非常に不安定であり、体のバイオリズムによって性格も変わってしまっている、というものです。データの統計誤差範囲の見積もりなどがまだ甘いことは否めませんし、これ以上は・・・

2017-02-20 23:27:09
Galactica Magnum @Ranger_Oops

@TomoMachi @TrinityNYC @KS_1013 @kiichiro なお、「この単語では」「このような解析は可能か」など、ご要望がありましたら言っていただければプログラムを検討します。なお、私の本職は物理学であり、言語処理などは素人であることはお含みおきください。

2017-02-20 23:27:59