2018年10月28日

自分のツイートをテキストマイニングして一人反省会をする

38
マイコー @mjackson0625

自分のtweetの傾向を分析して悪い癖があれば直さなきゃ。【Twitterで自分が普段どういった発言をよくしているのかが露骨にわかる「テキストマイニング」ツールの使い方】 gigazine.net/news/20150717-…

2015-07-17 23:43:42
KH Coder @khcoder

「KH Coder開発者が【すごいと思った分析事例】のご紹介」 togetter.com/li/1197725 まだ2事例ですがtogetterにまとめました。 #すごいと思った分析事例

2018-02-09 18:17:00
kampfer @kampfer2009

「togetterユーザ動向をちょっと調べてみた」をトゥギャりました。 togetter.com/li/1207544

2018-03-11 20:15:33
Togetter公式🐤人気のツイートまとめを紹介🐤 @togetter_jp

「「テキストマイニングによるTwitter個人アカウントの性格推定」反応まとめ in PyConJP2018」togetter.com/li/1281224 が伸びてるみたい。いま話題みたいですよ? 作成者:@jumpyoshim

2018-10-27 09:45:07
サンセット @Sunset_Yuhi

前々から気になってたKH Coderを触ってみる。夏目漱石の『こころ』で、「先生の自殺は突然で不自然」という批判はもっともか、テキスト分析から考える。 khcoder.net/kh_tuto.html 文章単位で見た時、「人の死」に関する語句は上・中でも多くあるけど、下ではラストになって急増pic.twitter.com/C31ZRDlWvI

2018-10-27 15:36:34
拡大
サンセット @Sunset_Yuhi

「人の死に関する語句は上・中でも多くある」ことに注目すれば、先生の死は特に不自然でないと言えるかもしれない。とはいえ、下のラストで急に死の話題が増えてるようにも見えなくはない。先生の死因が読み解き対象になる理由が分かる気がした。

2018-10-27 15:43:53
サンセット @Sunset_Yuhi

このチュートリアルだと、『こころ』の文章をあらかじめリスト化したファイルが用意されてるけど、他の文章でやろうとすると工夫が必要そう。 Twitterの分析をする場合、ツイートはリスト化されてるからいいけど、@やRTがついたツイートをどう扱うかが考え所だなあ。

2018-10-27 15:56:41
サンセット @Sunset_Yuhi

自分のツイートをテキストマイニングして、静かに自省するの巻。左が多次元尺度法、右が共起ネットワークの図で、どちらも出現パターンの類似性を見る図らしい。 pic.twitter.com/d5mWwnut6s

2018-10-27 21:10:31
拡大
拡大
サンセット @Sunset_Yuhi

「T」「CO」「https」「RT」が多いのは、リンク付きツイートをよくRTしてるということだと思うんだが、そこから派生して「Blender」「機能」が続いている。 これはBlenderで何かしたいと思いつつ、ネット記事を読んだり機能を確認するだけで、特に何もしてない状況を示してるように見えますね(真顔)

2018-10-27 22:12:21
サンセット @Sunset_Yuhi

上位の頻出語で、「自分」に絡めて「思う」「言う」「見る」「分かる」「考える」「使う」「作る」「出る」という動詞があるけど、これらは共起する割合も高い。 元の文章を見た感じ、「思う」が多いのは断定口調を避けるため、「言う」が多いのは「世間で言う○○」みたいな伝聞で使うため、かなあ。

2018-10-27 23:19:54
サンセット @Sunset_Yuhi

「映画」の出現回数も多いけど、「世界」「片隅」「片渕」があるのは『この世界の片隅に』の影響か。 「家族」は『万引き家族』関連っぽいけど、「万引き」は出現回数が100未満で図には現れず。 『ズートピア』も割と呟いてたけど図では現れなかった。

2018-10-27 23:28:13
サンセット @Sunset_Yuhi

「要素」「方程式」「プログラム」「計算」「Python」が連なってるのは有限要素法関連だな。 「D」と「モデル」の繋がりは、数学やCGとかで3Dモデルの話が多いためらしい。 「Processing」は比較的着実に「プログラム」を作ってる一方、「Python」はどうすれば「使える」か苦悩してるのが分かった。 pic.twitter.com/xyvY8Dt8Dy

2018-10-27 23:51:52
拡大
サンセット @Sunset_Yuhi

「現象」に連なって「現代」「経験」「哲学」「説明」「存在」「価値」「読む」があるのは『WM現代現象学』関連の話だな。 ただし、「現象」に関する文章を見たら、物理現象や社会現象に関するツイートも多かった。 「科学」という語句は、技術的な話題よりも哲学的な話題で使ってる傾向があった。

2018-10-28 01:45:11
サンセット @Sunset_Yuhi

共起ネットワークが面白いのでやり直し。さっきは100回以上出現・上位150の共起関係を描画したけど、80回以上・係数0.055以上でやってみた。頭の中を覗かれてるみたいでゾクッとしたpic.twitter.com/jHx8DdSAnY

2018-10-28 01:51:14
拡大
サンセット @Sunset_Yuhi

「ニュース」「Y」「X」が直線的に連なってるけど、「Y」と「ニュース」はヤフーニュース由来「Y」と「X」はy=f(x)みたいな数式由来の関係だった。なので「X」と「ニュース」の関係は薄い。 あと図には現れてないけど、「探索」という語句が「プログラム」と「手」との関わりで強かった。

2018-10-28 02:04:15
サンセット @Sunset_Yuhi

「時代」「来る」の関係は、「ついにこの時代が来たか!」の場合と「こんな時代来たら嫌だなあ」の場合があった。あと今更だけど、RTも含めて分析してるので多少ごちゃ混ぜになってる。 「言える」と「理由」の関係は、巷の意見に対する「○○と言える理由は何なんだ」という愚痴が影響してるっぽい。

2018-10-28 02:20:30
サンセット @Sunset_Yuhi

ちなみに、@以下のアカウント名はネットワークから除外した。あと、URLの文字を結構拾ってくるので、PとかKみたいな単語も適宜ネットワークから除外した。 実を言うと、ネットワークにある「Y」や「X」も結構その辺が混ざっている。なので共起関係を見るには良いけど、出現回数はあてにならないかも。

2018-10-28 02:53:34
サンセット @Sunset_Yuhi

再び調整。URLに使う「T」「CO」を消し、抽出できてなかった「3D」を強制抽出。 「3D」と「CG」の共起関係がはっきり表れ、「Blender」とも結びついて大きなクラスターになった。 青緑は「技術・創作」、紫は「映画」、黄色は「意見」、赤は「思想・哲学」、という感じ? 綺麗に分類してくれた。 pic.twitter.com/m13cqBrNJK

2018-10-28 17:37:41
拡大
上ノ原秀晃 / UENOHARA Hideaki @hideakiuenohara

自分のツイートの解析なんて怖くてできない。 自分のツイートをテキストマイニングして一人反省会をする togetter.com/li/1282024 @togetter_jpさんから

2018-10-28 21:38:35
Togetter公式🐤人気のツイートまとめを紹介🐤 @togetter_jp

「自分のツイートをテキストマイニングして一人反省会をする」togetter.com/li/1282024 が伸びてるみたい。みんなに届けぇ〜 作成者:@Sunset_Yuhi

2018-10-29 08:14:04
null @langstat

自分のツイートをテキストマイニングして一人反省会をする - Togetter togetter.com/li/1282024

2018-10-29 08:32:03
サンセット @Sunset_Yuhi

Personality Insights …sonality-insights-demo.ng.bluemix.net/?source=myself ツイートから性格推定できるIBMのサービス。「6000単語以上あるから統計的にも有意な結果です」とかマウント取ってくるぞ~。こわ~い。 pic.twitter.com/OxklvB8G50

2018-10-29 21:45:01
拡大
拡大
サンセット @Sunset_Yuhi

鋭敏で、自説を曲げず、哲学的で、探求することを好み、自分本位で、感情移入しやすく、人に同情する。組織への帰属を意識して意思決定する。伝統には拘らず、自主性を重んじつつ、自分で目標を設定する。 共存しそうにないタイプがいくつか共存していてクレイジーですね。

2018-10-29 21:56:30
サンセット @Sunset_Yuhi

INTJ型「独創的なアイデアマン」の性格-16タイプ性格診断 motivation-up.com/whats/16_intj.… 自分のアイデアを言わないのは説明するのが面倒な時だなあ。だからTwitterにメモしてる。パーソナリティーの研究ってどういうことしてんだろ。

2018-11-29 15:09:30
ふみすむ @Fumisme

@Sunset_Yuhi MBTIの性格診断だとそれになるのか いろいろ納得した

2018-11-29 23:53:11
残りを読む(4)

コメント

Yeme @yer_meme 2018年10月28日
面白いっスね。自己を省みるのに使えそうっス
5
@mouth0717 2018年10月28日
面白いけど気分が鬱のときにこれやると病みが加速しそう。それとも案外自分を客観視できていいのかな。
3
廣瀬 健 @hirokenP3 2018年10月29日
ついったはSNSとはいっても独り言的に使うものだし、相手が実在かどうかはそう問題にならない。人によって深浅の差はあるけど、自己分析しているようなもんだね。
0
kartis56 @kartis56 2018年10月29日
先にノイズ除去したほうがいいんじゃ
1