【KH Coder】『社会調査のための計量テキスト分析』ご紹介【フリーのテキストマイニング】

KH Coderの本、『社会調査のための計量テキスト分析』(樋口耕一著, 2014, ナカニシヤ出版, http://amzn.to/1kJGVh5)のご紹介です。計量テキスト分析のためのフリーソフトウェア「KH Coder」についてはこちら: http://khc.sourceforge.net/
10
KH Coder @khcoder

#KHCoderの本、『社会調査のための計量テキスト分析』 amzn.to/1kJGVh5 の内容を章ごとにご紹介しています。数日に1章くらいのペースが目標です。宣伝の意味合いもありますが、読解のヒントにもしていただければ幸いです。(博士論文ベースの専門書ですので)

2014-06-11 13:30:47
KH Coder @khcoder

#KHCoderの本 第1章では、計量テキスト分析に対する「数値にすると文章の微妙なニュアンスが失われるのでは?」「統計に頼らず、人間がもとの文章を見て考えた方が『深い』分析ができるのでは?」「単に客観的になるだけ?」「本当にメリットあるの?」といった疑問に答えようとしています。

2014-06-08 22:42:25
KH Coder @khcoder

そのためには「内容分析」の方法を参考にしています。内容分析は新聞の部数が伸びた頃あたりから、メディア報道の分析等、いろいろな用途で活発に使用されてきました。また方法について様々に議論されてきました。その蓄積に依拠しつつ「計量テキスト分析」を提案しています。 #KHCoderの本

2014-06-08 22:52:52
KH Coder @khcoder

(順番が前後してしまいましたが)第1章のタイトルは「内容分析から計量テキスト分析へ――継承と発展を目指して」です。 #KHCoderの本

2014-06-09 01:59:54
KH Coder @khcoder

#KHCoderの本 第1章は考え方がメインでしたが、第2章「計量的分析の新たなアプローチ――2つのアプローチの峻別と接合から」は、具体的な手順の章です。「自動要約」ではなく「分析」ですから、人間の目の付け所ないしは独自の観点を活かしつつも、信頼性を保つというバランスが大切です。

2014-06-11 13:28:38
KH Coder @khcoder

このバランスをとるために、独自の観点を活かすコーディングと、自動処理(自然言語処理+多変量解析)を組み合わせる手順を提案します。「どこまでコンピュータに任せてしまうのか?」「人間が判断するのははどの部分か?」という問いに、具体的な手順から答えます。 #KHCoderの本

2014-06-11 13:28:47
KH Coder @khcoder

#KHCoderの本第3章「新たなアプローチによる分析の手順と実際」は、ぜひ同じ操作を行いながらお読みください。必要なデータ、漱石「こころ」はKH Coderに同梱しています。「こころ」の鑑賞を深めつつ、計量テキスト分析とKH Coderの利点を体感していただければと存じます。

2014-06-13 16:02:16
KH Coder @khcoder

→操作の内容についてはスライド版チュートリアルとほぼ同じです。 khc.sourceforge.net/kh_tuto.html ですが本の方では、操作の意味分析結果の読み取り方などについて、より詳しく記載しています。手を動かして結果を見ながら読むことで理解が深まるでしょう。 #KHCoderの本

2014-06-13 16:02:54
KH Coder @khcoder

#KHCoderの本第4章では「KH Coderを使っても、昔ながらの手作業と、ちゃんと同じ結果になるのか?」「昔から重視されてきたデータである新聞記事もちゃんと分析できるか?」といった疑問に答えようとしています。言わば「互換性」、それも「後方互換性」を確認する章です。→

2014-06-18 11:35:05
KH Coder @khcoder

→章のタイトルも「手作業による伝統的な方法との比較――新聞記事の分析結果から」です。結果としておおむね「互換性」が確認されるのですが、KH Coderによるコンピュータコーディングでは、数字の出方に少し癖があるというか、留意点があることも分かります。 #KHCoderの本

2014-06-18 11:40:11
KH Coder @khcoder

→また、新聞記事データを分析するときには、どうやってデータを収集すべきかという点についても、ささやかではありますが発見がありました。第4章では、ただ単に互換性を確認したというだけでなく、これらのExtraな収穫もあったのではないかと思います。 #KHCoderの本

2014-06-18 11:45:12
KH Coder @khcoder

#KHCoderの本第5章の問いは「新聞の内容分析で何が分かるのか?」です。新聞社の方針が分かるだけでしょうか? それとも日本の社会で共有されている考え方やイメージを、すなわち社会意識を、新聞から取り出せるのでしょうか? 言わば、新聞の「データとしての価値」を確認します。→

2014-06-25 19:45:29
KH Coder @khcoder

→この問いに答えるために、全国紙の内容分析の結果と、全国アンケートの結果とを突き合わせました。結論として、ある程度までは社会意識を探ることができるようです。ただ、一部のキーワードは新聞に頻出しても、社会意識では影が薄いという、注意が必要な点もありました。 #KHCoderの本

2014-06-25 19:45:56
KH Coder @khcoder

→この第5章のタイトルは「現代における全国紙の内容分析の有効性――社会意識の探索はどこまで可能か」です。4~5章では、重要な分析対象として新聞記事にフォーカスしました。次の第6章では、同じく大切な分析対象データとして、アンケートの自由記述に注目します。 #KHCoderの本

2014-06-25 19:46:12
KH Coder @khcoder

#KHCoderの本第6章ではアンケートに自由回答型の質問を入れるメリットを、例題的な分析ではなく、完結した研究事例から示そうとしています。普通の選択肢型の質問を使った分析と、自由回答を通じての、言わばマイクロ・インタビューとの連携によって、アンケートの可能性が広がります。

2014-07-17 22:08:27
KH Coder @khcoder

研究事例の中では、選択肢型の質問の分析から、学歴が高い人ほどウェブを使い始めるのが早いことが分かります。それはなぜか?という部分で自由回答の分析が役立ちます。はたして「高学歴の人は情報の重要性に気づきやすい」という理論を裏付けるような分析結果は得られるのか。 #KHCoderの本

2014-07-17 22:08:53
KH Coder @khcoder

また、ウェブのような新しいものを使うかどうかという選択は、お金の有無によってどれくらい制約を受けているのか。こうした問いに答えようとする分析事例です。この第6章のタイトルは「情報化イノベーションの採用と富の有無 ―自由回答データを用いた分析事例―」です。 #KHCoderの本

2014-07-17 22:09:24
KH Coder @khcoder

#KHCoderの本第7章は最後のまとめの章です。計量テキスト分析は、これからの社会調査にこんなふうにも役立つんじゃないかという夢を書き綴っています。本書で実際に取り組めたこと以外にも、いろいろ使い道があるのではないかなと。皆さまの活用のヒントにしていただければ幸いです。→

2014-08-09 17:03:44
KH Coder @khcoder

→第7章ではもう1つ、今後の課題も挙げています。「人文社会系の研究者はこんな技術的問題で困ってます」という課題です。もし理系/情報系/統計数理系でテキストマイニングにご関心おありの方に、研究テーマとして拾い上げて、解決していただければ万々歳です。【少し訂正】 #KHCoderの本

2014-08-09 17:36:13
KH Coder @khcoder

#KHCoderの本資料AはKH Coderのリファレンス・マニュアルです。B5サイズできちんと製本されているので、PCを操作しながらでもページをめくりやすいでしょう。PC画面の一角を占領してしまうこともないので、PC画面はすべてソフト操作に使えます。→

2015-05-05 22:02:33
KH Coder @khcoder

→それぞれの機能を利用する時に、詳しいこと、細かなことが気になった時にページをめくってみてください。詳細な情報を盛り込んでいるので、ページ数は1章~7章を合わせたくらいあります。KH Coderが内部でどんな処理をしているかという点にも踏み込んでいます。 #KHCoderの本

2015-05-05 22:02:51
KH Coder @khcoder

#KHCoderの本資料BKH Coderの使用条件とその考え方」には、KH Coderが「無料ソフトウェア」というよりは「自由ソフトウェア」であることを書いています。研究論文と同じように、誰でも自由に読んだり、引用したり、改良を加えたりできるソフトウェアです。→

2015-06-07 23:24:09
KH Coder @khcoder

→そうした自由ソフトウェアと学術研究の相性や、人文社会系研究者によるソフトウェア開発の意義について、私の考えを書きました。またライセンスの全文(GPL和訳)も掲載してます。最後に、「KH Coder」という名称の由来が気になる方は「あとがき」をご参照ください。#KHCoderの本

2015-06-07 23:24:30
KH Coder @khcoder

『理論と方法』(数理社会学会機関誌)の最新号・29巻2号/通算56号に #KHCoderの本 の書評が掲載されました。丁寧で温かい書評に涙が…。お隣には『M-PlusとRによる構造方程式モデリング入門』の書評も。 pic.twitter.com/382tr7WPve

2014-12-22 20:49:46
拡大
KH Coder @khcoder

『選挙研究』30(2)には、KH Coderをお使いいただいた上ノ原先生のご研究に加えて、#KHCoderの本 『社会調査のための計量テキスト分析』 amazon.co.jp/gp/product/477… の書評も掲載! pic.twitter.com/fuzz2YoQoE

2015-01-21 19:02:39
拡大