『Rによるやさしいテキストマイニング[活用事例編]』の内容紹介(画像多数)

小林雄一郎 (2018). 『Rによるやさしいテキストマイニング[活用事例編]』 オーム社. https://www.ohmsha.co.jp/book/9784274222771/
1
langstat @langstat

小林雄一郎 (in press). 『Rによるやさしいテキストマイニング [活用事例編]』オーム社. ohmsha.co.jp/book/978427422… amazon.co.jp/dp/4274222772 今回は、様々な「実データ」を前処理から結果の解釈までの全てを省略せずに説明する活用事例編です。全ての分析データを公開予定。#やさテキ #rstatsj #TokyoR

2018-09-13 18:14:07
langstat @langstat

(承前)小林雄一郎 (in press). 『Rによるやさしいテキストマイニング [活用事例編]』オーム社.   本書の特徴や目次などは、こちら ohmsha.co.jp/book/978427422… をご参照ください。詳しい内容なども、近日中に少しずつツイートします。 #やさテキ #テキストマイニング #rstatsj #TokyoR pic.twitter.com/cFK7sNEWb6

2018-09-13 18:16:59
拡大
拡大
拡大
langstat @langstat

『Rによるやさしいテキストマイニング [活用事例編]』は、「R本」というより、全ての分析データ(=テキストデータ)とコードが付属した「テキストマイニング分析事例集」という感じです。実データの解析がメインなので、非常に楽しく書けました。 #やさテキ #テキストマイニング #rstatsj #TokyoR twitter.com/langstat/statu…

2018-09-13 18:20:19
langstat @langstat

小林雄一郎 (in press). 『Rによるやさしいテキストマイニング [活用事例編]』オーム社. shop.ohmsha.co.jp/shopdetail/000… 10月25日発売予定。オーム社ウェブサイト(上記リンク)で予約受付中です。テキストマイニングやコーパス言語学、自然言語処理にご関心のある方は是非!

2018-09-13 21:29:57
langstat @langstat

小林雄一郎 (in press). 『Rによるやさしいテキストマイニング [活用事例編]』オーム社. ohmsha.co.jp/book/978427422… amazon.co.jp/dp/4274222772 現時点では、Amazonに「10月26日発売」とありますが、正しくは「10月6日発売」だそうです(担当編集者より連絡あり)。 #やさテキ #rstatsj #TokyoR

2018-09-14 10:38:07
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』という本を刊行します - langstat blog langstat.hatenablog.com/entry/20180919… 豊富な分析事例を用いて、実務や研究で使える「分析のひな形」を提示。特に「テキストマイニングのレポートを限られた時間で執筆しないといけない方にオススメ。 #rstatsj #TokyoR

2018-09-19 12:39:02
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』 amazon.co.jp/R%E3%81%AB%E3%… の第1章「Rによるテキストマイニング」では、読者が自分自身の分析を始めるにあたって参考になる情報を紹介。また、具体的な分析計画を立てて、分析結果をレポートにまとめる方法について解説。 #やさテキ pic.twitter.com/PoOdh0SLMJ

2018-09-19 12:49:57
拡大
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』 amazon.co.jp/R%E3%81%AB%E3%… の第2章「Rの活用」では、データの読み込み、前処理、可視化、テキスト処理などの実践的な方法を説明。主に、dplyrやggplot2を用いた「モダンな」データ処理を紹介。 #やさテキ pic.twitter.com/pWyy2mBRtR

2018-09-19 12:54:19
拡大
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』 amazon.co.jp/R%E3%81%AB%E3%… の第3章「授業評価アンケートの分析」では、テキストマイニングの技法を用いた自由記述の分析事例を紹介。本章で紹介する手法は、マーケティングや業務改善などに取り組むビジネスパーソンにもオススメです。 #やさテキ pic.twitter.com/NCLkC42X71

2018-09-19 13:17:54
拡大
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』 amazon.co.jp/R%E3%81%AB%E3%… の第4章「オンラインレビューを用いたクチコミ分析」では、インターネット上にある膨大な顧客の声を「見える化」し、商品やサービスの改善に役立つヒントや気づきを得るための方法を紹介。 #やさテキ pic.twitter.com/oxIy1OrF3L

2018-09-19 13:18:52
拡大
拡大
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』 amazon.co.jp/R%E3%81%AB%E3%… の第5章「スクレイピングによる特徴語抽出」では、インターネットからテキストをダウンロードし、テキストごとに特徴語を抽出。具体的には、RとPythonについての記事で使われている単語を統計的に比較。 #やさテキ pic.twitter.com/Ky50gJo1w6

2018-09-19 13:19:18
拡大
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』 amazon.co.jp/R%E3%81%AB%E3%… … の第6章「Twitterにおける話題と感情の抽出」では、首相官邸が発信するツイートを分析対象に、ツイート数の分析、話題の抽出、感情分析などを実行する方法を紹介。流行の把握やクチコミ分析などに応用可能。#やさテキ pic.twitter.com/hGRhXrLJLW

2018-09-19 13:28:38
拡大
拡大
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』 amazon.co.jp/R%E3%81%AB%E3%… の第7章「警察白書のトピック分析」では、トピックモデル(潜在的ディリクレ配分法)で白書に含まれるトピックを推定し、テキスト中のトピック比率に基づいて白書のクラスタリングする方法を紹介。 #やさテキ pic.twitter.com/EMb3xeRfUp

2018-09-19 13:31:04
拡大
拡大
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』 amazon.co.jp/R%E3%81%AB%E3%… の第8章「文学作品の著者推定」では、テキストの著者推定を行う方法を紹介。スパムメールの自動判別、小論文の自動評価、犯行声明文や遺書の著者推定など、数多くのタスクに応用可能。 #やさテキ pic.twitter.com/qEXKyKpChs

2018-09-19 13:36:33
拡大
拡大
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』 amazon.co.jp/R%E3%81%AB%E3%… の第9章「政治演説の言語分析」では、ドナルド・トランプとヒラリー・クリントンの演説を用いて、リーダビリティや語彙多様性の分析、感情分析などの方法を紹介。 #やさテキ pic.twitter.com/LOSyG5pAxw

2018-09-19 13:44:05
拡大
拡大
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』 amazon.co.jp/R%E3%81%AB%E3%… の第10章「文学テキストの類型化」では、アイルランド人作家(ジェイムズ・ジョイス)によって書かれた短編小説集を対象に、階層型クラスター分析と対応分析などを用いて、テキストを類型化する方法を紹介。 #やさテキ pic.twitter.com/Jjmq9JUCS9

2018-09-19 13:49:20
拡大
拡大
langstat @langstat

『Rによるやさしいテキストマイニング[活用事例編]』 amazon.co.jp/R%E3%81%AB%E3%… の各章末にあるコラムでは、正規表現、文字コード、テキストの系統分析、分類モデルの(ハイパー)パラメータ・チューニング、英文の品詞情報付与、単語の意味の学習など、発展的な話題を紹介。 #やさテキ

2018-09-19 14:00:37