第32回マイニング探検会 #mitan

第32回マイニング探検会 #mitan をまとめました。
1
myrmecoleon @myrmecoleon

サーバログには時間属性に着目した分析が有効。平日と週末,朝昼夕深夜,季節・新学期・夏休み・試験期間。どんな人に使われてるのか。どう使われてるか。サービス導入前と比較してどうなのか #mitan

2013-02-08 19:17:22
myrmecoleon @myrmecoleon

取れる情報もうひとつ。リファラ。どこからアクセスが来てるのかわかる #mitan

2013-02-08 19:18:54
myrmecoleon @myrmecoleon

サーバログは個人情報? 厳密な意味での個人情報ではない。個人を特定しうる情報か? IPアドレスで特定できないわけではない。法的に個人情報ではないが,プライバシーに関わる。扱いに注意すべき情報。 #mitan

2013-02-08 19:20:18
myrmecoleon @myrmecoleon

ログ収集の2タイプ。サーバ側のアクセスログの他に,アクセス解析サービスによる収集も。Google Analyticsとか #mitan

2013-02-08 19:22:17
myrmecoleon @myrmecoleon

昔ブログにGoogle Analytics入れてたけどもう何年も見てないや…… #mitan

2013-02-08 19:23:34
myrmecoleon @myrmecoleon

まいたんサイトのGoogle Analyticsのグラフが。 #mitan

2013-02-08 19:23:58
myrmecoleon @myrmecoleon

まいたんサイトはIE派によく見られてるのか。 #mitan

2013-02-08 19:25:15
myrmecoleon @myrmecoleon

蔵書選定のための学位論文マイニング。おお #mitan

2013-02-08 19:33:49
myrmecoleon @myrmecoleon

東大図書館のユーザー(≒学生・教員)の研究分野に沿った図書館蔵書を選定するために,過去の学部・研究科の学位論文のタイトルをテキストマイニングして蔵書選定に利用 #mitan

2013-02-08 19:35:14
myrmecoleon @myrmecoleon

サブ目的。若手職員のスキル向上。言選Webのプロジェクト #mitan

2013-02-08 19:35:43
myrmecoleon @myrmecoleon

なぜ学位論文。学部の情報として使える…Webサイト,シラバス,他。学位論文タイトルは一般公開されている,データ利用の問題をクリアしやすい。実際にデータも持っている。 #mitan

2013-02-08 19:36:35
myrmecoleon @myrmecoleon

東大柏図書館所蔵の学位論文論題データベースに載せってるデータを使用。これは18年前に前田さんが作った簡易データベースを使用している #mitan

2013-02-08 19:37:27
myrmecoleon @myrmecoleon

暫定結果。多次元尺度構成法や共起ネットワークを使用 #mitan

2013-02-08 19:38:05
myrmecoleon @myrmecoleon

なぜ用語の関連か。出てるのがどの用語との組かが重要。電気が頻出していても,電気自動車か電気業界かでちがってくる #mitan

2013-02-08 19:39:06
myrmecoleon @myrmecoleon

過去の研究から。Webサイトの頻出語と蔵書との相関。不足がよくわかる #mitan

2013-02-08 19:39:44
myrmecoleon @myrmecoleon

Webサイトや所蔵の共起からの分析は試し済み。新しいチャレンジとしての学位論文タイトル #mitan

2013-02-08 19:40:19
myrmecoleon @myrmecoleon

課題。新しい研究テーマには不向き? 過去の研究に依存。関係のない用語同士の組み合わせがはじかれる。評価は不十分。専攻別など,条件を変えた場合もよくわかってない #mitan

2013-02-08 19:41:32
myrmecoleon @myrmecoleon

やってみた結果の副産物。楽にできるテキストマイニング #mitan

2013-02-08 19:41:46
myrmecoleon @myrmecoleon

「コーパスとテキストマイニング」で紹介されてるツール。KH Coder, MTMineR, RMeCab TinyTextMiner, termmi #mitan

2013-02-08 19:42:33
myrmecoleon @myrmecoleon

MTMineRがオススメなのかな。試してみよー #mitan

2013-02-08 19:42:56
myrmecoleon @myrmecoleon

辞書の追加もできるのね。 #mitan

2013-02-08 19:46:01
かな○かな @kana0355

RT @myrmecoleon: 「コーパスとテキストマイニング」で紹介されてるツール。KH Coder, MTMineR, RMeCab TinyTextMiner, termmi #mitan

2013-02-08 19:47:33
myrmecoleon @myrmecoleon

KH Coderのが一番見やすかったとのこと。なるほ #mitan

2013-02-08 19:49:09