サーバログには時間属性に着目した分析が有効。平日と週末,朝昼夕深夜,季節・新学期・夏休み・試験期間。どんな人に使われてるのか。どう使われてるか。サービス導入前と比較してどうなのか #mitan
2013-02-08 19:17:22サーバログは個人情報? 厳密な意味での個人情報ではない。個人を特定しうる情報か? IPアドレスで特定できないわけではない。法的に個人情報ではないが,プライバシーに関わる。扱いに注意すべき情報。 #mitan
2013-02-08 19:20:18ログ収集の2タイプ。サーバ側のアクセスログの他に,アクセス解析サービスによる収集も。Google Analyticsとか #mitan
2013-02-08 19:22:17東大図書館のユーザー(≒学生・教員)の研究分野に沿った図書館蔵書を選定するために,過去の学部・研究科の学位論文のタイトルをテキストマイニングして蔵書選定に利用 #mitan
2013-02-08 19:35:14なぜ学位論文。学部の情報として使える…Webサイト,シラバス,他。学位論文タイトルは一般公開されている,データ利用の問題をクリアしやすい。実際にデータも持っている。 #mitan
2013-02-08 19:36:35東大柏図書館所蔵の学位論文論題データベースに載せってるデータを使用。これは18年前に前田さんが作った簡易データベースを使用している #mitan
2013-02-08 19:37:27なぜ用語の関連か。出てるのがどの用語との組かが重要。電気が頻出していても,電気自動車か電気業界かでちがってくる #mitan
2013-02-08 19:39:06課題。新しい研究テーマには不向き? 過去の研究に依存。関係のない用語同士の組み合わせがはじかれる。評価は不十分。専攻別など,条件を変えた場合もよくわかってない #mitan
2013-02-08 19:41:32「コーパスとテキストマイニング」で紹介されてるツール。KH Coder, MTMineR, RMeCab TinyTextMiner, termmi #mitan
2013-02-08 19:42:33RT @myrmecoleon: 「コーパスとテキストマイニング」で紹介されてるツール。KH Coder, MTMineR, RMeCab TinyTextMiner, termmi #mitan
2013-02-08 19:47:33