昨日発生していたサイトログインできない不具合は修正されております(詳細はこちら)

第2回 テキストマイニング・シンポジウム

8/30、8/31におこなわれた「第2回 テキストマイニング・シンポジウム」のまとめ。 http://goo.gl/3vrpy
1
前へ 1 ・・ 3 4 ・・ 7 次へ
Takahiro Miura @hariktriam

田中ら「知識水準の違いに対応した多視点融合型閲覧システムの提案」ユーザの知識量に応じて提示内容を変えるシステム.ニュース記事を内容で分類し,クラスタの重心から主題語を抽出し関連エンティティを取得した後で,常識語・意外語の集合を抽出.UIの右部に補足情報として提示 #signlc

2012-08-31 10:41:49
shuyo @shuyo

対象文書から抜き出した主題語に関連する「常識語」と「意外語」を収集、ユーザの知識水準にあわせた関連情報を提示。知識水準はどうやって推測するのかな、と思ったらUIでユーザが選択。常識語の選択も十分難しいけど、意外語はとてつもなく広く分布してる気がするから満足度を上げるのは難しそう。

2012-08-31 10:49:28
黒霧 @kuromu_mk

そういえば、以前常識に当たるものってわざわざ言葉にしないことがある、という話を聞いて、それを考えると頻度の扱いって難しいなぁと思ったことがありました。 #signlc

2012-08-31 10:59:57
shuyo @shuyo

serendipity な知識獲得がどうのこうのという論文をどこかで読んだ気がするんだけど、何だったかなあ。

2012-08-31 11:00:14
山元 @kamiyammmm

知識水準の違いに対応した、他視点融合型閲覧システムの提案 #signlc

2012-08-31 11:01:00
山元 @kamiyammmm

時系列テキストデータからのアラート情報の抽出と俯瞰 #signlc

2012-08-31 11:02:58
Takahiro Miura @hariktriam

塚原ら「時系列テキストデータからのアラート情報の抽出と俯瞰」過去の大量データの内容把握のために時間軸で分割して俯瞰.この際のクラスタリングを,文書間距離の計算を特徴語でコントロール.評価データは通販のコールセンタのログ.現在の話題と過去話題の関連付けなどが出来た. #signlc

2012-08-31 11:23:11
山元 @kamiyammmm

高齢者の履歴書からの特徴語抽出によるスキルの発見とマッチング #signlc

2012-08-31 11:31:40
山元 @kamiyammmm

言語理解とコミュニケーション研究会 #signlc

2012-08-31 11:32:43
黒霧 @kuromu_mk

時系列で比較した見る、というのは、テキストマイニングではよく聞きますねー。こういうのは特定の話題に着いての継続的なデータが必要だから、ちょっとやり辛くて、こうして発表で見られるのは嬉しい。 #signlc

2012-08-31 11:36:47
shuyo @shuyo

聞き逃したのかもしれないけど、そもそも保守日報のクラスタリングになぜ時系列を反映させたかったのかがよくわからなかったなあ。追加されたデータに対するupdate?

2012-08-31 11:37:36
shuyo @shuyo

あれれ、冒頭のスキルモザイク(複数の就業希望者のスキルを補完しあう)は話の振りだけで、研究内容とは関係ないのか……。

2012-08-31 11:54:53
shuyo @shuyo

tf-idf についてディスカッション。「試しに使ってみていい結果が出ればそれでOK」でいいにしても、tf-idf にもいろいろ親戚がいるわけで、そこらへんは一通り使って比べるくらいのことはしてみてもいいんじゃあないかなあ。

2012-08-31 12:11:50
Takahiro Miura @hariktriam

三浦ら「高齢者の履歴書からの特徴語抽出によるスキルの発見とマッチング」.高齢者の履歴書を収集し,ここからキーワードを抽出/TF-IDFを計算しマージした上で中身を分析.また,職務内容の情報を収集し同様にキーワード集を作成.その上で高齢者と職務内容をマッチング. #signlc

2012-08-31 12:13:16
Нiroshi Кanayama @kanayama_h

テキストマイニング・シンポジウムでは、ニッセン柿丸様の招待講演が始まります。テキストマイニングを作る技術・使う技術の間にある、「考える技術」についての話、として紹介されています #signlc

2012-08-31 13:32:30
Takahiro Miura @hariktriam

柿丸「[招待講演]ソーシャル時代のVOC爆発~テキストマイニングテクノロジーの活用~」テキストマイニングを「考える技術」に関する話.ソーシャルCRM,VOC(Voice of customer),ビッグデータに関する研究に携わっている方のお話.#signlc

2012-08-31 13:36:45
Takahiro Miura @hariktriam

承前)「顧客DBを如何に立地にするかが事業基盤の一つ(深い顧客の理解に基づくCRM活動の実践)」.CRMにおける顧客理解の変遷:2000年代前半まで購買系トランザクションデータ,00年代後半までウェブログ(ビヘイビア),2010年からはソーシャルデータ(非構造化) #signlc

2012-08-31 13:39:17
Takahiro Miura @hariktriam

承前) 具体的な対象:デモグラフィックス(セグメンテーション),ジオグラフィックス(エリアマーケティング)からのー サイコグラフィクス(耐用性・個への対応 1to1),センチメント(心まで察したおもてなし) #signlc

2012-08-31 13:40:27
Takahiro Miura @hariktriam

承前)VOCを活用したお客様主義の実践:ニッセンではコールセンターをアウトソースしない.VOCを収集する最前線.10年続く「お客様の声活用委員会」,2002年から部署単位・現場単位.VOCログを取る土壌.2003年からテキストマイニングツールを導入. #signlc

2012-08-31 13:43:07
Takahiro Miura @hariktriam

承前)03年:テキストマイニングポータルの稼働,06年:レビューサイト稼働,07年:ウェブログの収集と活用開始,08年:ECサイト上に目安箱,11年以降:ソーシャルメディアの台頭.対応中.月間5万件の記録,商品購入後の声が86%.レビュー(67)と返品(19). #signlc

2012-08-31 13:45:30
Takahiro Miura @hariktriam

承前)お客様の声の内訳は,商品:サービス=7:3.ここから商品提案に繋がった例は1700件弱.課題例:ECサイトのシステムの問題,商品に対する要望(女性のトールサイズを増やして欲しい).システムはマイニング技術を基盤.10年使用.幾つかの観点で相対的に老朽化/劣化.#signlc

2012-08-31 13:49:36
Takahiro Miura @hariktriam

承前)具体的には,マイニング技術の相対劣化(分析精度) ,声のボリュームの増大(データ処理能力),一律のUI(職務階層や部門ごとに変えたい,分析編集の容易化が必要),運用体制面(専任アナリストの育成が必要,専任部門の不在).#signlc

2012-08-31 13:51:16
Takahiro Miura @hariktriam

承前)ソーシャルの台頭による顧客接点の多様化:2010年以降の話.SNSプラットフォームを活用した対話戦略.目的とターゲットによって公表するSNSを変えている.FBにはメンズ向けとか.対話をメインにし,顧客ロイヤルティを上げる.LTV=ライフタイムバリュー #signlc

2012-08-31 13:53:15
shuyo @shuyo

ニッセンさんの招待講演。スミスの中の人……ではないと思うw

2012-08-31 13:53:37
前へ 1 ・・ 3 4 ・・ 7 次へ