第2回 テキストマイニング・シンポジウム

8/30、8/31におこなわれた「第2回 テキストマイニング・シンポジウム」のまとめ。 http://goo.gl/3vrpy
1
前へ 1 ・・ 5 6 次へ
Takahiro Miura @hariktriam

承前)テキストマイニング技術が,経済効果に繋がることを経営層などに分かってもらえる取組が必要. #signlc

2012-08-31 14:32:46
shuyo @shuyo

テキストマイニングシンポジウム、富士ゼロックスさんのカフェスペースでサンドイッチをいただいて休憩中。休憩が終わったくらいで離脱予定。ニッセン柿丸氏の招待講演めっちゃおもしろかった。これ聞けてよかったー。

2012-08-31 14:48:03
山元 @kamiyammmm

クエリと説明文の関係を表す記述要素辞書の構築 #signlc

2012-08-31 14:54:43
Takahiro Miura @hariktriam

久保木ら「クエリと説明文の関係を表す記述要素辞書の構築」まとめを作る際などの検索支援に当たっての記述要素の辞書構築.IPADICから記述要素を人手で抽出し(名詞群73k個から3.6k個),その性質を分類して必要性質を抜き出し(必須:包含性,文接続性,(続)#signlc

2012-08-31 15:11:25
Takahiro Miura @hariktriam

承前)曖昧化する性質:実在性,固有性,抽象性,非安定性),最後に3名で人手で性質判定.純粋に記述要素と言えたのは1664個.この際の記述要素は包含性・文接続性だけを持つ.この要素は73k個のうち2%.非安定要素:6%,抽象要素:2,具体要素:1,純粋属性:22%.#signlc

2012-08-31 15:12:13
Takahiro Miura @hariktriam

承前)なお,包含性:記述要素が話題性の特徴や性質を包含することを補償,文接続性:話題語の記述要素のあとに文章が続く性質,実在性:当該語が話題語と別の具体的事物として存在することを示す,抽象性:話題語の説明としては当該語が該当するか具体的には不明(続) #signlc

2012-08-31 15:12:40
Takahiro Miura @hariktriam

承前)固有性:話題語のあとに続くものが特定の品詞のものである性質,非安定性:説明文が一定の形式や特徴を持った文とならない性質.記述要素の辞書はメールすれば頂けるそうな.私は聞き逃したけど,@maimai_swapさんはそう仰っている. #signlc

2012-08-31 15:15:18
shuyo @shuyo

大きく3部に分かれてて、第1部は主にコールセンターで集めた「トラディショナルな」VOC(voice of customer)を分析・活用するニッセンの体制。「お客様の声活用委員会」とデータマイニングツールを2003年までに発足導入、日々改善に。約1700件提案、約600件実践。

2012-08-31 15:19:22
Takahiro Miura @hariktriam

質疑:記述要素の客観的定義は?(私は門外漢ゆえ決まった言葉なのかなと思ったけど,どうやらそうでもないみたい.ちなみに,私はまずメタデータを思い浮かべた.)記述要素の判断基準は?◯◯性のようなものは必要だったのか? #signlc

2012-08-31 15:23:51
shuyo @shuyo

ツール導入して10年経ち、老朽化が。分析ツールは全社員が閲覧可能だが、本来職務レベルによって見たい見るべき情報は異なる。ダッシュボード的なもの・リスクアラートなど欲しい。データ量増加による処理能力不足。分析精度も今の技術ならもっと。そのへん再構築をはかっているところ。

2012-08-31 15:25:06
shuyo @shuyo

第2部はソーシャルメディアの活用。スミスさんとかの話w 流入客も大切だが、流出客をいかに減らすか(負の拡散の予防)。サポートに寄せられる苦情は氷山の一角。そんなサイレントマジョリティをソーシャルメディアで把握できるようになった。

2012-08-31 15:33:32
shuyo @shuyo

ニッセンに関してつぶやいている人に積極的にリプライする(アクティブサポート)。これはサイボウズもやってるなw VOCの方向(ネガポジ)をコントロールすることはできないが、VOCを増やすことはできる。

2012-08-31 15:35:51
Takahiro Miura @hariktriam

酒井ら「手掛語による論文概要中の問題文の特徴付け」関連研究の文献調査を行う際,各論文での設定問題が分かりにくい.この問題文に関する手掛語集合をSVMで発見.学習データとテストデータの比率やスコア指標を変えて実験.学習データが少ないと手掛語集合の方が判別性能が高い.#signlc

2012-08-31 15:45:34
shuyo @shuyo

第3部はこれからの話とか。苦情の分析例。年代別分析で20台は「色イメージ違い」が多いと。あげられた色を分析。黒・茶などイメージが違うと言われそうにない色が上位に。共起分析により黒は「生地」と共起(製品企画にフィードバック)、ベージュ・灰・茶は「画像」と共起(カタログの解像度up)

2012-08-31 15:46:27
shuyo @shuyo

web会員1000万人の75%がソーシャルメディアを利用。それらのテキストマイニングにより200余の属性変数(ライフステージ、ペット有無、旅行、車バイク、引っ越し準備中)を抽出可能。 VOCは原石、そのままでは使えない。テキストマイニングはテクノロジーであり、魔法の杖ではない。

2012-08-31 15:52:02
shuyo @shuyo

テキストマイニングをどのようにマーケティング全体構造に反映するか。分析だけ一人歩きして改善につながらない。専従アナリストが企業の中に育っていない。テキストマイニングがどのように企業の経済活動や消費の現場に還元されるのか、企業や経営者がすんなり理解ができること。課題多いな。

2012-08-31 15:57:08
shuyo @shuyo

テキストマイニングアナリストの育成。まだ解はないが、データとお客を知っている人間でなければ適切な分析はできない。恒常的なチューニングも必要。したがって育てる主体は企業だろう。ただし企業の経済価値(利益)につながることが示されないと育成にお金をかけられない。産学協同でできれば?

2012-08-31 16:03:49
Takahiro Miura @hariktriam

得丸「複雑系解析のためのテキストマイニング ~デジタル言語の情報源復号化(検索・検証・取り込み)の手法~」模様に思えるカラフルなスライド,論理を成さない専門用語,牧師のような説話,経典のような文字列,それはまるで無限地獄.一つだけ分かったのはトリの発表が何故コレか.#signlc

2012-08-31 16:10:01
Takahiro Miura @hariktriam

承前)質疑応答:座長から「全体のゴールを教えてくれ」.これに対する応答「・・・自殺・・・・・原罪・・・・・死ぬしか無い・・・・・・・・生かしきれていない・・・・南アフリカの洞窟・・・・・言語の不思議さ・・・・・全体が見えてきた・・・・・我々は悟りに近い・・・・・・」#signlc

2012-08-31 16:23:39
Takahiro Miura @hariktriam

ディスカッション)竹内「記述要素辞書に関して.説明文のカテゴリ化しているが,単語でカテゴリ化出来ると思った理由は?」 -> 久保木「文章を単語に集約させたいため」 #signlc

2012-08-31 16:32:06
Takahiro Miura @hariktriam

ディスカッション)小林「記述辞書の自動化は?」 -> 久保木「初めはある程度人手が必要.将来的には.」 .#signlc あまりこの分野に理解がない自分には,あまり内容が解らなかった.勉強しなきゃ.

2012-08-31 16:34:03
山元 @kamiyammmm

使ってどうだったかの発表とかも欲しいって。#signlc

2012-08-31 16:37:00
Takahiro Miura @hariktriam

山本:閉会の言葉.「参加者は延べ150人.テキストマイニングの期待と需要の大きさを感じた.来年度も夏頃に関東地区で開催予定.ユーザレベルの話も歓迎.データを沢山持ってるけど,分析をどうすれば…的な発表が欲しい.次回研究会は10月@函館,テーマは「感情,評価」など」 #signlc

2012-08-31 16:39:18
kitanow @_mkitano

今年度の集合知シンポジウムは12月に東工大か。日程が合えば参加したい。 #signlc

2012-08-31 16:40:38
shuyo @shuyo

以上、#signlc の招待講演かんたん勝手なまとめ。テキストマイニング導入におけるポイントをまとめたようなスライドの一枚に「部分最適化しない!」と一言書かれてあって、それがどういう意味なのかとても気になったのだけど口頭でも触れられず、質問時間もなかった。残念。

2012-08-31 20:26:56
前へ 1 ・・ 5 6 次へ