第0回ゆるふわ非構造 #ゆるふわ非構造

非構造化データ解析(自然言語処理・画像認識・音声解析)の学び方アンカンファレンスを開催しました。
1
nezuq @nezuq

勉強会「ゆるふわ非構造 #0」(学び方アンカンファレンス)を明日14時から開催します。自然言語処理・画像認識・音声解析、ビジネスで使いたいけどイマイチどう学んでいいかも分からない。そんな状況から一緒に脱しましょう。 tokyoscrapper.connpass.com/event/7373/ #ゆるふわ非構造

2014-07-20 16:56:32
Kuma @kumakumakkk

会場はソニービルから50mほど品川方面に歩いたところです。目印は木の壁のお店!そこの9階です。 #ゆるふわ非構造 pic.twitter.com/GgeeJFQRIH

2014-07-21 13:05:59
拡大
ladicle @Ladicle

自然言語と人工言語のはなし始まった #ゆるふわ非構造

2014-07-21 14:32:22
フランドン畜舎内 ヨークシャイヤ @furandon_pig

形態素の解析結果ではないけれど、Googleサジェストの結果を共起分析にかけるのはどうだろうか。 #ゆるふわ非構造

2014-07-21 14:51:47
Naoto Karibe / 苅部直知 @naoto_karibe

@nezuq 本日、ゆるふわ非構造#0にキャンセル待ちで参加登録させていただいた者です。ありがたいことに補欠から繰上げすることが出来たのですが予定を入れており16時ごろからの参加でも可能でしょうか?よろしくお願いいたします。

2014-07-21 13:44:16
nezuq @nezuq

@naoto_karibe 連絡に今気が付きました。申し訳ございません。自分が開催する勉強会は途中参加歓迎なので、もしも次回ございましたら遠慮なくご参加ください。

2014-07-21 19:19:20
Naoto Karibe / 苅部直知 @naoto_karibe

@nezuq ちゃっかり直接伺い遅れて参加させていただきました。本日は開催頂きありがとうございました!Webスクレイピング勉強会にも参加させていただく予定なので、引き続きよろしくお願いいたします!

2014-07-21 19:21:50
nezuq @nezuq

勉強会運営方法を考える。名前と関心事を書いた名札を用意するのがいいかな。関心事が分かると話しやすい。

2014-07-21 19:28:51
nezuq @nezuq

機械学習のアルゴリズムは数式ではなく動作イメージで理解するという意見が面白かった。例えば、ナイーブベイズによる文書分類なら、教師データの各単語の発生頻度と検証データの各単語の発生頻度を突き合わせて、似ている物をカテゴリとして選ぶ。アルゴリズム動作イメージ集があると学びが捗る。

2014-07-21 19:37:06
nezuq @nezuq

音声認識の精度の上げ方。ユーザーが固定なら、特定ユーザーに特化した学習をしてしまうのが良いのではないかとの意見。使っている内にそれができたらいいな。JuliusやそれをベースにしたMMDAgentに実装して欲しい機能だ。

2014-07-21 19:40:53
nezuq @nezuq

Webスクレイピングをスクリプトファイルで実装するのではなく、定義ファイル(XAML)で実装する思想。面白かった。Angular.jsを彷彿とさせる。Rawlerフレームワーク(全体) slideshare.net/TakaichiIto/ra… @SlideShareから

2014-07-21 19:44:38
TJO @TJO_datasci

@nezuq 僕がブログでやってる「パッケージユーザーのための機械学習」シリーズにはそれに近い意図を込めてます。

2014-07-21 19:43:54
nezuq @nezuq

@TJO_datasci なるほどです。ブログ記事を覗かせて頂きます。単純に数式を書くよりも、ずっと直感的で学習効率が良さそうです。

2014-07-21 19:47:46
nezuq @nezuq

自然言語処理・画像認識・音声解析の初心者向けのソリューション。「調べ方を教える」「QAサイトに期待する」「実行環境(インフラ定義ファイル)を用意しておく」。インフラをあらかじめ用意する手法は、自分だけでは思いつかなかった。

2014-07-21 19:53:15
nezuq @nezuq

QAサイト運営。QAを自前で用意するのではなく、目的ごとに集めてパッケージ提供するのが良いのではないかとの意見。にゃるほどです。

2014-07-21 19:58:49
nezuq @nezuq

サンプルコードWikiは、自然言語処理や画像認識、音声解析の領域であると、確かに捗りそうだ。

2014-07-21 20:03:22
nezuq @nezuq

自然言語処理→Mecab。画像認識→OpenCV。音声解析→Julius。各領域の代表ツールの中でJuliusのドキュメントの難しさと少なさが問題。京大の開発元に尋ねる以外のソリューションは……/日本語音声解析ツールキットJulius julius.sourceforge.jp

2014-07-21 20:15:05
nezuq @nezuq

最近はJavaにも形態素解析ライブラリができていたのか。知らんかった。 / kuromoji atilika.com/ja/products/ku…

2014-07-21 20:23:30
nezuq @nezuq

数学記号の意味や読み方が分からない。統計学の入門書で引っかかるポイントの一つとして興味深い。そこをカバーするアプローチは、統計学入門系のイベントを開くなら必要だと思う。 / “数式記号の読み方・表し方” htn.to/MaNMeRgK

2014-07-21 20:33:15
nezuq @nezuq

統計学のオススメ勉強法。1.統計を道具として使い、興味のあるデータを分析する。いわゆるパッケージユーザーになる。2.微積分・線形代数から統計学入門までを学ぶ。3.興味のある分野でビジネス活用する。※モチベーション維持が何よりも重要。簡単な操作で興味のある結果を得られる段階1が必要

2014-07-21 20:44:27
nezuq @nezuq

統計前知識としての数学知識のニーズは、思った以上にニッチだった。エンジニアの方→道具として使うなら不要で、深堀したい事がでてきたらつまみ食い勉強をすればいい。アナリストの方→もう知ってる。

2014-07-21 20:55:33
nezuq @nezuq

github純正エディタAtom。日本語対応余裕との事。これは自分にとって朗報。 github.com/atom

2014-07-21 21:04:18
nezuq @nezuq

ご発表をありがとうございました。 / 0th ゆるふわ非構造データ勉強会 「自然言語処理の第1^{-10}歩」 #nlp slideshare.net/data_sciesotis… @SlideShareから #ゆるふわ非構造

2014-07-21 21:21:20