波形vsメルスペクトログラムって、本質的には同じ情報だと思うので、波形を利用する方のアーキテクチャがまだまだやれることがあるということな気がするなぁ #nips17yomikai
2018-01-21 18:31:41でも、Deep Voice 2の方がいいよ!という話でした。が、すでにDeep Voice 3もあるし、学会が時代に追いついていない。 #nips17yomikai
2018-01-21 18:38:41Imaginary soundscape、風景画像を入れると、風景音を自動生成してくれる。クロスモーダル現象をコンピュータで再現しているみたいだ。 #nips17yomikai
2018-01-21 18:40:30まあそれぞれ別のNNを作って、それっぽく組み合わせればいいのかなあ #nips17yomikai
2018-01-21 18:42:37音声合成って、自然にするには抑揚(よく感情を選択すると同じワードでも出力が変わる、みたいなの)もちゃんとしないとダメだと思うんだけど、そういうのDeepでどうやるんだろうな。感情ラベル付き教師データなんて集められなさそうだし。 #nips17yomikai
2018-01-21 18:42:47SoundNet: 映像の物体検出とシーン部類の認識結果を教師として音を認識を学習する。音だと無理ゲーな部分(逆に音のほうが得意な領域)もありそうだけどその辺りが可視化されると面白いな #nips17yomikai
2018-01-21 18:43:16Visual to Soundとかすごいな arxiv.org/abs/1712.01393 #nips17yomikai
2018-01-21 18:45:14Googleの音のデータセットAudioSet #nips17yomikai research.google.com/audioset/
2018-01-21 18:45:24五感全部使うくらいマルチモーダルの研究が進んでほしいですね。データの量じゃなくて次元数を増やす方向に。 #nips17yomikai
2018-01-21 18:45:52テキスト2ボイスだとそういうの難しそうかなと思ったけど、例えばドラマの台本とドラマの音声をペアで放り込んで、抑揚は台本から状況推定して教師無しでいい感じに学習してくれ、みたいな感じでいけたりするのかな(適当です) #nips17yomikai
2018-01-21 18:50:44NIPS2017読み会@PFN 〜テーマ発表6 大野健太(PFN)〜 Machine Learning for Molecules and Materials ワークショップ youtube.com/watch?v=O2qPOi… #nips17yomikai 本日最後の講演になります
2018-01-21 18:51:50マルチモーダルな研究って、rawレベルに近いところでのealy fusionより、ほぼ結果らへんで統合するlate fusionのほうが精度的には良い印象なんだよなぁ…(なんかそれだとあまり面白くない) #nips17yomikai twitter.com/sammy_suyama/s…
2018-01-21 18:54:11#nips17yomikai / “| 情報統合型物質・材料開発イニシアティブ” htn.to/cTRQ51
2018-01-21 18:55:49別にどちらか一方にする必要はなくて、組み合わせることができるのでは #nips17yomikai twitter.com/yu4u/status/95…
2018-01-21 18:56:41