2020年11月7日

エレン先生が翻訳ＡＩを起動させると

機械翻訳 Google翻訳エレン先生 DeepL DeepL翻訳

Uroak_Miku
1193
0
0
0

0

uroak_miku @Uroak_Miku

深層学習（deep learning）について今のうちにかじっておきたくてごそごそ文献に当たっていたら「ボルツマン・マシン」なる概念と遭遇。ぼるつまん？おお、ボルツマン分布に由来するそうです！ pic.twitter.com/OCDbwHwCsu

2020-11-07 09:59:59

拡大

uroak_miku @Uroak_Miku

機械翻訳の新しいパラダイム：ニューラル機械翻訳の原理中澤敏明 jstage.jst.go.jp/article/johoka…

2020-11-07 10:07:40

uroak_miku @Uroak_Miku

＞ニューラル機械翻訳（Neural Machine Translation: NMT） 2014年。

2020-11-07 10:10:31

uroak_miku @Uroak_Miku

＞2016年11月にGoogle翻訳がNMTを採用したときには大きな話題となった。そうそうありましたありました。私もちょっと驚いた。

2020-11-07 10:11:22

uroak_miku @Uroak_Miku

これが旧型ですね。統計的機械翻訳（SMT） pic.twitter.com/zZxYq0nC0W

2020-11-07 10:12:41

拡大

uroak_miku @Uroak_Miku

これが現行型。ニューラル機械翻訳（NMT）。 DeepL翻訳をこの半年いろいろ試してみて、どうも入力言語内、出力言語内でそれぞれ校閲機能が回っている感じがしていたのですが、この概念図によると、私の感覚はどうやら正解？ pic.twitter.com/LaIlJ8AqVm

2020-11-07 10:16:51

拡大

uroak_miku @Uroak_Miku

＞モデル自体は非常にシンプルになり使いやすくなったのだが，翻訳の過程の解釈は困難，もしくは不可能である。

2020-11-07 10:18:39

uroak_miku @Uroak_Miku

この〈EOS〉というのが鍵のようですね。 pic.twitter.com/W7cMHMDeGh

2020-11-07 10:22:35

拡大

uroak_miku @Uroak_Miku

＞出力する単語候補には<EOS>も含まれており，これが出力された時点で翻訳が完了する。

2020-11-07 10:23:35

uroak_miku @Uroak_Miku

＞NMTでは符号化された入力文とアテンションの情報からデコーダーが次に出力する単語を1つずつ決定し，<EOS>が出力された時点で翻訳が完了する。

2020-11-07 10:28:05

uroak_miku @Uroak_Miku

＞デコーダーが<EOS>を出力するまで翻訳は継続し，いつ<EOS>が出力されるかは今のところ知るすべがない。このため入力文のすべてが過不足なく訳出されるという保証がない。

2020-11-07 10:28:53

uroak_miku @Uroak_Miku

＞過去に訳出した箇所の情報をもっていないため，同じところを複数回訳出したり（重複訳：over translation），まだ訳出していない部分があるにもかかわらず，<EOS>にアテンションして翻訳を終了させてしまったりそう、これ！ときどき起きるんですよ。

2020-11-07 10:30:20

uroak_miku @Uroak_Miku

＞もちろんこの点に関してはさまざまな研究者が解決に向けて研究しているところだが，今のところ決定的な方法は考案されていない。前から気になっていましたが、原理的困難ですか。

2020-11-07 10:31:22

uroak_miku @Uroak_Miku

＞日↔英に関しては評価の低い文の割合は減っているものの，評価5の割合も減っていることがわかる。これは現在のNMTの最大の問題である「訳抜け」によるものである。これはGoogle翻訳での検証ですが、今の私が使っているDeepL翻訳だと日→英の精度はもっと高く感じます。 pic.twitter.com/47ARoC24VF

2020-11-07 10:35:35

拡大

uroak_miku @Uroak_Miku

＞ここで注意したいのは，NMTの翻訳は訳文だけを見るとどれも完璧な日本語の文として成立しているという点である。そうそう、訳文じたいはすごく自然。

2020-11-07 10:36:55

uroak_miku @Uroak_Miku

＞原文と照らし合わせて初めて翻訳誤りが含まれていることが判断できるが，訳文だけを見ても気づくことはできない。これはDeepLには当てはまらないかな。日→英だと、英文が露骨に構文エラーなことがごくまれにあります。

2020-11-07 10:38:03

uroak_miku @Uroak_Miku

cresco.co.jp/blog/entry/130… DeepL上に日本語で論文を書き進めて英文出力したものを、英語の得意な同僚にチェックしてもらって英文校閲会社に出して完成、とあります。私と同じことをなさっていますが、英文の校正もネイティヴチェックも人任せなのが情けない。

2020-11-07 10:43:45

uroak_miku @Uroak_Miku

このDeepLの原理が今なおわからない。

2020-11-07 10:46:52

uroak_miku @Uroak_Miku

しかしひとつたしかなのは、私にとっては潜在能力をフルに活かせるどころか、さらに進化を促してくれる機動戦士だってことですねっ。

2020-11-07 10:48:43

uroak_miku @Uroak_Miku

♪ﾃﾞﾝｯﾃﾞﾝﾃﾞｰﾝ､ﾃﾞｰｯﾃﾞﾝﾃﾞﾝ､ﾃﾞﾝｯﾃﾞﾝﾃﾞｰﾝ､ﾃﾞｰｯﾃﾞﾝﾃﾞﾝ､ﾃﾞﾃﾞｯ､ﾃﾞﾃﾞﾃﾞﾃﾞｯ(ﾁｬｶﾁｬｰﾝ) pic.twitter.com/SI7fABOlp1

2020-11-07 10:50:14

拡大

こちらに続く↓

まとめ

エレン先生はＡＩ翻訳をどう考える？ 694 pv 1

いま話題のタグ

AIイラスト259 絵師502 クリエイター480 ワールドトリガー866 宇宙食6 シン・ゴジラ545 ポケモン1922 おがくず152 名探偵コナン496 あすけん8 注意喚起747 平安時代180 タヌキ108 青山剛昌62 逆カルチャーショック1