2020年3月21日

「敬語をちょっと直すだけでほぼ完璧な翻訳」Google翻訳以上?DeepL翻訳がスゴいという話

628
アルベド @dwdaai

お勉強だけは得意な人

レム@精神科医 @dwdaai

DeepL翻訳ガチでやばい こら時代が変わるわ グーグル翻訳でもなんとか意味は取れるがDeepL翻訳は敬語をちょっと直すだけでほぼ完璧な翻訳 twitter.com/jaguring1/stat…

2020-03-20 19:31:09
小猫遊りょう(たかにゃし・りょう) @jaguring1

試しに、いま僕が読み返している、グーグルのAI開発を率いている大天才Jeff Deanの論文(2019年11月13日)の概要を、DeepL翻訳(1枚目)とグーグル翻訳(2枚目)に入れてみた。 Jeff Deanの論文 arxiv.org/abs/1911.05289 DeepL翻訳 deepl.com/translator グーグル翻訳 translate.google.com/?hl=ja pic.twitter.com/9o5VJkfm11

2020-03-20 18:44:13
拡大
拡大
isoo @isoo_

@dwdaai @nojiri_h deepl良さげ。ちょっと見てみよう。

2020-03-20 21:53:56
小猫遊りょう(たかにゃし・りょう) @jaguring1

きてた 「DeepL翻訳」が日本語と中国語を習得 deepl.com/blog/20200319.… 「翻訳システムの名前を伏せた状態で日本語と中国語の翻訳者に示し、評価してもらいました。またしても、DeepL翻訳が他よりも優れているとして選ばれる頻度が最も高いという結果になった」 翻訳ツール deepl.com/translator pic.twitter.com/miMY1NvW4K

2020-03-20 18:01:53
拡大
拡大
小猫遊りょう(たかにゃし・りょう) @jaguring1

次は、AI分野で1週間前に話題になった研究「AutoML-Zero」の論文の概要を、DeepL翻訳(1枚目)とグーグル翻訳(2枚目)に入れてみた。 AutoML-Zero arxiv.org/abs/2003.03384 DeepL翻訳 deepl.com/translator グーグル翻訳 translate.google.com/?hl=ja pic.twitter.com/wg5H2ddJpt

2020-03-20 19:17:34
拡大
拡大
小猫遊りょう(たかにゃし・りょう) @jaguring1

話はズレるが、AutoML-Zeroに関して、「1週間前に話題になった」と書いたが、少し補足。日本語ではまったく話題になってない。 Quoc Le(Google Brain @quocleix) Jeff Dean(Google Brain @JeffDean) Ilya Sutskever(OpenAI @ilyasut) Jeff Clune(OpenAI @jeffclune) などが話題にしてた。

2020-03-20 20:02:30
小猫遊りょう(たかにゃし・りょう) @jaguring1

2年半ぐらい前にDeepL翻訳が話題になったとき、「やっぱ、日本語版はないか」と思ったわけだけど、とうとう日本語版が出てきた twitter.com/jaguring1/stat…

2020-03-20 22:46:14
小猫遊りょう(たかにゃし・りょう) @jaguring1

ディープラーニングに関する文章をディープラーニングが翻訳してると思うと、エモい

2020-03-20 23:13:16
trout @TroutPee01657

@jaguring1 deeplで今日のJapan Timesの記事を翻訳してみた。 ”While there have been disruptions caused by school closures, life continues as normal for much of the population.” 「廃校による混乱はあったものの、多くの人にとっては普通の生活が続いています。」 この場合、コロナなので廃校ではなく休校

2020-03-21 03:45:51
trout @TroutPee01657

@jaguring1 我々の時代と比較して、かなりきれいな翻訳だが、まだ文脈を理解するまでには至ってない。 たぶん、この英文だけをタイトルも見せずに翻訳家に示したら、同じ翻訳をするだろう。 だが、正確に翻訳するには、世界モデルを持つ必要あがある。やはり、機械はまだまだ。

2020-03-21 03:49:00
(仮) @army__dreamers

@jaguring1 ディープラーニングすごい! かつて神様にバベルの塔が見つかってバラバラにされた言語を、もう一回統一することができるかも… 各国のテキストメッセージをリアルタイムで翻訳しまくれれば、外国人同士のオンラインの友達も増えて、内紛とか戦争とか減ればいいなあ

2020-03-21 07:53:20
じぇい@株式会社じぇいらぼの代表 @kasajei

@jaguring1 DeepL日本語対応したんですか!ヤバすぎる自動翻訳の精度!めっちゃ丁寧な日本語ですね

2020-03-20 23:05:58
橘 為右衛門 @tameemon_g

@dwdaai @calisius 確かにすごい。英語を勉強する意味がなくなりそうで困っています。

2020-03-21 18:17:10
ラーメン大好きしろくまさん @Kumappus

@dwdaai @SciCafeShizuoka 最初の一文とっても「無理に訳そうとしてない」感じがしてかえって読みやすくなってますね。

2020-03-21 07:37:19

コメント

パンダは肉食獣 @j_inbar 2020年3月22日
廃校ではなくて休校も、単文じゃなくて、しっかり文章全体訳させればできるので、こっちのtwも補完してほしい。ref. https://twitter.com/jaguring1/status/1241081223356678144
11
Hacchi @2mocccck 2020年3月22日
試しに「She is on the rampage that she strikes her uncle with a spiked bat again and again and chokes her boyfriend like a professional wrestler.」を読ませてみたけど、DeepLは主語を落としてしまうので微妙に使いづらい気がする。
3
Hacchi @2mocccck 2020年3月22日
DeepLは「おじさんを何度も何度もトゲトゲのついたバットで殴り、プロレスラーのように彼氏の首を絞めるという暴挙に出ている。」、google翻訳は「彼女は何度も何度もスパイクバットで叔父を襲い、プロレスラーのように彼氏を窒息させるという大暴れをしています。」になる。DeepLのほうがこなれ感あるけど主語を落とした理由がよくわからない。Google翻訳は主語をちゃんと残してくれてるけどstrikesとかchokesの翻訳が怪しい。
13
Hacchi @2mocccck 2020年3月22日
全くどちらの言語も知らない状態で使うにはまだちょっと怖いかもしれない。ある程度の意味を掴む程度の利用だったらほぼ問題なさそうだけど。
10
kou_kuwa @kou_kuwa 2020年3月22日
とりあえずブックマークしました。
2
takatakattata @takatakattata1 2020年3月22日
Google翻訳が何年か前まで文法って何?みたいな状態だったのを考えるとえらい進化だと思う
18
DOK @nyu_nyu2012 2020年3月22日
チャットレベルの普通の文は日英機械翻訳かけた時に大抵主語がおかしくなる。英日だとセンテンスごとに私はあなたはと煩くなる。そこは日本語の主語を省ける特殊性ゆえなんだけど、この翻訳は英日で主語を省いて自然な口語に見えるようにしてる。でも逆だと隠れた主語が女性でも彼になる。前の文で明記しても汲み取らない。その点以外はちょっとしたスラングなら訳すくらい口語に関して優秀だった。
6
緑川⋈だむ モデルナフルチン @Dam_midorikawa 2020年3月22日
Wikipediaの英語版いくつか翻訳してみたが確かに精度高いな
0
千と千尋の幻のラストは徳間アニメ絵本だと思う @Trtg8XBd7IN573d 2020年3月22日
あんまり関係ないけどGoogle翻訳の英語ーフランス語はものすごく正確ですごい(すごい) 似た言語なんだなあ
3
kathryn @KathrynJpn 2020年3月22日
みらい翻訳で訳してみたら「おじさんをスパイクバットで何度も殴ったり、プロレスラーのように彼を窒息させたりして暴れている。」になったよ。みらい翻訳は情報通信研究機構(NICT)のエンジンを使っている。この中では一番いいと思う。https://miraitranslate.com/trial/
6
kathryn @KathrynJpn 2020年3月22日
(みらい翻訳1/3)過去10年間に、機械学習、特に人工ニューラルネットワークに基づくディープラーニング手法において、コンピュータビジョン、音声認識、言語翻訳、および自然言語理解タスクを含む広範囲の分野にわたって、より正確なシステムを構築する能力を向上させるという著しい進歩があった。
0
kathryn @KathrynJpn 2020年3月22日
(みらい翻訳2/3)この論文は、2020年のInternational Solid-State Circuits Conference(ISSCC)で行われた基調講演のコンパニオンペーパーで、機械学習の進歩と、特にムーアの法則以降の時代に、私たちが構築する必要のある計算デバイスの種類に与える影響について議論している。また、機械学習が回路設計プロセスのいくつかの局面で役立つ可能性があるいくつかの方法についても説明する。
0
kathryn @KathrynJpn 2020年3月22日
(みらい翻訳3/3)最後に、現在の機械学習モデルよりもはるかに動的で、例やタスクに基づいたルーティングを採用する、まばらに起動されるより大規模なマルチタスクモデルに向けた、少なくとも1つの興味深い方向のスケッチを提供する。
0
kathryn @KathrynJpn 2020年3月22日
みらい翻訳>DeepL>グーグルと判定する。
2
kathryn @KathrynJpn 2020年3月22日
みらい翻訳がmachine learning may also be able to helpの"help"を「助ける」ではなく「役立つ」と訳したところが判定理由。ちなみにこの部分はグーグルでは「支援する」と訳しているのでそれでもいいが、全体的に文がこなれていない。
0
denev @_denev_ 2020年3月22日
「日本語と中国語を習得」ってあっさり言うなぁ。日本語を知らないドイツ人の手でこんなことされたら、日本人の立場がないよ。
0
nekosencho @Neko_Sencho 2020年3月22日
より自然な日本語になっているのはわかるんだが、むしろそこが危険な気もする。 きちんと訳されて間違いのないものならいいんだけど、間違いがあっても自然な日本語にされていたら元からそういう文章だと思って読んでしまいそうだ。 
27
toropin @toropin5 2020年3月22日
みらい翻訳でグーグルみたいなページ全体の翻訳ができるようになればいいんだけどなぁ。どこか個人向けにやってださい。
1
しろの @zoshirono 2020年3月22日
英日翻訳はみらい翻訳利用してるなあ。ざっと確認したところ、個人的にはみらい翻訳が使いやすい印象。
1
denev @_denev_ 2020年3月22日
少し弄ってみたけど、原文には存在しない単語を文脈から補完してきてびっくりした。確かにgoogle翻訳より何歩も踏み込んだ翻訳を出力してくる。そのぶん意訳が過ぎる危険もあるけど、それを承知で使えばかなり便利かもしれない。
4
denev @_denev_ 2020年3月22日
「原文の意味は理解できるけど、それを日本語で自然な表現にするにはどうすればいいのかわからない」ときとかに参考になりそう。
7
ま _ _ す @ryuta100kg 2020年3月22日
和文英訳だとどうなんだろう。あとは学術的な表現への対応。
0
RGB000 @19666_61 2020年3月23日
現状のAIは責任を果たせないので、できるだけいい感じに調整するとか、できるだけ良さそうなプランを選ぶとかには十二分に活かせるだろうけど、この手のは結局どこまで行っても本当に細部のニュアンスまで正しく変換できてるか判断できない(その能力があれば最初から訳せる)。
1
nekodaisuke @nekodaisuke1 2020年3月23日
みらい翻訳のほうが精度が良いからそれ使ってたな
0
茨 二科 @ibaranika 2020年3月23日
英文記事と和訳が読めるサイトの記事をいくつかぶちこんでみたけど、翻訳できてる文章はかなり精度が高い一方、意味が通じにくくなる単語や文章はかなりバッサリ割愛してるらしく、和訳と比較するとちょいちょい文章に抜けがある感じ。とはいえ、いまのgoogle翻訳よりはマシじゃないかなあ https://alpha.japantimes.co.jp/
5
茨 二科 @ibaranika 2020年3月23日
たとえば高輪駅の記事を入れてみると最後の方の品川再開発計画あたりの文章が抜ける。 https://alpha.japantimes.co.jp/zenyaku/top_news/202003/39580/ 大統領候補選びの記事だと冒頭の方の「2人の候補者の一騎打ちへと変容した」あたりの文章が出てこない。https://alpha.japantimes.co.jp/article/top_news/202003/38632/ 翻訳後に別の翻訳や原文と比較することは最低したほうがいいと思われる
4
フルグラ美味しい @frugura 2020年3月23日
う~ん、実際どうなのかなあ?昨日試しに中文Wikipediaの「孫悟空」の頁を日本語訳してみたが、やはりかなりの誤訳があって、脳内で意味を修正しながらじゃなければ意味がわからなかった。まあ、グーグル翻訳の方だと更に意味が分からない状態だったので、性能はDeepL翻訳の方が上だとは思うけど。
2
たられば @tarareba722 2020年3月23日
優秀な翻訳サイト。メモとして。
0
ホッパーホッパー(モンハンライズ 狩猟中) @overdrive0466 2020年3月23日
ええもん見つけた!! 英語の勉強がはかどりそうだ。
0
黄色いかまぼこ @yellow_chikuwa 2020年3月23日
こいつがamazonのレビューや偽装ウェブサイトとかに投入されるようになると、今まで以上にウェブリテラシーが求められる。
14
五月雨山茶花蝉しぐれ @taken1234challe 2020年3月24日
微妙に違和感の残る翻訳文体が、それ自体が一種の文体であると認識されるようになれば違和感が無くなる。つまり、微妙に残る違和感に我々が慣れた時が「完成」なのだ。
0
ハブ山@いんちょ @habuyama2000 2020年3月24日
長文の翻訳をGoogle、その中で難しい所をみらい翻訳と今まで使い分けていた。選択肢が増えるのはとても嬉しい。
0
ㇶ ㇱ゛ㇼ @hijirhy 2020年3月24日
翻訳のディープラーニングってそもそも良質な教師データがそんなにあるのか?ってのが前から疑問なのだけど、どこから教師データを集めてるんだろう?
0
door_vizi @door_0001 2020年3月25日
なんか長文中に The End of Evangelion というフレーズが出てくると、途端に「エヴァンゲリオン」だったり「エヴァンゲリヲン新劇場版」になったり表記ぶれが激しくなる
0
うみうし🐑ありえないくらい慎重 @umiusi45 2020年3月27日
で、エキサイト先生の話は、まだなのかしら?
0