語義を汲み過ぎて狂いがちなDeepL先生 vs Google先生の白熱バトル!「一体どんな仕組みなの?」

91
みる沌 @ABmiltong

これ翻訳できるの始めてみた。 twitter.com/TtTt_Cheese_Na… pic.twitter.com/YCFb5GAOTT

2022-01-26 18:12:46
おとりゃ@5/21 DF M-105 @Otorya_

DeepL、どの翻訳サービスよりもかなり精密に翻訳してくれるんだけど、あまりにも精密すぎてたまに面白い事になるから是非使ってほしい pic.twitter.com/v6b3DS9W48

2022-01-26 09:11:29
拡大
怒羅衛門ひよこメンバー @doraephoneomote

そのうち「334」とかもちゃんと「ロッテ-阪神」言ってくれるのかな。 twitter.com/tttt_cheese_na…

2022-01-26 17:03:17

さては中の人がいるな?

simeji | AI開発やめ太郎 @Simeji1993

修士の時からお世話になってたけど本当に中に人が居そう twitter.com/tttt_cheese_na…

2022-01-26 22:24:37
耕造 construction @constructuralis

えっこれ中に小さいおっさん入ってるやつ? twitter.com/TtTt_Cheese_Na…

2022-01-26 16:45:23

オタクに違いない

→実はそうなんですよね

DeepLは、もともとインターネット上にある文章や、ユーザーの入力したデータをAIで学習し、その結果を次の翻訳に生かしています。オタクが使えばオタクっぽい表現を学習するということです。
pata @qod_i8

お前が中の人になるんだよ‼️

2022-01-26 23:44:37

DeepL公式

リンク www.deepl.com DeepLの仕組み translatorDescription_1
ぶっちゃけ公式の説明は難解すぎて何を言っているのかよくわからないので、他のわかりやすい説明を持ってきました。立教大学異文化コニュニケーション学部教授、山田優氏のインタビュー記事です。
リンク univdb.rikkyo.ac.jp 研究者詳細 - 山田 優
リンク NEWSポストセブン 劇的進化の「機械翻訳」 背景にはAIと「良質な対訳データベース」 近年、日進月歩の勢いで進化を遂げている機械翻訳の世界。10月末には、角川ドワンゴ学園がGoogle翻訳を使用して英語小論文を読むオンライン講座をスタートさせたことも話題を呼んだ。急速な… 2 users 14

「Google翻訳やみらい翻訳と異なり、DeepL翻訳は内部の仕組みを説明した学術的な論文を出していないので、本当のところはわかりません。なのであくまでも憶測となりますが、次のように考えられると思います。

まず、最も大きいのは『データの質が良い』ということ。AIの深層学習を利用する際には、必ず原文と訳文のデータが必要になりますよね。その中から色々なパターンを見つけて学習していきます。この点でGoogle翻訳では、他社よりも桁違いに多いデータ量を保持していたことが最初はアドバンテージになったんですが、徐々にどうも質の悪いデータが多いということがわかってきた。

一方、DeepL翻訳の会社では、もともとウェブ上で原文と訳文を探してくる装置を持っていて、医療や機械工学などさまざまな分野に特化した対訳のデータベースを持っていたんです。それでプロの翻訳者向けに、翻訳する際の参考として使えるLingueeというサイトを運営していたんですね。その良質なコーパス(対訳データ)をベースに機械学習させて、医療用や機械工学用など専用の翻訳エンジンを作っていきました。

DeepL翻訳の裏側は一つではなくて、どうも専用の翻訳エンジンが複数あるようです。それで、例えば医療の分野のテクストを入力すると、『この単語の並びは医療っぽいな』と判定して、医療専用の機械翻訳に送るようになっているらしい。なのでGoogle翻訳などの一般知識しか持たない機械翻訳よりも、良質なコーパスで鍛えられた専用の翻訳エンジンがたくさん揃っているDeepL翻訳のほうが、精度が高いと言われています」

量より質で勝利したDeepL

Chelsea Kunimoto|Generative AIX Partner @chelsea_ainee

DeepLは、GoogleやMicrosoftほど学習データはなくても、数学とニューラルネットワークの方法論で、AI機械翻訳において圧倒的に1位に。これはどの機械学習スタートアップにも参考になる話よなぁ。 DeepL.com/blog/20200206.… pic.twitter.com/fg3db1EItu

2020-06-17 21:13:40
拡大
Chelsea Kunimoto|生成AI活用ならCynthialy @chelsea_ainee

Cynthialy CEO🔥OpenAI / Copilot等エンプラ向け生成AI人材育成・コンサル・Gen AIX伴走|Women AI Initiative創設|ChatGPT活用大全監修ベストセラー1位| 起業←AI Startup←SAP|iU客員教授・GUGA協議員・NewsPicksプロピッカー

https://t.co/YwmBUFF6kT

ただし弱点もあります。

弱点:偏見がある

※インターネット上の偏見を学習したためと考えられる。

なま @rt_4562580

@TtTt_Cheese_Nan リケジョの英訳は"男性の同性愛を描いた漫画が好きな女性" 精密がすぎる。 pic.twitter.com/Kpv3scxcBP

2022-01-26 17:32:23
拡大

弱点②:口調がブレる

※学習元に様々な語調が存在するため。

omega @omega01110

@TtTt_Cheese_Nan 確かに偶に面白いことになるよね。 だって今まで普通に標準語だったのに急に関西弁になるんだもん。 pic.twitter.com/5XJMXhzRME

2022-01-26 19:41:03
拡大