これ翻訳できるの始めてみた。 twitter.com/TtTt_Cheese_Na… pic.twitter.com/YCFb5GAOTT
2022-01-26 18:12:46DeepL、どの翻訳サービスよりもかなり精密に翻訳してくれるんだけど、あまりにも精密すぎてたまに面白い事になるから是非使ってほしい pic.twitter.com/v6b3DS9W48
2022-01-26 09:11:29そのうち「334」とかもちゃんと「ロッテ-阪神」言ってくれるのかな。 twitter.com/tttt_cheese_na…
2022-01-26 17:03:17さては中の人がいるな?
修士の時からお世話になってたけど本当に中に人が居そう twitter.com/tttt_cheese_na…
2022-01-26 22:24:37えっこれ中に小さいおっさん入ってるやつ? twitter.com/TtTt_Cheese_Na…
2022-01-26 16:45:23オタクに違いない
これ絶対ツールの中の人オタクでは?って思っちゃったwwwww twitter.com/tttt_cheese_na…
2022-01-26 13:12:22→実はそうなんですよね
DeepLは、もともとインターネット上にある文章や、ユーザーの入力したデータをAIで学習し、その結果を次の翻訳に生かしています。オタクが使えばオタクっぽい表現を学習するということです。
DeepL公式
ぶっちゃけ公式の説明は難解すぎて何を言っているのかよくわからないので、他のわかりやすい説明を持ってきました。立教大学異文化コニュニケーション学部教授、山田優氏のインタビュー記事です。
「Google翻訳やみらい翻訳と異なり、DeepL翻訳は内部の仕組みを説明した学術的な論文を出していないので、本当のところはわかりません。なのであくまでも憶測となりますが、次のように考えられると思います。
まず、最も大きいのは『データの質が良い』ということ。AIの深層学習を利用する際には、必ず原文と訳文のデータが必要になりますよね。その中から色々なパターンを見つけて学習していきます。この点でGoogle翻訳では、他社よりも桁違いに多いデータ量を保持していたことが最初はアドバンテージになったんですが、徐々にどうも質の悪いデータが多いということがわかってきた。
一方、DeepL翻訳の会社では、もともとウェブ上で原文と訳文を探してくる装置を持っていて、医療や機械工学などさまざまな分野に特化した対訳のデータベースを持っていたんです。それでプロの翻訳者向けに、翻訳する際の参考として使えるLingueeというサイトを運営していたんですね。その良質なコーパス(対訳データ)をベースに機械学習させて、医療用や機械工学用など専用の翻訳エンジンを作っていきました。
DeepL翻訳の裏側は一つではなくて、どうも専用の翻訳エンジンが複数あるようです。それで、例えば医療の分野のテクストを入力すると、『この単語の並びは医療っぽいな』と判定して、医療専用の機械翻訳に送るようになっているらしい。なのでGoogle翻訳などの一般知識しか持たない機械翻訳よりも、良質なコーパスで鍛えられた専用の翻訳エンジンがたくさん揃っているDeepL翻訳のほうが、精度が高いと言われています」
量より質で勝利したDeepL
DeepLは、GoogleやMicrosoftほど学習データはなくても、数学とニューラルネットワークの方法論で、AI機械翻訳において圧倒的に1位に。これはどの機械学習スタートアップにも参考になる話よなぁ。 DeepL.com/blog/20200206.… pic.twitter.com/fg3db1EItu
2020-06-17 21:13:40Cynthialy CEO🔥OpenAI / Copilot等エンプラ向け生成AI人材育成・コンサル・Gen AIX伴走|Women AI Initiative創設|ChatGPT活用大全監修ベストセラー1位| 起業←AI Startup←SAP|iU客員教授・GUGA協議員・NewsPicksプロピッカー
ただし弱点もあります。
弱点:偏見がある
※インターネット上の偏見を学習したためと考えられる。
@TtTt_Cheese_Nan リケジョの英訳は"男性の同性愛を描いた漫画が好きな女性" 精密がすぎる。 pic.twitter.com/Kpv3scxcBP
2022-01-26 17:32:23弱点②:口調がブレる
※学習元に様々な語調が存在するため。
@TtTt_Cheese_Nan 確かに偶に面白いことになるよね。 だって今まで普通に標準語だったのに急に関西弁になるんだもん。 pic.twitter.com/5XJMXhzRME
2022-01-26 19:41:03