くずし字をAIが解読する時代が来たことに喜びを覚える人たち。くずし字認識AIの作者が制作意図を語る展開も「資料の面白さを一般の人にわかってもらえたら」

心が踊るってやつだぜ
162
ロバート キャンベル @rcampbelltokyo

数億点規模という世界でも稀な量の古典籍・古文書を有しながら「くずし字」で書かれているため読める人が殆どいない現代日本。全世界のデータサイエンティストにAIを活用した認識モデルを募り、今日、その結果発表と授賞式が行われます。新時代に古典知の扉をみんなで開こうと #Kaggle #NIJL #NII pic.twitter.com/ba8jSygCrQ

2019-11-11 10:01:34
拡大
ロバート キャンベル @rcampbelltokyo

日本文学研究者 University Professor, Waseda U. 早稲田大学国際文学館特別顧問 / robertcampbell.jp. /youtube.com/channel/UCGbc4…

robertcampbell.jp

翎雅 Língyǎ @reclinata

@rcampbelltokyo 親親戚は古美術商で、私もくずし文字が読めるようにといわれたが、国文科を出ても、書道で草書を習っても、こ古文書解読字典などを何冊かひっくり返してもなかなか身に付かなかった。AIならたくさんの例を吸収して、かなりの精度でわかるようにしてくれるだろうと期待してます。

2019-11-11 10:39:24
みお奈 @pupu22bubu22

@rcampbelltokyo 凄い! 文字の美しさには惹かれながら、全然、読めずで、もやもやしてました。嬉しい😊

2019-11-11 10:25:30
特定非営利活動個人・源朝臣(あっそん) @genwat

@rcampbelltokyo @chizulabo 埋もれた古墳や木々に覆われた山城が、新技術の進展で発見される例が続いているだけに、この波が文学や文献学に押し寄せるのを楽しみにしています。 そこからのAIによるシソーラスやコーパスができれば、更に先の発見も生まれそう。

2019-11-11 12:18:30
特定非営利活動個人・源朝臣(あっそん) @genwat

@rcampbelltokyo @chizulabo 同様に、位置や距離方角が狂っている古地図の解析なども進むと面白いなあ。 もちろん、地形分類の自動化なども。 *くずし字ではないけど

2019-11-11 12:20:07
のん @nokorin528

@rcampbelltokyo 小学生の頃 先生も読めなかった社会科の教科書の関所の看板のくずし文字、家で父に聞いたらすらっと読んでくれて次の日授業中にで発表して鼻高々だったのを思い出しました。そして俳句が趣味で達筆だった今はもう亡き父を思い出しました。AIに読んでもらう時代になるとは父も驚いていることでしょう。

2019-11-11 18:29:56
琉金(→肉を斬らせて骨を断つ🐾😼💛 赤木俊夫さんを忘れない❣️) @take_mikazuchi

@Kikuchi_Monta @rcampbelltokyo 日本史の授業で、例えば… ・武田信玄など、戦国武将が部下にほうびを与える手紙 ・同じく、戦国武将の遺言 ・江戸時代などの、借金の証文 ・同じく、離縁状 など、古文書を読んで、 昔の人にも親近感持ってもらえるといいな😊👍

2019-11-12 13:53:12
たられば @tarareba722

編集者/だいたいニコニコしています/Fav→/大屋雄裕/鴻上尚史/東浩紀/士郎正宗/西原理恵子/伊坂幸太郎/みなもと太郎/中村珍/リアル脱出ゲーム/まどマギ/嵐/おかざき真里/ゆうきまさみ/羽海野チカ/末次由紀/小山宙哉/内藤泰弘/篠原健太/清少納言/羽生結弦/FGO/葦原大介/杉田圭/山本淳子/御用はリプ→DMで

たられば @tarareba722

この仕組みがすごいのは、古典文学だけでなく(つまり文学作品だけでなく)、近世以前のすべての文書のデジタル化が一気に進んで可読性と相互参照性と検索性が飛躍的に向上する可能性があることで、史実の人間関係や気象や地層や天文学にも資するまさに革命的発明だと思う。 headlines.yahoo.co.jp/hl?a=20191111-…

2019-11-12 10:03:58
リンク Yahoo!ニュース 古典・古文書の難読「くずし字」、AIが瞬時に解読…精度90%も(読売新聞オンライン) - Yahoo!ニュース 日本の古典文学や古文書などの「くずし字」を解読する人工知能(AI)に注目が集まって - Yahoo!ニュース(読売新聞オンライン) 33 users 1662
物書きモトタキ @motoyaKITO

@tarareba722 これはありがたい!くずし字によって、今の日本人は、江戸の文献すら読むのが困難です。 AIがざっくりでも今の文字にしてくれるのなら、読める文献の幅が広がりそう! 研究者ではなく、一般人もついこの間の日本を知ることができますね!とてもよいことです!

2019-11-12 10:08:11
銀河51号 ステージ4 @ginga25198491

@tarareba722 すごく期待しています。 卒業した高校の同窓会資料をアーカイブ化しようとしているのですが、画像としてデジタル化するのは易くとも、読めないので分類もできないようなことになっていて。

2019-11-12 12:08:04
ハチタロウ🐶🐾 @hachitarou

@tarareba722 石碑や言い伝えが現代の防災に活用されており、古文書の解析で新たに判明した情報が今後の防災に活かせるかもしれませんので、画期的で有意義な仕組みですね。

2019-11-12 19:26:20
トーマスさん @tohmas_tohmas

@tarareba722 自国の言葉を守りながら、世界の文化を学べる可能性もあるということでしょうか

2019-11-12 10:10:23
銀河51号 ステージ4 @ginga25198491

@tarareba722 たとえば、これは母校の明治37年の校務日誌なんですが、恥ずかしいことに私には、この程度の文字量でさえ読めないのです。 その解読だけでなく、相互参照性と検索性が飛躍的に向上する可能性、なんて夢のような話ではありませんか。 pic.twitter.com/A16DciUhPZ

2019-11-14 05:09:48
拡大

くずし字認識AI作者が語る制作意図

tkasasagi 🐻 @tkasasagi

PhD Japanese literature 早大文学博士 源氏古注専門 Research Scientist @SakanaAILabs Prev: @GoogleDeepMind Google Brain @rois_codh #miwoapp creator tkasasagi.github.io

tkasasagi 🐻 @tkasasagi

くずし字認識AIをなんで作ったのか、私はあまりちゃんと言っていないのですが、簡単に言うと、歴史資料をアクセスしやすくするのです。古典文学を守るために一般の人々から協力をもらえないといけない。でも、現状では文学研究者何をやっているのかもわからない。

2019-11-13 01:31:08
tkasasagi 🐻 @tkasasagi

資料が読めないから、読まれていないし、勝手に多く捨てられている。資料の面白さが一般の人々が分かってもらえたら、みんなが大事にしてくれるんじゃないかと思ったので、くずし字AIを作りました。日本人だけではなくて、くずし字資料の素晴らしさと面白さを海外にも知ってもらいたいから頑張りました

2019-11-13 01:32:08

嬉しいニュース過ぎる

悶僧騒動院検索捜査網火付投稿改方大門 @dddaimonsu

@tkasasagi いろんな地域社会から昔の資料の崩れた文字を読める人が不在の時代がすぐ近くまで来てる気がしてました。 過去と完全に途切れる時代がいよいよ来る,と不安に思ってました。 あなたのような人が新しいテクノロジーのAIと、勉強されてきた知識を結び付けたお陰でその危機は避けられそう。感謝します #iot

2019-11-13 13:09:43
happy_cross @happy_cross

@tkasasagi @shige45 曾爺ちゃんの日記が読めるようになるんだ!

2019-11-13 12:32:37
Masaru KOSAKA @ikkonclub

@tkasasagi @tanji_y 自分では読めない消息を少なからず所有している茶道関係者に福音です。普及すれば、茶席に消息が掛けられる機会が増え、それにより茶席の深みが増し、茶の湯の魅力が高まります。 頑張ってください!

2019-11-13 12:38:02