10周年のSPコンテンツ!
153
ロバート キャンベル @rcampbelltokyo
数億点規模という世界でも稀な量の古典籍・古文書を有しながら「くずし字」で書かれているため読める人が殆どいない現代日本。全世界のデータサイエンティストにAIを活用した認識モデルを募り、今日、その結果発表と授賞式が行われます。新時代に古典知の扉をみんなで開こうと #Kaggle #NIJL #NII pic.twitter.com/ba8jSygCrQ
拡大
ロバート キャンベル @rcampbelltokyo

日本文学研究者。国文学研究資料館長。Lover of cats, flâneur, Director General of NIJL in Tokyo. robertcampbell.jp. / nijl.ac.jp

robertcampbell.jp
友香 tomoka 左マヒリハビリ中 @reclinata
@rcampbelltokyo 親親戚は古美術商で、私もくずし文字が読めるようにといわれたが、国文科を出ても、書道で草書を習っても、こ古文書解読字典などを何冊かひっくり返してもなかなか身に付かなかった。AIならたくさんの例を吸収して、かなりの精度でわかるようにしてくれるだろうと期待してます。
みお奈 @pupu22bubu22
@rcampbelltokyo 凄い! 文字の美しさには惹かれながら、全然、読めずで、もやもやしてました。嬉しい😊
特定非営利活動個人・源朝臣(あっそん) @genwat
@rcampbelltokyo @chizulabo 埋もれた古墳や木々に覆われた山城が、新技術の進展で発見される例が続いているだけに、この波が文学や文献学に押し寄せるのを楽しみにしています。 そこからのAIによるシソーラスやコーパスができれば、更に先の発見も生まれそう。
特定非営利活動個人・源朝臣(あっそん) @genwat
@rcampbelltokyo @chizulabo 同様に、位置や距離方角が狂っている古地図の解析なども進むと面白いなあ。 もちろん、地形分類の自動化なども。 *くずし字ではないけど
のん @nokorin528
@rcampbelltokyo 小学生の頃 先生も読めなかった社会科の教科書の関所の看板のくずし文字、家で父に聞いたらすらっと読んでくれて次の日授業中にで発表して鼻高々だったのを思い出しました。そして俳句が趣味で達筆だった今はもう亡き父を思い出しました。AIに読んでもらう時代になるとは父も驚いていることでしょう。
琉金(野生化→心の声を聴いて進むッ🐅🐾) @take_mikazuchi
@Kikuchi_Monta @rcampbelltokyo 日本史の授業で、例えば… ・武田信玄など、戦国武将が部下にほうびを与える手紙 ・同じく、戦国武将の遺言 ・江戸時代などの、借金の証文 ・同じく、離縁状 など、古文書を読んで、 昔の人にも親近感持ってもらえるといいな😊👍
たられば @tarareba722

編集者/だいたいニコニコしています/Fav→/大屋雄裕/呉智英/鴻上尚史/高島俊男/東浩紀/士郎正宗/西原理恵子/伊坂幸太郎/みなもと太郎/瀧波ユカリ/中村珍/リアル脱出ゲーム/まどマギ/嵐/おかざき真里/ゆうきまさみ/羽海野チカ/末次由紀/小山宙哉/内藤泰弘/篠原健太/清少納言/羽生結弦/FGO/御用はリプ→DMで

たられば @tarareba722
この仕組みがすごいのは、古典文学だけでなく(つまり文学作品だけでなく)、近世以前のすべての文書のデジタル化が一気に進んで可読性と相互参照性と検索性が飛躍的に向上する可能性があることで、史実の人間関係や気象や地層や天文学にも資するまさに革命的発明だと思う。 headlines.yahoo.co.jp/hl?a=20191111-…
リンク Yahoo!ニュース 33 users 1662 古典・古文書の難読「くずし字」、AIが瞬時に解読…精度90%も(読売新聞オンライン) - Yahoo!ニュース 日本の古典文学や古文書などの「くずし字」を解読する人工知能(AI)に注目が集まって - Yahoo!ニュース(読売新聞オンライン)
物書きモトタキ@ガラダ堂12/28大崎おもしろ同人誌バザール @motoyaKITO
@tarareba722 これはありがたい!くずし字によって、今の日本人は、江戸の文献すら読むのが困難です。 AIがざっくりでも今の文字にしてくれるのなら、読める文献の幅が広がりそう! 研究者ではなく、一般人もついこの間の日本を知ることができますね!とてもよいことです!
銀河51号 @ginga25198491
@tarareba722 すごく期待しています。 卒業した高校の同窓会資料をアーカイブ化しようとしているのですが、画像としてデジタル化するのは易くとも、読めないので分類もできないようなことになっていて。
ハチタロウ @hachitarou
@tarareba722 石碑や言い伝えが現代の防災に活用されており、古文書の解析で新たに判明した情報が今後の防災に活かせるかもしれませんので、画期的で有意義な仕組みですね。
トーマス@趣味垢 @ii_persons
@tarareba722 自国の言葉を守りながら、世界の文化を学べる可能性もあるということでしょうか
銀河51号 @ginga25198491
@tarareba722 たとえば、これは母校の明治37年の校務日誌なんですが、恥ずかしいことに私には、この程度の文字量でさえ読めないのです。 その解読だけでなく、相互参照性と検索性が飛躍的に向上する可能性、なんて夢のような話ではありませんか。 pic.twitter.com/A16DciUhPZ
拡大
くずし字認識AI作者が語る制作意図
tkasasagi🐻 @tkasasagi

PhD (JPN literature) Project Assistant Professor at @rois_codh NII @jouhouken Japan. I tweet about dumb stuff, bears, Japanese cultural stuff

tkasasagi🐻 @tkasasagi
くずし字認識AIをなんで作ったのか、私はあまりちゃんと言っていないのですが、簡単に言うと、歴史資料をアクセスしやすくするのです。古典文学を守るために一般の人々から協力をもらえないといけない。でも、現状では文学研究者何をやっているのかもわからない。
tkasasagi🐻 @tkasasagi
資料が読めないから、読まれていないし、勝手に多く捨てられている。資料の面白さが一般の人々が分かってもらえたら、みんなが大事にしてくれるんじゃないかと思ったので、くずし字AIを作りました。日本人だけではなくて、くずし字資料の素晴らしさと面白さを海外にも知ってもらいたいから頑張りました
嬉しいニュース過ぎる
無双騒動院大門 @dddaimonsu
@tkasasagi いろんな地域社会から昔の資料の崩れた文字を読める人が不在の時代がすぐ近くまで来てる気がしてました。 過去と完全に途切れる時代がいよいよ来る,と不安に思ってました。 あなたのような人が新しいテクノロジーのAIと、勉強されてきた知識を結び付けたお陰でその危機は避けられそう。感謝します #iot
happy_cross @happy_cross
@tkasasagi @shige45 曾爺ちゃんの日記が読めるようになるんだ!
Masaru KOSAKA @ikkonclub
@tkasasagi @tanji_y 自分では読めない消息を少なからず所有している茶道関係者に福音です。普及すれば、茶席に消息が掛けられる機会が増え、それにより茶席の深みが増し、茶の湯の魅力が高まります。 頑張ってください!
残りを読む(5)

コメント

ろんどん @lawtomol 2019年11月14日
昔の人はアレをスラスラ読んでいたのかなぁ…なお字が読めたからといって、内容が理解できるかは別問題(原文で「源氏物語」が理解できるかっちゅーと、ねえ)
こねこのゆっきー @vicy 2019年11月14日
うちにもけっこうあるから、実用化したらほしいわ
クリスセドン @sedooooooon 2019年11月14日
人間「えーと…インド人を右に」 AI「ハンドルな」
reesia @reesia_T 2019年11月14日
汚いのとは違ってちゃんとした崩し字は一応規則性があるからね。汚い癖字の自動判別はまだ遠いだろう。
語るおじさん(おじさん) @ojisan_think_so 2019年11月14日
これはスゴい 本当に人を越える存在が生まれようとしてるんだなあ……
Yo-太 @Yota586 2019年11月14日
こいつぁめでてえ。精度90%くらいなら人間側の補正でちゃんと読めるところまで引き上げる事はできそう。
やって後悔よりやらない選択 @Negative_IsGood 2019年11月14日
ということはアイツやソイツのミミズの這ったような文字も解読できるんやな! #早合点
うに @UNYYYY_JJ 2019年11月14日
大学の頃にくずし字の辞典を使って江戸時代の借用書等の古文書を解読する講義があったなぁ。 教授が「昔の人は同じ字でも異なる形のくずし字を書ける事が知性のあらわれだった」と言っていたのを思い出す。
DWIW@柿食えば_鐘がなるなり_モドリッチ @IWDWIW 2019年11月14日
映画「ブレイド」に出てきた古代語の解読ソフトを思い出した。
ばにやまだ @baniyamada 2019年11月14日
現代の「っ」みたいな字形でも文によって全く読みが異なるのに凄いな。
たるたる @heporap 2019年11月14日
読める文字から虫食い問題のように推測するのはできるけど、読めない文字が多いと全く読めなくなる。
たるたる @heporap 2019年11月14日
最初のポスター、「〜とこ志のぶずりの特衣〜」みたいな、現代文章としてよくわからんことば(ずりの特衣)みたいなのが使われていると、まったく読めない。
巳堂鷺之丞 @saginojoh 2019年11月14日
UNYYYY_JJ 本居宣長が、源氏物語を書き写すのに「一ページに出てくる文字を絶対同じくずし字で書かない」という縛りルールを作って臨んだせいで、影写本解読の授業で「あいつのインテリ自慢のせいで俺らが苦しんでる」と怨嗟の声が渦巻いてたな。
夏越丸@ねんくり引き取り先募集 @nagoshimaru 2019年11月14日
heporap (とこ)忍夫摺りの御衣、じゃないかな。模様彫った石に布置いて忍夫て草で擦って染めたやつ。
RAM (内調かもしれない) @PLAPAPA 2019年11月14日
nagoshimaru 『陸奥のしのぶもぢずり誰ゆゑに乱れむと思ふ我ならなくに』源融[古今集]巻十四ですね。前後も服飾についての文のようですので、ご推察の通りかと思います。
RAM (内調かもしれない) @PLAPAPA 2019年11月14日
PLAPAPA 『乱れむと思ふ』は『乱れそめにし』の本もあり、古今とすれば、こちらのほうがよいのかも。
よみ @VKcyNlic7p1hOSs 2019年11月14日
古典の授業あんなにやっておいて文字すら読めないなんて悲しいな
ザンちゃん @zanchann 2019年11月14日
機械に仕事とられるみたいに喚く阿呆もいるけど、こういう人間には大変な奴をやってくれればいいよなぁ。
ゆゆ @yuyu_news 2019年11月14日
くずし字(というか変体仮名)資料は、現代仮名遣い読み下し(「意訳」よりもこれ!)があった方が、展示室でも盛り上がる系統だと思う。
okwae @okwae858 2019年11月14日
読める人少ないし解読するだけが仕事じゃないしで日本の古文書って全体の数%しか解読できてないんじゃなかったかな 大学や研究所にあって読むこと自体はできるのに、そこに書いてある歴史の新事実が最近になって解明されるとかザラ これで研究が盛んになるといいね
ゆゆ @yuyu_news 2019年11月14日
美術館で書物を見て「大体こんな内容が書いてあります」よりも「ここの内容は現代仮名遣いではこう表記されます(&古文に明るくない人向けの現代語での「あらすじ」)」の方が、絶対に見ている方が盛り上がる。
冶金 @yakeen4510 2019年11月14日
でたらめな翻訳ソフト程度のものだったらどうしよう。
たるたる @heporap 2019年11月15日
nagoshimaru そんな衣類があるんですね。やはり言葉を知ってる方が読めますね。
たるたる @heporap 2019年11月15日
象形文字やトンパ文字も前後関係で意味が変わったりする文字があるらしいですし、現代日本語の漢字も前後関係で読み方や意味が変わる漢字があるので、一文字ずつ解析するよりも流れで読んだ方が読みやすいと思うんですけどね。
夏越丸@ねんくり引き取り先募集 @nagoshimaru 2019年11月15日
heporap ソフトなくても読めなきゃいけない日文卒…。ですが、すでにほぼ読めなくなってるのでありがたいことです。
生ハムばなな @Namahamu_BANANA 2019年11月15日
話が逆転しちゃうが昨今の刀剣への知識が急上昇してるような一部界隈の例を見るに何かしらのきっかけがあった時に読解のとっかかりがあれば執念で読めるようになる人も増えるんじゃないだろうかw
たけ @Eo554IijYfHOQqw 2019年11月15日
確実に裾野が広がるすごい技術だ。そして裾野が広がれば頂点も広がる。
ログインして広告を非表示にする
ログインして広告を非表示にする