【ICT教育】情報工学×文法教育の接点を探る
@kimi_lab Jumanによる形態素解析はこちらでお試しください。 lotus.kuee.kyoto-u.ac.jp/nl-resource/cg… また、Jumanの形態素解析結果を用いた係り受け解析はこちらのKNPでお試しください。 lotus.kuee.kyoto-u.ac.jp/nl-resource/cg…
2015-12-28 13:47:07.@yunupc さんに教えていただいた解析ツールを使用して、「ねじれ文」とそうでない文の比較をやってみました。「規範文法」と「記述文法」の関係など、いろいろ考えさせられますね。 twitter.com/ynupc/status/6… pic.twitter.com/HwvY92kbhI
2015-12-28 14:01:18.@ynupc @kimi_lab ご指摘の点は重要ですね。ただ申し訳ないことに「現在の学校文法の教育目的」があいまいな状態(なにせ古典文法が持ち出される状況)です。現在模索しているのは「作文や読解に役立てるため」という目的ですが→ twitter.com/ynupc/status/6…
2015-12-28 14:04:21@mera85326 @kimi_lab (承前)文法教育と情報教育の両立の可能性が広がりより良いのではと私は考えました。形態素解析の観点からの文法の認知的な良し悪しというよりは、そのような文法の教育では現在の学校文法の教育目的に反することがあるのかないのかを知りたいです。
2015-12-28 13:18:17.@ynupc @kimi_lab →だとすれば現在の学校文法をかなり見直し、「作文に役立つ」「読解に役立つ」とはどのようなことかを検討する必要があります。このあたりは今後の課題なのですが、もしも情報工学の観点から文章産出・文章分析について有用そうな知見があれば、伺いたいです。
2015-12-28 14:06:13.@mera85326 @ynupc まったく情報工学の人ではないのですが、以前、大学生に「茶筅」chasen.naist.jp/hiki/ChaSen/ を使って、日本のポピュラーソングの歌詞分析をしてもらったことがあり、文章分析についてはかなり面白い知見が得られるツールだと思いましたよ
2015-12-28 14:10:45@kimi_lab @ynupc あ、このツールは知りませんでした。ちょっとさわってみます。ありがとうございます!
2015-12-28 14:12:04@mera85326 @kimi_lab 文章分析は、談話構造分析としてRhetorical Structure Theoryというもので多数の基本相互関係(21個?)を用いて分析する方法が言語処理で割と使われていると思います。
2015-12-28 14:43:23@mera85326 @kimi_lab 文章の良し悪しを定量的に測るものとしてROUGEという自動要約の分野で使われる指標があります。参照要約(模範解答)とどれだけ類似しているかを自動計算するもので、測るための単位(形態素Ngramかなど)や計算方法で様々な種類があります。
2015-12-28 14:44:21@mera85326 @kimi_lab ROUGEは文章の内容的な良し悪しの評価なので、文構造の良し悪しを測る一般的な方法は言語処理の世界ではないと思います。結束性や一貫性を定性分析する程度でしょうか・・・
2015-12-28 14:47:36@mera85326 @kimi_lab 最近はChaSenよりはMeCabの方が使われている印象があります。 MeCabには辞書が4種類あるのでIPA, NAIST(IPAと品詞体系は同じ)、JUMAN、短単位のUniDicそれぞれで試してみてください。
2015-12-28 14:50:43@mera85326 @kimi_lab MeCabの係り受け解析はCaboChaです。 CaboChaの述語項解析にChaPASというものもあります。 ぜひ試してみてください。 (一旦、寝ます。)
2015-12-28 14:53:25情報工学的な文章分析では、内容の指標があって形式の指標がない、というのが意外でした。勉強になります、ありがとうございます! twitter.com/ynupc/status/6…
2015-12-28 15:32:51@ynupc お休み前の貴重な御時間を、情報工学的知識に疎い国語教育研究者たちの質問にお付き合いいただき、また有益な情報をたくさんご提供いただき、感謝しております。Have a good sleep!!
2015-12-28 16:50:37@kimi_lab @ynupc あ、まとめについては、むしろありがとうございます! このあとお気に入りに入れておきます!
2015-12-28 19:17:53“【ICT教育】情報工学×文法教育の接点を探る - Togetterまとめ” htn.to/b9PzRCHFTU7
2015-12-28 19:20:19225件のコメント b.hatena.ne.jp/entry/atohs.ha… “若者言葉「さある」形の使用実態と、 その特徴について - あとーすログ” htn.to/8tgwfAAdDhQ
2015-12-28 22:07:26@mera85326 文や文章の綺麗さを表すような定量的な指数は言語処理ではまだ確立されていないという認識です。内容についてのROUGEも良く使われているけど研究者に完全に信用されているわけではないという認識です。
2015-12-29 00:09:42@mera85326 ROUGEを使用する上で参照要約(模範解答)を何個用意するのが良いのか、どの単位(形態素N-gram、内容語N-gramなど)が良いのかと言った議論や、
2015-12-29 00:09:54@mera85326 ROUGEのような単語単位のオーバラップでの類似度ではなく係り受けをベースにしたBasic Elementsや最小命題をベースにしたiUnitなど新たな指数も提案されています。
2015-12-29 00:10:20@ynupc 客観的な文章の指標もいろいろな方向から検討されているのですね。こちらも勉強してみます。情報提供本当にありがとうございます!
2015-12-29 00:16:15@mera85326 はい。文や文章の綺麗さを表すような定量指標が生まれたら言語処理界で大きなブレークスルーに成るはずです。文章生成者が人間なのか機械なのかで指標が変わるかもしれません。機械が生成する文章には、人間が文章生成する過程では一般的に発生しないことが発生するので。
2015-12-29 00:26:48