【ICT教育】情報工学×文法教育の接点を探る

「プログラミング教育」への批判からはじまった情報工学×文法教育の可能性に関する議論。情報工学で用いられている形態素分析の観点から文法教育を捉え直すことで、情報教育・ICT教育につながりうる文法教育の可能性を考えることができる。
8
Ynupc @ynupc

@kimi_lab Jumanによる形態素解析はこちらでお試しください。 lotus.kuee.kyoto-u.ac.jp/nl-resource/cg… また、Jumanの形態素解析結果を用いた係り受け解析はこちらのKNPでお試しください。 lotus.kuee.kyoto-u.ac.jp/nl-resource/cg…

2015-12-28 13:47:07
Kimi Ishida @kimi_lab

@ynupc なるほど、便利なツールがあるんですね!

2015-12-28 13:48:11
Ynupc @ynupc

@kimi_lab はい。ただし、品詞体系に内在する問題と解析器のエラーは分けて考えるべきかと思います。

2015-12-28 13:54:56
Kimi Ishida @kimi_lab

.@yunupc さんに教えていただいた解析ツールを使用して、「ねじれ文」とそうでない文の比較をやってみました。「規範文法」と「記述文法」の関係など、いろいろ考えさせられますね。 twitter.com/ynupc/status/6… pic.twitter.com/HwvY92kbhI

2015-12-28 14:01:18
拡大
拡大
KAMMERA Yuta @mera85326

.@ynupc @kimi_lab ご指摘の点は重要ですね。ただ申し訳ないことに「現在の学校文法の教育目的」があいまいな状態(なにせ古典文法が持ち出される状況)です。現在模索しているのは「作文や読解に役立てるため」という目的ですが→ twitter.com/ynupc/status/6…

2015-12-28 14:04:21
Ynupc @ynupc

@mera85326 @kimi_lab (承前)文法教育と情報教育の両立の可能性が広がりより良いのではと私は考えました。形態素解析の観点からの文法の認知的な良し悪しというよりは、そのような文法の教育では現在の学校文法の教育目的に反することがあるのかないのかを知りたいです。

2015-12-28 13:18:17
KAMMERA Yuta @mera85326

.@ynupc @kimi_lab →だとすれば現在の学校文法をかなり見直し、「作文に役立つ」「読解に役立つ」とはどのようなことかを検討する必要があります。このあたりは今後の課題なのですが、もしも情報工学の観点から文章産出・文章分析について有用そうな知見があれば、伺いたいです。

2015-12-28 14:06:13
Kimi Ishida @kimi_lab

.@mera85326 @ynupc まったく情報工学の人ではないのですが、以前、大学生に「茶筅」chasen.naist.jp/hiki/ChaSen/ を使って、日本のポピュラーソングの歌詞分析をしてもらったことがあり、文章分析についてはかなり面白い知見が得られるツールだと思いましたよ

2015-12-28 14:10:45
KAMMERA Yuta @mera85326

@kimi_lab @ynupc あ、このツールは知りませんでした。ちょっとさわってみます。ありがとうございます!

2015-12-28 14:12:04
Ynupc @ynupc

@mera85326 @kimi_lab 情報工学では文章生成は難しすぎて避けられているように感じます。

2015-12-28 14:43:08
Ynupc @ynupc

@mera85326 @kimi_lab 文章分析は、談話構造分析としてRhetorical Structure Theoryというもので多数の基本相互関係(21個?)を用いて分析する方法が言語処理で割と使われていると思います。

2015-12-28 14:43:23
Ynupc @ynupc

@mera85326 @kimi_lab 文章の良し悪しを定量的に測るものとしてROUGEという自動要約の分野で使われる指標があります。参照要約(模範解答)とどれだけ類似しているかを自動計算するもので、測るための単位(形態素Ngramかなど)や計算方法で様々な種類があります。

2015-12-28 14:44:21
Ynupc @ynupc

@mera85326 @kimi_lab ROUGEは文章の内容的な良し悪しの評価なので、文構造の良し悪しを測る一般的な方法は言語処理の世界ではないと思います。結束性や一貫性を定性分析する程度でしょうか・・・

2015-12-28 14:47:36
Ynupc @ynupc

@mera85326 @kimi_lab 最近はChaSenよりはMeCabの方が使われている印象があります。 MeCabには辞書が4種類あるのでIPA, NAIST(IPAと品詞体系は同じ)、JUMAN、短単位のUniDicそれぞれで試してみてください。

2015-12-28 14:50:43
Ynupc @ynupc

@mera85326 @kimi_lab MeCabの係り受け解析はCaboChaです。 CaboChaの述語項解析にChaPASというものもあります。 ぜひ試してみてください。 (一旦、寝ます。)

2015-12-28 14:53:25
KAMMERA Yuta @mera85326

情報工学的な文章分析では、内容の指標があって形式の指標がない、というのが意外でした。勉強になります、ありがとうございます! twitter.com/ynupc/status/6…

2015-12-28 15:32:51
Kimi Ishida @kimi_lab

@ynupc お休み前の貴重な御時間を、情報工学的知識に疎い国語教育研究者たちの質問にお付き合いいただき、また有益な情報をたくさんご提供いただき、感謝しております。Have a good sleep!!

2015-12-28 16:50:37
KAMMERA Yuta @mera85326

@kimi_lab @ynupc あ、まとめについては、むしろありがとうございます! このあとお気に入りに入れておきます!

2015-12-28 19:17:53
KAMMERA Yuta @mera85326

“【ICT教育】情報工学×文法教育の接点を探る - Togetterまとめ” htn.to/b9PzRCHFTU7

2015-12-28 19:20:19
KAMMERA Yuta @mera85326

225件のコメント b.hatena.ne.jp/entry/atohs.ha… “若者言葉「さある」形の使用実態と、 その特徴について - あとーすログ” htn.to/8tgwfAAdDhQ

2015-12-28 22:07:26
Ynupc @ynupc

@mera85326 文や文章の綺麗さを表すような定量的な指数は言語処理ではまだ確立されていないという認識です。内容についてのROUGEも良く使われているけど研究者に完全に信用されているわけではないという認識です。

2015-12-29 00:09:42
Ynupc @ynupc

@mera85326 ROUGEを使用する上で参照要約(模範解答)を何個用意するのが良いのか、どの単位(形態素N-gram、内容語N-gramなど)が良いのかと言った議論や、

2015-12-29 00:09:54
Ynupc @ynupc

@mera85326 ROUGEのような単語単位のオーバラップでの類似度ではなく係り受けをベースにしたBasic Elementsや最小命題をベースにしたiUnitなど新たな指数も提案されています。

2015-12-29 00:10:20
KAMMERA Yuta @mera85326

@ynupc 客観的な文章の指標もいろいろな方向から検討されているのですね。こちらも勉強してみます。情報提供本当にありがとうございます!

2015-12-29 00:16:15
Ynupc @ynupc

@mera85326 はい。文や文章の綺麗さを表すような定量指標が生まれたら言語処理界で大きなブレークスルーに成るはずです。文章生成者が人間なのか機械なのかで指標が変わるかもしれません。機械が生成する文章には、人間が文章生成する過程では一般的に発生しないことが発生するので。

2015-12-29 00:26:48
Ynupc @ynupc

@mera85326 国語教育側にはそのような客観評価の研究は何かございませんでしょうか。

2015-12-29 00:28:44