Asia-Pacific Corpus Linguistics Conference 2014の実況

2014年3月7-8日に香港理工大学で開催された標題の学会についてのつぶやきのまとめです。次回は北京のBeihang University(北京航空航天大学)で2016年の10月中旬に開催されるそうです。
人文
1300view 0コメント
5
Akira Murakami @mrkm_a
基調講演の部屋、各席にコンセントがある。さすが理工大学。

Akira Murakami @mrkm_a
最初のプログラムは基調講演1D. Biber氏「A user-based taxonomy of web registers: Investigating the composition of the web through corpus analysis」 #APCLCj
Akira Murakami @mrkm_a
「書き言葉の無作為抽出」とは一体何なのか。コーパスはISBNのある小説や新聞、学術文などに偏っていて、メモや広告、契約書などは含まれていない。 #APCLCj
Akira Murakami @mrkm_a
ウェブだと無作為抽出が可能。一方で外的基準からレジスターを判断することはできない。非ウェブの書き言葉コーパスだと可能。 #APCLCj
Akira Murakami @mrkm_a
WebGenreWiki, the wiki dedicated to Automatic web Genre Identification http://t.co/l04bjFx4I7
Akira Murakami @mrkm_a
COCAの高頻度trigramを基にした、ウェブの無作為コーパスを作成。それをレジスターに分類した。48000文書。Amazon Mechanical Turk使用。908人。一つの文書につき4 raters。 #APCLCj
Akira Murakami @mrkm_a
結果。70%の文書について、3/4人以上のagreement。narrativeがウェブで最も多いレジスターだった。次にinfo. describe/explain。advertisementは意外と少なかった。 #APCLCj
Akira Murakami @mrkm_a
narrativeの中で多かったのはnews report / blog。次にsports report / blog。そしてpersonal narrative blog。ブログはジャンルが色々と分かれることがわかる。 #APCLCj
Akira Murakami @mrkm_a
「informational」というレベルではagreementが高くても、サブジャンルになると非常に低くなる。 #APCLCj
Akira Murakami @mrkm_a
4人が2-2 splitした場合はhybrid registerとした。narrativeとinformationalが混ざったジャンルなど。 #APCLCj
Akira Murakami @mrkm_a
これらのジャンルをBiber (1988)のMD分析の次元に乗せることにより、言語を分析し解釈した。ウェブ上の「narrative」は通常のfictionに比べるとnarrative度が低い。 #APCLCj

Akira Murakami @mrkm_a
Xiaofei Lu氏とHaiyang Ai氏の「A corpus-based study of the effect of L1 on syntactic complexity in college-level English writing」 #APCLCj
Akira Murakami @mrkm_a
ICLEとLOCNESSにSyntactic Complexity Analyzer(http://t.co/cM5HTfEkBm)をあてて、ANOVAでどのsyntactic complexityがL1で異なるかを見る#APCLCj
Akira Murakami @mrkm_a
L1日本語話者は文長、T-unit、節が短い。L1ドイツ語話者は逆。 #APCLCj

Akira Murakami @mrkm_a
Anthony先生他 (含:水本先生)「Broadening the scope of parallel corpus tools: Using AntPConc in the DDL classroom」 #APCLCj
水本 篤 @MizumotoAtsushi
Second Asia Pacific Corpus Linguistics Conference (APCLC 2014) に参加しています。発表ではDDL (data-driven learning) の実践報告を行います。 http://t.co/psdwsL9jAT
Akira Murakami @mrkm_a
AntPConc: A freeware parallel concordance program for Windows. http://t.co/gNuMHK3bV2
Akira Murakami @mrkm_a
パラレルコーパスのツールは限られている。オフラインではMulticoncordとParaConcだけ。両者が開発されたのはそれぞれ2002年と2003年で古く、しかも有料。 #APCLCj
Akira Murakami @mrkm_a
そこでAntPConc!今はWindowsでしか動かないが、すぐにMac等のバージョンもリリースする。技術的にはSQLite/PyQt/Python 2.7で、n-gramでindexing #APCLCj
Akira Murakami @mrkm_a
中條先生にバトンタッチ。TOEIC300点、350点の215人の工学部生を対象に中高レベルの文法のDDL。8年間のDDLの経験で、日本語があった方が文法事項に焦点が当たるということを学んだ。 #APCLCj
Akira Murakami @mrkm_a
DD L→ follow-up exercises。疑問詞や完了相などが対象。 #APCLCj
残りを読む(75)
ログインして広告を非表示にする
ログインして広告を非表示にする