Asia-Pacific Corpus Linguistics Conference 2014の実況

2014年3月7-8日に香港理工大学で開催された標題の学会についてのつぶやきのまとめです。次回は北京のBeihang University(北京航空航天大学)で2016年の10月中旬に開催されるそうです。
5
Akira Murakami @mrkm_a

基調講演の部屋、各席にコンセントがある。さすが理工大学。

2014-03-07 10:13:06

Akira Murakami @mrkm_a

最初のプログラムは基調講演1D. Biber氏「A user-based taxonomy of web registers: Investigating the composition of the web through corpus analysis」 #APCLCj

2014-03-07 10:14:14
Akira Murakami @mrkm_a

「書き言葉の無作為抽出」とは一体何なのか。コーパスはISBNのある小説や新聞、学術文などに偏っていて、メモや広告、契約書などは含まれていない。 #APCLCj

2014-03-07 10:22:29
Akira Murakami @mrkm_a

ウェブだと無作為抽出が可能。一方で外的基準からレジスターを判断することはできない。非ウェブの書き言葉コーパスだと可能。 #APCLCj

2014-03-07 10:33:07
Akira Murakami @mrkm_a

WebGenreWiki, the wiki dedicated to Automatic web Genre Identification http://t.co/l04bjFx4I7

2014-03-07 10:42:37
Akira Murakami @mrkm_a

COCAの高頻度trigramを基にした、ウェブの無作為コーパスを作成。それをレジスターに分類した。48000文書。Amazon Mechanical Turk使用。908人。一つの文書につき4 raters。 #APCLCj

2014-03-07 10:47:11
Akira Murakami @mrkm_a

結果。70%の文書について、3/4人以上のagreement。narrativeがウェブで最も多いレジスターだった。次にinfo. describe/explain。advertisementは意外と少なかった。 #APCLCj

2014-03-07 10:51:35
Akira Murakami @mrkm_a

narrativeの中で多かったのはnews report / blog。次にsports report / blog。そしてpersonal narrative blog。ブログはジャンルが色々と分かれることがわかる。 #APCLCj

2014-03-07 10:54:41
Akira Murakami @mrkm_a

「informational」というレベルではagreementが高くても、サブジャンルになると非常に低くなる。 #APCLCj

2014-03-07 10:59:11
Akira Murakami @mrkm_a

4人が2-2 splitした場合はhybrid registerとした。narrativeとinformationalが混ざったジャンルなど。 #APCLCj

2014-03-07 11:03:46
Akira Murakami @mrkm_a

これらのジャンルをBiber (1988)のMD分析の次元に乗せることにより、言語を分析し解釈した。ウェブ上の「narrative」は通常のfictionに比べるとnarrative度が低い。 #APCLCj

2014-03-07 11:06:05

Akira Murakami @mrkm_a

Xiaofei Lu氏とHaiyang Ai氏の「A corpus-based study of the effect of L1 on syntactic complexity in college-level English writing」 #APCLCj

2014-03-07 13:14:16
Akira Murakami @mrkm_a

ICLEとLOCNESSにSyntactic Complexity Analyzer(http://t.co/cM5HTfEkBm)をあてて、ANOVAでどのsyntactic complexityがL1で異なるかを見る#APCLCj

2014-03-07 13:14:58
Akira Murakami @mrkm_a

L1日本語話者は文長、T-unit、節が短い。L1ドイツ語話者は逆。 #APCLCj

2014-03-07 13:16:42

Akira Murakami @mrkm_a

Anthony先生他 (含:水本先生)「Broadening the scope of parallel corpus tools: Using AntPConc in the DDL classroom」 #APCLCj

2014-03-07 15:21:45
MizumotoAtsushi @MizumotoAtsushi

Second Asia Pacific Corpus Linguistics Conference (APCLC 2014) に参加しています。発表ではDDL (data-driven learning) の実践報告を行います。 http://t.co/psdwsL9jAT

2014-03-07 14:49:22
Akira Murakami @mrkm_a

AntPConc: A freeware parallel concordance program for Windows. http://t.co/gNuMHK3bV2

2014-03-07 15:11:34
Akira Murakami @mrkm_a

パラレルコーパスのツールは限られている。オフラインではMulticoncordとParaConcだけ。両者が開発されたのはそれぞれ2002年と2003年で古く、しかも有料。 #APCLCj

2014-03-07 15:22:11
Akira Murakami @mrkm_a

そこでAntPConc!今はWindowsでしか動かないが、すぐにMac等のバージョンもリリースする。技術的にはSQLite/PyQt/Python 2.7で、n-gramでindexing #APCLCj

2014-03-07 15:23:51
Akira Murakami @mrkm_a

中條先生にバトンタッチ。TOEIC300点、350点の215人の工学部生を対象に中高レベルの文法のDDL。8年間のDDLの経験で、日本語があった方が文法事項に焦点が当たるということを学んだ。 #APCLCj

2014-03-07 15:27:31
Akira Murakami @mrkm_a

DD L→ follow-up exercises。疑問詞や完了相などが対象。 #APCLCj

2014-03-07 15:29:35
1 ・・ 4 次へ