
Asia-Pacific Corpus Linguistics Conference 2014の実況

最初のプログラムは基調講演1。D. Biber氏「A user-based taxonomy of web registers: Investigating the composition of the web through corpus analysis」 #APCLCj
2014-03-07 10:14:14
「書き言葉の無作為抽出」とは一体何なのか。コーパスはISBNのある小説や新聞、学術文などに偏っていて、メモや広告、契約書などは含まれていない。 #APCLCj
2014-03-07 10:22:29
ウェブだと無作為抽出が可能。一方で外的基準からレジスターを判断することはできない。非ウェブの書き言葉コーパスだと可能。 #APCLCj
2014-03-07 10:33:07
WebGenreWiki, the wiki dedicated to Automatic web Genre Identification http://t.co/l04bjFx4I7
2014-03-07 10:42:37
COCAの高頻度trigramを基にした、ウェブの無作為コーパスを作成。それをレジスターに分類した。48000文書。Amazon Mechanical Turk使用。908人。一つの文書につき4 raters。 #APCLCj
2014-03-07 10:47:11
結果。70%の文書について、3/4人以上のagreement。narrativeがウェブで最も多いレジスターだった。次にinfo. describe/explain。advertisementは意外と少なかった。 #APCLCj
2014-03-07 10:51:35
narrativeの中で多かったのはnews report / blog。次にsports report / blog。そしてpersonal narrative blog。ブログはジャンルが色々と分かれることがわかる。 #APCLCj
2014-03-07 10:54:41
「informational」というレベルではagreementが高くても、サブジャンルになると非常に低くなる。 #APCLCj
2014-03-07 10:59:11
4人が2-2 splitした場合はhybrid registerとした。narrativeとinformationalが混ざったジャンルなど。 #APCLCj
2014-03-07 11:03:46
これらのジャンルをBiber (1988)のMD分析の次元に乗せることにより、言語を分析し解釈した。ウェブ上の「narrative」は通常のfictionに比べるとnarrative度が低い。 #APCLCj
2014-03-07 11:06:05
Xiaofei Lu氏とHaiyang Ai氏の「A corpus-based study of the effect of L1 on syntactic complexity in college-level English writing」 #APCLCj
2014-03-07 13:14:16
ICLEとLOCNESSにSyntactic Complexity Analyzer(http://t.co/cM5HTfEkBm)をあてて、ANOVAでどのsyntactic complexityがL1で異なるかを見る#APCLCj
2014-03-07 13:14:58
Anthony先生他 (含:水本先生)「Broadening the scope of parallel corpus tools: Using AntPConc in the DDL classroom」 #APCLCj
2014-03-07 15:21:45
Second Asia Pacific Corpus Linguistics Conference (APCLC 2014) に参加しています。発表ではDDL (data-driven learning) の実践報告を行います。 http://t.co/psdwsL9jAT
2014-03-07 14:49:22
AntPConc: A freeware parallel concordance program for Windows. http://t.co/gNuMHK3bV2
2014-03-07 15:11:34
パラレルコーパスのツールは限られている。オフラインではMulticoncordとParaConcだけ。両者が開発されたのはそれぞれ2002年と2003年で古く、しかも有料。 #APCLCj
2014-03-07 15:22:11
そこでAntPConc!今はWindowsでしか動かないが、すぐにMac等のバージョンもリリースする。技術的にはSQLite/PyQt/Python 2.7で、n-gramでindexing #APCLCj
2014-03-07 15:23:51
中條先生にバトンタッチ。TOEIC300点、350点の215人の工学部生を対象に中高レベルの文法のDDL。8年間のDDLの経験で、日本語があった方が文法事項に焦点が当たるということを学んだ。 #APCLCj
2014-03-07 15:27:31