Asia-Pacific Corpus Linguistics Conference 2014の実況
最初のプログラムは基調講演1。D. Biber氏「A user-based taxonomy of web registers: Investigating the composition of the web through corpus analysis」 #APCLCj
2014-03-07 10:14:14「書き言葉の無作為抽出」とは一体何なのか。コーパスはISBNのある小説や新聞、学術文などに偏っていて、メモや広告、契約書などは含まれていない。 #APCLCj
2014-03-07 10:22:29ウェブだと無作為抽出が可能。一方で外的基準からレジスターを判断することはできない。非ウェブの書き言葉コーパスだと可能。 #APCLCj
2014-03-07 10:33:07WebGenreWiki, the wiki dedicated to Automatic web Genre Identification http://t.co/l04bjFx4I7
2014-03-07 10:42:37COCAの高頻度trigramを基にした、ウェブの無作為コーパスを作成。それをレジスターに分類した。48000文書。Amazon Mechanical Turk使用。908人。一つの文書につき4 raters。 #APCLCj
2014-03-07 10:47:11結果。70%の文書について、3/4人以上のagreement。narrativeがウェブで最も多いレジスターだった。次にinfo. describe/explain。advertisementは意外と少なかった。 #APCLCj
2014-03-07 10:51:35narrativeの中で多かったのはnews report / blog。次にsports report / blog。そしてpersonal narrative blog。ブログはジャンルが色々と分かれることがわかる。 #APCLCj
2014-03-07 10:54:41「informational」というレベルではagreementが高くても、サブジャンルになると非常に低くなる。 #APCLCj
2014-03-07 10:59:114人が2-2 splitした場合はhybrid registerとした。narrativeとinformationalが混ざったジャンルなど。 #APCLCj
2014-03-07 11:03:46これらのジャンルをBiber (1988)のMD分析の次元に乗せることにより、言語を分析し解釈した。ウェブ上の「narrative」は通常のfictionに比べるとnarrative度が低い。 #APCLCj
2014-03-07 11:06:05Xiaofei Lu氏とHaiyang Ai氏の「A corpus-based study of the effect of L1 on syntactic complexity in college-level English writing」 #APCLCj
2014-03-07 13:14:16ICLEとLOCNESSにSyntactic Complexity Analyzer(http://t.co/cM5HTfEkBm)をあてて、ANOVAでどのsyntactic complexityがL1で異なるかを見る#APCLCj
2014-03-07 13:14:58Anthony先生他 (含:水本先生)「Broadening the scope of parallel corpus tools: Using AntPConc in the DDL classroom」 #APCLCj
2014-03-07 15:21:45Second Asia Pacific Corpus Linguistics Conference (APCLC 2014) に参加しています。発表ではDDL (data-driven learning) の実践報告を行います。 http://t.co/psdwsL9jAT
2014-03-07 14:49:22AntPConc: A freeware parallel concordance program for Windows. http://t.co/gNuMHK3bV2
2014-03-07 15:11:34パラレルコーパスのツールは限られている。オフラインではMulticoncordとParaConcだけ。両者が開発されたのはそれぞれ2002年と2003年で古く、しかも有料。 #APCLCj
2014-03-07 15:22:11そこでAntPConc!今はWindowsでしか動かないが、すぐにMac等のバージョンもリリースする。技術的にはSQLite/PyQt/Python 2.7で、n-gramでindexing #APCLCj
2014-03-07 15:23:51中條先生にバトンタッチ。TOEIC300点、350点の215人の工学部生を対象に中高レベルの文法のDDL。8年間のDDLの経験で、日本語があった方が文法事項に焦点が当たるということを学んだ。 #APCLCj
2014-03-07 15:27:31