2022/02/04 Pythonで手軽に始める文章校正 参加者の皆さんのツイート
#chura_collabo N=2のn-gramsはバイグラムとも呼ばれますね。 nltk.org/api/nltk.util.…
2022-02-04 19:36:20#chura_collabo 飛行機の運航、ピアノを引く、 これらは名詞が共起していそう(飛行機ー運航/運行、ピアノー引く/弾く)だから、助詞を除いてカウントすると検出できるようになるかもしれませんね
2022-02-04 19:37:49#chura_collabo sentence-splitter、こちら? 文に分けてくれるみたいですね github.com/azu/sentence-s…
2022-02-04 19:39:04#chura_collabo 書名が上がった『入門 自然言語処理』、Python 2系なのでお気をつけください oreilly.co.jp/books/97848731… 確か英語版が公開されていて、それはPython 3のコードだったと思います
2022-02-04 19:40:41#chura_collabo 『BERTによる自然言語処理入門』 ohmsha.co.jp/book/978427422… こちらはBERTを使った例が充実してますよね、BERTで校正の章もありました
2022-02-04 19:42:14#chura_collabo 『実践 自然言語処理』という本が本日発売、先ほど上がった『入門 自然言語処理』、タイムリーだなと思いました oreilly.co.jp/books/97848731…
2022-02-04 19:44:05#chura_collabo 『入門 自然言語処理』、Python 2系の頃は「禁書」レベルだったそうです(有用すぎて) coreblog.org/ats/ten-reason…
2022-02-04 19:45:17お使いになった文に区切るプログラムは、コレですか?Wikipedia日本語版を1文事に区切るのには意外と苦労しています。 azu/sentence-splitter: Split {japanese, english} text into sentences. github.com/azu/sentence-s… #chura_collabo
2022-02-04 19:49:28@bignum さっくりと使う場合はSentenceSplitterを使うと便利かなと思います。私が今回の発表で準備をしたのは、こちらの東北大学さんのBERTを作るプログラムからコーパスを作りました github.com/cl-tohoku/bert…
2022-02-04 20:01:58@hirokiky わざわざ、御回答ありがとうございます。ginzaとかbunkaiとか色々試してみてるんですが、これというものにまだ出会えていません。ご紹介頂いたものも試してみます! p.s. 今日のご講演、NLPを少し囓っている者には目からうろこでとても楽しかったです。初心に戻ってみます!
2022-02-04 23:05:11ニューラル文章校正入門
合同勉強会はちゅらデータの「ニューラル文章校正入門」が始まっています。 #chura_collabo youtube.com/c/churadata/li…
2022-02-04 19:46:15