昨日発生していたサイトログインできない不具合は修正されております(詳細はこちら)

2022/02/04 Pythonで手軽に始める文章校正 参加者の皆さんのツイート

【初心者向け】Pythonで手軽に始める文章校正 Shodo × ちゅらデータ 合同勉強会 https://churadata.connpass.com/event/234308/ 見返したくなり以下のクエリからざっと眺めてまとめました #chura_collabo until:2022-02-10 since:2022-01-20
2
リンク www.nltk.org NLTK :: nltk.util module
リンク www.nltk.org NLTK :: nltk.util module
nikkie / にっきー @ftnext

#chura_collabo 飛行機の運航、ピアノを引く、 これらは名詞が共起していそう(飛行機ー運航/運行、ピアノー引く/弾く)だから、助詞を除いてカウントすると検出できるようになるかもしれませんね

2022-02-04 19:37:49
nikkie / にっきー @ftnext

#chura_collabo sentence-splitter、こちら? 文に分けてくれるみたいですね github.com/azu/sentence-s…

2022-02-04 19:39:04
うひーマン @norikoni

あやめの判別できて何が楽しいと言われる. に比べると自然言語処理は楽しい #chura_collabo

2022-02-04 19:39:44
nikkie / にっきー @ftnext

#chura_collabo 書名が上がった『入門 自然言語処理』、Python 2系なのでお気をつけください oreilly.co.jp/books/97848731… 確か英語版が公開されていて、それはPython 3のコードだったと思います

2022-02-04 19:40:41
リンク www.oreilly.co.jp 入門 自然言語処理 自然言語処理(NLP:Natural Language Processing)の実践的な入門書です。「自然言語」とは、英語や日本語など人々が日常のコミュニケーションで使う言語のことで、NLPに基づく技術は、モバイル端末におけるテキストの予測や手書き文字認識、検索エンジンにおける統一されていないテキスト内の情報取得、機械翻訳においてはある言語で書かれたテキストの分析と多言語への変換など、広範囲に活用されるようになってきています。本書では、NLPの理論的な基礎、理論、応用をバランスよく解説。本書の例から学び、 100 users 25
nikkie / にっきー @ftnext

#chura_collabo 『BERTによる自然言語処理入門』 ohmsha.co.jp/book/978427422… こちらはBERTを使った例が充実してますよね、BERTで校正の章もありました

2022-02-04 19:42:14
リンク オーム社 BERTによる自然言語処理入門 Transformersを使った実践プログラミング | Ohmsha BERTはGoogleが2018年末に発表した自然言語処理モデルです。「文脈」を考慮した処理が特徴的であり、言語理解を評価する11個のタスクについて最高精度を達成し、今や標準的なモデルとしての地位を確立しています。 本書は、自然言語処理の近年における発展に大きな役割を果たし、かつ応用上も有用であるBERTの入門書です。前半で自然言語処理や機械学習について概説したのち、BERTによって実際にさまざまなタスクを解いていきます。具体的には、文章分類・固有表現抽出・文章校正・類似文章検索・データの可視化を扱います 7 users 58
nikkie / にっきー @ftnext

#chura_collabo 『実践 自然言語処理』という本が本日発売、先ほど上がった『入門 自然言語処理』、タイムリーだなと思いました oreilly.co.jp/books/97848731…

2022-02-04 19:44:05
リンク www.oreilly.co.jp 実践 自然言語処理 自然言語処理(Natural Language Processing:NLP)の本格的な実践書。過去10年間で起きたブレークスルーにより、NLPは小売、医療、金融、法律など、さまざまな分野での利用が増えてきました。急速に利用が拡大する中で、産業界でNLPを使ったシステムを構築するのに必要な知識を学べる講座や書籍は不足していました。本書を読むことで、NLPの要素技術やSNS、Eコマース、医療、金融といった具体的なビジネスへの適用方法に加えて、NLPシステムを開発するためのベストプラクティスを詳しく学べます。 57 users 73
nikkie / にっきー @ftnext

#chura_collabo 『入門 自然言語処理』、Python 2系の頃は「禁書」レベルだったそうです(有用すぎて) coreblog.org/ats/ten-reason…

2022-02-04 19:45:17
びぐなむ @bignum

お使いになった文に区切るプログラムは、コレですか?Wikipedia日本語版を1文事に区切るのには意外と苦労しています。 azu/sentence-splitter: Split {japanese, english} text into sentences. github.com/azu/sentence-s… #chura_collabo

2022-02-04 19:49:28
リンク GitHub GitHub - textlint-rule/sentence-splitter: Split {Japanese, English} text into sentences. Split {Japanese, English} text into sentences. Contribute to textlint-rule/sentence-splitter development by creating an account on GitHub.
清原弘貴 @hirokiky

@bignum さっくりと使う場合はSentenceSplitterを使うと便利かなと思います。私が今回の発表で準備をしたのは、こちらの東北大学さんのBERTを作るプログラムからコーパスを作りました github.com/cl-tohoku/bert…

2022-02-04 20:01:58
リンク GitHub GitHub - cl-tohoku/bert-japanese: BERT models for Japanese text. BERT models for Japanese text. Contribute to cl-tohoku/bert-japanese development by creating an account on GitHub. 8 users
びぐなむ @bignum

@hirokiky わざわざ、御回答ありがとうございます。ginzaとかbunkaiとか色々試してみてるんですが、これというものにまだ出会えていません。ご紹介頂いたものも試してみます! p.s. 今日のご講演、NLPを少し囓っている者には目からうろこでとても楽しかったです。初心に戻ってみます!

2022-02-04 23:05:11

ニューラル文章校正入門

ちゅらデータ @churadata

合同勉強会はちゅらデータの「ニューラル文章校正入門」が始まっています。 #chura_collabo youtube.com/c/churadata/li…

2022-02-04 19:46:15