BPStudy#176〜BERTで自然言語処理を使ったサービスを開発してみよう まとめ

2022/04/27(水)に開催されたBPStudy#176〜BERTで自然言語処理を使ったサービスを開発してみよう( https://bpstudy.connpass.com/event/244966/ ) のまとめです。
2
nikkie / にっきー @ftnext

今夜私が(話を聴かせて)いただくのは #bpstudy 自然言語処理を使ったサービス開発ハンズオン! bpstudy.connpass.com/event/244966/ BERTを使った文章校正、19:30から!わくわく

2022-04-27 18:20:56
nibu / Yumihiki @YumihikiDev

今日は久しぶりに勉強会へ参加! #bpstudy

2022-04-27 19:31:43
佐藤治夫 @haru860

BPStudy始まりました!本日は自然言語処理がテーマです。 bpstudy.connpass.com/event/244966/ #bpstudy

2022-04-27 19:32:31
佐藤治夫 @haru860

BERTで自然言語処理をするエンジニアが増えてほしい、と kyさん #bpstudy

2022-04-27 19:34:37
nibu / Yumihiki @YumihikiDev

BERTによる自然言語処理入門とTransformerによる自然言語処理がおすすめ本らしい #bpstudy

2022-04-27 19:38:13
nikkie / にっきー @ftnext

#bpstudy KYさんからのBERTオススメ本 ストックマークさん ohmsha.co.jp/book/978427422… +1 こちらは事例豊富ですよねー。校正や文章分類、固有表現抽出

2022-04-27 19:38:14
nikkie / にっきー @ftnext

#bpstudy KYさんからのBERTオススメ本その2 asakura.co.jp/detail.php?boo… 朝倉書店さんから最近出た翻訳書です

2022-04-27 19:39:30
nikkie / にっきー @ftnext

本日の #bpstudy 「トルBERT」 twitter.com/hirokiky/statu…

2022-04-27 19:42:22
清原弘貴 @ ShodoでAI校正 @hirokiky

BERTで今回は「トル」の校正をするAIを作ります。たとえば「これははテストです」、「今日は27日日です」のような間違いを指摘できます。

2022-04-27 18:42:01
ながびん @nagabin

AIで校正してくれるサービスなんてあるんだなぁ shodo.ink #bpstudy

2022-04-27 19:44:58
佐藤治夫 @haru860

BERTのBは、Bidirectional。頭と後ろから読んでいって単語を判断していく。文全体を判断して処理していくことが画期的 #bpstudy

2022-04-27 19:45:22
ながびん @nagabin

日本語のウィキペディアの全文を学習したモデル…!を事前学習モデルとして利用できちゃう #bpstudy

2022-04-27 19:47:54
nikkie / にっきー @ftnext

#bpstudy BERTの説明は言語処理学会2022 #NLP2022 のチュートリアル(by ヤフーの柴田さん)が、私にはめちゃくちゃ分かりやすかったです slideshare.net/techblogyahoo/…

2022-04-27 19:48:13
ながびん @nagabin

おおー…それらしい単語が出てくる… #bpstudy

2022-04-27 19:57:45
ながびん @nagabin

今日は革命の日…!今日は死の日…!AIがなんか物騒だ #bpstudy

2022-04-27 19:58:30
ながびん @nagabin

おお…今日のお昼食べたもので、ちゃんと食べ物とか料理とかが出てきてる #bpstudy

2022-04-27 19:59:24
nikkie / にっきー @ftnext

#bpstudy BERTによるサマライズ、こちらとかですかね? github.com/dmmiller612/be… サマリーに入れるか入れないかで訓練して実現するそうです

2022-04-27 20:04:22
nikkie / にっきー @ftnext

#bpstudy 今回は各単語をKEEP/DELETEに分類させてトルを実現 (他にも補わせたり、置換させたり、活用形を直させたり) 別の手法は #chura_collabo (簡単な算数版) youtu.be/p4w3tVE3Pg8

2022-04-27 20:09:00
拡大
ながびん @nagabin

「だいじょばない」とかだと「だいじょうぶじゃない」って返ってくるのかな… #bpstudy

2022-04-27 20:09:48
ながびん @nagabin

タイポデータセットなんてものがあるのかぁ #bpstudy

2022-04-27 20:10:11
nikkie / にっきー @ftnext

#bpstudy kyさんが言及していた今回の手法(各トークンをKEEP/DELETEに分類) grammarlyさんが公開しているこちらの手法?なのかも github.com/grammarly/gect…

2022-04-27 20:29:48