2022/02/04 Pythonで手軽に始める文章校正 参加者の皆さんのツイート
【初心者向け】Pythonで手軽に始める文章校正 Shodo × ちゅらデータ 合同勉強会
https://churadata.connpass.com/event/234308/
見返したくなり以下のクエリからざっと眺めてまとめました
#chura_collabo until:2022-02-10 since:2022-01-20
さわら
@xhiroga
素の文章に使うけど学習データをめっさ増やすアプローチと、修正対象をいい感じに絞り込んでピンポイントで使っていくアプローチ、どっちがいいのかとか気になる #chura_collabo
2022-02-04 20:06:19
菱沼 雄太@ちゅらデータCTO(しばらく執筆モード)
@foursue
#chura_collabo 普通にノートブック表示されてて参考になると思うので 週末文章校正で遊んでみたい人、ぜひ見て〜 youtube.com/c/churadata/li…
2022-02-04 20:06:33
うひーマン
@norikoni
最後はデータの前処理が重要になってくる. 単語単位でなくセンテンス単位で扱うことで モデルが学習しやすくなるということもある. このへんチューニングポイントととのこと #chura_collabo
2022-02-04 20:10:06
うひーマン
@norikoni
一般的なモデルをよそに持っていっても ドメイン毎に通用するというわけではない. ドメインのデータどんだけ準備しないといけないの というところは永遠の課題 #chura_collabo
2022-02-04 20:11:23
リンク
GitHub
GitHub - google/sentencepiece: Unsupervised text tokenizer for Neural Network-based text generation.
Unsupervised text tokenizer for Neural Network-based text generation. - GitHub - google/sentencepiece: Unsupervised text tokenizer for Neural Network-based text generation.
104 users
202
ちゅらデータ
@churadata
オンライン合同勉強会【(初心者向け)Pythonで手軽に始める文章校正】にご参加ありがとうございました。 イベント後にオンライン懇親会を実施します。 参加無料なのでお気軽にご参加下さい。 (1時間程度を予定しています) SpatialChat URL: spatial.chat/s/chura-collab… #chura_collabo
2022-02-04 20:24:38
清原弘貴
@hirokiky
#chura_collabo めちゃくちゃ緊張したけど伝えたいことを話せて良かったです。自然言語処理は面白いので、ぜひちょっとでもやってみてくれると嬉しいです。
2022-02-04 20:28:16
とも@勉強中
@asagi_today
#chura_collabo 自然言語処理に初めて触れましたが、面白かったです。 経路は違いますが、レシートから画像認識で文字抜き出して照合のプログラム作っていたのでこういう話は興味深いですね。
2022-02-04 20:35:32