2022/02/04 Pythonで手軽に始める文章校正 参加者の皆さんのツイート

【初心者向け】Pythonで手軽に始める文章校正 Shodo × ちゅらデータ 合同勉強会 https://churadata.connpass.com/event/234308/ 見返したくなり以下のクエリからざっと眺めてまとめました #chura_collabo until:2022-02-10 since:2022-01-20
2
前へ 1 ・・ 3 4
さわら @xhiroga

全然関係ないけど、このプレゼン資料ってJupyter Notebookで出来てる? #chura_collabo

2022-02-04 20:04:54
さわら @xhiroga

素の文章に使うけど学習データをめっさ増やすアプローチと、修正対象をいい感じに絞り込んでピンポイントで使っていくアプローチ、どっちがいいのかとか気になる #chura_collabo

2022-02-04 20:06:19
菱沼 雄太@ちゅらデータCTO(しばらく執筆モード) @foursue

#chura_collabo 普通にノートブック表示されてて参考になると思うので 週末文章校正で遊んでみたい人、ぜひ見て〜 youtube.com/c/churadata/li…

2022-02-04 20:06:33
うひーマン @norikoni

学習用データ準備するのはどうするよ? #chura_collabo

2022-02-04 20:07:53
うひーマン @norikoni

学習データ自体ニューラルネットワークに作らせる.ということも出てきているらしい. #chura_collabo

2022-02-04 20:08:40
うひーマン @norikoni

固有名詞はパターンをとらえるのが難しい. 格助詞は汎用的ながら難しい. #chura_collabo

2022-02-04 20:09:11
うひーマン @norikoni

最後はデータの前処理が重要になってくる. 単語単位でなくセンテンス単位で扱うことで モデルが学習しやすくなるということもある. このへんチューニングポイントととのこと #chura_collabo

2022-02-04 20:10:06
うひーマン @norikoni

一般的なモデルをよそに持っていっても ドメイン毎に通用するというわけではない. ドメインのデータどんだけ準備しないといけないの というところは永遠の課題 #chura_collabo

2022-02-04 20:11:23
リンク GitHub GitHub - google/sentencepiece: Unsupervised text tokenizer for Neural Network-based text generation. Unsupervised text tokenizer for Neural Network-based text generation. - GitHub - google/sentencepiece: Unsupervised text tokenizer for Neural Network-based text generation. 104 users 202
うひーマン @norikoni

FairseqをGEC向けチューニングしたものもあるらしい #chura_collabo

2022-02-04 20:14:25
うひーマン @norikoni

イイ感じのコーパス欲しい・・・ が,新しい言葉増えるから大変 #chura_collabo

2022-02-04 20:18:10
うひーマン @norikoni

Mecab-python3とfugashi 比較するとfugashiは高速らしい #chura_collabo

2022-02-04 20:19:01
うひーマン @norikoni

辞書の作り方高速にするのは論文になる. アルゴリズムよりやはり辞書が重要 #chura_collabo

2022-02-04 20:21:33
ちゅらデータ @churadata

オンライン合同勉強会【(初心者向け)Pythonで手軽に始める文章校正】にご参加ありがとうございました。 イベント後にオンライン懇親会を実施します。 参加無料なのでお気軽にご参加下さい。 (1時間程度を予定しています) SpatialChat URL: spatial.chat/s/chura-collab… #chura_collabo

2022-02-04 20:24:38
清原弘貴 @hirokiky

#chura_collabo めちゃくちゃ緊張したけど伝えたいことを話せて良かったです。自然言語処理は面白いので、ぜひちょっとでもやってみてくれると嬉しいです。

2022-02-04 20:28:16
とも@勉強中 @asagi_today

#chura_collabo 自然言語処理に初めて触れましたが、面白かったです。 経路は違いますが、レシートから画像認識で文字抜き出して照合のプログラム作っていたのでこういう話は興味深いですね。

2022-02-04 20:35:32
前へ 1 ・・ 3 4