ノンプロ研初心者向けプログラミング講座第5期【Python コース】第5回
raise_for_status を記述しておくことによって、サイトの変更などが起こった時にトラブルを防止できる。 Webサイトはこちらの気づかない間にいつ変更されてもおかしくないものね #ノンプロ研
2021-05-24 20:50:48HTML、結構きれいなように見えますが、サイトによります。。。特にテーブルの取得ではセル結合問題などあるので要注意。その場合はpandasなどを利用して力技で解析したりします。 #ノンプロ研
2021-05-24 20:56:01note.nkmk.me/python-pandas-… #ノンプロ研 twitter.com/ponponmikankan…
2021-05-24 20:56:40BeautifulSoupの名前の由来はTag Soup(HTML)がどろどろしているという意味で、ダーティなHTMLのことを指してるとのこと。それをきれいにするからという由来。 不思議の国のアリスで登場する詩からという説もある。 #ノンプロ研
2021-05-24 21:00:48前にBeautifulSoupのfindメソッドの使い方を一覧でまとめました。 「テキスト検索」、「テキストの部分一致」など、詳細な指定をしたい場合は参考にしてください。 qiita.com/plumfield56/it… #ノンプロ研
2021-05-24 21:05:37不思議な国の方のアリスか 谷村新司じゃないのね #ノンプロ研
2021-05-24 21:08:41やべー 今日、全くついていけてない気がする #ノンプロ研
2021-05-24 21:38:37この2つ同じ結果が返ってきた soup.find(attrs={'id': 'hoge'}) soup.select('#hoge') #ノンプロ研
2021-05-24 21:40:02終わりましたー スクレイピングは実際に手を動かさないとピンと来ない部分もありますし、正解も一つではないので、宿題含めていろいろ触ってみてください #ノンプロ研
2021-05-24 22:01:00今日のスクレイピングは難しかったな さあ、少し仕事するかな テレワークって時間問わないからおわんないやね 来週の早稲田の資料も作らなきゃ #ノンプロ研
2021-05-24 23:08:20