ノンプロ研初心者プログラミング講座【Pythonコース第3期】第6回

コミュニティ「ノンプログラマーのためのスキルアップ研究会」の初心者プログラミング講座Pythonコース第6回のツイートまとめです。コンテンツは「スクレイピング実践」です。
1

コミュニティ「ノンプログラマーのためのスキルアップ研究会」についてのお知らせ
https://tonari-it.com/community-nonpro-semi/

コミュニティ連携型!ノンプロ向けプログラミング講座開講のお知らせ
https://tonari-it.com/nonpro-beginner-vba-gas/

@shotarosawada

#ノンプロ研 Python講座の最終(第6)回!まにあった~

2020-07-01 20:01:28
おおさき🥔小さなIT活用で快適な農場づくりを @massa_potato

Python初級講座の最終回スタートです(ちょっと寂しい感じで) #ノンプロ研

2020-07-01 20:08:24
すえ @sue1242

今週も #ノンプロ研 Python初級講座の時間がやってきました。今回で第6回、いよいよ最終回です。今日はスクレイピング の実践編をやります!

2020-07-01 20:09:28
すえ @sue1242

今日の「実は……」で「妻が #ノンプロ研 に入った」を言えばよかったw

2020-07-01 20:10:36
すえ @sue1242

スクレイピングはサイトによって難易度が変わるので、「難しいな」と感じたらSlackに質問をどんどん投げてください「#ノンプロ研 のPython猛者」達が質問に答えてくれます。

2020-07-01 20:11:53
@shotarosawada

「スクレイピングは試行錯誤なので、はやめに対戦相手を決めるのが大事だったりします。でも中には最初から強敵を選んじゃうひともいて…。この敵やばいなと思ったらPythonチャンネルの猛者をたよってください」 #ノンプロ研

2020-07-01 20:12:10
すえ @sue1242

Tagオブジェクトのインスタンス変数(.textとか)はめっちゃ使うので、スクレイピングした結果を読みやすく表示するのに便利なので、演習6-01, 02は結構大事ですね。 #ノンプロ研

2020-07-01 20:20:18
@shotarosawada

HTMLのタグをテストページから抜き出す演習。tableタグは世のHTML独学を志した子どもたちをことごとく打ち倒してきた…と思います(挫折組)#ノンプロ研

2020-07-01 20:21:30
すえ @sue1242

今日はピラニア不在かと思いきや、宿題がマッハで出てきたw #ノンプロ研

2020-07-01 20:24:38
おおさき🥔小さなIT活用で快適な農場づくりを @massa_potato

BeautifulSoup4で取得したタグオブジェクトの扱い。 soup.find('table').find_all('tr') みたいな感じで表の行を取ってくることができる #ノンプロ研

2020-07-01 20:26:49
すえ @sue1242

pandasはPythonでデータ分析するならpandasモジュールは必須なので、データ分析やりたい人は是非調べてみてください。 わからないことがあれば、Slackのチャンネルに投稿すれば「#ノンプロ研 のPython猛者」達が(ry

2020-07-01 20:29:10
@shotarosawada

ブラウザ操作用のライブラリ、selenium。なんでこの名前だったのでしょうか… #ノンプロ研

2020-07-01 20:30:51
すえ @sue1242

モジュールのimportについて解説中。 実はこの工程が一番難しくて時間がかかったりする。 #ノンプロ研

2020-07-01 20:32:46
おおさき🥔小さなIT活用で快適な農場づくりを @massa_potato

pythonでブラウザ操作ができるselenium 良く使うクラスは ・WebDriver ・WebElement #ノンプロ研

2020-07-01 20:33:32
おおさき🥔小さなIT活用で快適な農場づくりを @massa_potato

「オブジェクトを生成する」 この言葉の意味はクラス定義の話をがっつり教えてもらえたおかげでだいぶお友達になれた気がします! #ノンプロ研

2020-07-01 20:36:16
@shotarosawada

webdriverの展開先のパスを忘れて、あわてて準備時の資料を読み返すなど。マイドキュメント以下にwebdriverフォルダを切るのが、事前準備に出されていた例でした #ノンプロ研

2020-07-01 20:36:35
@shotarosawada

「seleniumは『RPA感』があって面白い」#ノンプロ研

2020-07-01 20:38:08
@shotarosawada

JupyterNotebookでseleniumを動かすの、セル単位実行するたびにブラウザががさごそ動くから対話的で楽しい #ノンプロ研

2020-07-01 20:43:24
@shotarosawada

find_element_byシリーズ 「すごい長い名前のメソッドがいっぱいありまして…seleniumつかってて『うわぁ』と思うのはこういうところなのですが!」browser.find_element_by_css_selector(selector)ってすごい迫力 #ノンプロ研

2020-07-01 20:46:12
すえ @sue1242

辞書型を渡すべきところで {key, value} (コロンじゃなくてカンマで区切ってる)のに何故かちゃんと動作する事案が発生。 #ノンプロ研

2020-07-01 20:55:38
おおさき🥔小さなIT活用で快適な農場づくりを @massa_potato

browser.quit()をしないでbrowser.get(url)をし続けると画面上がカオスになりますね(browserはWebDriverオブジェクト) 気を付けますw #ノンプロ研

2020-07-01 20:59:48