ノンプロ研Python初級講座_第7期_第6回

5
ume @plumfield56

本日はPython講座の6回目でseleniumを扱っていきます。 ブラウザ操作できる感動を是非、味わってほしいです。 本日もよろしくお願いします~(*'▽') #ノンプロ研 #Python講座 pic.twitter.com/53Z8G3eKtm

2021-12-15 19:47:24
拡大
な~@ぱいそん🐍 @PythonNao703

アイスブレイク #ノンプロ研 #Python講座 #ぱいそん 先週につづき、卒業LTで発表したいこと

2021-12-15 20:02:48
な~@ぱいそん🐍 @PythonNao703

実務で使うのが大切とのこと。 #ノンプロ研 #Python講座 #ぱいそん 最初のサイトが強敵すぎると大変なので、ペアプロしましょう! pic.twitter.com/hGVJuN2hvG

2021-12-15 20:08:26
拡大
kudou @kudou32323

今日はスクレイピング実践の講座です! 以前受講したときは、Python講座のなかで1番楽しかった記憶があります。 #ノンプロ研 #Python講座

2021-12-15 20:08:42
kudou @kudou32323

スクレイピングでとったタグ情報から、さらに指定した要素を取得できます。 ・tag.name要素タグ名を取得する ・tag.attrs要素タグに含まれる属性を辞書で取得する ・tag.text要素タグに含まれる文字列を取得する #ノンプロ研 #Python講座

2021-12-15 20:10:59
な~@ぱいそん🐍 @PythonNao703

Tagオブジェクト #ノンプロ研 #Python講座 #ぱいそん soupオブジェクトからTagオブジェクトを取り除く pic.twitter.com/YeHxBDYRe0

2021-12-15 20:11:14
拡大
な~@ぱいそん🐍 @PythonNao703

表のタグ tableタグ:テーブル全体 thead:表のヘッダー tbody:明細部分 tfoot:表のフッター tr:行 td:セル #ノンプロ研 #Python講座 #ぱいそん

2021-12-15 20:18:18
な~@ぱいそん🐍 @PythonNao703

Tableを解析するのは大変 でも来週ならうpandasが便利 #ノンプロ研 #Python講座 #ぱいそん

2021-12-15 20:28:50
な~@ぱいそん🐍 @PythonNao703

selenium #ノンプロ研 #Python講座 #ぱいそん Pythonでブラウザを操作するサードパーティ製ライブラリ ブラウザとHTML要素を扱う

2021-12-15 20:29:33
kudou @kudou32323

seleniumというモジュールを使うとプログラミングでブラウザ操作ができます! #ノンプロ研 #Python講座

2021-12-15 20:29:43
kudou @kudou32323

Webdriverのバージョンがchromeと異なるとseleniumで操作ができないです。 Webdriverは手動でダウンロードが必要なので注意です! #ノンプロ研 #Python講座

2021-12-15 20:31:16
kudou @kudou32323

ページの情報を取ってくるのは、selenumよりもBeautifuSoupの方が向いています。 seleniumはブラウザ操作があるので処理が遅いです。 #ノンプロ研 #Python講座

2021-12-15 20:32:22
kudou @kudou32323

soup = BeautifulSoup(browser.page_source, 'html.parser') WebDriverオブジェクトを使いたいので 今まで「r.text」としていた部分を「browser.page_source」に置き換えてHTML情報を取得します #ノンプロ研 #Python講座

2021-12-15 20:38:12
kudou @kudou32323

seleniumを使うときのWebDriverのパスは、カレントディレクトリにドライバーが入っていれば、相対パスでもOKです。 #ノンプロ研 #Python講座

2021-12-15 20:41:45
kudou @kudou32323

seleniumでも条件に合った要素を取得が可能です。 最初の要素を1つだけ取得するときは以下のように書きます。 書き方:find_element_by_○○ #ノンプロ研 #Python講座

2021-12-15 20:45:06