ハーバード大学のデジタル人文学のオンラインコースをやってみた
- kohkiwatabe
- 10734
- 32
- 2
- 269
最後にハーバード大美術館のデジタル・ツール・ビルダー。同美術館の所蔵品のデータや自分の持っているファイルを使って、デジタルコンテンツを作れる。画像を重ね合わせたりが簡単にできるようなので、これは授業の課題にするのにちょうどいいのではないか。 harvardartmuseums.org/tour/digital-t…
2019-05-02 16:31:49やっぱり、マップやグラフや図にするとどうしても『シヴィライゼーション』シリーズのゲームをやっている感がある。もちろん根拠となる資料を常に明示してあるので荒唐無稽なファンタジーをエンターテインメントとして遊んでるわけではないが。
2019-05-02 16:33:38しかし「てこをきかせてスケールをあげて人間の認知から零れ落ちるものを拾い上げる」という部分が必ずしもDHのコアというわけではないことはわかってきた。「映像的思考をする」とかそういう新しい潮流がぐわっと全ての流れを変えるというようなものではないようである。
2019-05-02 16:35:22今日はおしまい。明日のレッスン3からはもっと練習問題とかが多くなって、具体的に手を動かすようになるようだ。お疲れ様でした。
2019-05-02 16:36:07レッスン3「データの取得、クリーニング、作成」
さて今日も令和とか無視して #ハーバード大学 #Harvard の #デジタル人文学 #digitalhumanities のオンラインコースやります。レッスン3「データの取得、クリーニング、作成」です。
2019-05-03 13:10:16「構造化データ(structured data)」「半構造化データ(semi-structured data)」、「非構造化データ(unstructured data)」について。非構造化データは自然言語文などのコンピュータにが有効に使えないもの。これにタグをつけてくと半構造化データになる。
2019-05-03 13:19:39ミルトンのソネットをXMLタグを使って構造化する例をみて、練習問題としてキーツの「チャップマンのホーマーを読んで」を構造化する練習。<rhyme label =""><rhyme>なるタグを使ってどことどこが韻を踏んでいるかをマークアップしていく練習。
2019-05-03 13:48:07これはあれだ。ソネットが何かを勉強して知っていればただの流れ作業だけど、そうじゃなかったらわけわからんだろうな。まがりなりにも勉強しておいてよかった。河合祥一郎先生のおかげだ。
2019-05-03 13:59:02データベースの仕組みについて。APIを使うと簡単にデータが利用できて便利だよと。APIがないときはグーグルがやってるみたいにweb scrapingをすることもできて、web scrapingを使った研究の事例も紹介されている。academic.oup.com/dsh/article/32…
2019-05-03 16:30:37「デジタル倫理」のセクションに移る。著作権とは何か、パブリック・ドメイン、「独創性のない複製(slavish reproduction)」、電話帳の生データに著作権があるかどうかを争ったフェイスト出版の事例などの解説。
2019-05-03 16:52:18ライセンス、オープン・アクセスとオープン・ソース、フェア・ユース、それから自分のデータを配布するときの注意事項について。それぞれについて「こういう場合、これはおっけー?」かをきく練習問題がついてくる。レッスン3はこれでおしまい。
2019-05-03 17:17:37レッスン4「コマンドライン」
子供の日も #ハーバード大学 #Harvard の #デジタル人文学 #digitalhumanities のオンラインコースやります。今日はレッスン4「コマンドライン」です。人文系には厳しくなる予感。
2019-05-05 11:45:43今日のレッスンをやると「テキストファイルにコマンドライン機能を適用すること」と「のちの分析のためにファイルサイズを小さくすること」が身につく。これらの重要性はわからないが、今の所ここまで到達してアンケートに答えた16人の半分は「コマンドラインとか知らん」ということなのでまあいいや。 pic.twitter.com/mmpNTIhCfz
2019-05-05 11:48:29OSに依存せずに同じ環境が作れるようにUbuntuとVirtual Boxをインストールするように求められる。ビデオでやり方を説明してくれる。
2019-05-05 11:56:03Ubuntutorインストール完了。コマンドを入力してディレクトリを移動する。しかしここから先の修了証を出してもらうための練習問題は有料コンテンツで99ドル払わないと見ることもできない。
2019-05-05 12:39:12ubuntuを導入してさあこれからというところで有料コンテンツをぶっこんでくるか・・・。とりあえず練習問題以外の部分はタダで見れるので先に進んでみて、自分が勉強したい内容かどうか確認する。
2019-05-05 12:50:19HTMLファイルの歴代大統領のスピーチからHTMLタグなどを取り除いてクリーンナップして、それぞれの大統領のスピーチの中のセンテンスの数やそれぞれの大統領のセンテンスあたりのワード数の平均値を出す作業をやっている。
2019-05-05 12:56:17レッスン4の最後の問題はシェイクスピア『ハムレット』、『ロミジュリ』、『テンペスト』のテキストファイルをプロジェクト・グーテンベルクからダウンロードし構造化されたcsvファイルに変換し、その中でvileという文字列がどれだけ出てくるか調べろというもの。それでレッスン4は終わり。
2019-05-05 12:59:55レッスン5「Voyantを使ってみよう」
レッスン5はvoyantというツールを使って単一のあるいは複数のテクストの分析の仕方を学ぶことになっているらしい。これならレッスン4と5のために100ドル払うこともないかなと思う。
2019-05-05 13:22:06