編集部イチオシ

ハーバード大学のデジタル人文学のオンラインコースをやってみた

ハーバード大学が4月30日からデジタル人文学のオンランコースを公開したのでやってみました。このまとめでは実況に徹しています。練習問題をのぞいてほとんどすべてのコンテンツに無料でアクセスできます。聞き取りやすい英語で字幕もついており、ビデオをみながら勉強できるのでデジタル人文学に興味がある人にはおすすめです。99ドル払えば練習問題にアクセスできて、クリアすれば修了証が発行されるそうです。 https://online-learning.harvard.edu/course/introduction-digital-humanities
114
渡部宏樹 Kohki Watabe @kohkiwatabe

最後にハーバード大美術館のデジタル・ツール・ビルダー。同美術館の所蔵品のデータや自分の持っているファイルを使って、デジタルコンテンツを作れる。画像を重ね合わせたりが簡単にできるようなので、これは授業の課題にするのにちょうどいいのではないか。 harvardartmuseums.org/tour/digital-t…

2019-05-02 16:31:49
渡部宏樹 Kohki Watabe @kohkiwatabe

やっぱり、マップやグラフや図にするとどうしても『シヴィライゼーション』シリーズのゲームをやっている感がある。もちろん根拠となる資料を常に明示してあるので荒唐無稽なファンタジーをエンターテインメントとして遊んでるわけではないが。

2019-05-02 16:33:38
渡部宏樹 Kohki Watabe @kohkiwatabe

しかし「てこをきかせてスケールをあげて人間の認知から零れ落ちるものを拾い上げる」という部分が必ずしもDHのコアというわけではないことはわかってきた。「映像的思考をする」とかそういう新しい潮流がぐわっと全ての流れを変えるというようなものではないようである。

2019-05-02 16:35:22
渡部宏樹 Kohki Watabe @kohkiwatabe

今日はおしまい。明日のレッスン3からはもっと練習問題とかが多くなって、具体的に手を動かすようになるようだ。お疲れ様でした。

2019-05-02 16:36:07

レッスン3「データの取得、クリーニング、作成」

渡部宏樹 Kohki Watabe @kohkiwatabe

さて今日も令和とか無視して #ハーバード大学 #Harvard#デジタル人文学 #digitalhumanities のオンラインコースやります。レッスン3「データの取得、クリーニング、作成」です。

2019-05-03 13:10:16
渡部宏樹 Kohki Watabe @kohkiwatabe

「構造化データ(structured data)」「半構造化データ(semi-structured data)」、「非構造化データ(unstructured data)」について。非構造化データは自然言語文などのコンピュータにが有効に使えないもの。これにタグをつけてくと半構造化データになる。

2019-05-03 13:19:39
渡部宏樹 Kohki Watabe @kohkiwatabe

ミルトンのソネットをXMLタグを使って構造化する例をみて、練習問題としてキーツの「チャップマンのホーマーを読んで」を構造化する練習。<rhyme label =""><rhyme>なるタグを使ってどことどこが韻を踏んでいるかをマークアップしていく練習。

2019-05-03 13:48:07
渡部宏樹 Kohki Watabe @kohkiwatabe

これはあれだ。ソネットが何かを勉強して知っていればただの流れ作業だけど、そうじゃなかったらわけわからんだろうな。まがりなりにも勉強しておいてよかった。河合祥一郎先生のおかげだ。

2019-05-03 13:59:02
渡部宏樹 Kohki Watabe @kohkiwatabe

いろんなファイルタイプごとの特徴と利便性のお勉強。

2019-05-03 15:28:05
渡部宏樹 Kohki Watabe @kohkiwatabe

データベースの仕組みについて。APIを使うと簡単にデータが利用できて便利だよと。APIがないときはグーグルがやってるみたいにweb scrapingをすることもできて、web scrapingを使った研究の事例も紹介されている。academic.oup.com/dsh/article/32…

2019-05-03 16:30:37
渡部宏樹 Kohki Watabe @kohkiwatabe

グーグル・ブックのAPIを使った練習問題を解く。

2019-05-03 16:41:53
渡部宏樹 Kohki Watabe @kohkiwatabe

「デジタル倫理」のセクションに移る。著作権とは何か、パブリック・ドメイン、「独創性のない複製(slavish reproduction)」、電話帳の生データに著作権があるかどうかを争ったフェイスト出版の事例などの解説。

2019-05-03 16:52:18
渡部宏樹 Kohki Watabe @kohkiwatabe

ライセンス、オープン・アクセスとオープン・ソース、フェア・ユース、それから自分のデータを配布するときの注意事項について。それぞれについて「こういう場合、これはおっけー?」かをきく練習問題がついてくる。レッスン3はこれでおしまい。

2019-05-03 17:17:37
渡部宏樹 Kohki Watabe @kohkiwatabe

続くレッスン4は「コマンドライン」。明日はやることがあるので、明後日やる。お疲れ様でした。

2019-05-03 17:19:19

レッスン4「コマンドライン」

渡部宏樹 Kohki Watabe @kohkiwatabe

子供の日も #ハーバード大学 #Harvard#デジタル人文学 #digitalhumanities のオンラインコースやります。今日はレッスン4「コマンドライン」です。人文系には厳しくなる予感。

2019-05-05 11:45:43
渡部宏樹 Kohki Watabe @kohkiwatabe

今日のレッスンをやると「テキストファイルにコマンドライン機能を適用すること」と「のちの分析のためにファイルサイズを小さくすること」が身につく。これらの重要性はわからないが、今の所ここまで到達してアンケートに答えた16人の半分は「コマンドラインとか知らん」ということなのでまあいいや。 pic.twitter.com/mmpNTIhCfz

2019-05-05 11:48:29
拡大
渡部宏樹 Kohki Watabe @kohkiwatabe

OSに依存せずに同じ環境が作れるようにUbuntuとVirtual Boxをインストールするように求められる。ビデオでやり方を説明してくれる。

2019-05-05 11:56:03
渡部宏樹 Kohki Watabe @kohkiwatabe

Ubuntutorインストール完了。コマンドを入力してディレクトリを移動する。しかしここから先の修了証を出してもらうための練習問題は有料コンテンツで99ドル払わないと見ることもできない。

2019-05-05 12:39:12
渡部宏樹 Kohki Watabe @kohkiwatabe

ubuntuを導入してさあこれからというところで有料コンテンツをぶっこんでくるか・・・。とりあえず練習問題以外の部分はタダで見れるので先に進んでみて、自分が勉強したい内容かどうか確認する。

2019-05-05 12:50:19
渡部宏樹 Kohki Watabe @kohkiwatabe

HTMLファイルの歴代大統領のスピーチからHTMLタグなどを取り除いてクリーンナップして、それぞれの大統領のスピーチの中のセンテンスの数やそれぞれの大統領のセンテンスあたりのワード数の平均値を出す作業をやっている。

2019-05-05 12:56:17
渡部宏樹 Kohki Watabe @kohkiwatabe

レッスン4の最後の問題はシェイクスピア『ハムレット』、『ロミジュリ』、『テンペスト』のテキストファイルをプロジェクト・グーテンベルクからダウンロードし構造化されたcsvファイルに変換し、その中でvileという文字列がどれだけ出てくるか調べろというもの。それでレッスン4は終わり。

2019-05-05 12:59:55

レッスン5「Voyantを使ってみよう」

渡部宏樹 Kohki Watabe @kohkiwatabe

レッスン5はvoyantというツールを使って単一のあるいは複数のテクストの分析の仕方を学ぶことになっているらしい。これならレッスン4と5のために100ドル払うこともないかなと思う。

2019-05-05 13:22:06