2018 Spring Tokyo Digital History Symposium ツイートまとめ

2018年4月15日に開催されたデジタル・ヒストリーのシンポジウムのツイートまとめです。
4
前へ 1 2 ・・ 9 次へ
Tokyo Digital History @DHistory_Tokyo

分量が膨大なため、これまで研究者は自分の関心のある部分だけ検討するしかなかった。また、史料全体を俯瞰することは難しかった。 大量データを処理できるようになれば、省庁横断的研究したり、各研究者のトピックを全体に位置づけることができるようになる! #todh_2018

2018-04-15 13:45:00
FUKUSIMA,Yukihiro @archivist_kyoto

NAのシステムだとスクレイピングやりやすいのかいな #todh_2018

2018-04-15 13:45:17
Tokyo Digital History @DHistory_Tokyo

2人がかりで2週間!約11万件の入手に成功!!実際の文書館でこれだけの仕事をしようと思うと一生かかりそうですね。。 #todh_2018

2018-04-15 13:47:09
Tokyo Digital History @DHistory_Tokyo

バブルチャートを利用すると、史料全体の内容の偏りや規模が可視化できる。面白い図です。件名の共起ネットワークも、人の手では到底作れない図ですね! #todh_2018

2018-04-15 13:49:31
Makoto GOTO / 後藤真 @mak_goto

公文録件名共起ネットワークいいですね。 #todh_2018

2018-04-15 13:49:39
Tokyo Digital History @DHistory_Tokyo

「大阪」「大坂」の使用例の揺れ、実際の史料に基づいていると説得力あります…! #todh_2018

2018-04-15 13:51:22
Kiyonori Nagasaki @knagasaki

メタデータつけるときに正規化しすぎない方がよいという事例でもある? #todh_2018

2018-04-15 13:51:52
Tokyo Digital History @DHistory_Tokyo

デジタル時代になって、データを大量入手できるようになったからこそ見えるもの、また生まれる新しいアイデアがあるんですね! #todh_2018

2018-04-15 13:53:00
Tomoaki Shinoda @QsarKbir

福田報告、torre to tombo文書館のカタログでも似たようなアプローチは取れそうな気がする。 #todh_2018

2018-04-15 13:53:38
なおちー・もふりえ @nao_chihiro

パソコン持ってきてというから遅刻してまで持ってきたのにパソコンどころか資料広げる机すらなくて死亡 発表は大変に面白いです #todh_2018

2018-04-15 13:55:54
Tokyo Digital History @DHistory_Tokyo

セクション1:情報の入手チェア 清原先生コメント・質問 きむさんへ Q. どういう検索をすれば、メタデータを利用したいい検索ができますか? A. 史料の上位レベルを見てみることが大事 #todh_2018

2018-04-15 13:57:28
FUKUSIMA,Yukihiro @archivist_kyoto

記述揺れの話は出ますね。必ず。アーカイブズ学も弱かったからね #todh_2018

2018-04-15 14:00:35
Tokyo Digital History @DHistory_Tokyo

セクション1:情報の入手チェア 清原先生コメント・質問 福田さんへ Q. HTMLを分析し必要なところを抜き出す作業として、一番ポイントとなったプロセス・大変だったプロセスは? #todh_2018

2018-04-15 14:01:04
Tokyo Digital History @DHistory_Tokyo

福田さん A. 簿冊名をWEBスクレイピングする際に、表記に揺れがあり、それをコンピュータに読ませるのが大変。アーカイブの方々にデジタル面を意識したデータ作成をお願いしたい。 #todh_2018

2018-04-15 14:01:24
Koji Yamamoto 山本浩司 @Koji_hist

#todh_2018 きになります。 会場の様子写真とってる人いたらアップしてほしいなー。

2018-04-15 14:03:41
Tokyo Digital History @DHistory_Tokyo

フロアからQA 福田さんへ Q. 一括入手した場合でも、そもそもデータベースに偏りがあり、入手に偏りができる場合にはどうするのか? A. スクレイピングに適した史料を見つけることが大切。使う歴史学者の側で、史料の選別を行うことが必用(きむ発表にもつながる) #todh_2018

2018-04-15 14:03:49
Tokyo Digital History @DHistory_Tokyo

フロアからQA 福田さんへ Q. WEBスクレイピングでデータを入手しやすいような規格はあるのか? A. 今回はそのような形でデータ公開がなされてないので、段階的なデータ入手を行った。(APIについてはこの後の発表で!) #todh_2018

2018-04-15 14:07:52
Tokyo Digital History @DHistory_Tokyo

セクション2:情報の分析『データ加工の再現性を担保する』山崎翔平 #todh_2018

2018-04-15 14:08:37
Tokyo Digital History @DHistory_Tokyo

目的:明治期の県域について得られたデータを、現在の県域に加工する ポイント:データのクリーニング・データの再現性を担保する #todh_2018

2018-04-15 14:10:29
Tokyo Digital History @DHistory_Tokyo

データは必ずしも欲しい形・処理しやすい形にはなっていません。それを加工しやすいように処理する「クリーニング」という作業が、デジタルデータには必須のプロセスとなります。 #todh_2018

2018-04-15 14:11:56
egamiday @egamiday

#todh_2018 を見てるけど、某所でシニアだ何だという話が出てたのがよくわかった。会場の見た目年齢層がぜんぜんちがう。

2018-04-15 14:12:46
とりん(・と・) @trinh_JP

東アジアだとそこに「むつかしいかんじ」問題が加わるんだよあなぁ #todh_2018

2018-04-15 14:13:19
Tokyo Digital History @DHistory_Tokyo

ふたつのデータを結合させる・データを加工する(賃金の物価調整・季節調整など)という作業は、手作業でやると似たような作業を繰り返したり、手順を間違えたりと、かなり時間をくう大変な作業になってしまう。 #todh_2018

2018-04-15 14:15:18
Tokyo Digital History @DHistory_Tokyo

バッチ処理(⇔手作業):一つ一つの作業を順番に記述・データファイルと読み込ませて実行させると一括で処理してくれる! #todh_2018

2018-04-15 14:16:44
Makoto GOTO / 後藤真 @mak_goto

そうそう。データ公開の作業をこちょこちょやっていて、ミスがあって手戻りする時とかでも、数日前の作業でも実際には厳密な手順を忘れていたりする。 #todh_2018

2018-04-15 14:18:41
前へ 1 2 ・・ 9 次へ