漢字文献情報処理研究会 第15回大会(2012年12月23日)

2
野村英登 NOMURA Hideto @bajie38

自動で行区切りしたり、区切りをテンプレ化して一括適用とかできるみたい。

2012-12-23 13:48:13
野村英登 NOMURA Hideto @bajie38

行またぎで検索を可能にしているのは、行区切りをした順に検索するようにしているためとの由。画像ファイルをフォルダで整理可能。ファイルやフォルダ単位で検索対象を指定可能。

2012-12-23 13:51:44
Makoto GOTO / 後藤真 @mak_goto

今日は漢字文献情報処理研究会に参加予定だったが、やむを得ない用事で大学に変更。うう、行きたかったよう(−_−;)

2012-12-23 13:52:12
野村英登 NOMURA Hideto @bajie38

函館市立図書館ではSAMEによって制作したデジタルアーカイブを公開。現状ここだけ。

2012-12-23 13:55:49
野村英登 NOMURA Hideto @bajie38

個人で作ったファイルを別の人に渡すことは可能。何人かで共同でデータ化できるってことか。

2012-12-23 13:56:54
野村英登 NOMURA Hideto @bajie38

一つの画面で縦横混在はできない。縦を左から検索はできない。

2012-12-23 14:00:37
野村英登 NOMURA Hideto @bajie38

SAMEは個人の検索ツールや逆に大量の画像データベースの公開としてはよさそう。でも電子テキストを起こして研究成果を発信するとかには不向きっぽい。SMART-GSの方がその点はよさそう。

2012-12-23 14:03:41
野村英登 NOMURA Hideto @bajie38

@knagasaki 今見たデモもそんな調子でした。活字での精度は市販のOCRに負けてるっぽいです。

2012-12-23 14:13:41
狩野宏樹 @KAN0U

@bajie38 @knagasaki ヒットした領域を赤で表示して、その周辺をコントラストを下げた白黒で見せてくれると、文字の一部を切り出しているのが一発で分かって良さそうですね。

2012-12-23 14:29:05
飯香幻 @meshikagen

某漢字文献情報処理研究会場潜伏なう。毎度、話をおとなしく聞いてるだけの一般人ですよw

2012-12-23 14:23:36
飯香幻 @meshikagen

@moroshigeki えー?おとなしいもんでしょ!

2012-12-23 16:53:15

上地宏一「日中両言語混在テキストデータリソースの継承について」

野村英登 NOMURA Hideto @bajie38

休憩終了。上地さんの報告。

2012-12-23 14:31:42
野村英登 NOMURA Hideto @bajie38

チャイニーズライター形式で作られたデータをどうやってUnicodeに切り替えるのか。

2012-12-23 14:33:28
野村英登 NOMURA Hideto @bajie38

フリーの変換ツールはあるよね。バッチ処理ができるかどうかの違い?

2012-12-23 14:35:00
野村英登 NOMURA Hideto @bajie38

WordやExcelの中からCWコードだけ抜き出して交換し、他のデータは触らず。なるほど。

2012-12-23 14:38:03
野村英登 NOMURA Hideto @bajie38

cygwinでperlとwin32:OLEをインストールすると、上地さん作成のスクリプトが動くのこと。

2012-12-23 14:41:44
野村英登 NOMURA Hideto @bajie38

実際に変換してみると、フォントの行の高さが異なるために行がずれたり、ピンインもSimsunに一括置換されるので見た目が悪い。このあたりは目視確認。

2012-12-23 14:46:59
野村英登 NOMURA Hideto @bajie38

そもそもピンインフォントでアルファベットと声調符号が混ざるのはUnicodeの仕様上の問題で、中国側が何故か熱心でなかったとの由。

2012-12-23 14:55:11
野村英登 NOMURA Hideto @bajie38

フォント一括置換ツールとして汎用性があるとのコメント。

2012-12-23 15:00:46

小島浩之「図書館、ミュージアム、文書館所蔵資料の利用と研究者」

野村英登 NOMURA Hideto @bajie38

小島さんの報告。図書館や博物館側のスタッフと研究者との間での所蔵資料の扱いをめぐる意識の違いについて。

2012-12-23 15:06:29
野村英登 NOMURA Hideto @bajie38

大学図書館は実は法的根拠がない。

2012-12-23 15:06:58