文字データいじりしてて気づいたこと

CHISE 文字オントロジーの編集中に見つけたり気づいたりしたことをまとめてみました。
13
MORIOKA Tomohiko @CHISE_ja

(U+6602 が JTB281 を包摂できるかどうか自信がないので、とりあえず A-HDU+6602 を新設。JIS X0208/0213 抽象文字オブジェクトからこの全体を包摂するようにしたけど、厳密には問題ありな気がする。ただ、そうしないと U+663B との関係が問題に)

2014-01-28 18:53:32
MORIOKA Tomohiko @CHISE_ja

(あ、でも、文字情報基盤を表すドメイン識別子を mj にするか moji-joho にするか迷い中。mj は短すぎて良くない気がするけど、moji-joho という名前も良くない気がする。むしろ、JP-ipa-mj とか JP-mj みたいなのにした方が良いのかも)

2014-01-19 01:34:31
MORIOKA Tomohiko @CHISE_ja

(UCV では包摂できなさそうな汎用電子を扱うために今まで ==>ucs@bucs という BUCS の超抽象文字を表す素性を使っていたのだが、=>ucs@hanyo-denshi という専用の抽象文字素性を導入することにした。今後、=>ucs@mj も追加する予定)

2014-01-19 01:31:23
MORIOKA Tomohiko @CHISE_ja

http://t.co/VzsUCex1hK CJKV Information Processing の CHISE に関する記述が微妙なことに気づいたんだけど訂正を求めるべきか否か(^_^;)

2014-01-17 18:11:42
UTF-8はBOMなしでって言ったよね? @moji_memo

わあ、重要なのを見逃してた! DTPの人コメントしてください。意見を言うなら早いほどいいですよ! “@ken_lunde: 来月のUTC会議(2013-02-03から2013-02-06まで)の為に次の提案は投稿されました → http://t.co/DNFan1883A

2014-01-15 02:42:00
MORIOKA Tomohiko @CHISE_ja

(CNS 7-2C3A に1対1対応する UCS のコードポイントがないことを忘れててちょっとはまったり(^_^;)

2014-01-14 21:28:31
MORIOKA Tomohiko @CHISE_ja

@sarasvati635 http://t.co/fEMoyCQgIx を眺めてると⿱一⿰山亇みたいに見えるのが結構あるので、確かにそんな気になりますね。

2013-12-21 20:27:59
MORIOKA Tomohiko @CHISE_ja

http://t.co/BpUg4YDIyp フィクション論と一般キャラクター論に関係する重要な議論が話されるような気がするので行けないのが残念。誰か後で内容教えて(^_^;;;)

2013-12-15 10:58:34
manabu kawada @manavic_k

というわけで、14時から立命で語り手のお話をさせていただきます。今の大学に着任して以来ぽちぽちとやってきたことを話す予定です。直前のお知らせで恐縮ですが、お近くの方はぜひ。 http://t.co/2gosCLccYR

2013-12-15 10:23:15
MORIOKA Tomohiko @CHISE_ja

@KiyonoriNagasak @ken_lunde 「门」と「門」が違う文字(異体部品)だという意識がないからかも知れません(うちの親とかもそんな感じw)。

2013-11-24 13:43:27
雑談する人 @KiyonoriNagasak

書いた人の「開店」への想いを表していますね。 RT @ken_lunde 面白い。左の「開」は普通の字形で、右の「閉」は異体字です。 http://t.co/JRu06qbNrn

2013-11-24 11:32:53
拡大
Kiyonori Nagasaki @knagasaki

「いまさら、Unicodeの漢字をさらに増やそうとしているのですが…」 http://t.co/1Mu89NUWuy

2013-11-21 01:23:17
MORIOKA Tomohiko @CHISE_ja

(そういえば、KAGE ってゴシック出力あったっけと思ってググってみたらこんなのが見つかった:「KAGE/engineを勝手に改造した丸ゴシック試作エンジン」 http://t.co/N7uw8sLCld

2013-11-19 23:39:04
MORIOKA Tomohiko @CHISE_ja

(という訳で、 http://t.co/Ik41Ap5Yx3 に push したけど、だからどうだって話ではあるな。CNS 全部やったら幹に merge したい気もするが、残り全部やってからの方が良い気もする)

2013-11-14 22:02:45
MORIOKA Tomohiko @CHISE_ja

(いつもだと作業結果がどんどん CHISE-wiki や CHISE IDS Find に反映されるのに対して、今回はローカルブランチでやってるから全部終わるまで何もやってない気がするのも良くない気がする。という訳で、リモートブランチにも push してみた)

2013-11-14 21:58:07
MORIOKA Tomohiko @CHISE_ja

(new glyph image conventions 化作業そろそろ飽きてきた。作業が単調な割にたまにトラップがあるのが(変換プログラムのバグのせいだといえるが)。特に CNS 第3面の作業中に MBP 壊れて大分 HP 削られた気がする。)

2013-11-14 21:55:54
MORIOKA Tomohiko @CHISE_ja

(新しい MBPR でも char-db-dump bench を動かしてみたのだが、今まで使ってた Retina なし 13inch MBP の i7 2.9GHz と比べると i5 2.6GHz というのはやっぱちょっち遅いようで、ちょっと遅めの結果になった)

2013-11-08 12:02:17
MORIOKA Tomohiko @CHISE_ja

(結局、変更した文字定義ファイルを1つづつ差し替えてはビルドして char-db-dump するという作業をしていくうちに、==cns11643-1 が何故か 1 byte 集合になってることに気づいたのだが既に朝になってた。orz )

2013-10-27 00:50:08
MORIOKA Tomohiko @CHISE_ja

(CNS 第1面の NGIC 化をすべく、自動変換したものをチェックして XEmacs CHISE に取り込んで make したら途中で seg fault してすごく悩んでしまったり。*.elc 全部消したり、Linux と Mac で試したり、いろいろ試行錯誤する羽目に)

2013-10-27 00:45:51
Kazuhiro hokkaidonis @kzhr

@CHISE_ja 去年そんな話し安岡さんとしましたねえ

2013-10-25 19:53:30
MORIOKA Tomohiko @CHISE_ja

(JEF-CHINA3 のフォントを眺めてたら怪しげなものが http://t.co/HzQIDPE5AM JEF って変体仮名っぽいものも入ってたのか)

2013-10-25 19:47:05
MORIOKA Tomohiko @CHISE_ja

(現在移行作業中の字形関連オブジェクトの新たな整理基準について覚え書きを書いてみた: http://t.co/G260LHwo2Y (3日坊主にならなきゃ良いが(^_^;;;))

2013-10-03 13:32:28
MORIOKA Tomohiko @CHISE_ja

(包摂規準に名前を付けて登録する仕組みが欲しい気がするが、誰か作ってくれないかなぁ。)

2013-10-02 19:42:37
MORIOKA Tomohiko @CHISE_ja

(将来的には CHISE 文字オントロジーを、文字だけでなく形態素とかグリフとか出典・文献等の複数の genre のオブジェクト間の関係のネットワークに再編したいと思っている。これによって特定アプリケーションはより簡単な構造を参照するだけで済むし、より大きな構造も見れると思う)

2013-09-25 18:33:31
MORIOKA Tomohiko @CHISE_ja

(Concord ではある程度共通したインターフェースを持つオブジェクトの集合を genre という単位で管理してるが、従来の CHISE は character という単一の genre だけ使って文字の情報を記述していた。)

2013-09-25 18:30:09
1 ・・ 12 次へ