昨日発生していたサイトログインできない不具合は修正されております(詳細はこちら)

文字データいじりしてて気づいたこと

CHISE 文字オントロジーの編集中に見つけたり気づいたりしたことをまとめてみました。
13
前へ 1 ・・ 9 10 12 次へ
tomo.(むにゃむにゃ) @MnjaMnia

(あるいは、どう見てもそれ文字じゃないだろ(字形だろ、グリフだろ、形態素だろ、文字列だろ、絵だろ、それ動いてるだろ、色付いてるし、発音できないよ、見えないし、何も判らん、etc.)って場合でも、文字が置かれる場所にあって文字だと言い張られたらやっぱ文字と看做すしかないとか)

2012-02-26 00:34:47
tomo.(むにゃむにゃ) @MnjaMnia

(そう言う意味では、いぬぼく1巻であった吹き出しの中にコマや吹き出しがあるマンガ的表現があった場合、安岡さんがいうように、吹き出しの中に書かれたマンガ全体を吹き出しの中のテキストと考えるしかないといえる。)

2012-02-26 00:32:35
tomo.(むにゃむにゃ) @MnjaMnia

(あと、『文字と「長さ1の文字列」は等価か?』問題もあるな。さらに言えば、合文や合字とかの『文字列的には長さ2以上の文字』ってのもあって楽しいね。w でまあ、私の今の結論は『文字とか文字列とか形態素とか語とかはインターフェースなので…』ってことなんだけども…)

2012-02-26 00:18:57
tomo.(むにゃむにゃ) @MnjaMnia

今の CHISE IDS-Find の文字詳細画面は CHISE-Wiki(正確には EsT だけど)だよ RT @bajie38: もちろん!素晴らしいですよ!IDS-Find、授業でも一押ししてます。あ、CHISE-Wikiって公開されたの? RT …

2012-02-25 19:34:28
tomo.(むにゃむにゃ) @MnjaMnia

(でも、CHISE IDS-Find とか CHISE-Wiki とかゆーざーふれんどりぃだよね?(って言い張る所が、あの矢印図が判りやすいと言い張るとこに重なると言われれば…(-_-;;;)とはいえ、CHISE IDS-Find は簡単だよね?))

2012-02-25 19:30:08
tomo.(むにゃむにゃ) @MnjaMnia

がーん!RT @bajie38: でもそれはむにゃさんにCHISEにユーザーふれんどりぃなインターフェースつけろって迫るようなもんじゃ(^_^;) RT @MnjaMnia: (やっぱ、白須さんの一連の仕事に注を付けたものを作るのが良いのかなという気がするけど、できれば本人に…

2012-02-25 19:27:11
tomo.(むにゃむにゃ) @MnjaMnia

(やっぱ、白須さんの一連の仕事に注を付けたものを作るのが良いのかなという気がするけど、できれば本人にやって欲しいよな。(^_^;)

2012-02-25 18:25:06
tomo.(むにゃむにゃ) @MnjaMnia

それが意味してるものを何も知らない人が理解するのはやっぱ相当ハードなんじゃないかと思う。だけども、逆に言えば、ああいうややこしい話をさらっと簡潔かつ厳密に書けちゃう圏論は、多分、人文情報学における有用なツールの一つであるということはいえる。やっぱ理論重要!)

2012-02-25 18:22:31
tomo.(むにゃむにゃ) @MnjaMnia

(私が仮にまんが研究するとしたらやっぱ概念とアフォーダンスの関係が気になって一般キャラクター論まっしぐらになるだろうし、コス写真を扱ってもやっぱそう。基本、CHISE と一緒になっちゃう。もろさんだと何か1周回るだろうし、白須さんがやれば多分圏論の例の矢印いっぱいの図だらけ?w)

2012-02-25 18:14:06
tomo.(むにゃむにゃ) @MnjaMnia

(安岡さんの視界には多分狭義のまんが研究者は入ってないと思うけど、両者はつながりうるか?); ただ、安岡さんが表層しか見ないのは別にまんがに限った話じゃないので、そういう問題ではないかも知れんが

2012-02-25 18:07:47
tomo.(むにゃむにゃ) @MnjaMnia

白須さんは多分そっちを目指してると思います(IF-Chaon モデルはそのモジュールなんだと思う)RT @bajie38: …モデルが、翻訳と相似するのであれば、訓詁学における本文と注釈の関係の理論的な記述ともなっているわけで、漢字に留まらず、漢籍の電子化全般のモデルとなるはず…

2012-02-24 15:36:05
tomo.(むにゃむにゃ) @MnjaMnia

その対談集を円城塔が書いたらさらに面白いかもだがさらに理解不能かもw RT @KAN0U: 白須さんと円城塔が対談したら面白いだろうな。私には絶対に理解不能だが。

2012-02-24 15:34:13
tomo.(むにゃむにゃ) @MnjaMnia

(Chaon モデル、あるいは、Unicode をはじめとする符号化文字モデルというもの自体、符号化文字のセマンティクスに詳しくない人にはよく判らないと思うので、情報の流れ理論版 Chaon モデルである IF-Chaon モデルも圏論の難しさを別にしてもとっつきにくいかも)

2012-02-24 15:30:37
貍人鳥(小池咊夫) @koikekaisho

漢字表って、典拠、用例と字体の揺れの範囲を明示しないと使い物にならないということが、まだ浸透してない。

2012-02-10 11:02:50
tomo.(むにゃむにゃ) @MnjaMnia

俺得なので是非調べてください。(^_^; RT @KAN0U: …p://bit.ly/xY1MV0)って、C6A1〜C7FCの拡張文字がEten(Mac OS Xの文字ビューアではHKSCS-2001で確認できる)と違うけど、何がソースなんだろう?(知った所で何も得しないけど)

2012-02-08 14:18:53
tomo.(むにゃむにゃ) @MnjaMnia

(甲骨文字索引入力データの校正が完了したら所蔵甲骨の全文検索システムもどきを作ろうと思いつつはや5年(^_^;;;)

2012-02-01 18:25:31
tomo.(むにゃむにゃ) @MnjaMnia

(で、 http://t.co/gViG2jO6 の用例を見てみると http://t.co/KFmkKhJz 以外は「今春王…」と読めるのでこれらについていえば「春」なのかな?)

2012-02-01 18:23:31
tomo.(むにゃむにゃ) @MnjaMnia

(そういう訳で、「京都大学人文科学研究所所蔵甲骨文字索引」(および、それに対応する CHISE-wiki の項目)の『対応する現代字』の情報は探したい甲骨(片)へのインデックス的なものだと思って使った方が良いです。要は字義は用例を見て考えてねというか)

2012-02-01 18:18:41
tomo.(むにゃむにゃ) @MnjaMnia

(「京都大学人文科学研究所所蔵甲骨文字」 http://t.co/a24B6rBh の釈文や字説は1960年代当時のもので、その後の半世紀の間の研究の進展によって学説が変わってることに留意しないといけないとその筋の人が行ってました。ご注意を!)

2012-02-01 18:15:22
tomo.(むにゃむにゃ) @MnjaMnia

(U+2A4C1 (𪓁) は CNS 11643 の 7-652C を包摂しない気がするけど http://t.co/W3GjNZr5 によれば明體と宋體は包摂されちゃうので C7-652C が U+2A4C1 を包摂するという風に書くしかないかな)

2012-01-31 17:43:06
tomo.(むにゃむにゃ) @MnjaMnia

(「舌」の項目 http://t.co/xhNua9WQ はあるけど、所蔵している甲骨には用例はないのか。でも、「言」も3つしかないか。 http://t.co/M8MT0OjE

2012-01-30 21:17:30
tomo.(むにゃむにゃ) @MnjaMnia

(漢字は時代が下がる程単純化していったというイメージを持ってる人って結構いるのかな?そういえば、昔、たしろさんに漢字の時代変遷の例が欲しいって言われて適当に出した例が甲骨文字の方が現代文字より簡単でがっかりされた記憶が。w 仕方がないのでイメージにあった例を探したけど(>_<))

2012-01-21 17:14:25
tomo.(むにゃむにゃ) @MnjaMnia

(CNS 取り込み完了時点で一度 CHISE をリリースすべきか否か(まあ、CHISE の正式リリース版とか誰得な気もするが(^_^;))

2012-01-16 23:13:41
tomo.(むにゃむにゃ) @MnjaMnia

http://t.co/qLqlydHh 「盒」の用例です(ちょっと偏ってるかもですが(^_^;) RT @ogawaissui: 飯盒の「盒」っていつの字なんだろうか。飯盒そのものとともに開発されたとしたら意外に新しいな。

2012-01-15 15:15:54
tomo.(むにゃむにゃ) @MnjaMnia

(CJK の漢字の字体の統一とかいう前に、CJK 統合漢字/互換漢字のバグ直して欲しいw)

2012-01-10 11:40:46
前へ 1 ・・ 9 10 12 次へ