異体字/IVSなどなど

昨晩の小形さんの呟きから派生したと思われる一連のご発言を纏めてみました。 誰でも編集可に設定してあります。
20
前へ 1 2 ・・ 12 次へ
小形克宏 @ogwata

「社会的合意」という言葉が一人歩きしているようにも思えますが、べつに「広範な議論」でもかまいません。文字は相手に伝わってナンボのもの。ところが相手に伝える/伝わることを踏まえた異体字に関する議論がないまま、使用可能なグリフだけが微細化しているところに危惧を覚えたまでです。

2011-06-08 11:29:36
tomo.(むにゃむにゃ) @MnjaMnia

@ogwata さんがいう所の「社会的合意」ってのは『一般キャラクター論』でいう所の『解釈共同体』の問題の一種かな。

2011-06-08 11:39:44
tomo.(むにゃむにゃ) @MnjaMnia

(いつも言ってる話だけど)これ、文字だと思うと目が曇るんだけど、例えばボカロ系のコスでキャラと PV やどこどこの絵師さんの描いた〜とかどのシーンといった作品世界・変種・状況等が了解可能かって考えると良く判ると思う(って、一般人はコスの話が分からない罠(^_^;;;)

2011-06-08 11:40:53
tomo.(むにゃむにゃ) @MnjaMnia

キャラクターにはキャラが立ってるのとそうじゃないのがあって、前者は比較的文脈独立、後者は別のものとの関係性や比較によって了解可能になる訳で、このために、キャラクターセットが必要になる(例:常用漢字、戦隊もの)

2011-06-08 11:44:18
狩野宏樹 @KAN0U

IVS つきのフォントを作って市場に出してしまった私が言うのもなんですが、同感です。不安というより申し訳ないというか何というか。 RT @ogwata: ぼくが不安を抱くのは、異体字に関する社会的合意がまったく成立していないのに、技術だけはどんどん確立・実装されていくことです。

2011-06-08 11:50:26
tomo.(むにゃむにゃ) @MnjaMnia

異体/変種を考える場合、規範的な例示体との関係ってのもあるけど、規範的なセットとの関係が重要なこともある。ただ、形式的にはある例示体の異体の一種だとしても、ベースとなる例示体やセットとの関係とは違う面でキャラが立ってたとしたら、異体関係は二義的な問題かも知れない…

2011-06-08 11:51:01
tomo.(むにゃむにゃ) @MnjaMnia

視覚的記号の場合、視覚のアフォーダンスの問題もあるかも知れない。これは多分に無知識的に働く(実際には意識できないだけで後天的に獲得されたものだろうけど)。この『直接知覚』的な文字感覚と文字に関する知識の兼ね合いによって我々は文字を読み選んでるんじゃないかと思うのだが…

2011-06-08 12:00:14
tomo.(むにゃむにゃ) @MnjaMnia

まあ、いずれにしても、手書き文字やコスとかを考えた場合、グリフや文脈・状況依存な変種の類を考えた場合でも諒解可能性を担保するための捨象というかキーとなる差異というか、要するに包摂的なものは必要ではある。だけど、その差異のセットは一般には文脈独立ではないと思う(多分、それが問題)。

2011-06-08 12:05:23
tomo.(むにゃむにゃ) @MnjaMnia

ある状況においてどの差異(素性)が重要(有効)になるかってことに関してはある種の制約やパターンがあるような気はする。あと、素性や制約の強度の大小みたいなのもあるかな?また、関係素性の場合、セットという場や異体関係が問題になるとか。

2011-06-08 12:12:12
狩野宏樹 @KAN0U

@MnjaMnia 今のIVSはキャラ立ち派(人名外字)を取り扱うための枠組みとしてはいいんですが、戦隊(キャラクターセット)がうまく扱えないので、E01E0~E01FFをキャラクターセット用(漢字との組み合わせでなくIVS個別で割り当てる)にしたらいいのではないかと思います。

2011-06-08 12:13:52
tomo.(むにゃむにゃ) @MnjaMnia

こういう要素を抽出していけばある程度客観的な議論が出来る、と良いんだけど、漢字の場合、いかんせん、文字数が多くて、関係の数も百万のオーダーになりうるし、歴史も長いし、思い入れもあるし、議論のベースになるデータの蓄積自体が大変なんだよなぁ

2011-06-08 12:14:47
狩野宏樹 @KAN0U

例えばE01E0は「改定常用+人名+印標+exptモード」、E01E1は「旧字体(所謂康煕)モード」、E01E2は「もう少し古臭い康煕字典モード」、E01E3は「90モード(JIS90+常用漢字表優先)」、E01E4は「E01E0 のヒゲつき」とか。個別字形の前に選定方針ありき。

2011-06-08 12:16:29
tomo.(むにゃむにゃ) @MnjaMnia

キャラ立ってるのと立ってないのを分けて考えるのは良いと思うんですが、セット毎に割当って話になると 2022 に先祖帰りしちゃう気が(まあ、すでに、その兆候はあるような気もしますがw)RT @KAN0U: …セット用(漢字との組み合わせでなくIVS個別で割り当てる)にしたらいいの…

2011-06-08 12:19:41
tomo.(むにゃむにゃ) @MnjaMnia

思うに、こういうのは writing system declaration 的な仕組みでやるのが良いような気がします。 RT @KAN0U: 例えばE01E0は「改定常用+人名+印標+exptモード」、E01E1は「旧字体(所謂康煕)モード」、…個別字形の前に選定方針ありき。

2011-06-08 12:24:12
小熊善之 @0guma

@moji_memo じゃあ俺関係ねぇやー(おいおい)

2011-06-08 12:26:53
tomo.(むにゃむにゃ) @MnjaMnia

ただ、いずれにしても、ポリシーは書けた方が良いと思います。ただ、IVS 的なのでやっちゃうとどれを基準にするかが書きにくく、そのために、ポリシー考えずに混ぜるやつが出てくると思う訳です。多分、必要なのは文字の切り替えじゃなくて、テキストの属性なんだと

2011-06-08 12:27:13
UTF-8はBOMなしでって言ったよね? @moji_memo

@KAN0U そのE01E0は結合文字ではなく開始タグとして機能するってことですか?

2011-06-08 12:28:36
tomo.(むにゃむにゃ) @MnjaMnia

でまあ、基準となるポリシーの指定とその差異という形で書いた場合、その中の任意の文字や文字列を別のポリシーが指定されたテキストと比較したり挿入したりしようと思ったら、ポリシー間の翻訳が必要となり、このためにはオントロジーが必要になると(別の方法でできるならそれでも可)

2011-06-08 12:31:26
狩野宏樹 @KAN0U

@MnjaMnia IVSって、モーダルな処理を必要としないプレーンテキストの枠組に密輸入できたことと、本来書体切り換えでやるべきヒゲ付きヒゲありもごっちゃに扱える懐の広さが利点だと思うので…。。2022への先祖帰りというのは確信犯(平和な78JISへの回帰願望)かもしれません。

2011-06-08 12:32:39
tomo.(むにゃむにゃ) @MnjaMnia

まあ、なんというか、互換漢字をしくじったり XML で複雑骨折したりとかで他に手はなかったのかも知れないけど、『プレインテキストの世界の中のマークアップテキスト』ってのはやっぱ無理があるような気が。(^_^;

2011-06-08 12:37:36
狩野宏樹 @KAN0U

キャラクター(というかグリフ)セット用IVSが出来るとしたら、基本的には新字形を割り当てるのを禁止して、E01DFまでのエイリアスとしたい。勿論、サポートする漢字集合の全字種への字形割り当てを必須とする。そしてエイリアス定義は1個だけでなく、複数個の包摂可能なIVSを並列可能に。

2011-06-08 12:39:51
tomo.(むにゃむにゃ) @MnjaMnia

まあ、でも、そういう形式面は些細な問題かも知れず、より重要な問題は、やっぱ、IVS で指定したいものは一体なんなのか?ってことかなぁ。『字形』は無理があるけど、『字体』は合意がない、あるいは、合意が出来たらそれより細かい差異が書きたくなる…w

2011-06-08 12:40:06
tomo.(むにゃむにゃ) @MnjaMnia

@KAN0U 案だと、統一的な合意の代わりに、ポリシーに対して識別子を振って IVS の枠組の中で運用する訳で、このポリシーの記述は良いような気がするけど、ただ一般的にやるにはオントロジーが要ると思う。

2011-06-08 12:45:29
狩野宏樹 @KAN0U

@moji_memo 漢字1文字ごとに後置するのは現状のままです。ただ「旧字体のテキストには必ずE01E2をつける」というようにSelectorが統一されていると楽だし、字形の詳細をフォント制作者に任せられる。仕組みを変えずIVS割り当ての運用で使い勝手を良くするアイデアです。

2011-06-08 12:46:26
前へ 1 2 ・・ 12 次へ