変体仮名符号化案について

とりあえず速報的にまとめました。今後内容が増えていくかと思います。
16
なんでやねんDTP/おぢん @works014

“MJ文字情報一覧表 変体仮名編(案)の公開 | 文字情報基盤整備事業” htn.to/eFitqe #変体仮名

2015-07-01 08:28:35
日本規格協会 @jsainfra

変体仮名の文字符号を国際標準とする為の提案を行う計画/Mj文字情報一覧表 変体仮名編(案)の公開 - 情報処理振興事業協会 (プレスリリース) mojikiban.ipa.go.jp/4436.html #feedly

2015-07-01 10:36:38
小形克宏 @ogwata

MJ文字情報一覧表 変体仮名編(案)の公開 mojikiban.ipa.go.jp/4436.html 〈文字情報基盤ワーキンググループ並びに文字情報基盤検討サブワーキンググループでの議論を踏まえ、299文字の変体仮名をまとめたMJ文字情報一覧表 変体仮名編(案)を作成し、公開しました。〉

2015-07-01 11:36:39
Ryusei @mandel59

「同一字母が複数の音価に用いられている場合においては、図形的に同一であっても別な変体仮名としました。」 それ重複符号化じゃんね?

2015-07-01 11:41:24
Ryusei @mandel59

「む」と「ん」のどっちで符号化するのか悩むでしょ pic.twitter.com/we3BKfp6XG

2015-07-01 11:44:52
拡大
Ryusei @mandel59

まあ“重複符号化”とか言い出しても、現状のUnicodeで大量に重複があること考えたら今更何をって感じだけどなー

2015-07-01 11:46:29
Ryusei @mandel59

文字の符号化、多義や多音価は困るところだなー

2015-07-01 11:48:11
Ryusei @mandel59

「子」も、「こ」と「ね」で重複

2015-07-01 11:49:03
Ryusei @mandel59

「変体仮名の同定は、「音価」×「字母」の組によってなされることを第一とし」 という方針だから、音価が違う時点で別字扱いになるのか……

2015-07-01 11:54:31
Ryusei @mandel59

それだったら、別に「字母」だけで同定してもいいんじゃないのか

2015-07-01 11:55:16
Ryusei @mandel59

あー、字母が判然としないかなもあるんだっけ?

2015-07-01 11:55:28
Ryusei @mandel59

音価が違うのを別コードにしたところで、違う音価の方が使われることは容易に想像できるし、重複符号化はやっぱり避けたほうがいいんじゃないの

2015-07-01 12:02:10
Ryusei @mandel59

「き子」が「きね」なのか「きこ」なのかは字からは分からないじゃん??? 字から分からない音価を字の同定に使うのって、倒錯しているのでは

2015-07-01 12:04:19
Ryusei @mandel59

多音価の仮名が存在するという事実から目をそらして重複符号化しても、つらみをよそに転嫁するだけですよ

2015-07-01 12:05:44
Ryusei @mandel59

うーん、でも重複符号化の話、「分かって」やってるとしたら、ちゃんとなんで重複符号化が悪筋なのか説得力ある理由付けてやらないと……

2015-07-01 12:07:52
狩野宏樹 @KAN0U

@mandel59 仮名の後ろにVariation Selectorをつけて表現する形での国際標準化を目指しているので、まず読みを決めないと符号化できないのですね。mojikiban.ipa.go.jp/contents/2015/… によると、戸籍の運用で機械的に平仮名に変換できる必要があるらしいです。

2015-07-01 12:17:21
狩野宏樹 @KAN0U

変体仮名の符号化案、同一図形で違う読みになり得るって何か既視感があると思ったら金と金、龜と龜と龜を区別したKS C 5601(今のKS X 1001)だ。個人的には字母と大きな形の違い(「多」レベルの)で区別して音は区別せず、崩し方の差はIVSのように登録制でやるのがいいと思う。

2015-07-01 12:32:41
Ryusei @mandel59

文字符号の音価主義は色々な歪みを生んでると思う(後の祭り)

2015-07-01 12:36:35
Ryusei @mandel59

Variation SelectorのVariationが何を指しているのか分からなくなってきた

2015-07-01 12:38:12
Ryusei @mandel59

文字はキレイなもんじゃないから、キレイに符号化できないって面もあるんだけど、キレイじゃないものを無理にキレイに取り繕おうとしてかえって汚い符号化になってるって側面があることを理解してほしい……

2015-07-01 12:43:58
Ryusei @mandel59

キレイじゃないことを踏まえた上でたてた原理原則が、キレイじゃないせいで次第に無実化していくという……

2015-07-01 12:44:57
Ryusei @mandel59

抽象文字という概念も骨抜きにされた

2015-07-01 12:46:18
Ryusei @mandel59

文字符号化の専門家なんてほとんど存在していないのではないのか? だいたい文字符号化の専門家とやらが十分な数存在しているんだったら、 Regional Indicator Symbol の悲劇は起こらなかったのではないのか?

2015-07-01 12:48:00
貍人鳥(小池咊夫) @koikekaisho

文字符号化の専門家と文字の専門家の意見が合わないことはよくある。

2015-07-01 12:49:59
1 ・・ 5 次へ