半角濁点の編集上の扱いについて

結合文字ではない半角片仮名の濁点(U+FF9E)が、カーソル移動/削除で前の文字と一まとめになる現象とその理由について。IVSも同じ扱いだということです。
8
小形克宏 @ogwata

いろいろ検索して次のような記事に当たった。「本と本屋がなくなる日」現代ビジネス、2010年05月06日 http://gendai.ismedia.jp/articles/-/498?page=2 句読点、括弧、中黒等の約物が全て半角。紙の組版の詰組を再現しようという意図かな?

2011-03-26 01:36:03
小形克宏 @ogwata

(承前)「現代ビジネス」全体の組版ルールということではない様子。最新の記事では全角約物を使っている。ただ、前掲記事と同時期の2010年前半の記事は、やはり半角約物を使っているものがある。 http://bit.ly/foTV1i

2011-03-26 01:39:23
小形克宏 @ogwata

あと、以前から愛読しているこの人なんかは、普段使いとして半角の句読点を使っているみたい。 http://www.ycaster.com/diary/index.html 経済評論家として著名な人ですが。

2011-03-26 01:41:02
小形克宏 @ogwata

いずれも文書の構造化という見地からは「見た目偏重の不適切なデータ」と言えるし、組版の見地からは「詰まった本文の好み」を感じる例ではある。

2011-03-26 01:44:40
窮狸校正所 @mori_taksi

@ogwata 「ドル」もわざとなんでしょうね。

2011-03-26 01:47:23
小形克宏 @ogwata

ええと、すいません、どのページでしょう。半角カタカナまで使ってます? RT @mori_tacsi: @ogwata 「ドル」もわざとなんでしょうね。

2011-03-26 01:50:15
小形克宏 @ogwata

確認しました。これは…単位語などの組み文字の再現を試みたのかなw RT @mori_tacsi: @ogwata 反応が遅くてすみませんw  現代ビジネス、2010年05月06日 http://gendai.ismedia.jp/articles/-/498?page=2 です。

2011-03-26 01:53:43
小形克宏 @ogwata

まあ、出版社の見た目偏重は宿痾というべきですね。反面「デザイン・組版へのこだわり」と言えなくもないところが厄介。

2011-03-26 01:55:25
窮狸校正所 @mori_taksi

@ogwata 「㌦」U+3326を使えばよかったのに^^

2011-03-26 01:56:29
小形克宏 @ogwata

そうそう、charset=UTF-8のくせにw RT @mori_tacsi: @ogwata 「㌦」U+3326を使えばよかったのに^^

2011-03-26 01:58:35
ものかの @monokano

@ogwata 中途半端なこだわりですね〜w。で、そんなことより、Safariやテキストエディットで半角カナ2文字「ド」が1文字として選択されるんですけど(OSX10.6.7)、前からこうでしたっけ? いま気づいてビックリしました。

2011-03-26 01:59:47
小形克宏 @ogwata

ほんとだ!! RT @monokano: @ogwata 中途半端なこだわりですね〜w。で、そんなことより、Safariやテキストエディットで半角カナ2文字「ド」が1文字として選択されるんですけど(OSX10.6.7)、前からこうでしたっけ? いま気づいてビックリしました。

2011-03-26 02:00:47
小形克宏 @ogwata

それどころか、Mac OS X 10.6.7だと、テキストエディットでも同じ挙動ですぜ!RT @monokano: @ogwata 中途半端なこだわりですね〜w。で、そんなことより、Safariやテキストエディットで半角カナ2文字「ド」が1文字として選択されるんですけど…

2011-03-26 02:02:50
小形克宏 @ogwata

Mac OS Xになにがおこった……

2011-03-26 02:03:34
窮狸校正所 @mori_taksi

@monokano 私もこの件で気付きました。文字ビューアには「ト」1文字しかドロップされないし... でもmonokanoさんのUnicode Normalization Testerにはちゃんと「ト」と「゙」がペーストされました。 @ogwata

2011-03-26 02:05:11
小形克宏 @ogwata

キャレットの挙動だから、レンダリングエンジン周りの仕様変更ということかなぁ。しかし検索置換における文字の単位だから、もうちょっと根深いかな。

2011-03-26 02:07:48
窮狸校正所 @mori_taksi

依然、ユニコードについてよくわかってない私。 @monokano

2011-03-26 02:08:13
小形克宏 @ogwata

いや、これは規格じゃなくて実装の問題ですよ。RT @mori_tacsi: 依然、ユニコードについてよくわかってない私。 @monokano

2011-03-26 02:08:59
窮狸校正所 @mori_taksi

@ogwata 規格自体がよくわかってないので、実装となるともっとわからないのです。

2011-03-26 02:09:55
UTF-8はBOMなしでって言ったよね? @moji_memo

@monokano 「ド」の件、Mac OS X 10.4.11のSafariとテキストエディットでも確認。実はけっこう昔からそうだったのかも。

2011-03-26 02:13:17
ものかの @monokano

わ、そうなんですか! 私たち、今やっと気づいたんですねえw RT @moji_memo: 「ド」の件、Mac OS X 10.4.11のSafariとテキストエディットでも確認。実はけっこう昔からそうだったのかも。

2011-03-26 02:15:49
小形克宏 @ogwata

直井さんちのMac OS Xは、Tigerである件。RT @moji_memo: @monokano 「ド」の件、Mac OS X 10.4.11のSafariとテキストエディットでも確認。実はけっこう昔からそうだったのかも。

2011-03-26 02:16:27
小形克宏 @ogwata

Mac OS X 10.6.7 のSafariだと、「ド」と「と」がマッチしちゃうのがなんとも……。要するに「ト」として扱っているということかな。これもTigerから?

2011-03-26 02:20:15