@andochin UCSが文字コード、文字セット、UTFはエンコード [今週土曜日は東京勉強会来てね! http://j.mp/aBsbhg]
2010-06-21 11:30:44@nakawankuma うん。だからUTFが文字コードを表すエンコード方法でUCSが文字コードに対応する文字の集合なんじゃないかと
2010-06-21 11:32:16@andochin UTFは文字符号化方式、UCS2と4があって符号化文字集合(俗にいう文字セット)と文字符号化方式(俗にいう文字円コーディング方式)の両側面があります。
2010-06-21 11:33:11@andochin エンコードはエンコードであって、文字セットとはちょっと関係がない。 [今週土曜日は東京勉強会来てね! http://j.mp/aBsbhg]
2010-06-21 11:33:16文字エンコーディング方式ですね(^^; RT @hiroyuki_mori: @andochin UTFは文字符号化方式、UCS2と4があって符号化文字集合(俗にいう文字セット)と文字符号化方式(俗にいう文字円コーディング方式)の両側面があります。
2010-06-21 11:35:00UCS、UTFについて http://homepage1.nifty.com/nomenclator/unicode/ucs_utf.htm
2010-06-21 11:35:16@andochin UTF-16がUnicodeの文字セットの番号と直接結びつくから誤解のたね。 JISコードと、ShiftJISをかんがえるといい。 [今週土曜日は東京勉強会来てね! http://j.mp/aBsbhg]
2010-06-21 11:35:41. @hiroyuki_mori @andochin @harunyan UCSはややこしいから話し出さない方がいいよねw [今週土曜日は東京勉強会来てね! http://j.mp/aBsbhg]
2010-06-21 11:36:09@andochin 符号化文字集合で割り当てられた符号をどのようにデータとして置き換えるかを定義したものが文字符号化方式ですね。
2010-06-21 11:36:12@nakawankuma UTF16が直接結びつくのはUCS2?サロゲートペアがあるとUCS4を使うことになる?必須という意味でなくサロゲートペアを使うと2byteを超える文字が出るので。
2010-06-21 11:39:01@andochin UCSってUniversal Charactor Setとなっていますが、文字集合に何かしらの符号化を行っていないと管理できないじゃないですか。 なので、2オクテットで管理したものがUCS2で4オクテットで管理したものがUCS4
2010-06-21 11:40:46@hiroyuki_mori なるほど。難しそうなのできっと140文字では説明できないと思うからちょっと読んできます^^
2010-06-21 11:42:03