MessagePack ep.1 〜文字列とバイナリをめぐる issue 121〜
んーまてよ、不当であるかどうかは、どっちでもいいんでは。ポイントは、value.getString 文字列だろうがバイト列だろうが妥当であることのみ。
2013-02-20 20:41:21日本人で追加すべき側に立つ人とかいないかな。日本人の仲良しグループがクローズドに重要な部分を決めている感がするのがなんかあれ。 Rubyの開発とかでも似たようなことよくあるんかな。
2013-02-20 20:51:16@methane Ruby は 2.0 で multi charset すてて unicode only になるんでしたっけ? そのへんで参考になることはある?
2013-02-20 20:52:05@kazuho あのスレッドで現状の仕様を支持しているのが日本人だけなので、日本人が日本語で重要な決定をしてしまって英語圏の人が参画しにくい不公平感が出るのではないかという意味での発言です。Rubyはきっと2.0でもCSIのはず。
2013-02-20 20:55:41@frsyuki そう反論すると、 string 型はいいから unicode string 型追加してくれって言われません? unicode は internet の標準だって。
2013-02-20 20:58:24変更を必要としない人は、議論に参加するモチベーションが薄いというバイアスはあるはず。変更が必要だから積極的に説得する必要があるわけで、変更が不要な人はそもそもこのスレッドに興味が無い。
2013-02-20 20:58:26@methane ん…ちょっと良く分かりませんでしたが、追加するとすれば型システムと符号化の両方を考える必要があって、型システム上はunicode、符号化はUTF-8、という感じになるんですかね。
2013-02-20 21:01:03@frsyuki 微妙なとこだと思いますよ。我々は .txt ファイルが特定のエンコーディングだとは期待しないけど mime attribute としての charset は存在する世の中に住んでるので。結局、ユースケース次第じゃないかと個人的には思ってます
2013-02-20 21:01:55@frsyuki はい、符号化方式は UTF-8 でも UCS4 でも良いので、 Unicode を、 Unicode だという型情報を付与した形で保存して欲しいのだと思います。文字列型とバイト列型の違いが明確な言語は大抵文字列はUnicode文字列のことなので。
2013-02-20 21:03:06OSSでは声がデカくて粘り図良いヤツが勝つ。別の面では、実装するヤツも良い線には行くが、大抵その後で声がデカいやつに負ける。
2013-02-20 21:05:17@jj1bdx そこんとこちょっと自分詳しくないので(歴史を知らない)…スレッドで言ってやるか、この際日本語でも良いので並べて下さい…
2013-02-20 21:08:02文字列型を追加した結果 s.decode('utf8') が if isinstance(s, bytes) s=s.decode('utf8') になるだけなのが目に見えてるんだよなー。文字列型あったら便利なのは解るけど、文字列とバイト列区別しない言語とのやり取りは面倒になる。
2013-02-20 21:30:03