更新 2014年5月21日作成 2013年2月23日

MessagePack ep.1 〜文字列とバイナリをめぐる issue 121〜

MessagePack に文字列型を追加するべきか否かをめぐった、長い議論のまとめ。 ep.2に続きます：http://togetter.com/li/467451 issueスレッド121： https://github.com/msgpack/msgpack/issues/121

プログラミング msgpack

frsyuki
27832
0
21
5

前へ 1 2 3 ・・ 48 次へ

Sadayuki Furuhashi @frsyuki

んーまてよ、不当であるかどうかは、どっちでもいいんでは。ポイントは、value.getString 文字列だろうがバイト列だろうが妥当であることのみ。

2013-02-20 20:41:21

Sadayuki Furuhashi @frsyuki

@kazuho あー、それいいですね。

2013-02-20 20:41:47

methane @methane

メンション来たから何て返そうか考えて3行で答えてる間にスレッドは10件くらい伸びてるというｗ

2013-02-20 20:46:54

methane @methane

日本人で追加すべき側に立つ人とかいないかな。日本人の仲良しグループがクローズドに重要な部分を決めている感がするのがなんかあれ。 Rubyの開発とかでも似たようなことよくあるんかな。

2013-02-20 20:51:16

Kazuho Oku @kazuho

@methane Ruby は 2.0 で multi charset すてて unicode only になるんでしたっけ？　そのへんで参考になることはある？

2013-02-20 20:52:05

methane @methane

CSIの文字列型を追加したら発狂する人出てくるってｗｗｗ

2013-02-20 20:52:08

methane @methane

@kazuho あのスレッドで現状の仕様を支持しているのが日本人だけなので、日本人が日本語で重要な決定をしてしまって英語圏の人が参画しにくい不公平感が出るのではないかという意味での発言です。Rubyはきっと2.0でもCSIのはず。

2013-02-20 20:55:41

Sadayuki Furuhashi @frsyuki

文字コードを難しく考えすぎなんですかね？

2013-02-20 20:57:14

methane @methane

msgpackに文字列型を追加するとしてNUL終端すべきか否か。

2013-02-20 20:57:29

methane @methane

@frsyuki そう反論すると、 string 型はいいから unicode string 型追加してくれって言われません？ unicode は internet の標準だって。

2013-02-20 20:58:24

Sadayuki Furuhashi @frsyuki

変更を必要としない人は、議論に参加するモチベーションが薄いというバイアスはあるはず。変更が必要だから積極的に説得する必要があるわけで、変更が不要な人はそもそもこのスレッドに興味が無い。

2013-02-20 20:58:26

Sadayuki Furuhashi @frsyuki

@kuenishi ぃゃそれ言ってやってください…

2013-02-20 20:59:05

Sadayuki Furuhashi @frsyuki

@methane ん…ちょっと良く分かりませんでしたが、追加するとすれば型システムと符号化の両方を考える必要があって、型システム上はunicode、符号化はUTF-8、という感じになるんですかね。

2013-02-20 21:01:03

Sadayuki Furuhashi @frsyuki

もう疲れた…4時ですよ。寝てもいいですか…

2013-02-20 21:01:03

Kazuho Oku @kazuho

@frsyuki 微妙なとこだと思いますよ。我々は .txt ファイルが特定のエンコーディングだとは期待しないけど mime attribute としての charset は存在する世の中に住んでるので。結局、ユースケース次第じゃないかと個人的には思ってます

2013-02-20 21:01:55

Sadayuki Furuhashi @frsyuki

ここで「じゃぁ文字列型入れるわ」って言った後にどんな議論が起こるのかをパラレルワールドで見てみたい。

2013-02-20 21:02:01

methane @methane

@frsyuki はい、符号化方式は UTF-8 でも UCS4 でも良いので、 Unicode を、 Unicode だという型情報を付与した形で保存して欲しいのだと思います。文字列型とバイト列型の違いが明確な言語は大抵文字列はUnicode文字列のことなので。

2013-02-20 21:03:06

Sadayuki Furuhashi @frsyuki

@kuenishi 意見しないから有罪判決だ！ですよ…疲れた…

2013-02-20 21:04:08

Sadayuki Furuhashi @frsyuki

OSSでは声がデカくて粘り図良いヤツが勝つ。別の面では、実装するヤツも良い線には行くが、大抵その後で声がデカいやつに負ける。

2013-02-20 21:05:17

Sadayuki Furuhashi @frsyuki

@jj1bdx そこんとこちょっと自分詳しくないので（歴史を知らない）…スレッドで言ってやるか、この際日本語でも良いので並べて下さい…

2013-02-20 21:08:02

Sadayuki Furuhashi @frsyuki

@kuenishi 返信付いてますよ

2013-02-20 21:16:11

methane @methane

ウィルスにどの会社から発信されたか情報が残るのかー

2013-02-20 21:21:15

methane @methane

歩み寄るとしたら、ユーザー拡張型をシリアライズするために残ってる先頭ビットを使う時の推奨を決めるとかかなぁ。

2013-02-20 21:23:04

Sadayuki Furuhashi @frsyuki

@nalsh 超ナイスです…！！！！

2013-02-20 21:29:50

methane @methane

文字列型を追加した結果 s.decode('utf8') が if isinstance(s, bytes) s=s.decode('utf8') になるだけなのが目に見えてるんだよなー。文字列型あったら便利なのは解るけど、文字列とバイト列区別しない言語とのやり取りは面倒になる。

2013-02-20 21:30:03

前へ 1 2 3 ・・ 48 次へ

いま話題のタグ