MySQL勉強会 in 大阪(第10回)

MySQL勉強会 in 大阪(第10回) 関連のツイートまとめです。 https://atnd.org/events/86982
0
yoku0825 @yoku0825

風が…やんだ…(意訳: 休憩時間なう?)

2017-04-11 20:48:56
Yoshiaki Yamasaki @yyamasaki1

MySQL 8.0.1で照合順序に utf8mb4_ja_0900_as_cs を追加。ハハ パパ問題を解消できる。※_as:アクセントセンシティブ(アクセントを区別)、_cs:ケースセンシティブ(大文字小文字を区別) #mysql_jp

2017-04-11 20:52:40
Yoshiaki Yamasaki @yyamasaki1

utf8mb4_ja_0900_as_cs_ks の追加を検討中。 ※_ks:カナセンシティブ 'あ' 'ア' 'ァ'を区別 #mysql_jp

2017-04-11 20:57:44
Yoshiaki Yamasaki @yyamasaki1

utf8mb4_ja_0900_as_cs_ks を追加した場合、utf8mb4_ja_0900_as_cs は utf8mb4_ja_0900_as_cs_ki に名称変更した方がいいでしょうか?是非フィードバックを下さい。 ※_ki:カナインセンシティブ #mysql_jp

2017-04-11 20:59:48
Yoshiaki Yamasaki @yyamasaki1

_ks は日本語だけの話です。utf8mb4_ja_0900_as_cs の名称に _ki をつけるかどうかを判断するために、日本のMySQLユーザーの皆さんのフィードバックをお待ちしています。m(_ _)m #mysql_jp

2017-04-11 21:03:50
山下 光洋(AWS SAP本10/22刊行) @yamamanx

where name = '芦田' ってすると他の字体の'芦田'も結果に含まれるってこと?ですかね #mysql_jp

2017-04-11 21:05:48
Yoshiaki Yamasaki @yyamasaki1

(来場者に質問) _WSは必要でしょうか? → 必要なさそう ※ワイドセンシティブ:'ア' と 'ア' を区別 #mysql_jp

2017-04-11 21:06:14
Yoshiaki Yamasaki @yyamasaki1

_vss(variation selector sensitivity) の話など、詳細なディスカッション中。'崎'と'﨑'はコードポインタが異なるから区別できるけど、'芦'は同じコードポインタで複数の字体が存在する、、、などなど。  #mysql_jp

2017-04-11 21:10:34
🐬🍣🍻 @RKajiyama

正確にはアアアー性能問題というべきか

2017-04-11 21:11:44
Yoshiaki Yamasaki @yyamasaki1

バグ報告があると「実際にユーザーさんがどんな機能を使っているのか?」、「どんな使い方をしているのか?」といったことが開発者に伝わるので、とても有益です。積極的にバグ報告頂けると嬉しいですm(_ _)m #mysql_jp

2017-04-11 21:18:32
Yoshiaki Yamasaki @yyamasaki1

バグ報告はこちらから。bugs.mysql.com 絵文字を区別する実装も、「🍣と🍺が同じ文字として判断される」というこちらのバグ報告をきっかけにして開発が行われました。 bugs.mysql.com/bug.php?id=765… #mysql_jp

2017-04-11 21:22:26
SSSS.からあげ @rzl5

きょうのMySQL勉強会、予想以上に面白かった!閉会直後に新たな観点出るし。ょぅι゛ょとようじょ、検索でどう扱うか。ソートでどう扱うか。 #mysql_jp

2017-04-11 22:12:48
🐬🍣🍻 @RKajiyama

@tmtms @yoku0825 病院美容院問題も今日話してましたが、開発責任者が( ゚д゚)こんな顔してました。

2017-04-12 00:37:26
🐬🍣🍻 @RKajiyama

拗音(ぁぃぅぇぉゃゅょなど)は音節で扱うのか捨て仮名(小書き文字)で扱うのか。前者ならas/aiで、後者ならcs/ciで処理することに。

2017-04-12 00:44:14
yoku0825 @yoku0825

カミポゥ≠カミポウ問題

2017-04-12 00:49:48
yoku0825 @yoku0825

@RKajiyama つを名前に持つものとしては、ぁぃぅぇぉゎはケースでゃゅょっは音節?w

2017-04-12 00:52:12
🐬🍣🍻 @RKajiyama

JIS X 4061:1996 日本語文字列照合順番でのぁぃぅぇぉっゃゅょゎの文字の扱いは「小文字」

2017-04-12 09:14:39
yoku0825 @yoku0825

斉藤ケースセンシティブ、大概読み仮名で済ませると思うのでサイトウ≠ザイドウならそれでいいか

2017-04-12 09:59:54
🐬🍣🍻 @RKajiyama

🍣🍻問題:Unicode絵文字の照合 ハハパパ問題:清音濁音半濁音の照合 病院美容院問題:拗音促音またはかな小文字の照合 アアアー問題:長音の照合による性能問題 邊邉問題:異体字セレクタの照合 崎﨑問題:異コードポイント同一扱い文字の照合 ハハ問題:全角半角の照合

2017-04-12 10:21:49
🐬🍣🍻 @RKajiyama

ダタ゛問題:結合文字の照合 ぅゎょぅι゛ょっょぃ問題:ギャル文字の照合

2017-04-12 10:25:21
🐬🍣🍻 @RKajiyama

邉邉問題と邉邊問題は別物ってあたりでさらに頭を抱えてる。u9089対u9089-gとu9089対u908aとなっている。そもそも異体字ってのがJIS X 0212, JIS X 0213, 常用漢字表と人名用漢字表とかとかそれだけでももうね。。。

2017-04-12 14:10:51