𐰔 𐰕 𐰤 サボテンのような文字! 「古テュルク文字」(突厥文字,トッケツ文字) の解読ツール作りで,"Unicodeサロゲートペア" の文字化けと格闘した話 …「サロゲート安全」なテキスト処理のJavaScript作法 𐱅𐰭𐰼𐰃 ∶ 𐰋𐰃𐰔 ∶ 𐰢𐰤𐰤 𐰔 𐰕 𐰤
- rwanda_go_tan
- 16671
- 110
- 1
- 0
@it_yabghu 文の区切りごとに分割して その区切りごとに,Google検索などのリンクを 自動的に生成。 これは,調べ物がはかどりますね~! pic.twitter.com/F6IlNco3hx
2019-06-13 11:02:02@it_yabghu 単語内で,1文字ずつ・1音素ずつの 詳細も出せるようになりました。 それぞれ1つの単語の中で, 前母音用の文字のみ または 後母音用の文字のみ で統一されているので 母音調和してるってことですね。 テュルクらしい~!! pic.twitter.com/d4JFrxp0ob
2019-06-13 10:50:57@it_yabghu 「つづりと発音 3列列挙モード」 というのを使えば つづり,ラテン文字転写,IPA の順に表形式に並べることができ かつ,各列の見出しをクリックすると その列を アルファベット順に並び替えることができます。 エクセルにそのまんま貼り付けて 自分のオリジナル辞書を作るのに便利な機能です。 pic.twitter.com/3btahoKVRV
2019-06-13 11:05:04@rwanda_go_tan ルワンダたんの文字使いぶり凄すぎる!! 一昔前簡体字やら何やらでドヤが押してた人よりも遥か上を行っている。
2019-06-13 11:06:27@it_yabghu 今回のリリースはver0.1ですので、 改善要望や、修正案、 こんな機能がほしいなど ありましたら、お気軽にお伝えくださいね!😆
2019-06-13 13:12:30@rwanda_go_tan 有難うございます。 いずれ役に立たせます。 突厥碑文の一部を写経の様に入力してみようかな・・・ TWでは文字数制限がw
2019-06-13 14:17:34@it_yabghu どうもです。 文字数制限があるときには、 スクリーンショットをご活用くださいね。 パソコンなら、 プリントスクリーンキーを押してから ツイート編集欄でctrl+v 押せば、 画面を 画像としてそのまま投稿できますよ! これなら、文字数の心配も無しです!
2019-06-13 17:41:58これで,突厥文字で書かれたテキストを
自動的に,音訳に変換できます!
(機械的な転写しかできませんけど!)
@it_yabghu 前々から疑問に思っていた, カシュガリーたんの管理人さんの,アカウント名の読み方 何て読むんだろう と,わからないままでしたので 入力して,転写を生成してみると… 犬單于 𐰃𐱃 𐰖𐰉𐰍𐰆 さん / (ı/i)t¹ j¹b¹g¹(o/u) / [ (ɯ/i)t jbɣ(o/u) ] イット・イブゴ…? …みたいな? pic.twitter.com/dVOnrzPrUl
2019-06-13 11:14:14@it_yabghu まあ,これは 機械的に転写しているにすぎないので・・・。 おそらく,正確な発音は ところどころ,母音が補われたりするんでしょうね~ その補われる部分については, 文章のスペルそのものからは 知ることができないので・・・仕方ないですね
2019-06-13 11:19:24@rwanda_go_tan ایت یبغو it yabghu(いと・やぶぐー) = 犬単于(いぬぜんう) 偉犬なる単于という意味ですw 「単于=yabghu」説を唱えているのは、管見の限り自分だけです。
2019-06-13 11:21:05スマホからも使えます
@it_yabghu あとは,このフォームが PCからだけでなく, スマホからもちゃんと動くかどうか ちょっと動作検証してみましょう・・・ 突厥語(とっけつご,古テュルク語) 発音表示・変換フォーム ver0.1 tagengo-gakushuu.study-tips.info/app/web-form/a…
2019-06-13 11:19:38@it_yabghu おっ、スマホからも ちゃんと動きますね! 一つの単語の発音方法をツイートしたい時は 画面をスクショして、画像を添付するだけで、発音の説明が済むので ラクですね〜! (PCから利用の場合も、PrtScrキーでスクショをツイート可能) 単語から、一発でGoogle検索に飛べるのも便利! pic.twitter.com/obtEdZqyeN
2019-06-13 11:28:47▶ 完成: 「古テュルク文字(突厥文字)で書かれた文章に,自動的に発音を付与するWebフォーム」
@it_yabghu 完成を,宣言します! ★突厥語(とっけつご,古テュルク語)★ 発音表示・変換フォーム ver0.1 tagengo-gakushuu.study-tips.info/app/web-form/a… 突厥文字(古テュルク文字,テュルク・ルーン文字) で書かれた文章に対し センテンスごと・単語ごと・1文字ごとに 自動的・機械的に,ラテン文字転写とIPAを付与します! pic.twitter.com/Pm1E4mR3fJ
2019-06-13 11:35:59文字マニアを自負なさる,グラマロジストの リオさん @KawaneRio にも,ご報告します・・・ テュルク・ルーン文字の 自動解読装置の開発に成功しました。 どうぞお使いください! twitter.com/rwanda_go_tan/…
2019-06-13 11:42:19また今回,突厥文字を扱うことによって 新しいノウハウや知見が多く得られました。 ・Unicode4桁以内に収まりきっていない,サロゲートペア(Unicode番地・5ケタ以上) ・右から左へ表記する文字 などの文字を,効率的に処理するための枠組み・ライブラリを 独自に完成させました。
2019-06-13 11:44:10Webブラウザ上の「文字」は, Unicode+サロゲートペア で表現されます。 これをUTF16と呼びます。 今回,サロゲートペアの問題をクリアしましたので・・・。 UTF16に 全面的に対応可能になった。 つまり,「Webブラウザ上で表示できる文字を 全面的にカバー可能になった。」 と言えます。👍
2019-06-13 11:47:01「突厥文字を読みたい,理解したい」 という方々・・・
けっこう,おられるみたいですね・・・?
テュルク系の言語って人気ありますよね!