ファイル名ローマ字表記時の「んあ(na)」と「な(na)」などの表記分けについて
- amitaro_utau
- 11321
- 47
- 2
- 0
【質問】 フリー声素材のファイル名をローマ字でつけるにあたって、「本屋」を「hon'ya.wav」とした時に不具合が起こる可能性はありますか? エンジニアさんなど、ご自身の分野を想定して教えていだたければ助かります!
2022-07-24 18:59:53アンケート、たくさんのご回答ありがとうございます。 「回答だけ見る」が多いので、皆さん同じことで悩まれていたのかもしれません。 pic.twitter.com/gBk2hp4Y4C
2022-07-26 13:42:53「'(シングルクォーテーション)」は問題が発生する可能性も
@amitaro_utau たぶん、 'ここに何か書くことがある' "ここに何か書くことがある" ような感じで使われるものがあるかもなので、「'」の記号はあんましファイル名には入れない方が良いかもです…。 hon-yaとかなら大丈夫かなと思われ(`・ω・´)ゞ
2022-07-24 19:27:41@SymbiosisServer あああなるほど、「’」は別の意味で使う可能性があるんですね…!自分では思いつきませんでした、ありがとうございます!! 声素材は実際は短い文章なので、「ん」のたびに「-」を入れると単語の切れ目に見えそうで困ってます…
2022-07-24 20:03:29@amitaro_utau 「-」「_」以外の記号を含めると何らかの不具合が起きる可能性があるので hon-ya hon_ya honYa などにして頂けると嬉しいです。
2022-07-24 21:03:50@akira_yui ありがとうございます、やはり記号はややこしいんですね…! 実際の声素材は文章形式が多いので「-」や「_」は単語の切れ目と混同されないか心配していました。 大文字案も含めて考えてみます、ありがとうございます!
2022-07-24 22:03:54@amitaro_utau おねがいしますー 詳しく言うと、 「'」(シングルクォテーション)はphpなどで文字列を囲む記号だったりするので、csvなどで処理する時に困ったりしますねww 「-」「_」はご指摘通り単語の切れ目として使う事が多いため、文字列の一部として考える事が多いのが推奨の理由ですね。
2022-07-24 22:10:46ファイル名に「'」とかは、きちんとしたシステムなら無問題だけど、世の中きちんとしたシステムばかりではないので避けた方が無難、かなぁ。
2022-07-26 14:27:45『正しいローマ字』では、「ほんや=hon'ya」ですが、「'(シングルクォーテーション)」を使用すると問題が起こる場合は「honxya」としても良いそうです。
が、「x」の使用は直感的ではないので、避けたいです。
案5. 「-(ハイフン)」や「_(アンターバー)」を使用する
@amitaro_utau ハイフンかアンダーバーとかでも良いかも…です(`・ω・´)ゞ もしくは、もう「honya」にしちゃうとか…?
2022-07-24 21:58:42@SymbiosisServer やはり記号ならハイフンやアンダーバーが無難でしょうか… 「honya」は「ほにゃ!」に見えなくもないですが、心の目で読んでいただくのも手ですね…!
2022-07-24 22:05:28@amitaro_utau あー…たし…かに…。 ほにゃ! にも見える…。 honya(bookstore)にするとか…。 ファイル名ならハイフン、アンダーバーなら大丈夫なはずです(`・ω・´)ゞ
2022-07-24 22:29:11@amitaro_utau 私の職場のエンジニアさん的には、 「-」は単語同士をつなぐ使う 「_」は単語を区切るときに使う ってイメージらしいです!うちの職場だけのイメージかも知れませんが、なにか参考になれば…!
2022-07-24 22:21:54ファイル名ローマ字の「n」問題、エンジニアの方なら皆さん同じような答えをお持ちかと思ったのですが、定石ルールはないみたい…? hon-ya hon_ya hon’ya hoNya honYa などのご意見をいただいてますが、実際の声素材は文章風なので単語の切れ目に見えそうで悩んでます…! twitter.com/amitaro_utau/s…
2022-07-24 22:09:00案6. ひらがなで表記する案
案7. 自分でルールを決めてしまう案
@amitaro_utau 例えば、「本屋さんに行った」 honyasanniitta を見た目分かりやすく書けと言われたら honya-san_ni_itta と書くと思うので honYa-san_ni_itta とか hoNya-san_ni_itta と書くかと言われると、書かんな~ hon-ya-san とも書かない(「本屋」はそれで1単語だから。。。)
2022-07-24 22:41:19@amitaro_utau でも「Pascal記法ね(はぁと)」とか言われたら「合点承知」て従います(要は決めちゃえばそれでいい)
2022-07-24 22:42:28@amitaro_utau ローマ字で日本語を表記しようとすると、「ほんや」なのか「ほにゃ」なのかみたいなの、起きますよね。文字の違いは仕方ないので、自分ならルールを統一できれば誤読覚悟で割り切る形にします。 システムに取り込む場合は「'」は避けたほうがいいですね……「_」「-」についてはRinさんに同意です
2022-07-25 16:25:46しかしこれはなかなか難しいな……英語音源の録音リストではn+をNの読み替えで使ってるけど、正規表現的に嬉しくない(例えば文書の中に複数のファイル名のうちいずれかに一致する文字列があるかみたいな実装)
2022-07-25 16:37:32