ファイル名ローマ字表記時の「んあ(na)」と「な(na)」などの表記分けについて

運営している『日本語セリフ素材配布サイト』の【音声ファイルのローマ字命名規則】について、「ん」などをどう表記すべきかたくさんのご意見をいただきました。
38
あみたろ │ 小春音アミ公式 @amitaro_utau

【質問】 フリー声素材のファイル名をローマ字でつけるにあたって、「本屋」を「hon'ya.wav」とした時に不具合が起こる可能性はありますか? エンジニアさんなど、ご自身の分野を想定して教えていだたければ助かります!

2022-07-24 18:59:53
あみたろ │ 小春音アミ公式 @amitaro_utau

アンケート、たくさんのご回答ありがとうございます。 「回答だけ見る」が多いので、皆さん同じことで悩まれていたのかもしれません。 pic.twitter.com/gBk2hp4Y4C

2022-07-26 13:42:53
拡大

「'(シングルクォーテーション)」は問題が発生する可能性も

上林賢司@Genussmittel @Symb10s1sServer

@amitaro_utau たぶん、 'ここに何か書くことがある' "ここに何か書くことがある" ような感じで使われるものがあるかもなので、「'」の記号はあんましファイル名には入れない方が良いかもです…。 hon-yaとかなら大丈夫かなと思われ(`・ω・´)ゞ

2022-07-24 19:27:41
あみたろ │ 小春音アミ公式 @amitaro_utau

@SymbiosisServer あああなるほど、「’」は別の意味で使う可能性があるんですね…!自分では思いつきませんでした、ありがとうございます!! 声素材は実際は短い文章なので、「ん」のたびに「-」を入れると単語の切れ目に見えそうで困ってます…

2022-07-24 20:03:29
唯 彰@しばらく自粛にゃう @akira_yui

@amitaro_utau 「-」「_」以外の記号を含めると何らかの不具合が起きる可能性があるので hon-ya hon_ya honYa などにして頂けると嬉しいです。

2022-07-24 21:03:50
あみたろ │ 小春音アミ公式 @amitaro_utau

@akira_yui ありがとうございます、やはり記号はややこしいんですね…! 実際の声素材は文章形式が多いので「-」や「_」は単語の切れ目と混同されないか心配していました。 大文字案も含めて考えてみます、ありがとうございます!

2022-07-24 22:03:54
唯 彰@しばらく自粛にゃう @akira_yui

@amitaro_utau おねがいしますー 詳しく言うと、 「'」(シングルクォテーション)はphpなどで文字列を囲む記号だったりするので、csvなどで処理する時に困ったりしますねww 「-」「_」はご指摘通り単語の切れ目として使う事が多いため、文字列の一部として考える事が多いのが推奨の理由ですね。

2022-07-24 22:10:46
fukasawa takuya @fukasawa_takuya

ファイル名に「'」とかは、きちんとしたシステムなら無問題だけど、世の中きちんとしたシステムばかりではないので避けた方が無難、かなぁ。

2022-07-26 14:27:45

『正しいローマ字』では、「ほんや=hon'ya」ですが、「'(シングルクォーテーション)」を使用すると問題が起こる場合は「honxya」としても良いそうです。

が、「x」の使用は直感的ではないので、避けたいです。

案5. 「-(ハイフン)」や「_(アンターバー)」を使用する

上林賢司@Genussmittel @Symb10s1sServer

@amitaro_utau ハイフンかアンダーバーとかでも良いかも…です(`・ω・´)ゞ もしくは、もう「honya」にしちゃうとか…?

2022-07-24 21:58:42
あみたろ │ 小春音アミ公式 @amitaro_utau

@SymbiosisServer やはり記号ならハイフンやアンダーバーが無難でしょうか… 「honya」は「ほにゃ!」に見えなくもないですが、心の目で読んでいただくのも手ですね…!

2022-07-24 22:05:28
上林賢司@Genussmittel @Symb10s1sServer

@amitaro_utau あー…たし…かに…。 ほにゃ! にも見える…。 honya(bookstore)にするとか…。 ファイル名ならハイフン、アンダーバーなら大丈夫なはずです(`・ω・´)ゞ

2022-07-24 22:29:11
Rin @Rin_to_uta

@amitaro_utau 私の職場のエンジニアさん的には、 「-」は単語同士をつなぐ使う 「_」は単語を区切るときに使う ってイメージらしいです!うちの職場だけのイメージかも知れませんが、なにか参考になれば…!

2022-07-24 22:21:54
あみたろ │ 小春音アミ公式 @amitaro_utau

ファイル名ローマ字の「n」問題、エンジニアの方なら皆さん同じような答えをお持ちかと思ったのですが、定石ルールはないみたい…? hon-ya hon_ya hon’ya hoNya honYa などのご意見をいただいてますが、実際の声素材は文章風なので単語の切れ目に見えそうで悩んでます…! twitter.com/amitaro_utau/s…

2022-07-24 22:09:00

案6. ひらがなで表記する案

CrazY@豚肉 @crazy_toho

変換はプログラム側で組む前提で「ほんや」が嬉しいかも twitter.com/amitaro_utau/s…

2022-07-25 16:44:23

案7. 自分でルールを決めてしまう案

たついかみ / tatsuikami @tatsuikami

@amitaro_utau 例えば、「本屋さんに行った」 honyasanniitta見た目分かりやすく書けと言われたら honya-san_ni_itta と書くと思うので honYa-san_ni_itta とか hoNya-san_ni_itta と書くかと言われると、書かんな~ hon-ya-san とも書かない「本屋」はそれで1単語だから。。。)

2022-07-24 22:41:19
たついかみ / tatsuikami @tatsuikami

@amitaro_utau でも「Pascal記法ね(はぁと)」とか言われたら「合点承知」て従います要は決めちゃえばそれでいい

2022-07-24 22:42:28
潮見ひろ @shioming

@amitaro_utau ローマ字で日本語を表記しようとすると、「ほんや」なのか「ほにゃ」なのかみたいなの、起きますよね。文字の違いは仕方ないので、自分ならルールを統一できれば誤読覚悟で割り切る形にします。 システムに取り込む場合は「'」は避けたほうがいいですね……「_」「-」についてはRinさんに同意です

2022-07-25 16:25:46
デルタ@きみがため @delta_kuro

しかしこれはなかなか難しいな……英語音源の録音リストではn+をNの読み替えで使ってるけど、正規表現的に嬉しくない(例えば文書の中に複数のファイル名のうちいずれかに一致する文字列があるかみたいな実装)

2022-07-25 16:37:32
デルタ@きみがため @delta_kuro

一長一短なので、「俺はこのやり方でやる!実装するやつが汗かきな!あばよ!」ってするのが正解かな(不正解の音

2022-07-25 16:51:25