#nvdajp 点訳エンジン改良

0
ほおずき山 @hoozukiyama

@dot_taigu @6dts mecabでつかっている辞書のリンクです。http://t.co/lEZfUrTP この中のnaist-jdic.csvがそれです。 #nvdajp #tenyaku

2012-05-30 10:06:56
ほおずき山 @hoozukiyama

@dot_taigu @6dts 形態素解析を直接呼び出すプラグインをメールで送りましたので試してみて下さい。#nvdajp #tenyaku

2012-05-29 18:29:32
まま a.k.a. みやゆん @dot_taigu

@hoozukiyama @6dts 余談ですが、英語の文章と比較して、COBOL のソースは大文字ばっかですし、Java は英語みたいですし、Lisp だとカッコがえらいことになりますし、いろいろポイントは多いです。 #nvdajp #tenyaku

2012-05-27 21:08:22
ほおずき山 @hoozukiyama

@dot_taigu @6dts 括弧の扱いがポイントになりそうですね。#nvdajp #tenyaku

2012-05-27 20:59:17
まま a.k.a. みやゆん @dot_taigu

@hoozukiyama @6dts 文書中の、数字アルファベットの部分は、なにが書いてあるのかによって、カッコの開き閉じの厳密さが必要かとかが、変わってくると思います。 #nvdajp #tenyaku

2012-05-27 20:53:19
ほおずき山 @hoozukiyama

@dot_taigu @6dts テーブルの差し替えはありで考えています。今のところデータの流れは、全角日本語は形態素解析でマス空けカナ文字に変換して点字出力。数字アルファベットはそのまま点字出力しようと思っています。#nvdajp #tenyaku

2012-05-27 20:48:17
まま a.k.a. みやゆん @dot_taigu

@hoozukiyama @6dts デフォルトというということは、テーブルの差し替えもありかもということですね。気になっていたのは、ユーザーがスクリーンリーダで読む前に、点訳エンジンに流すデータの内容がわかるかどうかでした。 #nvdajp #tenyaku

2012-05-27 20:43:40
ほおずき山 @hoozukiyama

@dot_taigu @6dts もめそうなキャラクターをリストアップしてそこからデフォルトのテーブルを作るのがよいのではないかと思っているのですが。いかがでしょうか? #nvdajp #tenyaku

2012-05-27 20:39:01
まま a.k.a. みやゆん @dot_taigu

@6dts @hoozukiyama ユーザーに選択させるかどうか、設計者のポリシーによる部分ですねえ。いちおうユーザーに負担をかけることになりますから。 #nvdajp #tenyaku

2012-05-27 20:36:47
6dts @6dts

@dot_taigu @hoozukiyama 両方考えてみましたが、まあ、テーブルでしょうか #nvdajp #tenyaku

2012-05-27 20:29:42
6dts @6dts

@hoozukiyama @dot_taigu 今回与えられた目的と関係ないのですが、使う人が自分で選べるようにっていうのは無理ですか? #nvdajp #tenyaku

2012-05-27 20:23:20
6dts @6dts

@hoozukiyama @dot_taigu ごめんなさい、情報処理を離れ、「自然な日本語点字」になるかなを考えたら、そこで過激な手にでなくても良かった。わたしも右に1票。半角小文字あいうえおやゆよはどっち案でも良い #nvdajp #tenyaku

2012-05-27 20:17:15
ほおずき山 @hoozukiyama

@6dts @dot_taigu 括弧のヒラキ・トジについて外印符みたいにする事を考えて見ても良いかもしれません。問題は外印符との区別が出来るかどうかです。点字数学記号解説(暫定改訂版)を見たところ小括弧は外印符と同じみたいです。#nvdajp #tenyaku

2012-05-27 20:03:33
6dts @6dts

@dot_taigu @hoozukiyama 私は逆にそこが、ヒラキ・トジの区別が付かない欠陥をひきずっているところが最も気にくわなかったのですが、考えてみれば通常の文章に半角カッコが出てきた場合に、外引符みたくされては困るんですね? #nvdajp #tenyaku

2012-05-27 19:48:38
ほおずき山 @hoozukiyama

@dot_taigu @6dts ありがとうございます。あと日本語表記で足りないものなどあれば気づかれたことがあればハッシュタグつきでつぶやいておいて下さい。#nvdajp #tenyaku

2012-05-27 16:33:22
まま a.k.a. みやゆん @dot_taigu

@hoozukiyama @6dts 自分が使うならば、Altair 側のテーブルに準拠し、必要なところを補っていく気がします。事務屋なので、コードで処理するより、テーブル参照で処理するのがすきです。そういうバイアスがかかってるかもしれません。 #nvdajp #tenyaku

2012-05-27 16:26:36
まま a.k.a. みやゆん @dot_taigu

@hoozukiyama @6dts もし、読み上げるテキストを先読みして、全角文字の文章中に半角文字が混じっているだけなら、PCTalker に準拠してしまうと、ちょっと読みにくい出力になると考えます。 #nvdajp #tenyaku

2012-05-27 16:13:26
まま a.k.a. みやゆん @dot_taigu

@hoozukiyama @6dts 今回の点訳エンジンは、スクリーンリーダーの読み上げのリダイレクト先を、点字ディスプレイにするというふうに理解しています。 #nvdajp #tenyaku

2012-05-27 16:09:11
まま a.k.a. みやゆん @dot_taigu

@hoozukiyama @6dts 変換テーブルとして準拠するのには、PCTalker, Altair とも、記号、特殊文字については、疑問が残ります。もちろん、どちらのソフトもちゃんと動作しているのですから、問題があるとは思いませんが。 #nvdajp #tenyaku

2012-05-27 16:06:11
まま a.k.a. みやゆん @dot_taigu

@hoozukiyama @6dts PCTalker について、カナ大文字、英字大文字、数字については、きっと問題ないと思われます。Altair 側も一緒ですし。 #nvdajp #tenyaku

2012-05-27 16:01:33
ほおずき山 @hoozukiyama

@dot_taigu @6dts 了解です。細かい内容であれば、メールで返信していただけると助かります。#nvdajp #tenyaku

2012-05-27 16:00:03