圧縮プログラムを利用した著者推定研究と音声波形抽出アルゴリズム

気がついたら色々と呟いていたのでまとめてみた。
3
Shuntaro Nakano @nshun583ts

「圧縮プログラムを応用した著者推定」の論文ざっと目を通した 確かにLZ77符号化形式のアルゴリズムをテキストの類似性評価に適応すると文章の著者推定に活用できそうだな それなりに有意な結果も出ているし それにしてもこのテーマで先行研究ってあるんだな

2010-07-05 03:55:29
Shuntaro Nakano @nshun583ts

「圧縮プログラムを応用した著者推定(安形輝)」: http://bit.ly/avD9ft

2010-07-05 03:57:10
Shuntaro Nakano @nshun583ts

最終総括の3次会後に@tktn_と話していた、特定アーティストの曲から「僕」や「私」や「俺」だけを波形解析して自動抽出するアルゴリズムの話もそうだけど、この手の話は凄く面白い

2010-07-05 04:02:31
Shuntaro Nakano @nshun583ts

音声の場合は「撲殺」「橋渡し」「名折れ」などの、部分的に「僕」「私」「俺」が歌詞に含まれる場合をどうするかというアルゴリズム上の問題があるな 一度「僕」のフレーズをランダムで選んだ曲から切り出してその音声波形との類似性を判断すればいいんだろうけど

2010-07-05 04:08:17
Shuntaro Nakano @nshun583ts

「撲殺」とか歌詞に入っている物騒な歌はどうかと思うけどw

2010-07-05 04:08:22
Shuntaro Nakano @nshun583ts

類似性判断のパラメーターを調整することで、最終的にはアーティストごとにチューニングした特化アルゴリズムになりそう 1から10までのレベルで精度を調整できるGUIを付けて

2010-07-05 04:11:53
Shuntaro Nakano @nshun583ts

洋楽だと同音異義なフレーズを判別しなくていいから既に先行研究がありそうだな

2010-07-05 04:14:57
Shuntaro Nakano @nshun583ts

あと色々と応用が利きそう off vocal曲を複数読み込ませてその曲に関わっているギタリストや制作に使われているMIDI環境を推定するアルゴリズムとか、歴代首相の所信表明演説・国会答弁・選挙演説から「消費税」「善処します」「最後のお願いに参りました」を抽出するアルゴリズムとか

2010-07-05 04:19:57
Shuntaro Nakano @nshun583ts

もはや応用なのかどうかよく分からないが

2010-07-05 04:23:07