in_tailでaccess.log読み込んでみたら invalid byte sequence in US-ASCII とかいわれて、リファラに非ascii文字が入ってるからみたいなんだけど困るな #fluentd
2012-04-16 15:27:23format /^(?<key>[^ ]+) (?<value>.*)$/ にUTF-8のログ食わせても invalid byte sequence in US-ASCII になるということは、in_tail マルチバイト対応してないのかな? #fluentd
2012-04-16 16:10:23@fujiwara $LANG ってなんですか?LANG が utf8 じゃないと Ruby のエンコーディング周り適切に設定してないとそうなると思います。
2012-04-16 16:12:43@hotchpotch 手元のmacですが LANG=ja_JP.UTF-8 でした。実際は壊れたバイナリがログに混じったところで死なれると困るので、エンコーディングを仮定するわけにも行かない気がしています
2012-04-16 16:14:17僕も違うファイルだけどin_tailしたらずっと「 invalid byte sequence in US-ASCII 」と「closed stream」出てしまって読み込めなかった・・・。 #fluentd
2012-04-16 16:51:25あれ、fluentd-0.10.15だと発生しなかったけど、fluentd-0.10.17に上げたら「 invalid byte sequence in US-ASCII」出てくる! #fluentd
2012-04-16 17:04:54さっきまでテスト環境はうまく行って、本番でデプロイしたらコケたので調べてみるとVerが違ってた。で、テスト環境をVerアップしたら「invalid byte sequence in US-ASCII」出るようになった。 #fluentd
2012-04-16 17:06:08@oranie https://t.co/aN42UP6E このcommitで、sliceで正規表現使うところでencoding依存するようになったっぽいですね
2012-04-16 17:08:05Released fluentd v0.10.19! This release includes some major bug fixes for in_syslog and in_tail. #fluentd
2012-04-18 03:30:26この件、@frsyuki さんがチェックしてくるはず!w QT @fujiwara: .@oranie @hotchpotch http://t.co/M5NZSOem in_tailの件、まとめつくらせていただきました
2012-04-16 19:54:26@oranie @fujiwara たぶん、このパッチで直ると思います。https://t.co/92YDFyn8
2012-04-17 10:27:16@frsyuki @fujiwara 手元のテスト環境で0.10.18(in_tail→forawad)→0.10.18(foward→file)という形で読み込み、送信、受信、書き込みを行った所問題無しでした!パッチを外すと問題は再現しました。
2012-04-17 11:54:19Released fluentd v0.10.19! This release includes some major bug fixes for in_syslog and in_tail. #fluentd
2012-04-18 03:30:26Also this release fixed in_tail's "invalid byte sequence in US-ASCII" error. And also fixed in_syslog which was broken. #fluentd
2012-04-18 03:31:17