amazonランキングの仕組みをもう少し真面目に推測した。

アマゾンのランキングについて服部先生(@tetshattori)にご教授いただく機会がありましたのでまとめます。 話がすれ違ってる印象なのは、服部先生はアマゾンランキングの動きを統計的にうまく近似する表現を求めようとしているのに対し、私はプログラマとして、あくまで実際のアマゾンのランキングのアルゴリズムがどのようなものであるかを推測しようとしているからです。もう少し具体的には、アマゾンのランキングを正確に説明でき、かつ極力シンプルなアルゴリムズを推測しようとしています。正直言うと、統計学は大学の理系教養レベルの知識しかないので服部先生の理論は理解できません。 アマゾンはランキングの仕組みを公表していないので、実際のアルゴリズムは推測するしかないのですが、服部先生と私の推測の(おそらく)一致している点を簡単にまとめると以下の通りです。書籍以外は観察していないので、あくまで書籍のランキング。 続きを読む
6
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

@tetshattori さっき書いたマーケットプレースがロングテール主体、というのはちょっと正確ではなかったです。マーケットプレースも売り上げの主体は回転本です。マーケットプレースのうちの「古書」「絶版本」がロングテール主体と書き直します。

2013-02-28 07:22:06
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

@tetshattori ですから「観測されない順位」など存在しない、と言う話です。アマゾンのランキングはあくまで一時間ごとの計算の結果生まれるもので、販売時点では存在していないでしょう。

2013-02-28 07:23:22
Tetsuya Hattori 服部哲弥 @tetshattori

@fod5 (実質)同じならなぜそんな「抽象的」な概念を持ち込む,と仰るかもしれません.そこが興味の違いなのでたいへんおもしろいところです.次の呟きで書くことはできれば頭からはねつけず少し考えて下さってわかって頂ければたいへん嬉しいのですが,だめなら議論を全部控えたい最初の山です

2013-02-28 07:24:04
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

@tetshattori 「結果としての先頭に飛ぶ規則」という前提が事実に反していると思います。先に書いた sort($a<=>$a||$b<=>$b)が正しいとすれば、それは「先頭には飛ばない」ということを意味してるのですが…。

2013-02-28 07:26:47
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

@tetshattori 頭からはねつけるつもりは毛頭ありません。ただ、語ってる対象がアマゾンのランキングである以上、アマゾンのランキングの仕組みをもっともシンプルに実現するアルゴリズムを推察すべきで、なにかアプリオリな現象を観察した結果であるとは考えるべきでないと思います。

2013-02-28 07:29:50
Tetsuya Hattori 服部哲弥 @tetshattori

@fod5 アルゴリズムを当てることを私は最初から避けました.なぜかというとamazoncojpが少しいじれば不正解になるからです.実際に少なくとも2,3年に一度いじってる形跡があります.そのような,先方の一方的変更に振り回される説明を避けました.(興味もあるし重要ですが)

2013-02-28 07:33:41
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

@tetshattori んーー、その部分で興味の焦点がちがってるんでしょうかね。私はどのようなアルゴリズムであるかが最大関心事ですし、それが変更されたのならどう変更されたのかが(どういう意図で変更されたのかも含めて)関心事です。

2013-02-28 07:35:33
Tetsuya Hattori 服部哲弥 @tetshattori

@fod5 FoD5さんの明快なプログラムも実際のランキングの動きとは細かい点で違います.売れてないのに順位が逆転する現象が観測されているからです.(この現象は,私の立場からは細かい問題なので,公開していませんが,データをためておられればいずれ気付くと思います)

2013-02-28 07:35:59
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

@tetshattori アマゾンノランキングは1時間に一回ソートの結果計算されるのは間違いないと思いますが、それが各々の本にフィードバックされるタイミングは、かならずしも1時間に一回ではない(下位ランクは数スパンに一度)とも思っています。それとは別の話ですか?

2013-02-28 07:38:31
Tetsuya Hattori 服部哲弥 @tetshattori

@fod5 そういう理由で具体的なアルゴリズムによらず「アマゾンのような数百万の数の順位付けをしたときアルゴリズムの詳細によらずに成り立つ現象は何か?」を見出し説明するために,Fod5さんが抽象的と仰る模型を説明しました.点数膨大ならアルゴリズムによらず実質同じに近づく模型です

2013-02-28 07:38:36
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

@tetshattori アルゴリズムの詳細といわれますが、きわめて単純なアルゴリズムでしょう。N時間内に売れていない本は、単純に最後に売れたタイミング順に並ぶ、だけですから。それを抽象的な模型で近似する必要と言うのがよくわかりません。

2013-02-28 07:41:06
Tetsuya Hattori 服部哲弥 @tetshattori

@fod5 このような「アルゴリズムによらず(点数無限極限で)成り立つ性質」には「amazoncojpがロングテールビジネスか否か」という問題の解答も含みます.それが興味対象の一つです.順位をつける主体のビジネスなので,派生する他の商売への言及でないことは連投の最初に書きました.

2013-02-28 07:43:39
Tetsuya Hattori 服部哲弥 @tetshattori

@fod5 興味を持って頂いて,実質的な順位付け(ロングテール部分)にFoD5さんのアルゴリズムと実質同じ結果をもたらすことを理解して頂ければさいわいです.だいじな議論と思ったのでこちらも連投しましたが,この件はこれくらいにさせて頂きます

2013-02-28 07:45:44
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

@tetshattori amazonの売り上げが(本に限っても)ロングテール部分が主体ではない、というのであれば同意します。ただ、ほかの書店が手を出せないようなロングテール部分からも収益を上げているのは事実なので、そこまで否定されるような論調はいかがなものかと思います。

2013-02-28 07:48:05
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

@tetshattori いやだから、その「実質的な」という部分に疑問を感じてるわけですけど。ひらたくおうと、服部さんが実質的と想定する部分など存在していないのでは、というのが私の主張です。

2013-02-28 07:49:20
Tetsuya Hattori 服部哲弥 @tetshattori

@fod5 途中質問頂いたのを見逃してたので一呟き追加.FoD5さんアルゴリズムがアマゾンのと違うことは途中説明しました.はい,アルゴリズムの興味が先か否かが最大の立場の違いと思います.それはむしろ良いことで,違う考察の結果のどこが重なり別れるかが一番面白い点と考えます.議論多謝

2013-02-28 07:52:42
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

@tetshattori アマゾンのと違う、というのは私が書いた理由(個々の本にランクを反映させるスパンの違い)ではなく、もっとロングでのケースでしょうか?

2013-02-28 07:54:33

ここからは一人であれこれとつぶやいています。


H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

まとめを作成しました。 「amazonランキングの仕組みをもう少し真面目に推測した。」 http://t.co/O6mKhNDi4l

2013-02-28 08:41:06
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

今のまとめの前書きで、N時間が24時間より長いと推測した理由を書きます。

2013-02-28 08:42:59
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

私のブログで、アイアムアヒーロー11巻の1月2日以降の売り上げ(現時点ではすべて予約数)のデータを表示させています。 http://t.co/eRDhjtEhw7 このページの最後の部分。

2013-02-28 08:45:06
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

これは一時間ごとのランクを表示したものですが、スクロールさせていくと徐々に増減していることがわかります。もし一時間ごとの集計であれば、ここまで平滑に推移することはないと思われます。

2013-02-28 08:45:54
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

スクロールさせていくと、なにかのはずみか急にランクがガンと上がるポイントがあります。もしN=24時間であれば、その24時間後にガンと上がった反動でいくぶんかはランクが下がるはずですが、どうもそうした動きはないようです。

2013-02-28 08:47:17
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

したがってNは24時間よりもっと長い時間で、ガンと上がった販売数を平準化させてしまうくらいのスパンではないかと推測しています。ちがうかもしれません。そのうちデータをd3.jsでチャート化する予定なので、そうしたら何か見えてくるかも。

2013-02-28 08:48:28
H.Sakai 🚲UberEats大阪🍔🍱🍜 @FoD5

ちなみに、アマゾンの書籍として登録されている本(ASINの振られていない本)がどれくらいあるかは、これもたぶん公表されていないと思うけど、私は400~500万と推測している。推測と言ってもヤマカンだけど。

2013-02-28 08:54:21