グラフの作り方講座にげんめっ!(引き続き東京は暑くなっているのか問題を例に)
- adonis_fish
- 19106
- 8
- 39
- 37
@motohirohonma ご指摘ありがとうございます。30年というのも考えましたが、対象期間が長いと最近の特徴がボケるかと思い、とりあえず何となくで5年にしました。(後程、時間を見つけて検討したいと思っています)
2015-08-11 13:38:35@kobiwa_net 期間統計をとるときは,少なくとも変動周期と同程度の期間をとることが望ましいですね.(お昼休みにさらっとやられたものなので,突っ込むべきものでもないのですが)
2015-08-11 13:48:05@motohirohonma どの周期の変動(例えば温暖化か都市化:ヒートアイランド、今回はどちらかと言うと後者に注目)に注目するかで対象とする期間も変わってきますね。あと、8月だけを対象にしていいのかも少し考えましたが、他に良い案が無かったので8月のみを対象にしました。
2015-08-11 13:55:10@kobiwa_net 何を見たいかにもよりますが、最近の特徴というよりENSOの特徴をとらえていないか気になります(より長いスケールではPDOとの関連も気になりますね)。
2015-08-11 13:57:20@shearline (こういうのって、最初に何を見たいのかはっきりさせておかないと、卵を見たかったのか鶏を見たかったのか、考えているうちにわけがわからなくなりそうですねw)
2015-08-11 14:03:05@kobiwa_net 気候システムはとても複雑で、解析結果が得られても自分がいったい何を「見ている」のか悩んでしまうことが多々あります。(その悩みを解決するのが研究なのかもですが)
2015-08-11 14:16:07前まとめに「グラフはいくらでも恣意的に操作できるから気を付けろ」みたいなコメントをたくさんいただいたのですが、意図的な操作以前に自分で自分を騙してしまうというか、自分の見ているものがどこから来ている差なのか(あるいは、差のなさなのか)、よくわからないまま適切でないグラフで適切でない解釈をしてしまいかねないのがグラフの厄介なところだったりします。
「何も考えずにとりあえず数字を並べてみて、何が見えるか考えよう」というのは一見偏りのないやり方に見えて、実は作り手のコントロールできないバイアスが入り込みがちなので、なんというか一番ダメなパターンですね(´・ω・`)
8月の最高気温に絞ってもっとグラフを描いてみた
昼に投げた東京8月の最高気温のヒストグラム。5年ではなく30年(平年値の期間)くらいとった方が良いとのご意見を頂いた事もあって30年でヒストグラムを描いてみた。やはり、ヒストグラムが全体的に右へシフトしているし、猛暑日も増えている。 pic.twitter.com/0ifTlge7RJ
2015-08-11 19:17:39さて、なんで昼に5年間でヒストグラムを描いたかと言うと、30年もあれば最高気温の分布が変わるのではないかと思ったため。ということで、1985~2014年のうち始めと終わりの5年のヒストグラムも描いてみた。 pic.twitter.com/weMIovmFDy
2015-08-11 19:26:1130年でヒストグラムを描いてみて思ったけど、最高気温の分布をみるとやはりファットテールというか、裾が高い形をしている。確率紙にプロットしても、直線ではなく下に凸の曲線になっている。 pic.twitter.com/GkhZ7fYVfz
2015-08-11 19:36:49とりあえず今の段階では絵を描いただけですが、1875~1904年と1985~2014年の30年間、1985~1989年と2010~2014年の5年間の気温分布を比べてみると面白いかもしれませんね。また、猛暑日の発生確率とかも調べてみたら面白いかも。
2015-08-11 19:28:10@OBA1417861533 純粋に年ごとの(8月)猛暑日発生確率を「8月猛暑日日数÷31」で時系列グラフにしても良いでしょうし、もう一つは何らかの分布を仮定して累積分布関数から35℃超過確率とかパラメータの変動を見るのも面白いかなと思っています(確率紙プロットはそのため)
2015-08-11 19:41:53@kobiwa_net 8月の日最高気温の月平均値の経年変化を見てみると,直近5年間は過去最も高い時期になります.また直近30年間を見てみると,右肩上がりになっていますね. pic.twitter.com/ilkNmmdQqB
2015-08-11 20:47:30@kobiwa_net データ期間全体で140年間ある中で特定期間を取り出す前に,全期間の傾向をまずは見てみます.そのうえで,変動周期などを勘案しながら,日数を集計する年数を決めたりします.
2015-08-11 20:49:4510~20年の周期変動がある中で,直近の5年は周期変動のピークの時期かもしれません.その中で直近の5年間と過去の5年間の統計値を比較して「気温が高い」と言っても,それは正しい見方ではない,ということになります.
2015-08-11 20:52:37ちなみに,30年間の変化を見るのであれば,はじめ5年と終わり5年を取り出すのではなく,期間の前後半(15年ずつ)とか3分割(10年ずつ)としてグラフを描くのが良いと思います.期間真ん中のデータを使わない理由は?と突っ込まれます. twitter.com/kobiwa_net/sta…
2015-08-11 22:42:57@kobiwa_net 私が出した経年変化を見てもわかりますが,直近5年の気温が結構高いんですよね.それで,直近5年だけを取り出して比較すると,そのつもりはなくても「恣意的」と突っ込まれてしまいます.(テレビでは恣意的にやっているかもしれませんが)
2015-08-11 23:13:40真ん中の20年が抜けないように、前半15年と後半15年でヒストグラムも作ってみる。こうすると、そんなに極端では無くなりますね。(一枚目と二枚目でデータの期間が違うことに注意) pic.twitter.com/Hpztc2APOu
2015-08-11 23:23:20