グラフの作り方講座にげんめっ!(引き続き東京は暑くなっているのか問題を例に)

グラフの作り方講座(http://togetter.com/li/859206)の続きです。前回は自分用に作ったあまりにも言葉足らずなまとめをあまりにも多くの方にご覧いただいたためにちょっとした誤解もありまして、そのへんを補うものとして作りました。前回よりは講座っぽくなったような気がします。
80
本間基寛 @motohirohonma

@kobiwa_net 5年分ではなく,少なくとも平年値を算出する30年分で集計するとよいですよ.

2015-08-11 13:31:00
こびわ⚒ @kobiwa_net

@motohirohonma ご指摘ありがとうございます。30年というのも考えましたが、対象期間が長いと最近の特徴がボケるかと思い、とりあえず何となくで5年にしました。(後程、時間を見つけて検討したいと思っています)

2015-08-11 13:38:35
こびわ⚒ @kobiwa_net

@motohirohonma (ボケるというよりも、30年間での変動を懸念したという感じです)

2015-08-11 13:42:26
本間基寛 @motohirohonma

@kobiwa_net 期間統計をとるときは,少なくとも変動周期と同程度の期間をとることが望ましいですね.(お昼休みにさらっとやられたものなので,突っ込むべきものでもないのですが)

2015-08-11 13:48:05
こびわ⚒ @kobiwa_net

@motohirohonma どの周期の変動(例えば温暖化か都市化:ヒートアイランド、今回はどちらかと言うと後者に注目)に注目するかで対象とする期間も変わってきますね。あと、8月だけを対象にしていいのかも少し考えましたが、他に良い案が無かったので8月のみを対象にしました。

2015-08-11 13:55:10
しおん @shearline

@kobiwa_net 何を見たいかにもよりますが、最近の特徴というよりENSOの特徴をとらえていないか気になります(より長いスケールではPDOとの関連も気になりますね)。

2015-08-11 13:57:20
こびわ⚒ @kobiwa_net

@shearline (こういうのって、最初に何を見たいのかはっきりさせておかないと、卵を見たかったのか鶏を見たかったのか、考えているうちにわけがわからなくなりそうですねw)

2015-08-11 14:03:05
しおん @shearline

@kobiwa_net 気候システムはとても複雑で、解析結果が得られても自分がいったい何を「見ている」のか悩んでしまうことが多々あります。(その悩みを解決するのが研究なのかもですが)

2015-08-11 14:16:07

前まとめ「グラフはいくらでも恣意的に操作できるから気を付けろ」みたいなコメントをたくさんいただいたのですが、意図的な操作以前に自分で自分を騙してしまうというか、自分の見ているものがどこから来ている差なのか(あるいは、差のなさなのか)、よくわからないまま適切でないグラフで適切でない解釈をしてしまいかねないのがグラフの厄介なところだったりします。

「何も考えずにとりあえず数字を並べてみて、何が見えるか考えよう」というのは一見偏りのないやり方に見えて、実は作り手のコントロールできないバイアスが入り込みがちなので、なんというか一番ダメなパターンですね(´・ω・`)

8月の最高気温に絞ってもっとグラフを描いてみた

こびわ⚒ @kobiwa_net

昼に投げた東京8月の最高気温のヒストグラム。5年ではなく30年(平年値の期間)くらいとった方が良いとのご意見を頂いた事もあって30年でヒストグラムを描いてみた。やはり、ヒストグラムが全体的に右へシフトしているし、猛暑日も増えている。 pic.twitter.com/0ifTlge7RJ

2015-08-11 19:17:39
拡大
こびわ⚒ @kobiwa_net

さて、なんで昼に5年間でヒストグラムを描いたかと言うと、30年もあれば最高気温の分布が変わるのではないかと思ったため。ということで、1985~2014年のうち始めと終わりの5年のヒストグラムも描いてみた。 pic.twitter.com/weMIovmFDy

2015-08-11 19:26:11
拡大
こびわ⚒ @kobiwa_net

30年でヒストグラムを描いてみて思ったけど、最高気温の分布をみるとやはりファットテールというか、裾が高い形をしている。確率紙にプロットしても、直線ではなく下に凸の曲線になっている。 pic.twitter.com/GkhZ7fYVfz

2015-08-11 19:36:49
拡大
拡大
こびわ⚒ @kobiwa_net

とりあえず今の段階では絵を描いただけですが、1875~1904年と1985~2014年の30年間、1985~1989年と2010~2014年の5年間の気温分布を比べてみると面白いかもしれませんね。また、猛暑日の発生確率とかも調べてみたら面白いかも。

2015-08-11 19:28:10
こびわ⚒ @kobiwa_net

@OBA1417861533 純粋に年ごとの(8月)猛暑日発生確率を「8月猛暑日日数÷31」で時系列グラフにしても良いでしょうし、もう一つは何らかの分布を仮定して累積分布関数から35℃超過確率とかパラメータの変動を見るのも面白いかなと思っています(確率紙プロットはそのため)

2015-08-11 19:41:53
本間基寛 @motohirohonma

@kobiwa_net 8月の日最高気温の月平均値の経年変化を見てみると,直近5年間は過去最も高い時期になります.また直近30年間を見てみると,右肩上がりになっていますね. pic.twitter.com/ilkNmmdQqB

2015-08-11 20:47:30
拡大
本間基寛 @motohirohonma

@kobiwa_net データ期間全体で140年間ある中で特定期間を取り出す前に,全期間の傾向をまずは見てみます.そのうえで,変動周期などを勘案しながら,日数を集計する年数を決めたりします.

2015-08-11 20:49:45
本間基寛 @motohirohonma

10~20年の周期変動がある中で,直近の5年は周期変動のピークの時期かもしれません.その中で直近の5年間と過去の5年間の統計値を比較して「気温が高い」と言っても,それは正しい見方ではない,ということになります.

2015-08-11 20:52:37
本間基寛 @motohirohonma

ちなみに,30年間の変化を見るのであれば,はじめ5年と終わり5年を取り出すのではなく,期間の前後半(15年ずつ)とか3分割(10年ずつ)としてグラフを描くのが良いと思います.期間真ん中のデータを使わない理由は?と突っ込まれます. twitter.com/kobiwa_net/sta…

2015-08-11 22:42:57
こびわ⚒ @kobiwa_net

@motohirohonma ありがとうございます。覚えておきます(´・ω・`)φ

2015-08-11 23:07:37
本間基寛 @motohirohonma

@kobiwa_net 私が出した経年変化を見てもわかりますが,直近5年の気温が結構高いんですよね.それで,直近5年だけを取り出して比較すると,そのつもりはなくても「恣意的」と突っ込まれてしまいます.(テレビでは恣意的にやっているかもしれませんが)

2015-08-11 23:13:40
こびわ⚒ @kobiwa_net

真ん中の20年が抜けないように、前半15年と後半15年でヒストグラムも作ってみる。こうすると、そんなに極端では無くなりますね。(一枚目と二枚目でデータの期間が違うことに注意) pic.twitter.com/Hpztc2APOu

2015-08-11 23:23:20
拡大
拡大
こびわ⚒ @kobiwa_net

(極端ではないとは言いましたが、猛暑日が増えているのはクッキリ出てますね)

2015-08-11 23:29:06
こびわ⚒ @kobiwa_net

あと、ヒストグラムで見ると、平均(母集団全体)が1℃上がる(右側に移動する)だけで、猛暑日が増えるのもわかりますねー

2015-08-11 23:33:47