年も明けて早々,みなさまいかがお過ごしでしょうか。私は,また風邪を引いてしまいました…みなさまもお気を付けくださいまし!
大晦日は料理したり買い物に行ったり忙しかったんですが,そんな中ちょっと時間が出来たので,統計に関するメモを書いてみます。
統計でよく使う平均や分散(あと標準偏差)までは比較的イメージしやすいんですが,それ以上になるとちょっとイメージしづらい気がします。そこで今回は,自分が納得するために,歪度や尖度といった統計量とはどんなものなのかのメモ。
データ数をとして,
で
番目のデータを表すとすると,まず平均は
分散は
です。平均は良いとして,分散は,各データの平均との差を2乗したものの総和をデータ数で割っています。まず,2乗することで各データと平均との距離(差)に付く符号(+−)が消えます。これにより分散とは,各データと平均の距離の大きさを表す指標,つまりデータがどの程度平均から離れて有るかどうか,データがどれ程ばらついているかを示すものです。標準偏差はで,これは平均からどれだけの距離の区間に全体の何%のデータが存在するかを示す指標であるのと同時に,これを用いて
とデータを変換すると,データの平均は(分子の計算で)0に,分散は(分母により)1になります。この形の方が扱いやすい場合があるため,この変換はよく使われます。
さて,これらより計算がちょっと複雑な尖度や歪度を説明する前に「モーメント」について軽く触れます。平均と分散は,それぞれ1次,2次のモーメントとも呼ばれます。
モーメントとは,高校の物理だと,テコの
とか,単位はニュートンメートル[N・m]とか,あるいは天秤を釣り合わせるためには
が両側で等しいとき,とか習いますよね。
同じように,天秤が数直線(棒)だとして,その棒上の各データの位置に(同じ重さの)重りを置いていったとします。
このとき,支点を平均の場所にすると,棒は水平になります。つまり,釣り合うと。また,支点を原点の場所にすると,この棒を回そうとする力は,平均の場所に全部の重りを集めた力と同じになります。
分散については,支点を平均の場所にしたときの,この棒の回しにくさ,あるいは回ってる時の止めにくさを表しています(慣性モーメント)。
統計などの数学で使われる「モーメント」とは,こうした力学の概念である「モーメント」を一般化したものだそうな。ともかく,力学での意味と似ているので「モーメント」と呼ぶと。
1次とか2次というのは,平均や分散を求める式に含まれる項の次数を指します。一般に,
のことを(平均まわりの)k次のモーメントと呼びます。なので何次まででも考えられますが,統計では3次と4次のモーメントがよく使われます。
この3次のモーメントを使った指標が歪度,4次のものを使った指標が尖度です。歪度は,
尖度は,
(は標準偏差)です。標準偏差のべき乗で割っているのは,分散を1にして分布同士を比較しやすくする(上で説明した,
に変換する標準化の)ため。
歪度は,分布がどれくらい左右対称になっているかを示すもので,これが0の時は左右対称,正の時は左側に偏っており,負の時は右側に偏ってることがわかります。
尖度は,分布がどれくらい平均の周りに集中しているかを示すもので,正規分布と同じ時3に,正規分布より尖っている時は3より大,正規分布よりなだらかな時は3より小になります。ただ,最初から3を引いておけば正負でわかりやすくなるので,そうする定義もあります。
なお直感的には,奇数次のモーメントを使う指標は,奇関数に関連して左右の偏りに関しており,偶数次のモーメントを使う指標は,偶関数に関連して分布のばらつきなどに関するみたい。
以上の平均,分散,歪度,尖度に加えて,中央値や最頻値,レンジ(最大値ー最小値)などが基礎統計量とか基本統計量とか呼ばれます。特に,モーメントに関する指標は,分布(全く異なるデータ)同士を比較するために使われるものです。ってね。
昨日まで,ちょっと用があって京都に行ってました。
でもせっかく京都に行ったのに,すぐに帰っちゃうのはもったい!というわけで,ちょbitだけ観光してきました。
それにしてもビックリしたのは,新幹線を降りた瞬間に直撃してきた寒さ!まさに底冷えってヤツっすね。なので,あんまり手広く回るのではなく,伏見稲荷をお参りしたら錦市場でおばんざいを買って帰るという短縮スケジュールに。
というわけで,伏見稲荷です!
んで,有名な千本鳥居。
んで,山を登って見下ろした京都市街(南部)の様子。
で,下ってから,参道で名物のうずらの串焼きを食べてきました。でもあそこはすずめの焼き鳥で有名だったハズ。なのに今はどの店でも売り切れになってました。輸入できないのかな。
注文してから10分ほどで出てきたのは,一口大に細切れにされたヤツと付け合わせのキャベツ。串焼きって言うから丸のまま出てくるのかと思いきや,ちょっと拍子抜け。でも食べたことが無かったので,おそるおそる口に入れてみると…意外にもチキンに似た味で普通に美味しい!ただ,(小)骨がちょっと固いので,噛み方には注意が要ります。骨の食感も美味しいんだけどね。
ひとしきり堪能した後,ぶらぶら参道の土産物屋を見つつ錦市場へ移動。ちなみに,土産で買ってきた狐のお面(手のひらの半分ほどのサイズ)が,今私の部屋の壁に掛かってますw
錦市場に行ってみると,年末の買い出しでごった返してました。注連飾りを売る出店があったり,棒鱈やおせちに使う食材が並んでたりと,季節感あふれる光景が。そんな中,さっき食べたうずらの照り焼きが並んでたので,思わず購入。今度は1羽まるごと焼いたまま。それがこんなん。
ちょっと皿の色とかぶってるんで見づらいかもしれませんが,ペタッと開いて焼いた物。持って帰って食べてみると,やっぱりバリバリしてて美味しい。
これからは,伏見稲荷に行ったら必ず食べてこよう!
今年に入ってからは,ちょいちょいご無沙汰しております。こぼるでございます。
ここ数週間で一気に冷え込んで参りましたが,みなさまにおかれましては如何お過ごしでしょうか。お風邪など召されません様,ご自愛ください!
…という毎度のご挨拶はさておき,先日ひさしぶりにスカイツリーを見てきました!もう来年開業ということもあり,周辺のビルも続々と建設が進められてます。
今回は,まず(恒例の)亀戸天神からスカイツリー,更に浅草の風景を撮ってきました。どこも年の瀬を感じさせる光景で,なかなかに感慨深いです。…ついこのまえ初日の出レポを書いた気がするのに(苦笑
さて,ではまず亀戸天神から!
そんなに違和感が無い気がするのは,もう見慣れてるからかな。
次に,天神さまのシンボル,U☆SHIさん
確か,さすると御利益があるんだっけ。
で,太鼓橋の上から撮ったスカイツリーと本殿。
とここで!過去の同じ場所から撮った写真を再度掲載!
う~ん,今回はちょっと手前から撮っちゃったから橋の欄干が被っちゃってるけど,まぁ大体こんな感じ。もう出来上がってるから,また今度ぴったり同じ構図になるよう撮りに行こうかな。
次は,スカイツリーの真下から!
こんなメッセージも,工事現場に掲げられてた。
前に流れる川の護岸整備も進んでる。
ちなみに,足下もまだ工事中で
こんな感じ。あと,よくある東武橋からのショットも
ね。以前はここにも一杯人が居たけど,今は川沿いの道に集まってるみたい。しかも,あの道にセブンイレブンが出来てた!意外と小回り利くんだなぁと感心w
開業したら,人が多く来ること間違いなし!ホントに楽しみ!
と,一通り写真を撮り終わって,押上から浅草線に乗ろうとして見上げたら
早くも竜が空を飛んでた。…いや鳥っぽいかな(苦笑
で,最後に浅草。仲見世から浅草寺を見て。
いつ行っても混んでるけど,やっぱ年の瀬はハンパじゃない。ホントはもっと広い範囲を撮ったんだけど,写り混んだ顔を修正するのが面倒だから切り抜いたもの。
で,う○こビルとスカイツリー。
すんごい光ってるw
最後の最後は,言問橋のたもとから。
この日は青空でよかった。
ふと思い立って,先日みなとみらいの夜景を撮りに行ってきました!
撮影ポイントは横浜マリンタワー。
根岸線の石川町駅から歩いて15分ほど。平日は人も少なくゆっくりと見るにはオススメのスポットです。
んで撮ったのがこんなん。
マリンタワーは中華街にも近いので,横浜の夜を満喫することができます。
これからの季節は空気が澄んでくるため,ぜひ足を運ばれてはいかがでしょうか!
台風も去ってようやく太陽が姿を見せ始めた今日この頃,急に気温が下がって参りましたが,みなさまにおかれましてはいかがお過ごしでしょうか。風邪などには十分にお気を付けくださいまし。
私はと言えば,相も変わらず行列の計算をいろいろ試してます。
…というわけで,GSL (GNU Scientific Library)を使ってみることに!あとGUIも欲しかったからQt(キュート)も!言語はC++です。
gccとかの一般的な環境であれば,普通にこれらをaptやportsとかでインストールして,エディタでコード書いてコンパイルすれば動くハズ。です。
でも今回は既にNetBeans(for mac)を使ってたので,これにC/C++用のプラグインを入れることに。これを入れると,特に指定しなくてもQtアプリ開発用の環境が整えられます。これを使ったQtアプリ開発のチュートリアルはこちらにあります。ここにある通りで動きました。
もちろん,GSLを使う場合はリンカーがlibgslを使う様に設定します。
んで使ってみて思ったけど,Qtすごい!あれはかなり使いやすい。C++だと一般にBoostとかのライブラリを使うことが多いかと思いますが,Qtに全部そうしたライブラリも付属してるのでお手軽です。
GSLも,扱いはかなり簡単。今回は行列と線形代数のライブラリを使いましたが,普通に領域を確保して計算させて解放するだけ。速度も…特にめちゃくちゃ遅いってこともありませんでした。
octaveと比較すると,C++で書いてるってこともあるので,csvファイルの読み込みが比較にならない程速いです。今回用いた行列計算はSVD(特異値分解)ですが,これも2000行x200列くらいだと5秒ほど(1世代前のMacBook Airで)。流石に数千行の正方行列とかをかけるとoctaveの1.5倍ほど時間がかかりましたが,もうちょっと工夫すればなんとかなりそうな気もします。ちなみに,計算時に消費したメモリはほぼ半分。
さらに,GSLにはup-to-dateな日本語版ドキュメントが翻訳されてますので,この点でも気楽に使うことができます。
もちろん,手軽に色んな計算を試したい!って場合にはoctaveやmatlabなどの行列計算ソフトを使うのが一番です。でもツールとして専用のソフトが作りたい!って場合にはこうしたライブラリを活用するのが手っ取り早いと思います。
オススメです!