カテゴリー別アーカイブ: 統計学

統計検定2級 合格の軌跡

未踏2次審査の結果が出るまで時間があって、その間、ずっと統計学やってました。

大学院生で落ちたら恥ずかしいレベルですが、勉強しなかったら落ちてたと思います。モチベーション保つには良い検定試験でした。

読んでルーズリーフにまとめた本は以下の通り。

マンガでわかる統計学
マンガでわかる統計学

マンガでわかる統計学 回帰分析編
マンガでわかる統計学 回帰分析編

統計学入門 (基礎統計学)
統計学入門 (基礎統計学)

自分みたいにまともに統計学やったことがなければ、マンガでわかるシリーズで全体像を見て、赤本(統計学入門)をやるのがお勧めです。

あとは、以下の統計学会公式認定本をやれば合格できるかと思います。

公式認定の教科書は評判が悪いけど、どんな問題が出てどんな問題が出ないか確認するためにも必要でした。

日本統計学会公式認定 統計検定2級対応  統計学基礎
日本統計学会公式認定 統計検定2級対応  統計学基礎

日本統計学会公式認定 統計検定 2級 公式問題集[2011〜2013年]
日本統計学会公式認定 統計検定 2級 公式問題集[2011〜2013年]

自分は推定と検定の問題の解き方のパターンがいまいち分からなかったので、さらに以下の本をやりました。
統計検定には出ない問題も一部含まれているけど、解法パターンがよくまとまっていて良書でした。

統計学演習
統計学演習

まともな統計学の講義を受けたことがある人は、東京大学出版会の赤本を教科書にして「統計学演習」で解き方を思い出して公式の過去問集やれば、手っ取り早く合格できるように感じました。

統計検定2級合格

次は心理学検定でさらに統計学やる予定です。

情報セキュリティスペシャリスト試験と統計検定2級試験

情報セキュリティスペシャリスト試験は、

  • 午前I:免除
  • 午前II:80点
  • 午後I:80点
  • 午後II:56点

で不合格でした。

これは合格したな!と思って、秋期の情報処理技術者試験はお休みかネットワークスペシャリスト試験かで悩んでいたぐらいだったので驚きました。未だにどこでそんな点数を引かれたのか不明です。抗議しても覆らないでしょうから、納得いかんけど再度受験してみます。

統計検定は絶対取らねばならない2問を落として、合格でも割りとギリギリかもしれないという手応えでした。時間なくて焦りまくってケアレスミスが頻発してしまいました。おとなしく結果を待とう。

休学残り3ヶ月は未踏1次審査は通ったアイディアで全力全壊で開発していきます。

Perl Data Language 統計編 #11 「対数近似曲線を引く」

変数の個数xと計算時間yとの間に「y = b + a log_10 x」の関係があるときに、5個のデータで対数近似曲線を引く問題です。

「X = log_10 x」、「Y = y」とおいて「Y = b + aX」の形にすると解けます。

図は

  • 青の点:データの散布
  • 赤の折れ線:対数近似した折れ線
  • 緑の曲線:対数近似した曲線

を表しています。

対数近似曲線

Perl Data Language 統計編 #10 「決定係数、残差プロット、自由度調整済み決定係数、標準誤差、P値」

データは#09と同じく最高気温とアイスティーの注文数のデータです。

Perlで書くとこんな感じっした。

出力↓

残差プロット

散布図と回帰直線は前回と同様です。
回帰直線

Perl Data Language 統計編 #09 「回帰直線を引く」

統計検定から少し寄り道して、「マンガでわかる統計学[回帰分析編]」の回帰直線を引くコードを書いていました。

最高気温とアイスティーの注文数のデータに対する回帰直線です。

一方向性の因果関係を想定する場合、散布図は、X軸に原因系の変数をとってY軸に結果系の変数をとったものにするようです。

回帰直線

追記:
olsメソッドの戻り値のy_predに予測値が入っているので、それを使うほうが効率いいですね。戻り値はPerlのコンテキストに応じて変わります。

出力される図は全く同一です。