翔泳社の機械学習シリーズのひとつで2018年4月に出版された馬場真哉さんの
「Pythonで学ぶあたらしい統計学の教科書」
統計学の基本から応用までしっかり解説されています。
またPythonも初歩的な使い方から説明があります。
ですのでPythonを使ったことない人でも十分勉強できます!
率直な感想は「初学者の定番の教科書になる!」です。
「機械学習 x Python」は最近よく見るけど「統計学 x Python」はほとんどなかったですしね!
具体的な特徴をまとめてみました。
ご本人の解説はこちら
https://logics-of-blue.com/python-stats-book-support/
内容が豊富!統計モデルから機械学習まで
まず目次を見ていただきたいのですが、
第1部では統計学の基本を解説しています。
第2部でPythonの基本やJupyter Notebookの使い方を説明します。
第3部でPythonを用いた統計分析の方法を学びます。
第4部からは統計モデルについて学んでいきます。
第5部では正規線形モデルを解説します。
第6部それを発展させた一般化線形モデルについて解説します。
第7部は、統計学から機械学習へのつながりを学びます。
めっちゃ充実しています!!!
基本的な内容を学んだ後、
第3部の統計の推定や検定にとどまらず、
第4部、第5部、第6部では統計モデルを扱っております。
さらに、第7部では機械学習について扱っています。
統計モデルまでPythonのコード付きで説明されてるのは
ほんとうにうれしいです!!!
さらに、統計のことをしっかり学習した後、
「じゃあ機械学習とは何が一緒で何が違うの?」ということが
説明されているのですごくいいですね!
統計とか機械学習とか流行ってるから
なんとなく言葉は知っているっていう人も多いと思うんです。
でも違いがいまいちわからないって人も、
回帰モデルやニューラルネットを実装して比較しているので
その辺りも参考になると思います!
さらに詳細な目次はこちら↓
https://www.shoeisha.co.jp/book/detail/9784798155067
理想の学習チャート!「解説→数式→Pythonで実装」
本書の流れは基本的に
語句の解説、数式の解説、Python実装の解説
のトリプルパンチが強烈に効いています。
語句だけの解説じゃわかりにくいところも
数式があるからしっかりと理解できるし、
コードで書いていくから習熟度が上がります。
本書ではこの理想の流れ作りに成功しています!
さらに「用語」や「実装」、「補足」と
一番小さい目次単位で分類されており、
勉強のしやすさが追求されています。
PythonではScipyやSeabornが登場!
Pythonでは基本的にはJupyter Notebookにノートを書いていきます!
あとはPandas、Numpyを基本的には使っています。
そして統計はScipyを使って進めていきます。
日本語でScipyをこれだけちゃんと説明している本は
この本以外にはないと思います!
それだけでもこの本の価値がいかに高いかがわかりますね。
統計モデリングのところでは
statsmodelを使うのですがこちらも
日本語でまとまった解説があまりない気がするので
重宝すると思います。
機械学習ではScikit-learnを用いています。
本書での機械学習は、統計学との比較で出てくるだけなので、
機械学習をがっつり学びたい人は少し物足りないかもです。
この本をやった後に別の機械学習の本をやることで
統計との違いがわかり理解度がかなり増すと思いますよ!!!
そして、グラフの描画には
「Matplotlib」と「Seaborn」を使います!
Matplotlibを使ったことをある人は多いと思いますが、
Seabornを使ったことがある人は少ないのではないでしょうか?
SeabornはMatplotlibの拡張版みたいな感じで簡単に綺麗なグラフを描画できます!
第3部の第3章がまるまるグラフ描画のことについて書かれていて
統計でよく使う描画についても一通り学べるのでとてもいいですね!!
まとめ
統計をこれから学ぶ人や簡単な入門書はしたけど…って方には
とても役立つのではないでしょうか!!!
ほんとに基本的なところも説明されているので、
はじめて統計やPythonに挑戦する人にも最適です!
ありそうでなかった「統計学 x Python」の本格的な教科書!
初学者にとってはこの内容でこの完成度はかなりありがたいですね!!!
また翔泳社の人工知能関連シリーズ
「現場で使える! TensorFlow開発入門 Kerasによる深層学習モデル構築手法」
こちらもすごくわかりやすいのでオススメです!!!
www.inoichan.com