1月は忙しくあまり勉強できなかったので2ヶ月まとめてのお届けです。
前回の記事はこちら。
- 1. アルゴリズム実技検定公式テキスト
- 2. A/Bテスト実践ガイド 真のデータドリブンへ至る信用できる実験とは
- 3.現場で使える!NumPyデータ処理入門 機械学習・データサイエンスで役立つ高速処理手法
- 4. データサイエンティスト入門 (日経文庫)
- 終わりに
1. アルゴリズム実技検定公式テキスト
2日かけて一通りやりました。めちゃくちゃ勉強になりました。Python本職じゃない人が書いているのでコンテストにありがちな呪文みたいな実装じゃなくてわかりやすいのがめちゃ良かったです。
他の本だと知らないアルゴリズムがC++ で実装されてたりしてやる気をなくすことが多かったのですが、Pythonネイティブで書かれているのでストレスフリーで読めてサクサク読み進めることができました。Pythonistaさんには非常におすすめです。来月はデータ構造の管理あたりを勉強したいと思っています。
この記事に抱負を書きましたが、AtCoderはこれから少しずつ頑張りたいと思っています。
2. A/Bテスト実践ガイド 真のデータドリブンへ至る信用できる実験とは
この本はオンラインでの対照実験についての本です。A/Bテストとは、Web広告などを最適化するための方策で、AパターンとBパターンを用意して、それぞれで実験を行い、どれくらいの効果があるかや、どちらが優れているかを評価する方法です。例えば、この記事を書いたあとで、twitterに記事を書いたことをお知らせするAパターンと、お知らせしないBパターンとで、どれくらい集客に差が生まれるかを知りたいときなどに利用することができます。
この本の良いところは陥りやすいピットフォールを列挙してくれるところです。人は失敗から学ぶことが多いとは言いますが、統計手法自体の失敗はなかなか気づくことができないので、A/Bテストにありがちな失敗をあげてくださるのは嬉しいです。また、巨大プラットフォームでのA/Bテストなんかは我々にはできない経験なので、そういうのも書いてくださるのは非常に嬉しいです。貴重な経験です。
余談ですが、この本の誤りを発見したので出版社のドワンゴさんに連絡したらちゃんと中身を検証して丁寧なメールを送ってくださいました。ドワンゴさんにはこれからも素晴らしい書籍を出してくださることを期待しています。
ところで、この本からも新しい学びがあって、先日それをPythonで実装したので今後また記事にしたいと思います。長編になりそうな割に労力だけがかかってかつ集客力のない記事が生まれそうです。やる気をください。
3.現場で使える!NumPyデータ処理入門 機械学習・データサイエンスで役立つ高速処理手法
AtCoderではPythonを使っていますがNumPyを使った実装をしたいなって思った時にネット記事より書籍の方が体系的に勉強できるので買いました。一応Numpy自体はE資格でディープラーニングの実装をするときに多用するのである程度知っていましたが競技プログラミング特有のテクニックや高速化の話は全く知らなかったので、とても勉強になっています。自分のレート帯のPythonistaさんではあまりNumPyを使ってる人は見ないですが、線形代数的手法や統計学的手法を必要とするテクニックや、並列操作、ブロードキャストが使えるのがお手軽で実装量を減らしつつ高速化できるのでおすすめです。NumPy。
4. データサイエンティスト入門 (日経文庫)
一般的なデータサイエンティストになる気はそんなにないのですが、自分のやっていることがどのような仕事に繋がるのか、またその分野ではどのようなことが前提知識となっているのかを知りたくて買いました。この本の中では統計検定がおすすめされてて笑いました。統計検定、役に立ちますよ。取りましょう(宣伝)。
終わりに
全体的に1月2月は競技プログラミングにシフトを置いた生活をしていました。長く楽しめる趣味として今後も続けていきたいのですが、なかなか勉強時間をまとまって取れない生活になってくると思うので少しずつ進めたいと思っています。
来月は少し統計寄りの記事を書けたらいいなと思っています。ちょっとずつ執筆中です。