Syleir’s note

2020.4.1より統計検定やE資格の勉強の進捗を報告しています。統計検定準1級、E資格、G検定取得しました!当ブログへのリンクはご自由にどうぞ。

MENU

2021年の買ってよかった本10冊を振り返る【データサイエンス・AI・DL】

はじめに

 

syleir.hatenablog.com

 

先月から、読書記録記事を書いています。年の瀬でせっかくなので12月に読んだ本よりも1年を振り返りながら今年勉強してよかった本をまとめていきたいと思います。BEST BUYは伝わるデザインの基本 増補改訂3版 よい資料を作るためのレイアウトのルール、これに尽きるんですけど、せっかく書いたので残りも読んでください。お願いします。

 

統計関連

1.日本統計学会公式認定 統計検定準1級対応 統計学実践ワークブック

この本は自分を統計沼に叩き落とした本です。近年、「データサイエンス」という言葉が一人歩きしています。データサイエンティスト、響きだけはかっこいいですけど、何を理解していたら名乗れるのかは正直定義が曖昧です。最近のtwitterを見ていると、データを使ってエクセルをいじっているだけでも、それはデータサイエンティストなんでしょうけど、データを使ってちゃんと科学したい人が最低限知っておいた方がいいことの体系が統計検定準1級であり、それを勉強するために学ぶべき本がこの本です。

古典的な統計学だけでなく、近年のトピック、例えばMCMCなどのベイズ関連や機械学習に関連するところまで触れられているので、体型的に近年のデータサイエンスの初歩を学びたいという方におすすめです。

 

syleir.hatenablog.com

 

2. エモリー大学クラインバウム教授の生存時間解析

ちょっと専門的なところに入っちゃうのであまり書かないですが、生存時間解析という分野は理解したかった分野で、この本で相当理解が深まったのでここに置いています。統計検定1級の医薬生物学対策で購入したんですが、普通に実務でも役に立ってますし、本当にわかりやすいので少しでも生存時間解析に興味がある方はこの本から入るのがおすすめです。生存時間解析については統計検定準1級でも躓きやすい人が多い分野だと思うのでいつかは初歩の解説ができたらと思っています。

3.時系列解析入門

正直くそむずいです。縄跳びで言うとはやぶさとびくらい難しいです。おすすめできるかと言われればNoですが、難しい本はしっかり取り組むことで自分の血肉となり生きてきます。自分が時系列解析に真面目に取り組むきっかけになった本なのでここに置いています。時系列解析という分野は自分が統計を勉強して一番やりたかった分野で、資格取得以上に勉強を深めたいと思っている分野です。もっと勉強を継続していきたいと思っています。これは余談ですが、資格取得を通じて自分の興味関心が芽生えるの、s世間では、あまり明文化されていないですが資格取得のメリットです。自分は資格取得ドリブンでの勉強もそんなに否定する気はありません。もっと言えば資格取得に伴う会社からの報奨金ドリブンでもいいと思っています。twitterでの褒められドリブンでもいいです。何かしらの勉強をするってそれだけで偉いですよね。

時系列に関しては解説記事を書いています。まだ未完ですが初学者にもわかりやすいようにめちゃくちゃ噛み砕いているので見てください。

 

syleir.hatenablog.com

ディープラーニング・E資格

4.ゼロから作るDeep LearningPythonで学ぶディープラーニングの理論と実装

通称ゼロつくです。この本はディープラーニングをずるしないで自分で作って理解しようという趣旨の本です。自分で手を動かすのでめちゃくちゃ理解が捗ります。時代はアクティブラーニングでディープラーニングを学ぶことです。本当にゼロからコードを書くので大変ですけどディープラーニングにおける主要な実装は一通り行うので力がつきます。Python力もつきます。

5.つくりながら学ぶ!PyTorchによる発展ディープラーニング

さて、E資格というのは自力でディープラーニングを作るという、マゾかアホしかやらんことをやらなくちゃいけない不毛な非常に勉強になる試験だったわけですが、実際のディープラーニングの実装においてはいちいちそんな実装をやっている暇はないし、大体自分で実装をするとバグり倒して終わります。

そういう時に役に立つのがフレームワークで、フレームワークというのは偉い人がディープラーニングのコードの骨組みを作ってあとは適当なパラメータを入れるだけというところまでお膳立てしてくれたものです。例えばPytorchやKeras、TensorFlowなどがあります。フレームワークがあるおかげで、ディープラーニングの難易度がラーメンを食べたいときに、小麦から小麦粉を作るところから始めるか、カップ麺にお湯を入れるだけかくらい違います。

この本はこのうちPyTorchについて何ができるよというのを学べます。E資格を取った後、kaggleでディープラーニング使ってみたいけどどうしよう、とか、実務に向けて何しようとかそういう人におすすめです。

実務では小麦粉を練るのがうまい人よりカップ麺にうまくお湯をこぼさずに入れられる方が必要とされます。ただ内部構造は知った上でそういう簡略化をしたほうがいいと思っているのでE資格の否定をするものではありません。あれはあれで素晴らしい資格です。

 

syleir.hatenablog.com

この辺のコンテストに出るとなった時に勉強しました。他にも趣味の開発でつかったりしています。

6.Magentaで開発 AI作曲

AI作曲が勉強できる本です。MagentaとはAI作曲ができるツールです。何ができるかはこの辺の記事を参考にしてください。

 

syleir.hatenablog.com

syleir.hatenablog.com

簡単なAIモデルからディープラーニングまで使って試せるので面白いです。これは完全に趣味の範囲ですが、音楽に興味があって、AIに興味があるみたいな人はやってみるといいと思います。自分は結構どハマりしています。

 

競技プログラミング

7.アルゴリズム実技検定 公式テキスト[エントリー~中級編]

AtCoderで遊ぶために買いました。AtCoderはプログラミングを通じて条件や制約をクリアする短めのコードを書くゲームでプログラミング初心者におすすめのゲームです。この本はAtCoderPythonでやる説明をしてくれている現状唯一の本です。競合おらんししゃあないかくらいの気持ちで買ったのですが普通に面白いしわかりやすかったです。ちょっとでも興味があればこの記事を読んで始めましょう。競技プログラミング人口を増やしたいです。わからないことがあればなんでも聞いてください。

 

syleir.hatenablog.com

 

その他

8. 確率思考の戦略論 USJでも実証された数学マーケティングの力

この本はまあよくある自己啓発本の一種です。意識高いサラリーマンがよく買ってます。まあまあ売れているみたいです。マーケティングのプロは本を売るのまでうまいんですかね。ところでこの本は使用されている数学、まあまあ難しいんです。ついに数学や統計のリテラシーが人口に膾炙してきたんだとしたら非常に喜ばしいことです。

本題に入ると、この本は数学や統計を具体的に戦略レベルまで落とし込んでどうモデリングしてどう活用していくかという考え方を学ぶ本です。その点ではよくある自己啓発本とは一線を画しています。正直ツッコミどころはたくさんある数学の記述とかもあるんですけど、それはさておき、どういう考え方を市場でしているか、どういう顧客の集め方をして学んでいくかをモデリングしながらどうなっていったかを学べる本です。結構座学ベースだと理論の理解を優先しようとして頭でっかちになっちゃうことが多いので、このような実体験ベースで学べるのは非常によかったですね。こういう本があったらもっと読みたいのでおすすめあったら教えてください。

9. Excel 最強の教科書[完全版] ーーすぐに使えて、一生役立つ「成果を生み出す」超エクセル仕事術

 

さて、みなさんはデータサイエンスにおいて役に立つスキルを知っていますか?まずはコミュニケーション能力、次にタイピング能力、最後にExcelをまともに使う力です。Pythonとか統計スキルとか、数学力とかは毛ほども役に立ちません。

Excelは我々の分野では軽視されがちですが、なぜか世間では使われていますし、エクセルを使う層の平均リテラシーレベルはそんなに高くないのでクソみたいな形式でデータを渡されたりします。SQLやPandasに渡して前処理とかRやSASで統計解析とかいう超高等テクニックを使う前にエクセルでちまちまセルの結合に対応をしなきゃいけないこともあるわけです。

この本は義務教育レベルのエクセルの知識を体系的に与えてくれる本です。正直言って統計処理を見据えるとやらない方がいいこととかを懇切丁寧に書いてくれていたりしますが、仕方ないです。式は全て展開しましょうって中学生の教科書に書いてあっても、かけ算には順序がありますって小学校の先生に教えられたりしても文句を言ってはいけないのと同じです。でも普通にExcelを使う方法はめちゃくちゃ丁寧に書かれています。1日あれば流し読みできてそこそこ使えるようになるのでおすすめです。

10. 伝わるデザインの基本 増補改訂3版 よい資料を作るためのレイアウトのルール

 

ダントツで2021年BEST BUYです。全人類買った方がいいです。これはマジです。今までデザインの勉強したことありますか?ないならいますぐ買った方がいいです。自分は美的センス壊滅人間なんですけど、この本がデザインのことを明確に言語化してくれているおかげで少しはまともな資料が作れるようになりました。パワーポイントを作るときに見出しと本文のフォントをちゃんと考えていますか?配色は理論があってその配色にしていますか?図を置くところはどこにするか理論がありますか?少しでも曖昧なところがあればすぐ買った方がいいです。

パワーポイントを作ったり、資料をワードで作ったり、写真の配置を考えたり、Officeを仕事で触れる機会がある人は全人類Must Buyです。学生からサラリーマンまでおすすめです。

え?そんなに勉強したのに、このブログのデザインがカスなのはなんでですかって?それはCSSの知識が足りないからです。ごめんなさい。2022年の目標にしたいと思います。

 

終わりに

これにて本記事、ひいては2021年の投稿は終わりです。2021年は31記事書いたみたいです。思ってた5倍くらい偉いです。でも最近書いた記事をGoogleくんが世に公開するのを拒否してくるので悲しいです。悪いことは書いていないと思うんですが。twitterからの流入が救いになっています。いいねとかコメントとかRTとか嬉しいです。

2022年もがんばります。少しでも役に立てていたらいいなと思って執筆を続けていますがあと2ヶ月くらいは投稿ペースが落ちそうです。気長にお待ちください。