データサイエンティストに俺はなる!
目標にしているプログラムを作るために、Pythonを使ったらできるっぽいんだけど、何をどうすればいいかわかんない…
ということで、『スッキリわかるPythonによる機械学習入門』をちまちまやっております。
今年2022年度の研究テーマは「データサイエンス」にしよう! と意気込んだ2月。研究テーマとカッコつけたものの、実際は「データサイエンスの本を多めに読もう!」くらいの軽いやつです。
そんな中、『スッキリわかるPythonによる機械学習入門』に
「データサイエンティストに必要な技術」
というコラムが。
一般社団法人のデータサイエンティスト協会が定義してる、3つがあるらしい。
「なるほど!これに沿って学んでいけばいいのね!」ということで、ちょっとまとめてみよう。
データサイエンティストに必要な技術
- データサイエンス力
- データエンジニアリング力
- ビジネス力
データサイエンス力
情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力
「情報処理」については、まず「基本情報技術者」試験にて勉強中。
ただ最大の関門は「統計学」。
ざっと見ると高校数学のシグマとか、微分とか出てきた。文系で数学を大学受験に使ってこなかった僕としては、1から勉強する必要があるっぽい。(まず「高校数学のシグマ」とか言ってる時点で、なんか間違ってる気がする…)
あとは線形代数とか偏微分とか。これらは大学数学基礎レベルらしい。
まず必要なシグマ、微分、線形代数、偏微分とかを勉強しよう。
データエンジニアリング力
データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力
「機械学習はデータの前処理が重要」的なことが書いてあったので、この辺を使えるようにする的な感じ?
実装・運用できる力は、これから機械学習のテキストで学んでいこう。
ビジネス力
課題背景を理解した上で、ビジネス課題を整理し、解決する力
『スッキリわかるPythonによる機械学習入門』の序盤にも書いてあったけど、
「とりあえずデータあるし機械学習でなんかAI作るぜうえーい!」的なのは意味ないらしい。
そのAIを作ることで、ビジネスの目標を達成できるか? とか、ただAIを作るだけではダメなので、
会社ならその会社の改善したい課題とか、どうしたら売り上げを伸ばせるか? とかを考えていく必要があるってことみたいですね。
今日のまとめ
まず、どんな知識が必要なのか? どこに向かっていけばいいか? ということがわかったので、かなり収穫があった感じです。
この定義を忘れず、知識をつけていきたいです。
コメント