「データサイエンティスト」に必要な技術とは?【新米エンジニア日記】

データサイエンティストに俺はなる!

目標にしているプログラムを作るために、Pythonを使ったらできるっぽいんだけど、何をどうすればいいかわかんない…

ということで、『スッキリわかるPythonによる機械学習入門』をちまちまやっております。

今年2022年度の研究テーマは「データサイエンス」にしよう! と意気込んだ2月。研究テーマとカッコつけたものの、実際は「データサイエンスの本を多めに読もう!」くらいの軽いやつです。


そんな中、『スッキリわかるPythonによる機械学習入門』に

「データサイエンティストに必要な技術」

というコラムが。


一般社団法人のデータサイエンティスト協会が定義してる、3つがあるらしい。

「なるほど!これに沿って学んでいけばいいのね!」ということで、ちょっとまとめてみよう。

データサイエンティストに必要な技術

  • データサイエンス力
  • データエンジニアリング力
  • ビジネス力
データサイエンス力

情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力

「情報処理」については、まず「基本情報技術者」試験にて勉強中。


ただ最大の関門は「統計学」。

ざっと見ると高校数学のシグマとか、微分とか出てきた。文系で数学を大学受験に使ってこなかった僕としては、1から勉強する必要があるっぽい。(まず「高校数学のシグマ」とか言ってる時点で、なんか間違ってる気がする…)


あとは線形代数とか偏微分とか。これらは大学数学基礎レベルらしい。

まず必要なシグマ、微分、線形代数、偏微分とかを勉強しよう。

データエンジニアリング力

データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力

「機械学習はデータの前処理が重要」的なことが書いてあったので、この辺を使えるようにする的な感じ?

実装・運用できる力は、これから機械学習のテキストで学んでいこう。

ビジネス力

課題背景を理解した上で、ビジネス課題を整理し、解決する力

『スッキリわかるPythonによる機械学習入門』の序盤にも書いてあったけど、

「とりあえずデータあるし機械学習でなんかAI作るぜうえーい!」的なのは意味ないらしい。

そのAIを作ることで、ビジネスの目標を達成できるか? とか、ただAIを作るだけではダメなので、

会社ならその会社の改善したい課題とか、どうしたら売り上げを伸ばせるか? とかを考えていく必要があるってことみたいですね。

今日のまとめ

まず、どんな知識が必要なのか? どこに向かっていけばいいか? ということがわかったので、かなり収穫があった感じです。

この定義を忘れず、知識をつけていきたいです。

コメント

タイトルとURLをコピーしました