データ サイエンティストとデータ エンジニア: これらの役割に対する需要はどのように変化しているか

  • Sep 03, 2023

企業は自社が求めるデータに精通した人材を探し続けていますが、一部のマネージャーが間違った場所を探している可能性があることを示す証拠があります。

調査によると、多くの企業が 必要な人材が見つからない、膨大な量のデータを利用可能な情報に変換することに苦戦しているためです。

一般的にこれは意味します データサイエンティストの捜索、この特定の役職を満たすことができる新入社員の需要が急増しています。 しかし、データサイエンティストを自称する人材をより多く雇用することは問題を解決する方法の 1 つですが、企業は また、これらのとらえどころのない人材を数名雇用する競争に参加することを意味しない代替案も考え出している。 個人。

特殊機能

新しい仕事のルール

オフィスでは、ハイブリッドであろうとリモートであろうと、どこで、いつ、どのように仕事をするかが変わります。

今すぐ読む

テクノロジーアナリスト フォレスター社は5年前に警告した 企業がデータサイエンス人材の獲得に多大なリソースを投入するのに忙しい一方で、リスクもあったということ 彼らは、科学者が価値を創造するのに役立つエンジニアリング能力に投資することを忘れていたのです。 データ。 現在、一部の企業はその不均衡に対処し始めているようだ。

見る: ソフトウェアのスキルがあれば大きな成果を上げることができますが、テクノロジー業界で成功するためにプログラマーである必要はありません

ライフサイエンス大手ノバルティス社のデジタル プラットフォームおよび製品デリバリーのグローバル責任者であるロイク ジロー氏は、少し前までは人材の争奪戦が大きな問題であったことを認識しています。 しかし今日では、それはそれほど心配ではありません。

「誇大広告があると思います」と彼は言う。 「2 年前、データサイエンティストを確保するのは非常に困難でした。」

ノバルティスには約2,000人のデータサイエンティストがおり、ジロー氏は人材獲得の戦いは現在、罠など他の分野に焦点を当てていると語る データ エンジニアリングの才能とビジネス アナリストの能力を磨くこと、そして他の企業も同様の結論に達することを彼は期待しています。 あまりにも。

「データサイエンティストの需要が増えるとは思えません。 もっと使いやすく、ビジネスアナリストが科学を行うのに便利なテクノロジーがさらに見つかると思います」と彼は言います。

「実際、私たちの組織でも、データサイエンティストをさらに増員しようとは考えていません。 私たちは、より多くの人が使用できるソフトウェア ソリューションを構築し、ビジネス アナリストとともにデータ サイエンスを民主化しようと努めています。」 

ノバルティスは、組織内のビジネス アナリストが保有するデータを最大限に活用できるようにするために必要なフルスタック エンジニアリング機能を見つけることに重点を置いています。

データ サイエンティストがスキルを使用してモデルを作成し、問題を解決するのに対し、データ エンジニアはデータ ソースとデータ分析の間にあるインフラストラクチャを構築および管理します。 どちらも重要ですが、データ エンジニアリングが犠牲になってデータ サイエンスに重点が置かれすぎていることを示す証拠が増えています。

別の業界評論家は「軌道修正」が起きていると示唆した。 データサイエンティスト マルフ・ホサインはブログ投稿に書いた 昨年、多くの組織がデータ サイエンティストを雇用し、データ エンジニアに一般的に関連する仕事を彼らに提供しました。

同氏は、多くのデータサイエンティストが、分析を実行するための強力な技術的基盤を備えていない企業に入社するために、このような不整合が生じるのではないかと示唆しています。

その後、それらの基盤の構築を支援するのがデータ サイエンティストの役割となります。 そのため、コーディングやアルゴリズムの作成を行うべきときに、科学者の中には、自分の既存の能力にぴったりとは当てはまらない技術的な役割を果たしてしまう人もいます。

最終的に果たす役割に関係なく、企業が依然としてデータ サイエンスの人材を探していることは何の価値もありません。CodinGame と CoderPad の 最近の技術者採用調査 データサイエンスは、需要が供給を大幅に上回る職業であると特定しました。

もちろん、それらの企業が本格的なデータ サイエンティストを必要とするか、それともデータ サイエンティストに近い人材を必要とするかは関係ありません。 フルスタックエンジニアという仕事は、多くの候補者が働き始めて初めて知るものかもしれません。 役割。

特殊機能

技術スキル: 仕事をアップグレードする

新しい仕事の世界には、新しいスキルセットが必要です。 前進するために知っておくべきことは次のとおりです。

今すぐ読む

そのために、ジローとノバルティス社の同僚がすでに取り組んできた取り組みは、いくつかの成果をもたらしています。 データサイエンティストを雇用しようとしているマネージャーや、データサイエンティストを担当しようとしている専門家にとって重要な指針 役割。

見る: 昇進する方法: はしごを登り、キャリアを成功させる 5 つの方法

データサイエンティストのスキルギャップを確実に埋めるための同社のアプローチは、過去数年間で確実に埋められてきました。 長年にわたる発見の旅は、現在エンジニアリングとビジネスに新たな焦点を当てています。 分析。

同社はクラウドベースのアプローチを採用し、 2017年にSnowflakeを採用 包括的な取り組みの一環として – フォーミュラワンとして知られる – 業務のあらゆる側面をデジタル化すること。

このアプローチの一環として、組織内の意思決定プロセスを改善するためのテクノロジーとデータの使用を促進するための新しいチーフデータオフィスの創設が含まれていました。

「CDO オフィスを設立したとき、業界全体から人材を採用しました。 私たちはデータ サイエンス アカデミーを設立し、多くの人を採用し始めました。 私たちの組織には統計学者がたくさんいましたが、彼らもデータサイエンティストに転向しました」とジロー氏は言います。

彼の組織がすぐに学んだ重要なことの 1 つは、優れたデータがなければデータ サイエンスは役に立たないということです。

最初の 1 年半、ノバルティスのデータ サイエンティストは、アルゴリズムの作成ではなく、データの特定とキュレーションに時間の 60% ~ 70% を費やしました。

このとき、同社は、必要な人材と、データ エンジニアが果たす重要な役割について、より慎重に検討し始めました。

「最終的には、データ エンジニアとして、データ セットを統合するのが得意な人を求めています。フルスタック エンジニアは、スタック全体を統合された方法で機能させます。」と彼は言います。

現在、同社の 2,000 人のデータ サイエンティストは、Snowflake、Databricks、Data IQ、Sage Maker などの企業のツールを使用して、ビジネスの課題に対する賢明な答えを見つけています。

これらの科学者たちは、データを活用して人生を変える医薬品をこれまでよりも早く市場に出すことに取り組んでいるチームの一員です。

見る: 「以前はパブを経営していましたが、今はテクノロジー業界で働いています。」 転職者が IT 業界に転職した理由について語る

初期研究から製造、治験、流通に至るまで、新薬が市場に投入されるまでには伝統的に 12 年もかかります。 データと人工知能をこれらのプロセスに適用することで、時間を 9 年に短縮できるとノバルティスは考えています。

ジロー氏は、同社がデータサイエンスをしっかりと管理していることが、年間500件の治験のうちどれを進めて、市場に投入できる医薬品として開発すべきかを決定するのに役立っていると語る。 そして、同社のデータ エンジニアリング プラットフォームが磨き続けられるにつれて、ビジネス全体の専門家が自らが生み出す洞察に対してさらに責任を負うことになると、ジロー氏は期待しています。

6 ~ 7 年前、彼のチームはノバルティスで使用されるすべてのダッシュボードを作成していました。 現在、企業全体で約 3,000 人が独自のダッシュボードを作成しています。

したがって、データ サイエンスは民主化されつつあり、ジロー氏は、才能あるデータ サイエンティストとエンジニアが最大限の違いを生む高レベルの活動に集中できるようにしたいと考えています。

「私のチームにはダッシュボードを作成してほしくないのです。ダッシュボードには価値がないからです」と彼は言います。 「ビジネス アナリストとビジネス ユーザーがセルフサービスできるプラットフォームを手に入れたいと考えています。」

ビッグデータ

データ侵害に関与しているかどうかを確認する方法 (および次に何をすべきか)
AI における偏見との戦いはデータから始まります
公平な予想? 180 人の気象学者が「十分な」気象データを提供している方法
がん治療は、目もくらむような量のデータに依存しています。 クラウド内での分類方法は次のとおりです
  • データ侵害に関与しているかどうかを確認する方法 (および次に何をすべきか)
  • AI における偏見との戦いはデータから始まります
  • 公平な予想? 180 人の気象学者が「十分な」気象データを提供している方法
  • がん治療は、目もくらむような量のデータに依存しています。 クラウド内での分類方法は次のとおりです