ブログBLOG

  1. HOME
  2. ブログ
  3. 【豆知識】ITエンジニア用語
  4. 【豆知識】データサイエンティスト・データサイエンスとは何か

【豆知識】データサイエンティスト・データサイエンスとは何か

データサイエンスが活用される業界は幅広く、あらゆる業種や職種の方に重要な素養になりつつあります。アナログからデジタルへ移行した近現代のように、ITとは縁がないように思える業種の方もデータを活用する世界が近づいています。
昨今、職業の需要が高まるデータサイエンティストとは、そしてデータサイエンスとはそもそも一体何かを解説します

  • データサイエンティスト・データサイエンスとは何か

 

まずデータサイエンスとは、アルゴリズムや統計など情報科学理論を活用してデータを分析、有益な知見を見いだすことを指します。そしてデータサイエンティストとは、データサイエンティスト協会によると「データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル」と定義されています。 一般の方には聞き慣れない言葉が並びますが、実はデータサイエンスは私たちの生活にすでに深く根づいています。

代表的な例は、ネット通販で現れるレコメンド機能です。膨大な消費者全体の情報から「商品Aを買った人は商品Bを買いやすい」といった仮想の私たちの行動が、データの中から具現化されるイメージになります。他にも自動運転のセンシングやスポーツのリアルタイムでの映像解析など、データサイエンスが持つ力を利用拡大して現在の私たちの生活は成り立っています。

  • 誕生の背景

 

データサイエンスという言葉が一般に注目されたのは2010年代以降ですが、その発端は50年以上前です。統計解析を業務に活かす方は一定数存在し、リサーチャーと呼ばれてきました。
特に2000年代以降のデータ活用の手法は大きく発展し、現在では多くの分野で人財不足が懸念されています。誕生の背景を振り返ると、2000年代以降だけでも以下が挙げられます。

  • Windows、SaaSSoftware-as-a-Service)が普及して個人のパソコン所有が一般的に。生活にインターネットが浸透し、行き交うデータ量が増加。
  • 2002年データベースの管理に関する論文を掲載する「データサイエンスジャーナル」が創刊される。
  • 2006年オートエンコーダを利用したディープラーニングにより人工知能が飛躍的進化。
  • 2008年Googleなどで「データサイエンティスト」を自称する人々が現れ、そのスキルや仕事内容が議論される。
  • 2010年インターネット上のデータ転送量が大幅に増加したことから「ビッグデータ」という用語が提唱される。
  • 2012年画像認識の精度を競う大会でディープラーニングを採用したチームが目覚ましい成果をあげて優勝。GoogleYouTube画像からの猫の認識に成功した事を発表するなど、現在まで続く第三次人工知能ブームに発展。

他にも2004年にFacebook2005年にYouTube2006年にTwitterがサービス開始、2007年にはiPhoneが発売され、現在の生活に必要不可欠なものの誕生と同時にデータ量が増大しました。
扱うデータ量が急激に増加する中で、データ活用の技術が素晴らしい成果をあげているという事実が、ニーズの多様化などにより焦点がぼやけることが多くなったビジネス課題に直結する提案が欲しいという市場のニーズにつながりました。そこから生み出された概念であり職業が、データサイエンティストであるといえます。

  • データサイエンティストの需要

 

AI (Artificial Intelligence:人工知能)が特定の領域において人間を超え始めていて、さらにその先にはAI時代の到来が予想されています。根幹技術であるディープラーニングだけでなく、それを扱うデータサイエンティストに対する注目はさらに高まっています。
2012
年以降はデータサイエンス学部を設立する大学が日本でも現れ、修士・博士号が取得できる大学院も増加しており、データサイエンスを学ぶ重要性や人財の価値が認められていることが分かります。これらの背景からデータサイエンティストは今後大きな需要が見込まれているといえるでしょう。

一方で、将来AIに取って代わられる可能性について論じられる向きもあります。確かにスーパーコンピュータや量子コンピュータによって得られる、計算処理に関する速度、精度が共に高い識別や予測を要する領域については、AIに代替されていくと考えられます。しかし、根本的にデータを使って社会をどう変えていくか、どこに価値を見いだすかは人間が話し合い、デザインして実行していくことになります。ただ計算資源として、パートナーとしてのAIがあるという考え方になります。 そこにデータサイエンティストの価値があり、ただの「解析屋」であってはならない理由もここにあります。現場と一体になって、データから改善を提案できて成果をあげる人財に限っては、その需要はなくなることはなく今後も増大し続けていくといえます。

  • データアナリストとの違い

 

データサイエンティストとデータアナリストとの違いについては、共通する仕事もありますが、データアナリストがデータの収集と分析を専門としているのに対して、データサイエンティストは、統計学、コンピュータサイエンスに基づいて、企業が抱える課題の解決までを目指す仕事です。データアナリストと比べて担当する領域が広い点が、両者の大きな違いです。
データサイエンティストはデータ活用の前提として、課題の洗い出しと優先順位付け、課題設定および達成目標の明確化、仮説立案を行います。以前は事業企画部門やコンサルが担う仕事でしたが、ビッグデータ活用による経営戦略が一般的になり、データサイエンティストの担当領域に加わった経緯があります。
このようにデータアナリストは主にデータの「収集」「分析」に特化しているのに対して、データサイエンティストはデータの「課題抽出」「収集と分析」「仮説構築」「アルゴリズムや予測モデルの実装」といった広い守備範囲を担うという違いがあります。

他の記事も読む