近年、「ビッグデータ」という言葉をよく耳にするようになりました。それ以外にも、「経営データの分析」や「データの可視化」、「データドリブン」など何かとデータの話題に触れる機会が増え、データ無しにはビジネスが成り立たないような時代になってきています。
今後ますますデータ分析に関わる職業のニーズが高まっていくと考えられる中で、データ周りの職業というとやはり最初に想起されるのは、「データサイエンティスト」「データアナリスト」ではないでしょうか。今回は、この二つの職業を軸に、データ分析の業界の今後と、どのような人材が市場価値を高めていくのか考えてみたいと思います。
データサイエンティストとデータアナリストについて
データサイエンティスト、データアナリスト誕生の背景
データサイエンスを行うのがデータサイエンティストですが、データサイエンスの基礎にあるのは統計学です。統計学の歴史は古く、本格的に学問として成り立ち始めたのは16世紀のイギリス、ジョン・グラントによるものだと言われています。
その後、統計理論が発達していく中でコンピュータが誕生し、統計理論はコンピュータに実装され、一般人も分析に触れやすくなりました。ユーザーが増え、コンピュータの性能が上がるにつれ、データの蓄積量が増えましたが、同時に異常値や欠陥値を含むようになりました。
こうした整っていない大規模データを扱うにあたって、これまでの統計学が通じなくなると計算機が生み出され、さらに1990年代に入ると計算機科学の分野から、大規模データを分析する技術として「データマイニング(上図の緑の領域)」が生まれました。これが現在の「データアナリスト」が担っている主な領域です。
2010年代になると技術の進歩によって、より膨大で非構造的なデータを蓄積し、リアルタイムに操作できるようになりました。いわゆるビッグデータの時代になったわけです。こうして生まれたのが「データサイエンス」「データサイエンティスト」で、膨大で複雑なデータの中から課題解決のために、どのような情報を掛け合わせ、分析することで、適切解を生み出せるか検討します。
参照): 大和総研「データ分析の歴史とビッグデータ」
データサイエンティスト、データアナリストの職務領域と求められる能力
データアナリストの職務領域
データアナリストの主な仕事内容はデータ分析になりますが、データアナリストには実はコンサル型と呼ばれるタイプと、エンジニア型と呼ばれる二つのタイプがあり、業務内容が異なります。
コンサル型のデータアナリストは、コンサルティング会社やマーケティング部門に属し、企業の課題に対して、データ解析を行い、解決策を提案することが主な仕事内容です。
一方、エンジニア型のデータアナリストとは、比較的データが集まってくるような企業に属し、データマイニングを活用して、ユーザーの行動の特性や規則性を導き出すことが主な仕事内容です。
データアナリストに求められる能力
コンサル型は課題把握から提案することまでを担う分、分析力や、論理的思考力が求められます。(必要な知識・スキル:統計学、SQL、Rなど)
一方、エンジニア型は、データマイニングを行うため、よりデータ処理能力が求められます。(必要な知識・スキル:Hadoop、Spark、SAS、R、Java、データマイニング(解析技術)、機械学習など)
データサイエンティストの職務領域
データサイエンティストは、データエンジニアリング(データ分析の力)のみならず、データサイエンスと呼ばれる統計学や機械学習などの専門知識、本質的課題抽出し、納得のいく提案をするビジネススキルが必要になります。その前提で、データサイエンティストも実は、データアナリストと同じように大きく2つの型に分類されます。
一つが『アルゴリズム実装型』ともう一つが『アドホック型』というものです。どちらも上の三要素はどれも必要ですが、それぞれの主業務が異なります。
アルゴリズム実装型のデータサイエンティストは、機械学習アルゴリズムに詳しく、データアナリストが加工・成形したデータを元に応用的に機械学習を用いてアルゴリズムを組み、事業システムに実装します。エンジニア的で創造的な業務です。
アドホック分析型のデータサイエンティストは、データを取り出し、掛け合わせや切り口を変えるなどアドホックな分析を行い、提案を行うことが主な業務です。より統計学や情報処理に詳しく、データ分析やデータの性質を手早く行うためのプログラミングに長けており、コンサル要素が強いです。
データサイエンティストに求められる能力
一般的に、素養としては課題特定力や論理的思考力、技術的にはPython、R、SQL、MySQL、Hadoop、Spark、SASといったスキル、知識的には統計学やAIといったものが求められる能力です。
また、分析部分をアナリストにお願いすることもあるので、全体のディレクション力や、課題解決手法を社内外に伝える提案力、そしてそもそもの良い提案をするための事業理解力も重要な能力です。
しかしながら、これらの能力は現在あるいはこれまで必要であった能力であって、データサイエンティストやデータアナリストがビッグデータと切っても切り離せない職業である以上、ビッグデータのあり方やそれを取り巻く技術が発展してきている今、求められる能力も変わってきています。
参照): 一般社団法人 データサイエンティスト協会「データサイエンティストに必要とされるスキルをまとめたスキルチェックリストを初公開」
データサイエンティスト、データアナリストを取り巻く環境は変化を続けている
データサイエンティスト、データアナリストの市場価値はどちらも”今のところ”高い
2013年の記事ですが、日経新聞で日本では将来25万人のデータサイエンティストが不足すると言われています。求人数も年々右肩上がりに増えており、大手転職サイトでも昨年ごろから職種に「データサイエンティスト」が追加されました。
下記は、転職サイトDODAのデータですが、登録者は微増したものの依然として少ない状況で、求人数は引き続きニーズは高まり続けているため今後も増加する見込みになっています。
【データ概要】登録者詳細
対象:2017年9月1日~2018年2月28日にDODAに いただいた求人件数と登録者数。
※9月の数値を「1」とした場合の変化を表しています。
これだけでも市場価値が高いことがわかりますが、現状とにかく人が足りていないので、Hadoopのような分散処理や統計学の知識が無くても、大学レベルの数学を学んでいて、かつ実務レベルでのRやPythonの知識があるような方は、データアナリストやデータサイエンティスト(または候補)としての転職が比較的容易です。
ビッグデータ後進国の日本では、企業もデータの分析や活用に不慣れなことも多く、何を得たいのが不明瞭なこともあります。そのため、データサイエンティストやデータアナリストの仕事内容が曖昧なことも多く、データサイエンティストとデータアナリストの境界が曖昧であったり、機械学習エンジニアやデータエンジニアと混同されてしまっていることも往々にしてあります。
逆もしかりで、企業も働き手の技術的な面に詳しくないこともあり、前述のデータサイエンスやデータエンジニアリングの力ではなく、ビジネス力やコミュニケーション力で判断しがちになっていることも起こっています。
参照): 日本経済新聞「ビッグデータ分析に人材の壁、25万人不足見通し」
参照): DODA「ビッグデータ分析に人材の壁、25万人不足見通し
データドリブン化が進んでいる
データドリブン(Data Driven)は、マーケティングでもよく使われますが、売上データやマーケティングデータ、測定データなど、ビッグデータを可視化し分析することで、次のアクション(経営判断や企画立案など)を決定することです。
データドリブンの成功のためには、分析だけでなく、データの可視化(データビジュアライズ)やアクショプランの決定に長けた人材が必要になります。
様々なツールが誕生している
先程のデータドリブンでも、支援ツールは上の表のように非常にたくさんありますし、TableauやDOMOといったBIツール、ビッグデータ可視化ツール、Data Diverといったデータサイエンス支援ツールまで、実に様々な支援ツールが存在します。
つまり、単純なデータ収集や分析、アウトプットは全て機械が自動化してくれるわけです。機械学習の技術も高まっているので、自動化できる作業も高度化が進んでいます。
参照):IT Koala Navi「データドリブンとは?データドリブンを成功に導く全知識と6つのITツール」
オープンイノベーションが進んでいる
オープンイノベーションとは、自社だけでなく他社や国、地方自治体、教育機関、フリーランスなど異業種が持つ技術やサービス、ノウハウ、データ、知識などを組み合わせ、新たなビジネスモデルやサービスなどを生み出す取り組みの事です。
近年こうした取り組みが積極的に進んでおり、ビッグデータに関しても、オープンデータ化やオープン分析プロジェクト化が進んでおり、一人の優秀なデータサイエンティストが多くのミッションを担う世の中になりそうです。
育成拠点の充実化が進んでいる
2011年のデータですが、データサイエンティストとなりうるデータ分析のスキルを有する大学を卒業する学生の数は、米国の24,730人に対し、日本は3,400人となっており、約7倍の開きがあります。
この状況に対して、日本もデータサイエンティストを養成しようと動き始め、2017年の滋賀大学のデータサイエンス学部の開設は大きなニュースとなりました。
その後も横浜市立大学や広島大学、京産大、武蔵大学などがデータサイエンスと名の付く学部、学科、コースを新設し、データサイエンスを学べる教育拠点が広がりを見せています。
参照): ニッポンクラウドワーキンググループ「ビッグデータビジネスとデータサイエンティスト人材の状況」
データサイエンティスト、データアナリストの今後
ここまでビッグデータを取り巻く環境の変化について述べてきましたが、これらの市場変化が、データサイエンティストやデータアナリストの今後にどう影響するのでしょうか。
データアナリストや、中途半端なデータサイエンティストは淘汰される
分析業務だけであれば、既に様々なツールやAIによって自動化されています。つまり、データアナリストの仕事は、今後自動化され、いずれは無くなるでしょう。
しかし、データサイエンティストも安心できる訳ではありません。前述のように、現状は人が足りていないので、RとPythonぐらいの知識があれば、この職を得ることができましたが、これからは前述の教育機関を卒業した、もっと勉強した若く優秀なデータサイエンティストが市場に増えてきますし、オープンイノベーションによって仕事はいい人材のところへ集中します。「あなたが近くにいたから、社内にいたから」では仕事はもらえないのです。
作業しかできない、簡単なことしかできない人材は、自然と淘汰されるでしょう。
予測モデルを構築できる人は強い
AIを活用したツールが増えた場合、人工知能は学習しますから、ツールは使えば使うほど使い勝手はよくなります。また、誰でも使いやすいUIに進化します。そうなるとツールを多く使った経験はさほど必要ではなくなるので、ツールの使い手は価値を失います。
今後、価値あるデータサイエンティストであり続けるためには、高度あるいは新たなアルゴリズムによって、予測モデルを構築できる力が必要です。単純な予測モデルの構築はAIで来てしまうので、高度さと進取性が求められます。
課題特定力と、思考力、提案力で生き残る
今ではデータサイエンティストの作業的な部分はほとんど自動化されていますし、簡単な構築でさえAIで可能になっています。そして、データサイエンスを活用して解決したい課題は、抽象的で複雑なことが多いです。
そうなると、人間に求められることは、企業の本質的課題は何なのか捉える課題特定力と、分析結果を課題解決のためにどう使うのか、前例がない課題に対しどのようにデータを利活用するのかといった思考力と提案力です。それを持ち合わせていないデータサイエンティストは価値がなく、自動化の波に飲み込まれるでしょう。
まとめ
ビッグデータは今後も様々な意思決定やIoT・クラウドサービスの発達に重要な役割を果たすでしょう。また、データそのものに価値づけをして売買する動きも始まっています。
データ分析を担える人材はまだまだ多くはありませんが、それが故に人材不足を補うAiが発達していますし、人材育成機関も増えています。(簡単な作業の)需要が減り、供給が増えると、当然質が求められます。
かつ、部分的な理解や専門性ではなく、データ分析業務全般を理解していること、つまりは、データ分析においてゼネラリストとして自身を成長させることで今後の市場価値を高めていくのではないでしょうか。
AIを活用でき、AIに負けないスキルを持った人材とそうでない人材の二極化が今後ますます進んでいくでしょう。