freshtrax

ビートラックスがサンフランシスコから最新情報を配信中

  • btrax Staff

    btrax Staff

    Designers, engineers, project managers and interns. We have a multitalented team here at btrax, and freshtrax is where their voices are heard! Anyone can contribute as long as they have something interesting to say. :)

  • → 記事一覧

    • このエントリーをはてなブックマークに追加
    • follow us in feedly
  • Nov 12, 2013

ball-63527_1280

今注目を集めるデータサイエンティストとは?

なぜ今“データサイエンティスト”?

現在、データサイエンティストなる専門家が注目を集めている。この言葉はビッグデータという言葉の出現と大きく関係している。このデータサイエンティストという語の登場は企業が今まで経験したことのないほどに多くの多種多様な情報に揉まれている背景を如実に表している。

“ビッグデータ”とは?

ビッグデータという語の始まりは、2001年にMETA Group(現、Gartner)から発表されたリサーチレポートに遡る。その中で、データ量の増大による課題と機会を量・速度・多様性という三つの次元で捉えた。それら三つが大きく増大した情報の集合をビッグデータとする定義が主流となった。さらに、他の機関から、その三次元に一つ二つの次元を足し、拡張した定義が多数存在する。

ビッグデータとはウェブやソーシャルネットワークに関連した情報だけでなく、従来の情報とITの発達によって利用できるようになった情報が複合してできた情報の集合をビッグデータなのである。

なぜ今ビッグデータ?

現在、企業が抱えるデータ量は指数関数的に増大している。そのデータは構造的であったり、なかったりと、加工を必要とするものもある。インターネットの重要性が認識された今、ビッグデータはビジネス分野で重要なものとなった。なぜなら、より多くのデータ・情報が利用可能であればあるほどより正確な分析結果が得られる。そして、より正確な分析結果によって、より納得しうる判断が可能になるからである。

ビッグデータを用いれば、よりすぐれた効率化、コスト削減、リスクヘッジが可能となる。企業はFacebookやTwitterといったソーシャルネットワークや検索履歴、顧客のトランザクションなどを企業運営に活かそうと試みている。すでに、いくつかの企業はその情報を駆使し、企業運営に活かしている。

しかし、それらデータを活用していくことには、困難がある。現在、企業が利用できるようになったデータの中には、情報が数字だけで構成され、その数字が整然と並んでいるものだけではないからである。ソーシャルメディアの発達によって、例えば、Twitterのツイートなど多くの文字を含んだデータを扱わなければならなくなった。

ソーシャルネットワークやウェブアプリケーション上で生まれる履歴やトランザクションなどの情報は数字、文字などの異なったフォーマットの情報が複合したデータであり、利用するためには情報を紐解き、利用できるようデータベースに加えるのである。

データサイエンティストとは?役割とは?

しかし、一秒間に何万と生まれる、これら多種多様で膨大なデータを収集し、整理し、分析するのは至極困難である。企業が直面しているそういった状況で、重要となっているのがデータサイエンティストなのである。データサイエンティストの役割は以下の四つ、データ・プラットフォーム・アナリシス・コンサルトである。

データ
データサイエンティストは、いくつもの情報源から多種多様な数値、文字やそれが混在した膨大な情報を収集する。そのままでは分析が困難なデータを分析可能なデータへ変換・加工・整理し、データベースに保存する。

プラットフォーム
ビッグデータの登場により、これまでのデータ処理では、活用できなかったデータを活用できるよう、コンピューター技術、プログラミング、統計、機械学習といった分野を掛け合わせ、データの収集・加工・保存・分析のためのプラットフォームを構築する。

アナリシス
数学、統計、モデリング、分析論を用いて、今まで発見できなかった有益な情報を膨大なビッグデータから明らかにする。

コンサルト
データサイエンティストは企業に対しコンサルタントとしての役割を担う。企業経営・製品戦略といった分野において、データ分析で得た情報・課題を読み解き、ビジネス・製品マネージメントのリーダーに対し伝え、課題策・戦略・情報を提示する。そのためには、データサイエンティストはプロダクトマネージャーや企業経営を行う部と協働し、企業がどのような戦略のもと、運営され、どのような課題を抱えているのかを知る必要がある。

データサイエンティストにはどのような能力が要求されるのか?

では、上記のことを踏まえ、データサイエンティストにはどのような能力が要求されるのかというと、主に三つの分野の能力が要求される。それは、データ分析、コンピューターサイエンス、ビジネスである。

データ分析
データを扱うため、データサイエンティストとなる人材はデータの収集、整理するといったデータの扱いに長けていなければならない。さらに、扱うデータは数値だけではないため、文字や文章を含んだデータの処理、分析という分野での経験が必要となってくる。そして、データを分析するために、分析論、計量分析、統計学、モデリングといった能力が必須である。

コンピューターサイエンス
データの収集・加工・保存・分析のためのプラットフォームの構築という役割をデータサイエンティストは行うため、当然コンピューターサイエンスの分野での実務的な経験が要求される。

ビジネス
企業経営や製品戦略などに深く関わるためには、企業経営・ビジネスの知識が重要である。なぜなら、データサイエンティストは企業の戦略・運営・課題策、また市場の動向などの知識が必要不可欠になってくるからである。また、データ分析により得た情報をプロジェクトマネージャーや企業運営部に伝えるため、説明能力、データのヴィジュアル化などの能力が要求される。

まとめ

データ量の増大により、データサイエンティストは企業にとって重要な存在となった。データサイエンティストはただ単にデータを収集し、分析し、それをレポートにまとめるだけの存在ではない。さらに、データサイエンティストは企業経営に深く関わり、企業に課題策、有益な情報、戦略を提示し、説明するという役割がある。それなくして、データサイエンティストの存在を最大限活かすことはできない。

写真:  geralt, geralt, geralttpsdave

参考記事:

筆者: Yoshimasa Sato

 ib-banner 

Like us on Facebook

Scroll to top

シリコンバレーから最新情報をゲット!

 

btrax-logo-100

サンフランシスコに本社を構えるクリエイティブエージェンシーbtraxのニュースレターに登録して最新の情報をいち早くゲットしませんか?

 

・オウンドメディアfreshtrax 今月の注目記事

・CEO Brandonの無料オンラインセミナー情報

・最新サービス・現地イベント情報

 

Subscribe!
Twitterで共有
Facebookで共有
はてなブックマークに追加
pocketで共有
Lineで共有