プログラミング的なSomething

プログラミング的なSomething

ITエンジニア(?)目線で生活・自転車・トレーニング話を綴ります

久方ぶりの更新:ビッグデータ本を読んだのでその紹介

ビックデータ本を読んだのでご紹介。
すでにご存知の情報も多いかもしれませんが、入門書としてとても秀逸だったのでご紹介。

ビッグデータビジネスの時代 堅実にイノベーションを生み出すポスト・クラウドの戦略
ビッグデータビジネスの時代 堅実にイノベーションを生み出すポスト・クラウドの戦略

目次:
第1章 ビッグデータビジネスとは何か?
第2章 ビッグデータビジネスの効用と活用事例
第3章 主要陣営の戦略とビッグデータ活用を支える技術
第4章 ビッグデータ活用に向けた3つの阻害要因
第5章 ビッグデータビジネスの将来予測

ビッグデータに期待される役割は、「これまで測定できなかった情報や、無価値とされていた情報が、CPUの計算処理の高度化に伴い、有効活用されることによるイノベーション」です。本著でもこのようなビッグデータの概要は論じられていますが、一番印象的だったのは、4章の「ビッグデータ活用に向けた3つの阻害要因」でした。

特に注目したのはプライバシの問題です。ビッグデータは基本的に収集・分析を繰り返すモデルなので、消費者の素行について定量的なデータを収集します。まあ要はこれがプライバシの問題に発展するか否か、という点がビッグデータ普及への阻害要因というわけです。

クラウドの普及時にも同じようなことは言われていて、情報を外部に預けるという不安感がその阻害要因になってきました。ビッグデータでは一歩進んで、「ユーザが意識しない」情報が外部に蓄積されるため、その心理的不安は相当程度のものだと推察できます。

これは、クラウドがビッグデータと並ぶバズワードだった数年前と同じで、当時のクラウドもプライバシやセキュリティに関しては口煩く言われてきました。情報漏洩するんじゃないかとか、顧客の信頼を失うとかとか……。しかし、現在のクラウド導入の阻害要因は本当にセキュリティでしょうか。まだサービスとしてまだ未成熟な部分はあるにせよ、すでにクラウドにおけるプライバシ・セキュリティの問題は一定程度解消されているものと考えられます。クラウドの導入を進言したとき、上司が懸念しているのは本当はコストなのかもしれません。クラウドの阻害要因の上位にセキュリティはあがっていますが、もはやトップではありません。

要は、同じようなことがビッグデータでも起こりうるのでは、と本書を読んで思いました。

阻害要因は技術の進歩や消費者の理解により次第次第に氷解していきます。そうなると、商売のヒントになるビッグデータを活用しない手はありません。これからどんどん普及していくでしょう。

じゃあ、なんで加速度的にビッグデータが普及しないの??

本書の4章でも触れられていますが、これは「人材不足」が主因であると言われています。たしかに、WEBサービスをガンガン作る人ははてな界隈、ひいてはWEB上にくまなく存在しますが、統計学を修めていて、かつビジネスを数字で語れる人ってどこにいるのって感じしません?自分なんかは「ああ、なるほどな」って胸のつっかえが取れました。「たしかに最近”R”って言葉を聞くわ」。

というわけで、クラウドが普及したように、ビッグデータもその阻害要因を(主に時間による技術進歩が)乗り越え、世の中に普及する可能性は大いにあります。単なるバズワードと切り捨てず、統計とか”R”とか食いっぱぐれないような努力を最低限していきたいなあと思う次第であります。

一年で身に付ける!Rと統計学・機械学習の4ステップ - iAnalysis 〜おとうさんの解析日記〜

ご多分にもれず、id:isseing333様の記事を拝読させていただいております。高校数学で問題ないという触れ込みを信じて、まずは統計学入門を紐解いていこうと密かに考えています。