現代のビジネスにおいて、データは新たな資産としての地位を確立しています。ビッグデータの時代が到来し、我々の周囲には多種多様なデータが溢れています。日常生活においても食事や旅行、美容など様々な場面でお店を決めるために比較サイトを参考にして自分に合ったお店を探すなど日常的にデータを活用している人も多いのではないでしょうか。テクノロジーが進化したことで企業や組織はさまざまなデータを収集し、長期的に保存することが可能となり、それらのデータをいかに有効活用していくかがビジネスの成功に繋がる大きな鍵となっています。しかし、膨大なデータを正確に把握し扱っていくことは難しく、事前の環境整備や知識習得の準備が必要なため、データの有効活用が思うようにいかず壁にぶつかってしまっている人も多いのではないでしょうか。この記事では、データ利活用の概要と目的、データの収集・蓄積・加工・可視化の重要性、そして壁にぶつかってしまう理由と解決のためのヒントについて解説していきます。
図1:データ利活用の全体像
データ利活用の概要と目的
データ利活用とは、企業にあるデータや一般公開されているオープンデータを活用して戦略的な意思決定を行うプロセスを意味しています。従来は経験と勘によって判断されていたことが、データを活用することで事実に基づいた判断を行うことができるようになります。データ利活用の目的は多岐にわたり、効果的なマーケティングの展開、生産性の向上、顧客体験の向上など、データの活用によって得られるメリットは計り知れません。
ITシステムにおけるデータ利活用は、主に以下の3つのステップで構成されます。
1. データの収集・蓄積
データ利活用の出発点は、多様なデータソースからデータを収集して蓄積することです。例えば、顧客の購入履歴、ウェブサイトのアクセス情報、社内の業務データなどを使って分析するためには、分析に必要なデータを集めてこなければなりません。データソースが1つであれば、シンプルですが、分析内容によっては、複数のデータソースからデータを集めてくる必要があります。また、集めてきたデータを蓄積する必要があります。しかし、データの蓄積には正確さと効率性が求められ、大量のデータを整理して活用できる形にするための戦略が必要です。そのためにもデータを蓄積する目的を明確にすることでどのようなデータが必要なのか?どんな形で蓄積するか?などの目的やルールを定めることが重要になります。例えば、小売店が売上を伸ばすために顧客の購買情報、購買時間、年齢、性別などのデータを蓄積していくことでそのお店の購買傾向や地域特性、売れ筋商品などの売上向上に対するアクション(意思決定)を取ることができます。分析目的にもよりますが、少なくとも売上などであれば1年前と比較して変化があるか、1年前が特異な年であった場合、さらに1年前と変化があるかなどを確認するためにも3年間分のデータが必要になります。しかし、分析を行いたいがデータが足りない、想定していたデータと実態が異なるなどデータを活用することが想定されていない貯め方をしている場合、いざ活用しようとしたタイミングで足止めされてしまうことがあります。逆に今まで貯めてあったが特に用途のなかったデータが数年経過して急に活用の道が出てくるなど、データの使い道は時代の変化とともに急激な変化を遂げる場合もあります。自社の状況に合わせて考えていくとどんなデータをどれくらいの期間蓄積していく方が良いのか判断が難しく悩んでしまうこともありますが、将来的に見るとデータは不足することはあっても無駄になることが少ない要素のため、可能な限り保存しておくことが望ましいと言えるでしょう。
2. データの加工
データの加工とは、文字通りデータに手を加えて整形していくことを指します。なぜそのような作業が必要かというと、収集・蓄積したデータはそのままでは分析に使えないことがあるためです。
図2:集計が合わない例
例えば、図2のように氏名というデータの入力形式が人によって異なってしまう場合、
集計すると異なるデータとして扱われるため正しく集計できないことがあります。そのためデータの形を揃えてきれいに整理してあげる処理が必要になります。その際に不要な情報を取り除いて加工することでデータの品質を向上させることも可能です。また、データソースがサイロ化されており、そのままでは分析・可視化を行うことができないため、データソースを1つに統合する加工を行うことで、分析・可視化に適したデータ(データマート)へと整えていくことも重要です。データの加工には高いデータへの理解やデータベースの知識、データ利活用の目的を正しく解釈することが求められます。加えて、小規模なデータの加工は手作業でも問題なく行えますが、運用を続けていき様々な分析を行っていくと徐々に大規模で複雑なデータを扱うことになる傾向があり、専門ツールの活用検討が必要です。
3. データの可視化
データの可視化は、データを視覚的な形で表現するプロセスです。棒グラフや折れ線グラフ、円グラフなどを用いてデータを直感的かつ正確に表現することで、データから得られる考察を効果的に伝えることができます。例えば、スプレッドシートの表に数字データがある場合、見慣れている人以外はデータを見てから理解するまでに時間がかかってしまいますが、グラフなどを使って表現することで直感的な理解に繋げることができます。また、データの可視化はビジネスの意思決定を速めるだけでなく、データにある潜在的なパターンやトレンドを明らかにすることも可能です。スプレッドシートのデータで見る場合、そのまま見るのではなく少し見方を工夫することでより理解しやすい形へと昇華させることができます。データの可視化では様々な角度や粒度でデータを見ていくことを可能とし、より多くの考察を得ることが可能となります。
図3:可視化による認識難易度の違い
例として、図3のスプレッドシートデータを見て、この中で「5番目に売上を上げている都道府県はどこか?」といった課題を考えていきましょう。図3の集計表の中でどれが一番スムーズに見つけられたでしょうか?左の集計表はスプレッドシートのデータをそのまま見ているのでここから課題の答えを見つけるのは難しいです。真ん中の集計表は値の大きさによって色分けされているため上位と下位がどれなのかわかりやすくなっており、課題の答えを見つけやすくなっていますが、5番目を見つけるにはまだわかりづらいです。右の集計表は売上を降順に並び替えており、集計表の中に棒グラフを内包することで数字の大小関係をより強調しています。右の表現であれば課題の答えはすぐに見つかります。
可視化はデータ利活用において非常に重要なポイントであり、目的に応じて表現を変えた方が迅速に正しい情報を伝えやすくなります。
データ利活用の普及はなぜ進まないのか
ここまでデータ利活用の概念について述べてきましたが、データを用いることで関係者間の意識を共有し、意思決定の効率化を可能とするデータ利活用は実用できれば非常に有効な活動です。しかし、多くの企業や組織ではその実践に踏み切れていないのが実情です。ビジネスにおいて有効な手段であることはわかっているにも関わらずなぜ活用が進まないのかを述べていきます。
1. データの不足と複雑な管理
データは様々な場所から生成され、別々に保管されていたり形が異なっていたりと非常に複雑に管理されている場合が多く、その複雑な管理がデータ利活用の壁となっています。例えば、分析を始めたいが自分の手の届く範囲のデータだけでは足りず他組織と連携する必要がある場合や、加工や集計がされておらず、利用したいタイミングでデータが使えないことがあります。このようにデータを使うためにいくつかの手順を踏む必要があるとなれば、分析を行うことにもハードルを感じる要因になり、手が遠のいてしまうでしょう。また、必要なデータが不足している場合もあり、データ収集の難しさがデータの利用を妨げている場合もあります。多くのデータベースでは可視化・分析を行う際に集計に必要なデータが足りないといった事態に陥ってしまいます。その場合できることが限られてしまうため満足のいく結果を得るのが難しくなってしまいます。
2. データの保護とプライバシー
データの保護やプライバシーの問題も顕在化しています。多くのデータを取り扱う際は、個人情報や会社固有の情報など、漏洩に気を付けなければなりません。個人情報の取り扱いには法的な規制が存在するため、利用する場合は、個人を特定できるデータを除外またはマスキングをするといった加工が必要です。データ利活用を実践していく際には、セキュリティとプライバシーの両面に配慮しながら進める必要があります。
3. 環境的な課題とリソース不足
データ利活用には一定の専門的な技術や知識が必要です。データの収集から、蓄積、加工、可視化、分析までを支援するツールやサービスも多く存在しているが、データ分析や利活用をしているのは一部の人々にまだ限定されているのが実態です。また、データの分析や洞察を得るためのスキルも重要です。ここで意味するスキルとはITと業務の2つの意味を持ちます。ITスキルとしてデータの形を理解する必要があり、ツール導入後に使いこなすため、データの持ち方やデータ型などデータそのものへの理解が求められます。業務スキルとして蓄積されているデータの意味を正しく理解する必要があり、どの項目がどんな意味を持ちどのように分析すれば効果的かを検討するためには業務を正しく理解していることが重要です。そのため、データ利活用の実践には技術と知識の両面を備えた人材の育成やデータ民主化が求められています。
4. 組織文化と変革の難しさ
データ利活用を推進するためには、組織全体の文化を変革する必要があります。しかし、多くの組織では業務効率化を目的とした縦割り構造が中心となっており、他組織との連携が取りづらい環境にある場合があります。そのため一つの組織で文化を変革したから完了とはいかないのが現状です。経営層がリードし、組織全体でデータ利活用を推し進める必要があります。また、新たな方法やプロセスへの適応には抵抗が生じることがありますが、個人がすべての知識と技術を持ちリーダーシップを発揮するのは難しいため、様々な人との協力を得る必要があります。組織文化の変革は時間がかかるものですが、その成果はデータ利活用を進化させる鍵となります。
データ利活用の推進が重要な理由
データ利活用の概要及び普及しない理由について述べてきました。やはり実現が難しく自社で推進するのは現実的ではないと感じるかもしれませんが、データを活用していくことはとても重要だと考えます。ここではデータ利活用の時代背景と推進することで得られる大きな価値について述べていきます。
・データは確認する時代から活用する時代へと変化
従来、データは内容を確認するためのエビデンスとしての役割が大きく、補助的な用途で利用されてきました。現代では私たちの身の回りはデータで溢れています。そのデータを活用することで新たな価値を生み出し、データドリブンな意思決定に寄与します。これはデータの収集・蓄積・加工・可視化といったデータを扱う分野でのテクノロジーの進化により、データ自体が当たり前の存在になってきていることが大きく影響しています。将来的にもデータの量は加速度的に増えていき、データを活用していくことが当たり前になり、そしてデータをうまく活用できるプレーヤーが大きな価値を享受していくことが予想されます。時代に取り残されないために、何より自身の価値を高めていくためにもデータを扱う術を身に着け活用していくことが非常に重要です。
まとめ
データ利活用は、ビジネスの未来を切り拓くための重要な手段です。データの収集・蓄積・加工・可視化を行うことで深い洞察や新たなビジネスチャンスを見つけることができます。実現するためには様々な課題が存在しますが、実現できればビジネスの効率化と競争力向上の可能性が待っています。日進月歩のテクノロジーと組織全体の協力を踏まえ、データ利活用を推進していくことが重要です。
※データ利活用についてビジネス業界の実態や進捗をレポート形式でまとめておいます。興味がある方は以下リンクよりダウンロードください。
- カテゴリ:
- データマネジメント