Alation、はじめました。
第1回:データカタログとは

 2024.02.09  2024.04.18

伊藤忠テクノソリューションズ株式会社(以下、CTC)では、データカタログ専用製品であるAlation(アレーション)の取り扱いを開始しました。
これから全8回の連載で、Alationをご紹介していきます。
初回はAlationそのものの紹介の前に、まずはデータカタログについて触れてみたいと思います。

Alation、はじめました。第1回:データカタログとは

データカタログとは

データカタログとは、組織に必要なデータに関する情報を集約し、データの目録として管理するシステムです。集約するのはデータそのものではなく、メタデータ(データに対する属性情報)と呼ばれるものになります。例えばデータベースの表名や列名がメタデータに該当します。
データの利用者が自分にとって必要なデータがどこにあるのか?を探し当てたい場合に、目録としてのデータカタログを検索するのですが、メタデータだけではデータの具体性に乏しくデータの利用価値を判断できない可能性が高いです。
そのため、収集したメタデータに対して説明文を付加して、データの価値がわかりやすいように工夫する必要があります。

データカタログとは

Alation Cloud Service
Alation Data Intelligence Platform

メタデータと補足説明だけでは不十分

データカタログの整備により、目的のデータ(と思わしきもの)がどこに保存されているのか、あたりを付けることができますが、データを活用する状況として十分とは言えません。

やりたい業務にとって本当に必要なデータですか?

通常は実際のデータを見ることで、やりたい業務に必要なものなのか、そうではないのかの最終判断が行われますが、その判断に全データが必要でしょうか?
データカタログにサンプルデータが付いていれば、多くのユーザーは実データを見る前に、ある程度の判断ができる場合が多いのではないでしょうか。
サンプルデータがあれば、データが想定した内容ではなかった場合に、別のデータを探し出して、実データの内容確認作業の繰り返しを抑止できます。
また、みなさんがデータへのアクセス権を持っていない場合の、業務の流れはいかがでしょう? アクセス権を申請して権限付与してもらう時間を待つ必要があったり、アクセス権限を保有する人に依頼してデータを取り寄せるための時間が発生したりしていませんか?
サンプルデータがあれば、これらの待機時間も節約できるはずです。
Alationにはサンプルデータを用意する機能があります。

データ使用のリスクやルールは確認できていますか?

データの使用に際し、リスクに対する説明やルールが設けられている場合も少なくありません。該当のデータは取り扱いに注意が必要なのかそうでないのか、注意が必要な場合にはその内容または詳細な情報へのリンクが整備されていると、データを使い始める前にそれらを確認することで安心して、使用を開始できるはずです。
Alationでは、利用者へ警告で注意を促したり、データに関連するビジネス情報をAlationの記事※としてメタデータへの説明文とは別に用意したりすることができます。これにより、データカタログでの検索時に忘れずに注意事項を確認できます。
※記事とは長文の記述コンテンツを作成できるAlationのオブジェクトです。詳細は本シリーズの別の回で紹介予定です。

データに関するアドバイスが欲しい場合に誰に相談しますか?

上司や同僚といった答えになると思いますが、そのデータを過去によく使っていた人であればもっと良いでしょう。
Alationでは、該当のデータをよく使っていた人を分析できます。これにより、より適切な相談相手を短時間で見つけ出す事ができます。

同じデータから作成されているBIダッシュボードがありますか?

既存のダッシュボードを確認することで、同じようなダッシュボードを作成してしまう無駄を回避でき、作成済みのダッシュボードをベースに変更を加えることで、ダッシュボードの作成時間を短縮できる可能性が大いにあります。
Alationでは、ダッシュボードがどのデータから作られているのかを確認できます。

データは信頼できる状況ですか?

信頼できない状態のデータを分析したものは、その結果も信頼することはできません。データの信頼状態はどのように確認していますか?
Alationでは、信頼に関するフラグを立てることで、データの信頼状況を利用者が簡易に判断できるようにしています。

このように、データの所在が明らかになるだけではなく、データに関連する情報収集が簡潔であると、データを使う本来の業務に早く取り掛かることができて、業務全体の効率化にもつながります。

あらゆる人がデータを必要としている

多くの企業では、データサイエンティストやデータアナリストがデータを使用しています。ただ実際はどうでしょうか? 例えばスプレッドシートを用いてデータを使うビジネスユーザーも多いのではないでしょうか?
データを必要としている誰もが、セルフでデータの発見と必要性の判断ができれば、データドリブンな組織改革の一助にもなるでしょう。
しかし、一般的に見て、ビジネスユーザーはデータサイエンティストと比べるとITスキルが高くない傾向があるようです。データを必要としている誰もが、セルフでデータの発見と必要性の判断ができるためには、環境や利用するツールは複雑でないものが最適です。

あらゆる人がデータを必要としている 01

あらゆる人がデータを必要としている 02

Alationは100種類以上のデータに接続できます。また、検索には特別なスキルは必要としません。

必要とされるデータカタログとは

データを活用するにあたり、データカタログの存在は重要です。データカタログを保有していない企業では、目的に必要なデータを入手してデータの活用を始めるまでの時間が思いのほか長く発生しています。また、上述したようにデータの所在がわかるだけでなく、データが目的にあっているのかどうかの判断や関連する情報を素早く確認できるような工夫を持つデータカタログであることが、業務の効率化につながります。
メタデータの収集と説明文の追加はデータカタログ製品の基本です。基本以外にどのような機能を持っているのかは、製品により異なります。
Alationは業務の効率化につながる機能を兼ね備えているだけでなく、ビジネスユーザーにわかりやすいUIを提供しています。多くの企業にとって導入価値のあるデータカタログと言えるでしょう。

【データカタログの導入によるデータ発見の効率化】

必要とされるデータカタログとは

<出典:https://www.alation.com/blog/what-is-a-data-catalog/

【直感的に検索を開始できるUI】

必要とされるデータカタログとは 02

第1回は「データカタログとは」についてお届けしました。
次回は、Alationの製品概要をご紹介いたします。

Alationの製品紹介やデモをご希望の場合には、CTC担当営業または問合せフォームからご連絡ください!

CTA

RECENT POST「データマネジメント」の最新記事


データマネジメント

データドリブンなビジネスを実現するDr.Sum導入のメリット

データマネジメント

ETLとELT|プロセス・おもな違い・データ利活用でのポイント

データマネジメント

データドリブンなビジネスを実現する Motionboard の魅力!

データマネジメント

クラウドデータ移行ならSnowflake x Alation

Alation、はじめました。第1回:データカタログとは
CTA

RECENT POST 最新記事

CTA

RANKING人気記事ランキング


OFFICIAL SUPPORTER