ETL/BI/DWH とは

BI関連

はじめに

A商社 社長
A商社 社長

我がA商社は事業を始めて35年。

これまでの業績などのデータは蓄積されているが、データをいまいち上手に活用しきれていない気がすんじゃ。

ITコンサルタント
ITコンサルタント

なるほど。そのお悩み解決しましょう!

ETL/DWH/BIツールを活用すれば、社長のお悩みは解決です!

 A商社 社長
A商社 社長

おおお、わ、わしは横文字が苦手じゃ。

なんじゃ、そのET..とは???

ITコンサルタント
ITコンサルタント

では、ETL/DWH/BIツールに関してご説明いたします。

全体図

As-is

To-be

A商社ではこれまでAs-isの図にあるように複数のシステムのデータをばらばらに連携し、エクセル職人がデータの加工を行い、メールでデータの共有を行っていました。

しかしながら、このやり方では、データ分析に時間がかかり、情報共有も大変です。

そこで、ITコンサルタントが提案した構成がTo-beの図です。

一連のデータの流れが集約されています。

ETLとは

DWH(後述)にデータをロードする工程。具体的には抽出(Extract)、加工(Transform)ロード(Load)の3つの処理に分かれる。

抽出(Extract)とは

抽出処理はシステムA、B、Cといった情報源となるシステムからデータを抽出することです。システムによってデータのフォーマットが異なる可能性があるため、抽出の段階で次の加工処理に適したフォーマットへ変換します。

加工(Transform)とは

抽出したデータを規則や関数を適用しDWHへ格納しやすい形に加工します。 第一段階処理で抽出したデータ がすでにDWHに見合った形式に変換されている場合は、この過程はスキップされる可能性もあります。

ロード(Load)とは

ロード処理ではデータをDWHにロードします。DWHへロードするタイミングなどは業務に依存します。最近では抽出、加工、ロード処理を一括で管理するETLツール( InformaticaPowerCenterIBM InfoSphere DataStage etc…)を導入しロード処理を行うのが主流です。

参考サイト

Extract/Transform/Load - Wikipedia
ETLとは?BIやDWHとの違い、機能 | 基礎から図解 - BIツール | 【ボクシルSaaS】法人向けSaaSの比較・検索サイト
ETLとは、バラバラな情報を整理しDWHに格納する処理を指します。ETLの意味、BIやDWHとの違い、ETLの機能について解説。少しでも不安に感じる方は必読です。

DWHとは

Data Ware House (データウェアハウス)の略であり、企業にある様々なシステムにあるデータを一か所に集約すること。一か所に集約することで、データの分析、保管をしやすくなる。データの倉庫と表現されることも。

通常のデータベースでは一定期間が過ぎるとデータを削除する傾向にありますが、DWHではデータの削除は行わず、時系列に保管していきます。そのため、保存できる容量が大きいのが特徴です。

DWHの提唱者である ビル・インモン によるとDWHとは「 意志決定のため、目的別に編成された時系列に統合されたデータの集合体 」であると定義されています。ただ闇雲にデータを格納するのではなく「意思決定」のために、目的をもってデータを保管、管理することが大切です。

参考サイト

データウェアハウス - Wikipedia
データウェアハウス(DWH)とは | 定義・データベース(DB)・データマートとの違い - DWH(データウェアハウス) | 【ボクシルSaaS】法人向けSaaSの比較・検索サイト
データウェアハウスとは、各種データを時系列に保存すデータベースの利用形態の一つです。データウェアハウス(DWH)の意味や定義を詳しく解説し、データベース、データマート、データレイク、RDBなどとの違いについて解説します。

BIツールとは

BIとはBusiness Intelligence(ビジネスインテリジェンス)の略であり、企業などの日々蓄積される膨大なデータを分析し、その分析結果を利用し経営の意思決定を行うことを指す。

BIツールは膨大なデータを分析し、経営者の意思決定を手助けるツールです。Excelよりも分析や集計を簡単に素早く行うことができます。また、クラウドの活用などで情報を素早く共有するこも可能な製品もあります。このように、単なるデータを意味のある情報に変換し、素早く経営判断に利用するというのが、昨今の企業戦略であり、BIツールが必要とされる要因となっています。

BIツール比較

製品名 形式 機能コスト
Tableau オンプレミス/クラウド データマイティング・レポーティング・OLAP機能 有償
QlikQクラウド データマイティング・レポーティング・OLAP機能 有償
MOTION BOARD オンプレミス・クラウド データ分析・レポーティング・プランニング 有償
Microsoft Power BI クラウド データマイティング・レポーティング・OLAP機能 無償から利用可
Google Data Studio クラウド データマイティング・レポーティング・OLAP機能 無償から利用可

参考サイト

【比較表つき】無料で使えるBIツール4種の「できること」「できないこと」を徹底調査
BIツールとは膨大なデータを、収集・分析・加工し、企業戦略、経営戦略のための意志決定を支援するツールです。本ページでは無料のBIツール4種の「できること」「できないこと」をわかりやすく整理しご紹介しています。
BIツールのおすすめ人気ランキング10選【オンプレミス型・クラウド型の優秀ツールを厳選!】
会社内の膨大なデータをまとめて検証するのに役立つBIツール。ベンチャー企業だけでなく、大企業の多くが取り入れている人気ツールです。しかし、オンプレミス型とクラウド型の2種類があり、ツールによって機能・特徴が異なるため、どのツールを利用すれば良いのか迷ってしまいますよね。そこで今回は、BIツールを選ぶときに役立つ情報をピ...

今回は、無償から利用可能なGoogle Data Studio を活用しコロナのレポート作成をしてみました↓↓

広告

高単価の完全非公開案件が多数【DYMテック】

フリーランスの報酬を即日払い【FREENANCE】

コメント

タイトルとURLをコピーしました