ETL/BI/DWH とは

はじめに

A商社 社長
A商社 社長

我がA商社は事業を始めて35年。

これまでの業績などのデータは蓄積されているが、データをいまいち上手に活用しきれていない気がすんじゃ。

ITコンサルタント
ITコンサルタント

なるほど。そのお悩み解決しましょう!

ETL/DWH/BIツールを活用すれば、社長のお悩みは解決です!

 A商社 社長
A商社 社長

おおお、わ、わしは横文字が苦手じゃ。

なんじゃ、そのET..とは???

ITコンサルタント
ITコンサルタント

では、ETL/DWH/BIツールに関してご説明いたします。

全体図

As-is

To-be

A商社ではこれまでAs-isの図にあるように複数のシステムのデータをばらばらに連携し、エクセル職人がデータの加工を行い、メールでデータの共有を行っていました。

しかしながら、このやり方では、データ分析に時間がかかり、情報共有も大変です。

そこで、ITコンサルタントが提案した構成がTo-beの図です。

一連のデータの流れが集約されています。

ETLとは

DWH(後述)にデータをロードする工程。具体的には抽出(Extract)、加工(Transform)ロード(Load)の3つの処理に分かれる。

抽出(Extract)とは

抽出処理はシステムA、B、Cといった情報源となるシステムからデータを抽出することです。システムによってデータのフォーマットが異なる可能性があるため、抽出の段階で次の加工処理に適したフォーマットへ変換します。

加工(Transform)とは

抽出したデータを規則や関数を適用しDWHへ格納しやすい形に加工します。 第一段階処理で抽出したデータ がすでにDWHに見合った形式に変換されている場合は、この過程はスキップされる可能性もあります。

ロード(Load)とは

ロード処理ではデータをDWHにロードします。DWHへロードするタイミングなどは業務に依存します。最近では抽出、加工、ロード処理を一括で管理するETLツール( InformaticaPowerCenterIBM InfoSphere DataStage etc…)を導入しロード処理を行うのが主流です。

参考サイト

https://ja.wikipedia.org/wiki/Extract/Transform/Load

https://boxil.jp/mag/a2415/

DWHとは

Data Ware House (データウェアハウス)の略であり、企業にある様々なシステムにあるデータを一か所に集約すること。一か所に集約することで、データの分析、保管をしやすくなる。データの倉庫と表現されることも。

通常のデータベースでは一定期間が過ぎるとデータを削除する傾向にありますが、DWHではデータの削除は行わず、時系列に保管していきます。そのため、保存できる容量が大きいのが特徴です。

DWHの提唱者である ビル・インモン によるとDWHとは「 意志決定のため、目的別に編成された時系列に統合されたデータの集合体 」であると定義されています。ただ闇雲にデータを格納するのではなく「意思決定」のために、目的をもってデータを保管、管理することが大切です。

参考サイト

https://ja.wikipedia.org/wiki/%E3%83%87%E3%83%BC%E3%82%BF%E3%82%A6%E3%82%A7%E3%82%A2%E3%83%8F%E3%82%A6%E3%82%B9

https://boxil.jp/mag/a1657/

BIツールとは

BIとはBusiness Intelligence(ビジネスインテリジェンス)の略であり、企業などの日々蓄積される膨大なデータを分析し、その分析結果を利用し経営の意思決定を行うことを指す。

BIツールは膨大なデータを分析し、経営者の意思決定を手助けるツールです。Excelよりも分析や集計を簡単に素早く行うことができます。また、クラウドの活用などで情報を素早く共有するこも可能な製品もあります。このように、単なるデータを意味のある情報に変換し、素早く経営判断に利用するというのが、昨今の企業戦略であり、BIツールが必要とされる要因となっています。

BIツール比較

製品名 形式 機能コスト
Tableau オンプレミス/クラウド データマイティング・レポーティング・OLAP機能 有償
QlikQクラウド データマイティング・レポーティング・OLAP機能 有償
MOTION BOARD オンプレミス・クラウド データ分析・レポーティング・プランニング 有償
Microsoft Power BI クラウド データマイティング・レポーティング・OLAP機能 無償から利用可
Google Data Studio クラウド データマイティング・レポーティング・OLAP機能 無償から利用可

参考サイト

https://www.justsystems.com/jp/products/actionista/bi-trend/free-bi.html

https://my-best.com/6632

今回は、無償から利用可能なGoogle Data Studio を活用しコロナのレポート作成をしてみました↓↓

コメントする

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)