はじめに

我がA商社は事業を始めて35年。
これまでの業績などのデータは蓄積されているが、データをいまいち上手に活用しきれていない気がすんじゃ。

なるほど。そのお悩み解決しましょう!
ETL/DWH/BIツールを活用すれば、社長のお悩みは解決です!

おおお、わ、わしは横文字が苦手じゃ。
なんじゃ、そのET..とは???

では、ETL/DWH/BIツールに関してご説明いたします。
全体図
As-is

To-be

A商社ではこれまでAs-isの図にあるように複数のシステムのデータをばらばらに連携し、エクセル職人がデータの加工を行い、メールでデータの共有を行っていました。
しかしながら、このやり方では、データ分析に時間がかかり、情報共有も大変です。
そこで、ITコンサルタントが提案した構成がTo-beの図です。
一連のデータの流れが集約されています。
ETLとは
DWH(後述)にデータをロードする工程。具体的には抽出(Extract)、加工(Transform)、ロード(Load)の3つの処理に分かれる。

抽出(Extract)とは
抽出処理はシステムA、B、Cといった情報源となるシステムからデータを抽出することです。システムによってデータのフォーマットが異なる可能性があるため、抽出の段階で次の加工処理に適したフォーマットへ変換します。
加工(Transform)とは
抽出したデータを規則や関数を適用しDWHへ格納しやすい形に加工します。 第一段階処理で抽出したデータ がすでにDWHに見合った形式に変換されている場合は、この過程はスキップされる可能性もあります。
ロード(Load)とは
ロード処理ではデータをDWHにロードします。DWHへロードするタイミングなどは業務に依存します。最近では抽出、加工、ロード処理を一括で管理するETLツール( InformaticaPowerCenter 、 IBM InfoSphere DataStage etc…)を導入しロード処理を行うのが主流です。
参考サイト

DWHとは
Data Ware House (データウェアハウス)の略であり、企業にある様々なシステムにあるデータを一か所に集約すること。一か所に集約することで、データの分析、保管をしやすくなる。データの倉庫と表現されることも。

通常のデータベースでは一定期間が過ぎるとデータを削除する傾向にありますが、DWHではデータの削除は行わず、時系列に保管していきます。そのため、保存できる容量が大きいのが特徴です。
DWHの提唱者である ビル・インモン によるとDWHとは「 意志決定のため、目的別に編成された時系列に統合されたデータの集合体 」であると定義されています。ただ闇雲にデータを格納するのではなく「意思決定」のために、目的をもってデータを保管、管理することが大切です。
参考サイト

BIツールとは
BIとはBusiness Intelligence(ビジネスインテリジェンス)の略であり、企業などの日々蓄積される膨大なデータを分析し、その分析結果を利用し経営の意思決定を行うことを指す。

BIツールは膨大なデータを分析し、経営者の意思決定を手助けるツールです。Excelよりも分析や集計を簡単に素早く行うことができます。また、クラウドの活用などで情報を素早く共有するこも可能な製品もあります。このように、単なるデータを意味のある情報に変換し、素早く経営判断に利用するというのが、昨今の企業戦略であり、BIツールが必要とされる要因となっています。
BIツール比較
製品名 | 形式 | 機能 | コスト |
---|---|---|---|
Tableau | オンプレミス/クラウド | データマイティング・レポーティング・OLAP機能 | 有償 |
QlikQ | クラウド | データマイティング・レポーティング・OLAP機能 | 有償 |
MOTION BOARD | オンプレミス・クラウド | データ分析・レポーティング・プランニング | 有償 |
Microsoft Power BI | クラウド | データマイティング・レポーティング・OLAP機能 | 無償から利用可 |
Google Data Studio | クラウド | データマイティング・レポーティング・OLAP機能 | 無償から利用可 |
参考サイト

今回は、無償から利用可能なGoogle Data Studio を活用しコロナのレポート作成をしてみました↓↓
コメント