導入
データ ウェアハウス(またはビジネス インテリジェンス データベース、またはデータ ウェアハウス) という用語は、運用データベースから情報を収集、注文、記録、保存し、ビジネス意思決定のサポートを提供するために使用されるデータベースを指します。

定義と構築
データ ウェアハウスは、企業のすべての機能データをまとめたデータベースです。これはビジネスインテリジェンスの枠組みに含まれます。その目的は、レポートツールを介して作成された統計やレポートを通じて、社内の意思決定に使用される単一の参照として機能する一連のデータを提供することです。
アーキテクチャの観点から、それにアプローチするには 2 つの方法があります。
- トップダウンアーキテクチャ: Bill Inmon氏によると、データウェアハウスは詳細レベルのデータベースであり、企業のグローバルな集中リポジトリで構成されます。この点で、データをグループ化し、集約し、機能的にターゲットを絞るデータマートとは異なります。
- 「ボトムアップ」アーキテクチャ: Ralph Kimball 氏によると、データ ウェアハウスは会社のデータマートによって徐々に構成され、単一の同じ基盤内にさまざまなレベルの集約とデータ履歴がまとめられます。
最も一般的に受け入れられている定義は、これら 2 つの観点を組み合わせたものです。 「データ ウェアハウス」という用語はコンテナとコンテンツを含みます。これは、一方ではデータマートの元となるデータ ソースである詳細なベースを指し、他方ではこの詳細なベースとそのデータマートによって構成される全体を指します。同様に、現在の設計手法ではこれら 2 つのアプローチが考慮されており、各企業に固有のリスクと機会に応じて特定の側面が優先されます。
データウェアハウスの周り
上流
データ ウェアハウスの上流では、データをウェアハウスに供給するためのすべてのロジスティクスが行われます。
- 本番データの抽出、可能な変換とウェアハウスのロード(これは ETL または抽出、変換とロード、さらにはデータポンプです)。
- 渡す際に、データは以下によって精製または変換されます。
このデータ ウェアハウス フィードは、次の形式の運用トランザクション システムからのソース データに基づいています。
- イベントレポートまたは業務レポート: 業務 (購買、販売、会計入力など) の長期にわたる観察であり、会社の活動またはフローの映像です。
- 在庫レポートまたは在庫レポート: これは、在庫全体 (顧客、契約、注文、未処理…) の特定の瞬間(期間の終わり:月、四半期など) に撮影された写真画像です。
信頼性の高いデータ ウェアハウスの電源システムのセットアップは、多くの場合、ビジネス インテリジェンスプロジェクトで最も高価な予算項目です。

下流
データ ウェアハウス (および/またはデータ マート) の下流には、すべてのデータ復元および分析ツール (英語: Business Intelligence ) が配置されます。
- クエリまたはレポートツール
- 多次元立方体または超立方体
- データマイニング。
したがって、データ ウェアハウスの設計は常に進化するプロセスです。この角度から見ると、データ ウェアハウスは最終的に、異質性と変化の両方を管理できる意思決定アーキテクチャであり、その課題はデータを、関連する専門分野のユーザーが直接使用できる情報に変換することであると考えることができます。

