數據倉庫是從各種渠道收集和管理數據的技術,可提供有意義的業務洞察,戰略性地使用數據。

它用於查詢和分析而不是事務處理,是將數據轉換為信息並及時向用戶提供的過程。 決策支持資料庫(數據倉庫)與組織的運營資料庫分開維護。 但是數據倉庫不是產品,而是環境。 它是屬於信息系統,向用戶傳統運營數據存儲難以訪問或展示的當前和歷史決策支持信息。 數據倉庫是BI系統的核心,BI是為數據分析和報告而構建的。 你們很多人都知道,3NF設計的庫存系統資料庫很多都有相互關聯的表。 例如,有關當前庫存信息的報告可包含超過12個連接條件,查詢慢。 數據倉庫提供了一種新設計,可以縮短響應時間,提高報表和分析查詢的性能。

數據倉庫系統的其他名稱:

  • 決策支持系統(DSS Decision Support System)
  • 執行信息系統(Executive Information System)
  • 管理信息系統(Management Information System)
  • 商業智能解決方案(Management Information System)
  • 分析應用(Analytic Application)
  • 數據倉庫(Data Warehouse)

圖片.png 數據倉庫的歷史

數據倉庫使用戶能夠理解並提高其組織的績效。 隨著計算機系統變得越來越複雜並需要處理越來越多的信息,倉庫數據的需求也在不斷變化。

  • 1960年 - Dartmouth和General Mills在一個聯合研究項目中,提出了維度概念。
  • 1970 - Nielsen和IR為零售引入了維度數據。
  • 1983- Tera推出了專為決策支持而設計的資料庫管理系統
  • 數據倉庫始於20世紀80年代後期,當時IBM工作人員Paul Murphy和Barry Devlin開發了業務數據倉庫。
  • 然而,真正的概念是由Inmon Bill提出的。 他是數據倉庫之父。 他撰寫了關於倉庫和公司信息工廠的建設,使用和維護的各種主題。

Datawarehouse如何運作?

數據倉庫作為中央存儲庫,信息從一個或多個數據源到達。 數據從事務系統和其他關係資料庫流入數據倉庫。 數據可能是:
  1. 結構化的
  2. 半結構化
  3. 非結構化數據

處理,轉換和提取數據,以便用戶可以通過商業智能工具,SQL客戶端和電子表格訪問數據倉庫中的已處理數據。 數據倉庫將來自不同來源的信息合併到綜合資料庫中。

通過合併所有這些信息,組織可以更全面地分析其客戶。 這有助於確保它已考慮所有可用信息。 數據倉庫使數據挖掘成為可能。 數據挖掘旨在尋找可能導致更高銷售額和利潤的數據模式。 數據倉庫的類型 1.企業數據倉庫:

企業數據倉庫是一個集中式倉庫。 它為整個企業提供決策支持服務。 它提供了統一的方法來組織和表示數據。 它還提供根據主題對數據進行分類並根據這些劃分進行訪問的能力。

2.運營數據存儲: 只需要數據存儲的運營數據存儲(也稱為ODS Operational Data Store)。 在ODS中,數據倉庫實時刷新。 因此,它廣泛地用於諸如存儲僱員記錄等。 3.數據集市: 數據集市是數據倉庫的子集。 它專門針對特定業務部門而設計,例如銷售,財務,銷售或財務。 在獨立的數據集市中,數據可以直接從源收集。 數據倉庫的一般階段 離線操作資料庫: 在此階段,數據只是從運營系統複製到伺服器。 離線數據倉庫: 數據倉庫中的數據定期從運營資料庫更新。 數據倉庫中的數據經過映射和轉換,以滿足數據倉庫的目標。

實時數據倉庫:

運營資料庫中發生任何事務,就會更新數據倉庫。 例如,航空公司或鐵路預訂系統。 集成數據倉庫: 運營系統執行事務時,數據倉庫會不斷更新。 然後,Datawarehouse生成傳遞迴運營系統的事務。 數據倉庫的組件 數據倉庫的四個組成部分是: 載入管理器:載入管理器也稱為前端組件。 它執行與提取和載入數據到倉庫相關的所有操作。 這些操作包括轉換準備用於進入數據倉庫的數據。 倉庫管理:倉庫管理執行與倉庫中數據管理相關的操作。 它執行數據分析等操作,以確保一致性,索引和視圖的創建,非規範化和聚合的生成,源數據的轉換和合併以及歸檔和備份數據。 查詢管理器:查詢管理器 也被稱為後端組件。 它執行與用戶查詢管理相關的所有操作操作。 此數據倉庫組件的操作是對相應表的直接查詢。 最終用戶訪問工具:

這分為五個不同的組,如1.數據報告 2.查詢工具 3.應用程序開發工具 4. EIS工具 5.OLAP工具和數據挖掘工具。

餘下部分請訪問原文 china-testing.github.io


推薦閱讀:
相关文章