更新時間:2021年05月21日16時23分 來源:傳智教育 瀏覽次數(shù):
每個數(shù)據(jù)倉庫都包含一個或者多個事實數(shù)據(jù)表,事實表是對分析主題的度量,它包含了與各維度表相關聯(lián)的外鍵,并通過連接(Join)方式與維度表關聯(lián)。
事實表的度量通常是數(shù)值類型,且記錄數(shù)會不斷增加,表規(guī)模迅速增長。例如,現(xiàn)存在一張訂單事實表,其字段Prod_ id(商品id)可以關聯(lián)商品維度表、TimeKey(訂單時間)可以關聯(lián)時間維度表等。
維度表可以看作用戶分析數(shù)據(jù)的窗口,維度表中包含事實數(shù)據(jù)表中事實記錄的特性,有些特性提供描述性信息,有些特性指定如何匯總事實數(shù)據(jù)表數(shù)據(jù),以便為分析者提供有用的信息。
維度表包含幫助匯總數(shù)據(jù)的特性的層次結構,維度是對數(shù)據(jù)進行分析時特有的一個角度,站在不同角度看待問題,會有不同的結果。例如,當分析產(chǎn)品銷售情況時,可以選擇按照商品類別、商品區(qū)域進行分析,此時就構成一個類別、區(qū)域的維度。維度表信息較為固定,且數(shù)據(jù)量小,維度表中的列字段可以將信息分為不同層次的結構級。
猜你喜歡:
Spark SQL如何實現(xiàn)Hive數(shù)據(jù)倉庫的操作?