更新時間:2021年06月11日16時23分 來源:傳智教育 瀏覽次數(shù):
在數(shù)據(jù)倉庫建設(shè)中,一般會圍繞著星型模型和雪花模型來設(shè)計數(shù)據(jù)模型。下面我們先來理解這兩種模型的概念。
1.星型模型
在數(shù)據(jù)倉庫建模中,星星模型是維度建模中的一種選擇方式。星型模型是以一個事實表和一組維度表組合而成,并且以事實表為中心,所有的維度表直接與事實表相連。接下來,通過一張圖來描述星型模型,如圖1所示。
圖1 星型模型
在圖1中,所有的維度表都直接連接到事實表上,維度表的主鍵放置在事實表中,作為事實表與維度表連接的外鍵,因此,維度表和事實表是有關(guān)聯(lián)的,然而,維度表與維度表并沒有直接相連,因此,維度表之間是并沒有關(guān)聯(lián)的。
2.雪花型模型
雪花模型也是維度建模中的另一種選擇,它是對星型模型的擴展,雪花模型如圖2所示。
圖2 雪花模型
從圖2中可以看出,雪花模型的維度表可以擁有其他的維度表,并且維度表與維度表之間是相互關(guān)聯(lián)的。因此,雪花模型相比星型模型更規(guī)范一些。但是,由于雪花模型需要關(guān)聯(lián)多層的維度表,因此,性能也比星型模型要低,所以一般不是很常用。
Spark SQL如何實現(xiàn)Hive數(shù)據(jù)倉庫的操作?