神魂顛倒論壇logo

icon
首頁Microsoft 應用技術區資料庫 MS SQL → 資料庫與資料倉庫的區別詳細介紹

雷射溶脂 | 瘦小腹 | 植髮 | 眼袋 | 玻尿酸 | 電波拉皮 | Flash | 購物車 | Flash Player 11.2 | 豐胸 |

下一主題 上一主題


資料庫與資料倉庫的區別詳細介紹


資料庫與資料倉庫的區別詳細介紹 簡版






資料庫與資料倉庫的區別詳細介紹

簡而言之,資料庫是面向事務的設計,資料倉庫是面向主題設計的。資料庫一般儲存線上交易資料,資料倉庫儲存的一般是歷史資料。

資料庫設計是盡量避免冗余,一般採用符合範式的規則來設計,資料倉庫在設計是有意引入冗余,採用反範式的方式來設計。

資料庫是為捕獲資料而設計,資料倉庫是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的ID。


單從概念上講,有些晦澀。任何技術都是為應用服務的,結合應用可以很容易地理解。以銀行業務為例。資料庫是事務系統的資料平台,客戶在銀行做的每筆交易都會寫入資料庫,被記錄下來,這裡,可以簡單地理解為用資料庫記帳。資料倉庫是分析系統的資料平台,它從事務系統取得資料,並做匯總、加工,為決策者提供決策的依據。比如,某銀行某分行一個月發生多少交易,該分行目前存款餘額是多少。如果存款又多,消費交易又多,那麼該地區就有必要設立ATM了。


顯然,銀行的交易量是巨大的,通常以百萬甚至千萬次來計算。事務系統是實時的,這就要求時效性,客戶存一筆錢需要幾十秒是無法忍受的,這就要求資料庫只能儲存很短一段時間的資料。而分析系統是事後的,它要提供關注時間段內所有的有效資料。這些資料是海量的,匯總計算起來也要慢一些,但是,只要能夠提供有效的分析資料就達到目的了。


資料倉庫,是在資料庫已經大量存在的情況下,為了進一步挖掘資料資源、為了決策需要而產生的,它決不是所謂的「大型資料庫」。那麼,資料倉庫與傳統資料庫比較,有哪些不同呢?讓我們先看看W.H.Inmon關於資料倉庫的定義:面向主題的、集成的、與時間相關且不可修改的資料集合。


「面向主題的」:傳統資料庫主要是為應用程式進行資料處理,未必按照同一主題儲存資料;資料倉庫側重於資料分析工作,是按照主題儲存的。這一點,類似於傳統農貿市場與超市的區別—市場裡面,白菜、蘿蔔、香菜會在一個攤位上,如果它們是一個小販賣的;而超市裡,白菜、蘿蔔、香菜則各自一塊。也就是說,市場裡的菜(資料)是按照小販(應用程式)歸堆(儲存)的,超市裡面則是按照菜的類型(同主題)歸堆的。


「與時間相關」:資料庫儲訊息的時候,並不強調一定有時間訊息。資料倉庫則不同,出於決策的需要,資料倉庫中的資料都要標明時間屬性。決策中,時間屬性很重要。同樣都是累計購買過九車產品的顧客,一位是最近三個月購買九車,一位是最近一年從未買過,這對於決策者意義是不同的。


「不可修改」:資料倉庫中的資料並不是最新的,而是來源於其它資料來源。資料倉庫反映的是歷史訊息,並不是很多資料庫處理的那種日常事務資料(有的資料庫例如電信計費資料庫甚至處理實時訊息)。因此,資料倉庫中的資料是極少或根本不修改的;當然,向資料倉庫新增資料是允許的。


資料倉庫的出現,並不是要取代資料庫。目前,大部分資料倉庫還是用關係資料庫管理系統來管理的。可以說,資料庫、資料倉庫相輔相成、各有千秋。


補充一下,資料倉庫的方案建設的目的,是為前端查詢和分析作為基礎,由於有較大的冗余,所以需要的儲存也較大。為了更好地為前端應用服務,資料倉庫必須有如下幾點優點,否則是失敗的資料倉庫方案。


1.效率足夠高。客戶要求的分析資料一般分為日、周、月、季、年等,可以看出,日為週期的資料要求的效率最高,要求24小時甚至12小時內,客戶能看到昨天的資料分析。由於有的企業每日的資料量很大,設計不好的資料倉庫經常會出問題,延遲1-3日才能給出資料,顯然不行的。


2.資料質量。客戶要看各種訊息,肯定要準確的資料,但由於資料倉庫流程至少分為3步,2次ETL,複雜的架構會更多層次,那麼由於資料來源有髒資料或者程式碼不嚴謹,都可以導致資料失真,客戶看到錯誤的訊息就可能導致分析出錯誤的決策,造成損失,而不是效益。


3.擴充性。之所以有的大型資料倉庫系統架構設計複雜,是因為考慮到了未來3-5年的擴充性,這樣的話,客戶不用太快花錢去重建資料倉庫系統,就能很穩定執行。主要體現在資料建模的合理性,資料倉庫方案中多出一些中間層,使海量資料流有足夠的緩衝,不至於資料量大很多,就執行不起來了。





瘦小腹 | 回到頂部
Icon
網路的事情,讓網路解決

[ 逛網路就像是在探險 ]

    神 魂 顛 倒 T W G

http://bbs.flash2u.com.tw

http://tw.myblog.yahoo.com/flash2u-twg

http://flash-silverlight.blogspot.com/

http://flash2u.spaces.live.com/?_c02_owner=1

資料庫與資料倉庫的區別詳細介紹 簡版






資料庫與資料倉庫的區別詳細介紹

簡而言之,資料庫是面向事務的設計,資料倉庫是面向主題設計的。資料庫一般儲存線上交易資料,資料倉庫儲存的一般是歷史資料。

資料庫設計是盡量避免冗余,一般採用符合範式的規則來設計,資料倉庫在設計是有意引入冗余,採用反範式的方式來設計。

資料庫是為捕獲資料而設計,資料倉庫是為分析資料而設計,它的兩個基本的元素是維表和事實表。維是看問題的角度,比如時間,部門,維表放的就是這些東西的定義,事實表裡放著要查詢的資料,同時有維的ID。


單從概念上講,有些晦澀。任何技術都是為應用服務的,結合應用可以很容易地理解。以銀行業務為例。資料庫是事務系統的資料平台,客戶在銀行做的每筆交易都會寫入資料庫,被記錄下來,這裡,可以簡單地理解為用資料庫記帳。資料倉庫是分析系統的資料平台,它從事務系統取得資料,並做匯總、加工,為決策者提供決策的依據。比如,某銀行某分行一個月發生多少交易,該分行目前存款餘額是多少。如果存款又多,消費交易又多,那麼該地區就有必要設立ATM了。


顯然,銀行的交易量是巨大的,通常以百萬甚至千萬次來計算。事務系統是實時的,這就要求時效性,客戶存一筆錢需要幾十秒是無法忍受的,這就要求資料庫只能儲存很短一段時間的資料。而分析系統是事後的,它要提供關注時間段內所有的有效資料。這些資料是海量的,匯總計算起來也要慢一些,但是,只要能夠提供有效的分析資料就達到目的了。


資料倉庫,是在資料庫已經大量存在的情況下,為了進一步挖掘資料資源、為了決策需要而產生的,它決不是所謂的「大型資料庫」。那麼,資料倉庫與傳統資料庫比較,有哪些不同呢?讓我們先看看W.H.Inmon關於資料倉庫的定義:面向主題的、集成的、與時間相關且不可修改的資料集合。


「面向主題的」:傳統資料庫主要是為應用程式進行資料處理,未必按照同一主題儲存資料;資料倉庫側重於資料分析工作,是按照主題儲存的。這一點,類似於傳統農貿市場與超市的區別—市場裡面,白菜、蘿蔔、香菜會在一個攤位上,如果它們是一個小販賣的;而超市裡,白菜、蘿蔔、香菜則各自一塊。也就是說,市場裡的菜(資料)是按照小販(應用程式)歸堆(儲存)的,超市裡面則是按照菜的類型(同主題)歸堆的。


「與時間相關」:資料庫儲訊息的時候,並不強調一定有時間訊息。資料倉庫則不同,出於決策的需要,資料倉庫中的資料都要標明時間屬性。決策中,時間屬性很重要。同樣都是累計購買過九車產品的顧客,一位是最近三個月購買九車,一位是最近一年從未買過,這對於決策者意義是不同的。


「不可修改」:資料倉庫中的資料並不是最新的,而是來源於其它資料來源。資料倉庫反映的是歷史訊息,並不是很多資料庫處理的那種日常事務資料(有的資料庫例如電信計費資料庫甚至處理實時訊息)。因此,資料倉庫中的資料是極少或根本不修改的;當然,向資料倉庫新增資料是允許的。


資料倉庫的出現,並不是要取代資料庫。目前,大部分資料倉庫還是用關係資料庫管理系統來管理的。可以說,資料庫、資料倉庫相輔相成、各有千秋。


補充一下,資料倉庫的方案建設的目的,是為前端查詢和分析作為基礎,由於有較大的冗余,所以需要的儲存也較大。為了更好地為前端應用服務,資料倉庫必須有如下幾點優點,否則是失敗的資料倉庫方案。


1.效率足夠高。客戶要求的分析資料一般分為日、周、月、季、年等,可以看出,日為週期的資料要求的效率最高,要求24小時甚至12小時內,客戶能看到昨天的資料分析。由於有的企業每日的資料量很大,設計不好的資料倉庫經常會出問題,延遲1-3日才能給出資料,顯然不行的。


2.資料質量。客戶要看各種訊息,肯定要準確的資料,但由於資料倉庫流程至少分為3步,2次ETL,複雜的架構會更多層次,那麼由於資料來源有髒資料或者程式碼不嚴謹,都可以導致資料失真,客戶看到錯誤的訊息就可能導致分析出錯誤的決策,造成損失,而不是效益。


3.擴充性。之所以有的大型資料倉庫系統架構設計複雜,是因為考慮到了未來3-5年的擴充性,這樣的話,客戶不用太快花錢去重建資料倉庫系統,就能很穩定執行。主要體現在資料建模的合理性,資料倉庫方案中多出一些中間層,使海量資料流有足夠的緩衝,不至於資料量大很多,就執行不起來了。





雷射溶脂 | 回到頂部
Icon
網路的事情,讓網路解決

[ 逛網路就像是在探險 ]

    神 魂 顛 倒 T W G

http://bbs.flash2u.com.tw

http://tw.myblog.yahoo.com/flash2u-twg

http://flash-silverlight.blogspot.com/

http://flash2u.spaces.live.com/?_c02_owner=1

簡版






管理大哥你的說明實在太精采了
想必是個寫資料庫的高手<
有機會請你親自操刀設計





購物車 | 回到頂部

簡版






管理大哥你的說明實在太精采了
想必是個寫資料庫的高手<
有機會請你親自操刀設計





購物車 | 回到頂部

簡版






在網路上找到的介紹
都是看到花貓貓
這裡的介紹
都寫得很少
至少能解開我一些疑問
不過還是不會寫
希望能多看到這樣詳細的解說



自體脂肪隆乳 | 回到頂部
下一主題 上一主題