跟我一起数据挖掘(10)——HP Vertica
考慮到企業數據倉庫的重要戰略意義(EDWs)和每年投入的巨額維護和擴展費用,如何容易地訪問這些大量信息資產是非常迫切的需求。然而,許多EDWs成為自己成功的受害者。隨著時間的推移,用戶獲取新問題答案的需要導致EDWs包含的數據量和復雜數據類型發生迅速增長,同時也帶來更多的并發和復雜分析的壓力。如果企業級數據倉庫變得無法應付這種變化,或者服務水平協議(SLA)不能滿足用戶的要求,企業則往往不得不進行昂貴的數據庫重新設計或硬件平臺遷移擴容項目,這往往需要持續好多個月以及帶來大量成本損失。即使如此新的架構也往往由于數據量增加得太快(目前已經有大量的客戶從TB向PB級別擴展),而導致系統不得不進行更多的優化,這些優化需要占用大量的磁盤存儲,帶來了存儲浪費和I/O瓶頸的問題。因此如何解決在以往EDWs架構保持不變的狀況下來滿足新的實時性分析應用的需要成為技術創新的重要領域。Vertica正是這一領域的積極創新先鋒。
下面這篇文章對vertica和inforbright進行了對比:
http://blog.csdn.net/zyz511919766/article/details/27682709
下面是關于建庫和建表的示例:
http://www.cnblogs.com/jyzhao/p/3779045.html
關于管理部分可以參考:
http://www.cnblogs.com/jyzhao/p/3798363.html
實測的過億條數據,在單表查詢的情況下,性能非常理想,推薦一下!
總結
以上是生活随笔為你收集整理的跟我一起数据挖掘(10)——HP Vertica的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Linux安全】安全口令策略设置
- 下一篇: Hadoop中RPC机制详解之Serve