春天遇见Apache Hadoop
SpringSource 剛剛宣布了適用于Apache Hadoop的Spring的第一個GA版本 。 該項目的目的是簡化基于Hadoop的應用程序的開發。
您可以下載該項目在這里 ,并檢查了Maven的文物在這里 。
Apache Hadoop的Spring誕生是為了解決Hadoop應用程序構建不良的問題,該應用程序通常由命令行實用程序,腳本和代碼段組成。 正如Spring項目所期望的那樣,它為廣泛的Hadoop生態系統項目提供了一致的編程和配置模型。
這里還包含了眾所周知的Template API設計模式,因此該框架包括以下類:
- HBase模板
- HiveTemplate
- 豬模板
另一個受歡迎的方面是從小規模開始發展為復雜解決方案的方法。 因此,Spring for Hadoop引入了各種Runner類,這些類允許執行Hive , Pig腳本,香草Map / Reduce或Streaming 作業 ,層疊流,還可以通過熟悉的JDK Callable合同調用基于JVM的通用前后腳本 。
當事情變得越來越復雜時,升級到Spring Batch變得簡單而容易。 Spring Batch豐富的功能可用于處理大文件的ETL處理,可直接轉換為Hadoop用例,以從HDFS提取和導出文件。
此外,將Spring Hadoop與Spring Integration結合使用,可以對事件流進行豐富的處理,這些事件流可以在從HDFS或其他存儲(例如NoSQL存儲)讀取和寫入之前進行轉換,豐富,過濾, Spring Data為此提供了很多支持。
要啟動您的應用程序,您可以從提供的示例應用程序開始(已編譯并可以下載)。 如果您測試Hadoop的Spring驅動器,請讓我們知道并分享知識 。
編碼愉快!
翻譯自: https://www.javacodegeeks.com/2013/02/spring-meets-apache-hadoop.html
總結
以上是生活随笔為你收集整理的春天遇见Apache Hadoop的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 不要仅仅依靠单元测试
- 下一篇: 阮氏三雄名字的含义(水浒传阮氏三雄的名字