阿帕奇跨域_阿帕奇光束
生活随笔
收集整理的這篇文章主要介紹了
阿帕奇跨域_阿帕奇光束
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
阿帕奇跨域
Apache Beam是一個開放源代碼統一模型,用于定義批處理和流數據并行處理管道。 使用一種開源的Beam SDK,您可以構建一個定義管道的程序。 然后,該管道由Beam支持的分布式處理后端之一執行,這些后端包括Apache Apex , Apache Flink , Apache Spark和Google Cloud Dataflow 。
Beam對于令人尷尬的并行數據處理任務特別有用,在該任務中,問題可以分解為許多較小的數據束,可以獨立和并行處理。 您還可以將Beam用于提取,轉換和加載(ETL)任務以及純數據集成。 這些任務對于在不同的存儲介質和數據源之間移動數據,將數據轉換為更理想的格式或將數據加載到新系統上非常有用。
Apache Beam管道運行器
Beam Pipeline Runners將您使用Beam程序定義的數據處理管道轉換為與您選擇的分布式處理后端兼容的API。 運行Beam程序時,需要為要在其中執行管道的后端指定適當的運行器。
Beam當前支持與以下分布式處理后端一起使用的Runner:
- Apache Apex
- Apache Flink
- Apache Gearpump(正在孵化)
- Apache Spark
- Google Cloud Dataflow
[1] https://beam.apache.org
翻譯自: https://www.javacodegeeks.com/2018/02/apache-beam.html
阿帕奇跨域
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的阿帕奇跨域_阿帕奇光束的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 小米Watch 2 Pro配置及渲染图曝
- 下一篇: 2017年最大的素数(2017年最大dd