DataWorks百问百答01:数据同步该用什么资源组
生活随笔
收集整理的這篇文章主要介紹了
DataWorks百问百答01:数据同步该用什么资源组
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
引子
很多用戶在使用數據集成建立同步任務時,往往都會困惑一個設置,即“資源組設置”。
大家常有的疑問是“資源組是用來做什么的?跟網絡之間什么關系?我該選擇那種資源組?”
下面本文給您一個簡要的介紹。
?
什么是資源組
資源組是數據集成用來運行數據同步任務的計算資源,可以通俗的理解為“帶有CPU、內存和網絡的計算機或計算機集群”。同步任務就是運行在上面的“程序”。所以如果機器性能低或者運行的程序過多,都會導致任務執行效率,而有如果機器的網絡不通,那么也會出現連接不到數據源的問題。
對比和推薦
數據集成有三種資源組:公共資源組(又稱默認資源組)、獨享資源組、自定義資源組。它們適用的場景不同,您在做數據同步時可以根據自己實際的需求來選擇。具體請參考下表
| 機器資源歸屬 | DataWorks維護 所有租戶競爭使用的共享資源 | DataWorks維護 自己租戶獨享使用的計算資源 | 客戶自己的IDC機器,客戶自己維護 |
| DataWorks版本要求 | 所有版本均支持 | 所有版本均支持 | 只有專業版及以上才支持 |
| 網絡 | 支持經典網絡 支持公網 支持阿里云內產品 | 支持VPC 支持公網 支持阿里云內產品 | 支持VPC 支持公網 支持阿里云內產品 |
| 收費方式 | 按任務實例量階梯計費 | 按機器規格包年包月計費 | DataWorks版本按月使用費 |
| 支持數據源 | 部分數據源 | 全部數據源 | 全部數據源 |
| 安全性 | 高 | 高 | 視客戶自身機器環境而定 |
| 任務執行效率* | 低 | 高 | 視客戶自身機器環境而定 |
| 可靠性* | 低 | 高 | 視客戶自身機器環境而定 |
| 適合場景 | 適用于做一些非重要、非緊急的少量、零散任務,或者測試性任務。 | 適合于大量、重要的生產級別任務。 | 自身已有資源利舊,或者同步的數據源全部都在IDC內 |
| 推薦指數 | ★★ | ★★★★★ | ★ |
任務執行效率:是指任務是否能分到足夠的計算資源,能否以最高性能運行。
可靠性:是指任務是否能按時啟動,執行時網絡資源是否被其他租戶所占據,而導致任務不能按時產出結果。
自定義資源組:此處僅指“用于數據集成的自定義資源組”,并不是“用于調度的自定義資源組”。
結論
所以綜合來看對于大多數正常需求的用戶來說“獨享資源組”是最佳選擇。
DataWorks百問百答歷史記錄請點擊查看
更多DataWorks技術和產品信息,歡迎加入【DataWorks釘釘交流群】
原文鏈接
本文為云棲社區原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的DataWorks百问百答01:数据同步该用什么资源组的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 漫画通信:一图看懂通信发展史
- 下一篇: 【深度学习】基于 Alluxio 数据缓