flink的分桶策略BucketAssigner与hive的分区的对应关系
生活随笔
收集整理的這篇文章主要介紹了
flink的分桶策略BucketAssigner与hive的分区的对应关系
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
分桶策略在代碼withBucketAssigner中設定
?
| ? | Flink寫入hive | Hive |
| 分桶策略 | 寫入hive中的一個文件夾 | 保存在文件 |
| 分區(qū) | 指的是如何分配到下游算子中進行計算[2] | 保存在文件夾 |
?
也就是說flink的寫入分桶和hive的分桶不是一個概念。
其中的flink分區(qū)是用來 流/離線 計算的
?
| 分桶策略[1] | 作用 |
| BasePathBucketAssigner | 不分桶,所有文件寫到根目錄 |
| DateTimeBucketAssigner | 基于系統(tǒng)時間分桶 |
Reference:
[1]學習 Flink(十六):Streaming Parquet File
[2]Flink分區(qū)策略
總結
以上是生活随笔為你收集整理的flink的分桶策略BucketAssigner与hive的分区的对应关系的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 关于flink的setCommitOff
- 下一篇: flink中写入行存储、列存储时设定ch