大数据学长面试之瓜子二手车面试题
生活随笔
收集整理的這篇文章主要介紹了
大数据学长面试之瓜子二手车面试题
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
大數(shù)據(jù)學(xué)長(zhǎng)面試之瓜子二手車面試題
1)技術(shù)部分
(1)優(yōu)化必問(wèn) hive/spark
(2)為什么kafka可以實(shí)現(xiàn)高吞吐?單節(jié)點(diǎn)kafka的吞吐量也比其他消息隊(duì)列大,為什么?
(3)如果寫了JVM調(diào)優(yōu):堆內(nèi)存溢出如何查看解決,用的那些命令工具;CMS和G1有什么不同?
(4)Hive自定義那些UDF函數(shù)
(5)Spark那些算子是在map端聚合的
(6)Kafka的偏移量offset存放在哪兒,為什么?
(7)Linux命令 查看內(nèi)存、磁盤、IO、端口、進(jìn)程
2)算法部分
(1)鏈表轉(zhuǎn)置/二叉樹轉(zhuǎn)置
3)情景部分
(1)一個(gè)字符串"jasonbbtomccjackddfftomkk",如果相鄰兩個(gè)字符相同視為一個(gè)切分點(diǎn),實(shí)現(xiàn)WordCount(注意會(huì)有多個(gè)連續(xù)相同的情況如aabbccdd,還有要問(wèn)清出現(xiàn)三個(gè)或者多個(gè)怎么算)
總結(jié)
以上是生活随笔為你收集整理的大数据学长面试之瓜子二手车面试题的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 2014 C专科C组第五题 套娃
- 下一篇: 直扩同步的跟踪 matlab,基于FPG