sqoop数据倾斜_北京卓越讯通大数据岗位面试题分享
北京卓越訊通面試題
學長1
1)筆試
(1)JAVA支持的數據類型有哪些?什么是自動拆裝箱?
(2)AtomicInteger和Volatile等線程安全操作的關鍵字的理解個使用
(3)創建線程有幾種不同的方式?你喜歡哪一種?為什么?啟動線程調用什么方法?
(4)什么是死鎖(deadlock),如何確保N個線程可以訪問N個資源同時又不導致死鎖?
(5)JAVA中的HashMap的工作原理是什么?
(6)GC算法有哪些、垃圾回收器有哪些、如何調優JVM?
(7)JAVA中堆和棧有什么區別?
(8)Spring有哪些不同類型的IOC(依賴注入)方式?
(9)判斷下列表達式是否相等
String a = “abc”;String b = “abc”;String c = new String(“abc”);String d = “ab” + “c”;(10)常用的spring mvc 注解有哪些?
(11)Spring 框架中的單例bean是線程安全的嗎?為什么?
(12)Mysql單表數據量過大可以采取什么措施進行性能調優?
(13)請寫出二叉樹的遍歷算法
(14)寫出一個單例模式
2)面試題1
(1)pv量,數據量,集群規模
(2)ES分片
(3)Spark Streaming 特點
(4)項目組件的選擇,為什么用spark streaming 不用storm
(5) ALS模型參數調優
學長2
(1)做大數據多久?
(2)用過ES、OZ嗎
(3)ES集群多大?配置怎么樣?服務器配置?數據量?處理速度?ES做過什么優化?主要負責哪個模塊?項目的架構和工作流?
(4)你們的Flume怎么做數據監聽?有沒有做ETL?
(5)有沒有自己寫過UDF函數?寫的是什么UDF函數 功能?
(6) HiveSQL 轉MapReduce join 實現怎么處理join關系。寫程序,怎么實現兩個表join
(7)數據分析有沒有用過算法?
(8)在項目中主要的工作是什么
(9)整個工作流,架構的設計,集群搭建 ETL 數據展示能否獨立完成
(10)協同過濾、隨機森林、能不能靠自己經驗完成?
(11)項目中遇到的問題 特別的 怎么解決 哪個Bug 印象最深的部分
(12) wordCount 機制
(13)MapReduce怎么解決數據均衡問題 如何確定分區號
(14)提升多少效率 ?數據傾斜使用隨機數 + key打散原有的key
(15)項目中使用Hive的作用?建的是外表?
(16)有沒有試過OZ調度Sqoop
(17)集群的監控用的什么
(18)有沒有用過HDP CDH
(19)有沒有使用OZ調度hadoop任務
學長3
(1)公司的集群架構,每臺部署了什么東西
(2)介紹離線數倉的架構
(3)HDFS讀寫流程
(4)都做了哪些需求,最難的是哪個需求
(5)離線數倉,都有什么進程
(6)HQL常用的函數,HQL調優
(7)SparkStreaming集群架構
(8)數據洪峰怎么解決
(9)最難的是哪個需求,怎么做的
(10)怎么優化的,遇到過什么故障,怎么解決的
(11)用什么采集數據庫的,遇到過哪些問題
(12)為什么要用Flink
(13)做過哪些需求,哪個最有難度
(14)Flink項目遇到過什么難題,怎么解決的
(15)延遲大約多少
(16)FlinkSQL了解嗎?
(17)ES用過嗎,架構
(18)ES規模,文件存儲機制,設置幾個副本
(19)Flink需求,都實現精確一致性了嗎?怎么實現的,有沒有什么漏洞
(20)Phoenix二級索引用法,原理
(21)某張表,分庫存儲的,怎么采集?可能會遇到什么問題,怎么解決?
(22)哪里用過Redis,為什么要用Redis
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的sqoop数据倾斜_北京卓越讯通大数据岗位面试题分享的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: QT QNetworkInterface
- 下一篇: tcpip路由技术卷一_减少与开发的撕战