spark-sql 方差和标准差
生活随笔
收集整理的這篇文章主要介紹了
spark-sql 方差和标准差
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
運行環境spark-shell
val p=spark.read.json("file:///root/spark-2.1.1-bin-hadoop2.7/examples/src/main/resources/people.json")p.show方差和標準差
1. 求age平均值
2.udf的函數
def subtraction2(variable:String):Double={ (variable.toDouble-avgvule)*(variable.toDouble-avgvule)}3.注冊ufd函數
spark.udf.register("square",subtraction2 _)4.方差運行
sql("select sum(square(age))/count(square(age)) as variance from people").createTempView("variance")5.標準差
sql("select sqrt(*) from variance").show最近發現 spark sql 自帶了方差和標準差的內置函數,自己重新卻重寫了一次。
總結
以上是生活随笔為你收集整理的spark-sql 方差和标准差的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据存储之SwiftJSON
- 下一篇: 手把手教你设计数字钟(基于protues