pyspark读取json文件中的内容
生活随笔
收集整理的這篇文章主要介紹了
pyspark读取json文件中的内容
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
?
代碼如下:
#-*- coding:utf- -*- import sys reload(sys) sys.setdefaultencoding('utf-8') from pyspark import SparkConf,SparkContext from pyspark.sql import SQLContext conf=SparkConf().setAppName("spark_json1") sc=SparkContext(conf=conf) sqlContext=SQLContext(sc)jsons=sqlContext.read.json("./testweet.json") print"type of jsons",type(jsons) print jsons.collect()#這個是把每個key-value對轉化為列表中的一個元素后輸出 print"-------------------------" jsons.printSchema() print"-------------------------" pandas_df = jsons.toPandas() print"type of pandas_df",type(pandas_df)#類型轉化<class 'pyspark.sql.dataframe.DataFrame'> -> <class 'pandas.core.frame.DataFrame'> {"lovesPandas":"lovesPandas","age":12} {"lovesPandas":"lili","age":22} {"lovesPandas":"cc","age":11} {"lovesPandas":"vv","age":13} {"lovesPandas":"lee","age":14} {"lovesPandas":"yuchi","age":14}?
總結
以上是生活随笔為你收集整理的pyspark读取json文件中的内容的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 输出省略号的问题
- 下一篇: 安装hive出现的各种问题(这些问题出现