spark sql 解析嵌套对象数组的json - 知否问答 - 万象云+社区

val sqlContext = sc.sqlContext val behavior = sqlContext.read.json("behavior-json.log") behavior.cache() behavior.createOrReplaceTempView("behavior") val appActiveTime = sqlContext.sql("SELECT data FROM behavior") // sql查询 appActiveTime.show(100,100) // 打印dataFrame appActiveTime.rdd.foreach(println) // 打印rdd

+----------------------------------------------------------------------+ | data| +----------------------------------------------------------------------+ | [[60000,com.browser1], [12870000,com.browser]]| | [[60000,com.browser1], [120000,com.browser]]| | [[60000,com.browser1], [120000,com.browser]]| | [[60000,com.browser1], [1207000,com.browser]]| | [[120000,com.browser]]| | [[60000,com.browser1], [1204000,com.browser5]]| | [[60000,com.browser1], [12075000,com.browser]]| | [[60000,com.browser1], [120000,com.browser]]| | [[60000,com.browser1], [1204000,com.browser]]| | [[60000,com.browser1], [120000,com.browser]]| | [[60000,com.browser1], [1201000,com.browser]]| | [[1200400,com.browser5]]| | [[60000,com.browser1], [1200400,com.browser]]| |[[60000,com.browser1], [1205000,com.browser6], [1205000,com.browser7]]|

[WrappedArray([60000,com.browser1], [60000,com.browser1])] [WrappedArray([120000,com.browser])] [WrappedArray([60000,com.browser1], [1204000,com.browser5])] [WrappedArray([12075000,com.browser], [12075000,com.browser])]

回答动态