数据清洗RDD转化为DF时要将ROW(0)过滤掉

当我们用spark做数据清洗时,将RDD转化为DataFrame,如果某些字段中含空值,或者与我们的字段不匹配,就会报如下的错误

java.lang.Integer is not a valid external type for schema of string

在代码中加入 val accessDF = spark.createDataFrame(accessRDD.map(x => AccessConvertUtil.parseLog(x)).filter(x=> x.equals(Row(0)).unary_!), AccessConvertUtil.struct),把Row(0)过滤掉,就可以了


版权声明:本文为qq_34341930原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。