在Scala中,可以使用第三方库如Spark SQL或Play Json将JSON字符串转换为DataFrame。
以Spark SQL为例:
val spark = SparkSession.builder().appName("JSON to DataFrame").getOrCreate()
读取JSON文件,并将其转换为DataFrame:
val df = spark.read.json("path/to/json/file.json")
显示DataFrame的内容:
df.show()
如果JSON字符串是多行的,则可以使用SparkSession的read方法读取多行JSON字符串:
val jsonStrings = Seq("""{"name":"John", "age":30}""", """{"name":"Jane", "age":35}""")
val jsonRDD = spark.sparkContext.parallelize(jsonStrings)
val df = spark.read.json(jsonRDD)
然后可以调用show方法查看DataFrame的内容。