Spark保存的时候怎么去掉多余的引号转义 - 凝望远处的天鹅

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

温文尔雅的领带 · NX CAM 3 轴铣削 | ...· 2 周前 ·

暴走的橡皮擦 · SOLIDWORKS教程_SOLIDWORK ...· 3 周前 ·

热心的春卷 · 公司简介 | 捷恩智液晶材料（苏州）有限公司· 3 周前 ·

谈吐大方的山楂 · 合肥市六安路小学翠微分校春苗童声合唱团荣获安 ...· 1 月前 ·

冲动的火车 · 《星际迷航 STAR TREK》观看顺序 ...· 2 月前 ·

保存后的数据长这样(用\t分割)：

data    "{\"key\": \"impl\", \"version\": \"1.0\"}"

于是乎一番查找Spark文档，尝试添加这个选项之后，option('escapeQuotes', False)，关闭引号转义，如此引号就不会被转义，结果如下：

data    {"key": "impl", "version": "1.0"}

同样尝试了用RDD去保存，也不会出现双引号被转义的问题，只是用SparkSQL或者DataFrame的时候才会出现被双引号被转义的情况。

PySpark代码如下，spark公共变量请大佬们自己创建：

# encoding = utf-8
import json
from utils import *
def t1():
    spark和sc变量放在utils文件里面
    :return:
    data = ('data', json.dumps({'key': 'impl', 'version': '1.0'}))
    df = sc.parallelize([data], 1).toDF(['key', 'value'])
    df.write.mode('overwrite').option('sep', '\t').option('escapeQuotes', False).csv(file_save)
if __name__ == '__main__':
    spark.stop()

推荐文章

温文尔雅的领带 · NX CAM 3 轴铣削 | Siemens Software

2 周前

暴走的橡皮擦 · SOLIDWORKS教程_SOLIDWORKS视频,文章教程_资源下载_智诚科技ICT

3 周前

热心的春卷 · 公司简介 | 捷恩智液晶材料（苏州）有限公司

3 周前

谈吐大方的山楂 · 合肥市六安路小学翠微分校春苗童声合唱团荣获安徽省第七届中小学艺术展演一等奖-新华丝路

1 月前

冲动的火车 · 《星际迷航 STAR TREK》观看顺序 (持续更新) | CooperMeta - 关于效率工具、前沿科技、科幻、认知提升、艺术的小站

2 月前