python将目录下的所有文件转换成UTF-8 without BOM编码格式 - 刘林的博客

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

风流的足球 · 日本无条件投降日_百度百科· 5 天前 ·

英俊的豆芽 · [Solved]GL ES don't ...· 1 月前 ·

潇洒的野马 · Sequential ...· 4 月前 ·

老实的充值卡 · C#如何通过同步和异步多线程来读取sqlse ...· 4 月前 ·

一直单身的小刀 · 开通3条地铁新线 ...· 6 月前 ·

脚本如下，逻辑是读取根目录下的所有文件，以UTF-8 with BOM的编码格式打开，然后以UTF-8 without BOM的编码格式保存。如果文件本身是UTF-8 with BOM的编码格式，被处理后会将前面3个字节去掉。如果文件本身是UTF-8 without BOM的编码格式，那么会先以UTF-8 with BOM的编码格式打开（会在前面新增3个字节），然后再以UTF-8 without BOM的编码格式保存（去掉前面新增的3个字节），所以最终的结果是所有文件都被修改为UTF-8 without BOM的编码格式了。

import os
root_path = r"E:\haha"
count = 0
for path, subdirs, files in os.walk(root_path):
    for name in files:
        file = os.path.join(path, name)
        print(file)
        s = open(file, mode='r', encoding='utf-8-sig').read() # UTF-8 with BOM
        open(file, mode='w', encoding='utf-8').write(s) # UTF-8 without BOM
        count +=1
print("共",count,"个文件，转换完毕")
UTF-8 without BOM的文件示例（以16进制打开）
UTF-8 with BOM的文件示例（以16进制打开），可以看到前面多了3个字节，后面的内容和上面一样

推荐文章

风流的足球 · 日本无条件投降日_百度百科

5 天前

英俊的豆芽 · [Solved]GL ES don't support 'switch' keyword in shader program - Ogre Forums

1 月前

潇洒的野马 · Sequential Consistency，Cache-Coherence及Memory barrier - Kongfy's Blog

4 月前

老实的充值卡 · C#如何通过同步和异步多线程来读取sqlserver数据库表里的内容 - CSDN文库

4 月前

一直单身的小刀 · 开通3条地铁新线近9成公交站50米内可换地铁 2024年—— 中心城区绿色出行比例力争达75％_部门动态_首都之窗_北京市人民政府门户网站

6 月前