点击上方“共享之家”,进行关注
回复“资源”即可获赠学习资料
今
日
鸡
汤
千呼万唤始出来,犹抱琵琶半遮面。
大家好,我是皮皮。
一、前言
前几天在白银群【凡人不烦人】问了一个编码的问题,这里拿出来给大家分享下。
二、实现过程
这里大家一起来学习下。在中,='utf-8-sig' 是一种编码格式,用于指定字符串的编码方式。
具体来说,utf-8-sig 编码格式是 utf-8 编码的一种变体,它通过在字节序列的末尾添加一个 BOM(Byte Order Mark) 来标识文本文件的编码方式。BOM 是用来标识文本文件的字节顺序的标记,通常是一个不可见的字符序列,用于告诉计算机该文件采用的是哪种字节顺序。
在 2.x 版本中,默认使用 ASCII 编码来处理文本文件,这可能会导致在处理非 ASCII 字符时出现问题。为了解决这个问题, 2.x 引入了 utf-8 编码,并将 utf-8 作为默认编码方式。但是,由于 utf-8 不包含 BOM,因此在处理文本文件时需要额外添加一个 BOM 才能正确地确定文件的编码方式。
为了解决这个问题#-*-coding:utf-8-*-, 3.x 引入了 utf-8-sig 编码格式,它包含了一个特殊的字节序列 ufeff,用于表示文件采用的是 UTF-8 编码。这样一来,在处理文本文件时就不需要再额外添加一个 BOM 了。
总之,='utf-8-sig' 表示使用 utf-8-sig 编码格式来处理文本文件,以确保能够正确地识别文件的编码方式。
这里【甯同学】和【此类生物】还补充了部分:
三、总结
大家好#-*-coding:utf-8-*-,我是皮皮。这篇文章主要盘点了一个字符串替换的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【凡人不烦人】提问,感谢【进阶者】、【甯同学】、【此类生物】给出的思路和代码解析,感谢【冯诚】等人参与学习交流。
【提问补充】温馨提示,大家在群里提问的时候。可以注意下面几点:如果涉及到大文件数据,可以数据脱敏后,发点demo数据来(小文件的意思),然后贴点代码(可以复制的那种),记得发报错截图(截全)。代码不多的话,直接发代码文字即可,代码超过50行这样的话,发个.py文件就行。