欢迎来到第壹文秘! | 帮助中心 分享价值,成长自我!
第壹文秘
全部分类
  • 幼儿/小学教育>
  • 中学教育>
  • 高等教育>
  • 研究生考试>
  • 外语学习>
  • 资格/认证考试>
  • 论文>
  • IT计算机>
  • 法律/法学>
  • 建筑/环境>
  • 通信/电子>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 第壹文秘 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    python-utf-8格式的文件转换gbk格式.docx

    • 资源ID:1209423       资源大小:9.44KB        全文页数:2页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    账号登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    快捷下载时,如果您不填写信息,系统将为您自动创建临时账号,适用于临时下载。
    如果您填写信息,用户名和密码都是您填写的【邮箱或者手机号】(系统自动生成),方便查询和重复下载。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    python-utf-8格式的文件转换gbk格式.docx

    需求:将utf-8格式的文件转换成gbk格式的文件实现代码如F:defKeadFiIe(fiIePath,CnCOdingutf-8"):withcodecs,open(fiIePath1r*,encoding)asf:returnf.readOdefWriteFiIe(fiIePath,u,encoding"gbk"):withcodecs.pen(fiIePath1w*,encoding)asf:f.write(u)defUTF8_2_GBK(SrC,dst):content=ReadFiIe(SrC,encoding="IHf-8”)WriteFi1.e(dst,content,encoding="gbk")心代码讲解:函数ReadFiIe的第二个参数指定以U1.1.8格式的编码方式读取文件,返回的结果content为Unicode然后,在将UniCode以gbk格式写入文件中。这样就能实现需求.但是,如果要转换格式的件中包含有一些字符并不包含在gbk字符集中的话,就会报错,类似如卜丁UnicodeEncodeError:'gbk'codeccan,tencodecharacteru,xa,inposition4813:i1.1.ega1.Bu1.tibytesequence以上的报钳信息的意思是:在将UniCode编码成gbk的时候,不能将UniCodeu'xa,编码成Rbke这里,我们需要弄清地gb2312、gbk和gb1.8030三者之间的关系GB2312:6763个汉字GBK:21003个汉字GB18030-2000:27533个汉字GB18030-2005:70244个汉字所以,GBK是GB2312的超集,GB18030是GBK的超集.理清了关系之后,我们进一步改进下代码:defUTF8_2GBK(src,dst):content=ReadFiIe(src,encoding=-utf-8)WriteFiIe(dst,content,CnCeding="gb18030")运行后,发现没有报错,可以正常运行。因为,在GB18030字符集中,可以找到u,xa,对应的字符。此外,还有另外一种实现方案:需要修改下WriIeFiIe方法defWriteFi1.e(fiIePath,u,encoding="gbk"):withcodecs.open(fiIePath1w*)asf:.wri1.e(u.encode(encoding,errors=*ignore*)这里,我们将UniCOde编码(encode)成gbk格式,但是注意encode函数的笫二个参数,我们赋值"ignore",表示在编码的时候,忽略掉那些无法编码的字符,解码同理。但是,当我们执行后,发现可以成功的将Utf-8格式的文件修改成了ansi格式。但,另外发现生成的文件中,每个行都有一行空行。这里,可以指定以二进制流的形式与文件,修改后的代码如下:<1.efWriteFiIe(fiIePath,u,encoding="gbk"):withcodecs.open(fiIePath1,wb,)asf:f.write(u.encode(encoding,errors=*ignore*)

    注意事项

    本文(python-utf-8格式的文件转换gbk格式.docx)为本站会员(p**)主动上传,第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第壹文秘(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 1wenmi网站版权所有

    经营许可证编号:宁ICP备2022001189号-1

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!

    收起
    展开