Pythonprint正确使用方法浅析

Python编程语言是一款比较新颖的编程语言,相对于其他语言来说,有很多不同的特点引起了大多数开发人员的兴趣。在这里我们可以先从Python print的相关应用方法来分析,初步了解这一语言的应用方式。

专注于为中小企业提供网站制作、成都网站设计服务,电脑端+手机端+微信端的三站合一,更高效的管理,为中小企业昭化免费做网站提供优质的服务。我们立足成都,凝聚了一批互联网行业人才,有力地推动了上千余家企业的稳健成长,帮助中小企业通过网站建设实现规模扩充和转变。

Python print会对输出的文本做自动的编码转换,而文件对象的write方法就不会做,因此,当一些字符串用print输出正常时,write到文件确不一定和print的一样。print转换的目的编码和环境变量有关,Windows XP是转换为gbk的。在linux下是按照环境变量来转换的。在linux下使用locale命令就可以看到。比如我的是:

 
 
 
  1. [zhaowei@papaya zhaowei]$ locale  
  2. LANG=zh_CN 
  3. LC_CTYPE="zh_CN" 
  4. LC_NUMERIC="zh_CN" 
  5. LC_TIME="zh_CN" 
  6. LC_COLLATE="zh_CN" 
  7. LC_MONETARY="zh_CN" 
  8. LC_MESSAGES="zh_CN" 
  9. LC_PAPER="zh_CN" 
  10. LC_NAME="zh_CN" 
  11. LC_ADDRESS="zh_CN" 
  12. LC_TELEPHONE="zh_CN" 
  13. LC_MEASUREMENT="zh_CN" 
  14. LC_IDENTIFICATION="zh_CN" 
  15. LC_ALL= 

这个时候会认为是gb2312的。在python中可以用locale模块来获得当前环境的编码:

 
 
 
  1. import locale  
  2. print locale.getdefaultlocale() 

Python print在输出时把字符串自动装换为这个编码。看看下面,"喆"这个字是很著名的一个在gb2312中没有的字,当把它转换为gb2312的时候是会出错的。

 
 
 
  1. #-*- encoding: gb18030 -*-  
  2. import locale  
  3. import sys, encodings, encodings.aliases  
  4. # 现在a是unicode的  
  5. a = u'喆' 
  6. print a.encode("gb2312") 

上面这段代码会报异常,就是这个原因。但如果是直接 print a 就可以输出来 (假设你的环境变量是GBK或者GB18030或者UTF-8)。如果你的环境变量是GB2312的,那这个print一样会报错!所以在处理其他地方来 的文本数据时,***不要用GB2312的编码,是中文数据,一定要用GB18030或者UTF-8!

而用文件对象的write写unicode的数据也是会出错的!需要做编码转换

 
 
 
  1. #-*- encoding: gb18030 -*-  
  2. import locale  
  3. import sys, encodings, encodings.aliases  
  4. # 现在a是unicode的  
  5. a = u'喆' 
  6. f = open("aaa.txt", "w")  
  7. f.write(a)  
  8. f.close() 

以上就是我们对Python print的相关介绍。

文章名称:Pythonprint正确使用方法浅析
网页地址:http://www.36103.cn/qtweb/news32/20082.html

网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联