Python—对字符编码的初步认识

系统 141 0

字符编码

Python主要识别文件内容,而不是关心拓展名—>解释器 例:cmd中输入 python xxx.txt也能运行 显示文本内容

字符—>(机器翻译)—>二进制

字符如何对应特定数字的标准,这个标准就是字符编码。

ASCII

GBK

Unicode

UTF-8(Unicode Transforma Format)

  • 对于英文字符来说,1bytes
  • 中文字符,3bytes
  • 对于其他偏僻字符,更多的bytes存储
            
              
                >>
              
              
                >
              
               b
              
                =
              
              
                bytes
              
              
                (
              
              
                '城市学院'
              
              
                ,
              
              encoding
              
                =
              
              
                'utf-8'
              
              
                )
              
              
                >>
              
              
                >
              
               b
b
              
                '\xe5\x9f\x8e\xe5\xb8\x82\xe5\xad\xa6\xe9\x99\xa2'
              
              
                >>
              
              
                >
              
               b1
              
                =
              
              
                '城市学院'
              
              
                .
              
              encode
              
                (
              
              
                'utf-8'
              
              
                )
              
              
                >>
              
              
                >
              
               b1
b
              
                '\xe5\x9f\x8e\xe5\xb8\x82\xe5\xad\xa6\xe9\x99\xa2'
              
              
                >>
              
              
                >
              
               b
              
                .
              
              decode
              
                (
              
              
                'utf-8'
              
              
                )
              
              
                '城市学院'
              
              
                >>
              
              
                >
              
               b
              
                .
              
              decode
              
                (
              
              
                'gbk'
              
              
                )
              
              
                '鍩庡競瀛﹂櫌'
              
              
                >>
              
              
                >
              
               b1
              
                .
              
              decode
              
                (
              
              
                'utf-8'
              
              
                )
              
              
                '城市学院'
              
              
                >>
              
              
                >
              
               b1
              
                .
              
              decode
              
                (
              
              
                'gbk'
              
              
                )
              
              
                '鍩庡競瀛﹂櫌'
              
              
                >>
              
              
                >
              
            
          

更多文章、技术交流、商务合作、联系博主

微信扫码或搜索:z360901061

微信扫一扫加我为好友

QQ号联系: 360901061

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请请扫描上面二维码支持博主1元、2元、5元等您想捐的金额吧,狠狠点击下面给点支持吧

发表我的评论
最新评论 总共0条评论