Python学习----字符集编码

python学习网 2018-08-19 15:05:02

1 ASCII码: American Standard Code for information inerchange

   美国最初采用的二进制和字符的编码映射表

2 Gb2312, Gbk1.0, Gbk10830

   中国最开始制定的编码表Gb2312,只包含简体字,后发现繁体字没有加进去,不断扩充,而出现了Gbk系列编码

3 unicode, utf-8

   由于世界各国都制定本国的编码表,导致各国之间信息交流出现障碍,遂ISO组织出面制定全球统一的编码表,即unicode码,又称万国码。

   万国码虽然包括了世界各国所有的字符,但是每个字符都用两个字节表示,对于英语国家来说,造成了大量的空间浪费,为了节省成本,对万国码进行压缩,字母用1个字节表示,欧洲字符用两个字节表示,中国汉字用三个字节表示

4 进入中国的操作系统采用中国制定的Gb2312编码标准,而Unix和Linux皆采用的utf-8的编码标准

 

阅读(971) 评论(0)