ascii码:美国国家标准交换码,不支持中文,占1字节;
gb2312:1981年发布,支持6K+汉字字符,占2字节;
big5:1984年发布,繁体汉字字符,支持1.3W+汉字字符;
gbk1.0:1995年发布,支持2.1W+汉字字符,兼容gb2312及big5,占2字节;
gb18030:2000年发布,支持2.7W+汉字字符(增加了对部分少数民族字符编码),兼容gbk1.0,占2字节;
unicode::统一码,固定2字节,外国人不满意,浪费空间;
utf-8:对unicode进行优化,英文字符占1字节,中文字符占3字节,没事,中国人不差这个钱;
在python2当中默认采用ascii码进行编码,如果出现中文字符,要在代码头部加 # -*- coding:utf-8 -*- ,否则会报错。
在python3中默认采用utf-8进行编码。