编码的发展过程:

美国ASCII码:1个字节

各国编码,如中国GB2312编码:2个字节

统一编码:Unicode 通常为2个字节,字节固定,浪费

UTF-8:将Unicode的字节 自动缩减合适字节存储,字母为1个字节,普通汉字为3个字节


字符ASCIIUnicodeUTF-8A0100000100000000 0100000101000001中无01001110 0010110111100100 10111000 10101101

此表格参考:https://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001386819196283586a37629844456ca7e5a7faa9b94ee8000


ASCII字符与数字转换:

#!/usr/bin/python

a = 65;
print ord('a'); #字符转数字
print chr(a); #数字转字符


汉字字符输出:

#!/usr/bin/python
# -*- coding: utf-8 -*- ##告诉Python解释器,按照UTF-8编码读取源代码

print u'文'; #u'...' 用unicode编码字符输出