1. 字符串格式化基础

字符串格式化相当于字符串模板。也就是说,如果一个字符串有一部分是固定的,而另一部分是动态变化的,那么就可以将固定的部分做成模板,然后那些动态变化的部分使用字符串格式化操作符(%) 替换。如一句问候语:“Hello 李宁”,其中“Hello”是固定的,但“李宁”可能变成任何一个人的名字,如“乔布斯”,所以在这个字符串中,“Hello”是固定的部分,而“李宁”是动态变化的部分,因此,需要用“%”操作符替换“李宁”,这样就形成了一个模板。
Hello %s

上面的代码中,“%”后面的s是什么呢?其实字符串格式化操作符后面需要跟着动态值的数据类型,以及更细节的格式(如对于浮点数来说,小数点后要保留几位),这里的“%s”表示动态部分要被替换成字符串类型的值。如果在字符串模板中有多个要被替换的部分,需要按顺序用“%”表示,然后在格式化字符串时,传入的值也要符合这个顺序。例5.2为我们演示了格式化字符串的基本用法。

本例首先定义了一个字符串模板,然后传入了两个字符串类型的值来格式化字符串,最后将格式化后的字符串输出。

# 定义字符串模板formatStr = "Hello %s. Today is %s, Are there any activities today?"# 初始化字符串格式化参数值,此处必须使用元组,不能使用列表values = ('Mike', 'Wednesday')# 格式化字符串print(formatStr % values)

程序运行结果如下图所示。

从上面的代码可以看出,不仅在为字符串模板指定格式化参数时要使用百分号(%),在格式化字符串时,也要像取模一样使用“%”操作符。还有就是指定字符串格式化参数值要使用元组,在这里不能使用列表。

在上图中,只是使用了字符串作为格式化参数,但在实际的应用中,可能会有其他类型的字符串格式化参数。如果遇到这种情况,可以使用str函数将这些数据类型的值转换为字符串类型的值,然后再传入字符串模板,这么做在大多数情况下是可行的,但如果要对格式化参数值有更进一步的要求,光使用str函数就做不到了,这就要使用能表示这些数据类型的格式化参数,如“%f”表示浮点类型的格式化参数。

在下面代码的字符串模板中包含了字符串、整数和浮点数类型的模板。

# 在这个字符串模板中,包含了浮点数和整数类型的格式化参数formatStr1 = "PI是圆周率,他的值是%.4f(保留小数点后%d位)"# 导入math模块中的pi变量from math import pi# 定义与formatStr1对应的格式化参数值values1 = (pi, 4)# 格式化字符串,运行结果:PI是圆周率,他的值是3.1416(保留小数点后4位)print(formatStr1 % values1)# 在这个字符串模板中,包含了整数和字符串类型的格式化参数formatStr2 = "这件事的成功率是%d%%, 如果有%s参与的话,成功率会提升至%d%%"values2 = (56, "John",70)# 运行结果:这件事的成功率是56%, 如果有John参与的话,成功率会提升至70%print(formatStr2 % values2)values3 = (66,"Mike")# 由于指定的参数值的数量和格式化参数的数量不匹配,所以会抛出异常print(formatStr2 % values3)

程序的运行结果如下图所示。

在上面的代码中,为格式化字符串指定了不同数据类型的格式化参数。如果要在格式化字符串中显示百分号(%),就要使用两个百分号(%%)表示。当传入的参数值的数量与格式化参数的数量不匹配时,就会抛出异常。

模板字符串

在string模块中提供了一个用于格式化字符串的Template类,该类的功能是用同一个值替换所有相同的格式化参数。Template类的格式化参数用美元符号($)开头,后面跟着格式化参数名称,相当于变量名。在格式化时,需要使用Template类的substitute方法,该方法用于指定格式化参数对应的值。

from string import Templatetemplate = Template("$s $s $s ")template.substitute(s = "Hello") # 这种参数被称为关键字参数,会在后面的章节详细介绍

在上面的代码中,通过Template类的构造方法传入了一个格式化字符串,在这个格式化字符串中包含了3个“$s”,然后调用了substitute方法格式化这个字符串,该方法指定了s参数值为“Hello”,最后的替换结果是“Hello Hello Hello”,也就是说,在格式化字符串中,有多少个“$s”,就替换多少个“$s”。substitute方法还可以通过字典(见下一章)设置格式化参数的值。例5.4完整地演示了如何使用Template类格式化字符串。

使用Template格式化字符串,当格式化参数是一个字符串的一部分时,需要用一对大括号({})将格式化参数变量括起来。

# 引用string模块中的Template类from string import Templatetemplate1 = Template("$s是我最喜欢的编程语言, $s非常容易学习,而且功能强大")# 指定格式化参数s的值是Pythonprint(template1.substitute(s='Python'))# 当格式化参数是一个字符串的一部分时,为了和字符串的其他部分区分开,# 需要用一对大括号将格式化参数变量括起来template2 = Template("${s}stitute")print(template2.substitute(s='sub'))template3 = Template("$dollar$$相当于多少$pounds")# 替换两个格式化参数变量print(template3.substitute(dollar=20,pounds='英磅'))template4 = Template("$dollar$$相当于多少$pounds")data = {}data['dollar'] = 100data['pounds'] = '英磅'# 使用字典指定格式化参数值print(template4.substitute(data))

程序运行结果如下图所示。

字符串的format方法

字符串本身也有一个format方法用于格式化当前的字符串。这个format方法和前面讲的格式化操作符(%)不太一样。字符串格式化参数并不是用百分号(%)表示,而是用一对大括号({}),而且支持按顺序指定格式化参数值和关键字格式化参数。例如,下面的代码通过format方法按顺序为格式化字符串指定了参数值。

print("{} {} {}".format(1,2,3)) # 运行结果:1 2 3

我们可以看到,上面的代码在字符串中指定了3对空的大括号,这代表3个格式化参数,不需要指定数据类型,可以向其传递Python语言支持的任何值。通过format方法传入3个值(1,2,3),这3个值会按顺序替换格式化字符串中的3对空的大括号。

命名格式化参数是指在一对大括号中指定一个名称,然后调用format方法时也要指定这个名称。

print("{a} {b} {c}".format(a = 1,c = 2,b = 3)) # 运行结果:1 3 2

上面的代码在3对大括号中分别添加了“a”、“b”、“c”。通过format方法指定了这3个关键字参数的值。我们可以看到,并没有按顺序指定关键字参数的值。这也是使用关键字参数的好处,只要名字正确,fomat参数的顺序可以任意指定。当然,顺序方式和关键字参数方式可以混合使用,而且还可以指定顺序方式中格式化参数从format方法提取参数值的顺序,甚至可以取format方法参数值的一部分。哇,接连抛出了这么多功能,可能很多读者有点应接不暇了,别着急,例5.5会为我们演示format方法的一些常用使用方式。

本例分别使用一对大括号“{}”、命名格式化参数和顺序格式化参数3中方式格式化字符串。

# 包含了2个空的大括号,format方法需要按顺序指定格式化参数值s1 = "Today is {}, the temperature is {} degrees."# format方法的第1个参数值对应s1的第1对大括号,第2个参数值对应s1的第2对大括号# 运行结果:Today is Saturday, the temperature is 24 degrees.print(s1.format("Saturday", 24))# 包含了2个命名格式化参数,一个是{week},另一个是{degree}s2 = "Today is {week}, the temperature is {degree} degrees."# format方法的第1个参数指定了{degree}的值,第2个参数指定了{week}的值,# 可以将degree和week调换,s2.format(week ="Sunday", degree = 22)# 运行结果:Today is Sunday, the temperature is 22 degrees.print(s2.format(degree = 22, week ="Sunday"))# 混合了顺序格式化参数和关键字格式化参数两种方式s3 = "Today is {week}, {},the {} temperature is {degree} degrees."# format方法的参数,前面应该是按顺序传递的格式化参数值,后面是关键字格式化参数值,顺序不能调换# 这样做是错误的:s3.format(degree = 22, "aaaaa", 12345, week ="Sunday")# 运行结果:Today is Sunday, aaaaa,the 12345 temperature is 22 degrees.print(s3.format("aaaaa", 12345, degree = 22, week ="Sunday"))# 为顺序格式化参数指定了从format方法获取参数值的顺序,{1}表示从format方法的第2个参数取值# {0}表示从format方法的第1个参数取值s4 = "Today is {week}, {1},the {0} temperature is {degree} degrees."# 运行结果:Today is Sunday, 12345,the aaaaa temperature is 22 degrees.print(s4.format("aaaaa", 12345, degree = 22, week ="Sunday"))# 定义了一个列表fullname = ["Bill", "Gates"]# {name[1]}取fullname列表中的第2个值(Gates)# format方法通过关键字参数,为name名字指定了fullname列表。运行结果:Mr Gatesprint("Mr {name[1]}".format(name = fullname))# 导入math模块import math# 访问math模块中的“__name__”变量来获取模块的名字,访问math模块中的pi变量获取PI的值s5 = "The {mod.__name__} module defines the value {mod.pi} for PI"# format方法为mod关键字参数指定了math模块# 运行结果:The math module defines the value 3.141592653589793 for PIprint(s5.format(mod = math))

程序运行结果如下图所示。