2.3 字符串

大多数程序都定义并收集某种数据,然后使用它们来做些有意义的事情。鉴于此,对数据进行分类大有裨益。我们将介绍的第一种数据类型是字符串。字符串虽然看似简单,但能够以很多不同的方式使用它们。

字符串 就是一系列字符。在Python中,用引号括起的都是字符串,其中的引号可以是单引号,也可以是双引号,如下所示:

  1. "This is a string."
  2. 'This is also a string.'
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  

这种灵活性让你能够在字符串中包含引号和撇号:

  1. 'I told my friend, "Python is my favorite language!"'
  2. "The language 'Python' is named after Monty Python, not the snake."
  3. "One of Python's strengths is its diverse and supportive community."
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  
  10.  

下面来看一些使用字符串的方式。

2.3.1 使用方法修改字符串的大小写

对于字符串,可执行的最简单的操作之一是修改其中的单词的大小写。请看下面的代码,并尝试判断其作用:

name.py

  1. name = "ada lovelace"
  2. print(name.title())
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  

将这个文件保存为name.py,再运行它。你将看到如下输出:

  1. Ada Lovelace
  2.  
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  

在这个示例中,小写的字符串"ada lovelace" 存储到了变量name 中。在print() 语句中,方法title() 出现在这个变量的后面。方法 是Python可对数据执行的操作。在name.title() 中,name 后面的句点(. )让Python对变量name 执行方法title() 指定的操作。每个方法后面都跟着一对括号,这是因为方法通常需要额外的信息来完成其工作。这种信息是在括号内提供的。函数title() 不需要额外的信息,因此它后面的括号是空的。

title() 以首字母大写的方式显示每个单词,即将每个单词的首字母都改为大写。这很有用,因为你经常需要将名字视为信息。例如,你可能希望程序将值AdaADAada 视为同一个名字,并将它们都显示为Ada

还有其他几个很有用的大小写处理方法。例如,要将字符串改为全部大写或全部小写,可以像下面这样做:

  1. name = "Ada Lovelace"
  2. print(name.upper())
  3. print(name.lower())
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  
  10.  

这些代码的输出如下:

  1. ADA LOVELACE
  2. ada lovelace
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  

存储数据时,方法lower() 很有用。很多时候,你无法依靠用户来提供正确的大小写,因此需要将字符串先转换为小写,再存储它们。以后需要显示这些信息时,再将其转换为最合适的大小写方式。

2.3.2 合并(拼接)字符串

在很多情况下,都需要合并字符串。例如,你可能想将姓和名存储在不同的变量中,等要显示姓名时再将它们合而为一:

  1. first_name = "ada"
  2. last_name = "lovelace"
  3. full_name = first_name + " " + last_name
  4. print(full_name)
  5.  
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  

Python使用加号(+ )来合并字符串。在这个示例中,我们使用+ 来合并first_name 、空格和last_name ,以得到完整的姓名(见❶),其结果如下:

  1. ada lovelace
  2.  
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  

这种合并字符串的方法称为拼接 。通过拼接,可使用存储在变量中的信息来创建完整的消息。下面来看一个例子:

  1. first_name = "ada"
  2. last_name = "lovelace"
  3. full_name = first_name + " " + last_name
  4. print("Hello, " + full_name.title() + "!")
  5.  
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  

在这里,一个问候用户的句子中使用了全名(见❶),并使用了方法title() 来将姓名设置为合适的格式。这些代码显示一条格式良好的简单问候语:

  1. Hello, Ada Lovelace!
  2.  
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  

你可以使用拼接来创建消息,再把整条消息都存储在一个变量中:

  1. first_name = "ada"
  2. last_name = "lovelace"
  3. full_name = first_name + " " + last_name
  4. message = "Hello, " + full_name.title() + "!"
  5. print(message)
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  
  12.  

上述代码也显示消息“Hello, Ada Lovelace!”,但将这条消息存储在了一个变量中(见❶),这让最后的print 语句简单得多(见❷)。

2.3.3 使用制表符或换行符来添加空白

在编程中,空白 泛指任何非打印字符,如空格、制表符和换行符。你可使用空白来组织输出,以使其更易读。

要在字符串中添加制表符,可使用字符组合\t ,如下述代码的❶处所示:

  1. >>> print("Python")
  2. Python
  3. >>> print("\tPython")
  4. Python
  5.  
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  

要在字符串中添加换行符,可使用字符组合\n

  1. >>> print("Languages:\nPython\nC\nJavaScript")
  2. Languages:
  3. Python
  4. C
  5. JavaScript
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  
  12.  

还可在同一个字符串中同时包含制表符和换行符。字符串"\n\t" 让Python换到下一行,并在下一行开头添加一个制表符。下面的示例演示了如何使用一个单行字符串来生成四行输出:

  1. >>> print("Languages:\n\tPython\n\tC\n\tJavaScript")
  2. Languages:
  3. Python
  4. C
  5. JavaScript
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  
  12.  

在接下来的两章中,你将使用为数不多的几行代码来生成很多行输出,届时制表符和换行符将提供极大的帮助。

2.3.4 删除空白

在程序中,额外的空白可能令人迷惑。对程序员来说,'python''python ' 看起来几乎没什么两样,但对程序来说,它们却是两个不同的字符串。Python能够发现'python ' 中额外的空白,并认为它是有意义的——除非你告诉它不是这样的。

空白很重要,因为你经常需要比较两个字符串是否相同。例如,一个重要的示例是,在用户登录网站时检查其用户名。但在一些简单得多的情形下,额外的空格也可能令人迷惑。所幸在Python中,删除用户输入的数据中的多余的空白易如反掌。

Python能够找出字符串开头和末尾多余的空白。要确保字符串末尾没有空白,可使用方法rstrip()

  1. >>> favorite_language = 'python '
  2. >>> favorite_language
  3. 'python '
  4. >>> favorite_language.rstrip()
  5. 'python'
  6. >>> favorite_language
  7. 'python '
  8.  
  9.  
  10.  
  11.  
  12.  
  13.  
  14.  

存储在变量favorite_language 中的字符串末尾包含多余的空白(见❶)。你在终端会话中向Python询问这个变量的值时,可看到末尾的空格(见❷)。对变量favorite_language 调用方法rstrip() 后(见❸),这个多余的空格被删除了。然而,这种删除只是暂时的,接下来再次询问favorite_language 的值时,你会发现这个字符串与输入时一样,依然包含多余的空白(见❹)。

要永久删除这个字符串中的空白,必须将删除操作的结果存回到变量中:

  1. >>> favorite_language = 'python '
  2. >>> favorite_language = favorite_language.rstrip()
  3. >>> favorite_language
  4. 'python'
  5.  
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  

为删除这个字符串中的空白,你需要将其末尾的空白剔除,再将结果存回到原来的变量中(见❶)。在编程中,经常需要修改变量的值,再将新值存回到原来的变量中。这就是变量的值可能随程序的运行或用户输入数据而发生变化的原因。

你还可以剔除字符串开头的空白,或同时剔除字符串两端的空白。为此,可分别使用方法lstrip()strip()

  1. >>> favorite_language = ' python '
  2. >>> favorite_language.rstrip()
  3. ' python'
  4. >>> favorite_language.lstrip()
  5. 'python '
  6. >>> favorite_language.strip()
  7. 'python'
  8.  
  9.  
  10.  
  11.  
  12.  
  13.  
  14.  

在这个示例中,我们首先创建了一个开头和末尾都有空白的字符串(见❶)。接下来,我们分别删除末尾(见❷)、开头(见❸)和两端(见❹)的空格。尝试使用这些剥除函数有助于你熟悉字符串操作。在实际程序中,这些剥除函数最常用于在存储用户输入前对其进行清理。

2.3.5 使用字符串时避免语法错误

语法错误 是一种时不时会遇到的错误。程序中包含非法的Python代码时,就会导致语法错误。例如,在用单引号括起的字符串中,如果包含撇号,就将导致错误。这是因为这会导致Python将第一个单引号和撇号之间的内容视为一个字符串,进而将余下的文本视为Python代码,从而引发错误。

下面演示了如何正确地使用单引号和双引号。请将该程序保存为apostrophe.py,再运行它:

apostrophe.py

  1. message = "One of Python's strengths is its diverse community."
  2. print(message)
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  

撇号位于两个双引号之间,因此Python解释器能够正确地理解这个字符串:

  1. One of Python's strengths is its diverse community.
  2.  
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  

然而,如果你使用单引号,Python将无法正确地确定字符串的结束位置:

  1. message = 'One of Python's strengths is its diverse community.'
  2. print(message)
  3.  
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  

而你将看到如下输出:

  1. File "apostrophe.py", line 1
  2. message = 'One of Python's strengths is its diverse community.'
  3. ^❶
  4. SyntaxError: invalid syntax
  5.  
  6.  
  7.  
  8.  
  9.  
  10.  
  11.  

从上述输出可知,错误发生在第二个单引号后面(见❶)。这种语法错误 表明,在解释器看来,其中的有些内容不是有效的Python代码。错误的来源多种多样,这里指出一些常见的。学习编写Python代码时,你可能会经常遇到语法错误。语法错误也是最不具体的错误类型,因此可能难以找出并修复。受困于非常棘手的错误时,请参阅附录C提供的建议。

注意  编写程序时,编辑器的语法突出功能可帮助你快速找出某些语法错误。看到Python代码以普通句子的颜色显示,或者普通句子以Python代码的颜色显示时,就可能意味着文件中存在引号不匹配的情况。

2.3.6 Python 2中的print 语句

在Python 2中,print 语句的语法稍有不同:

  1. >>> python2.7
  2. >>> print "Hello Python 2.7 world!"
  3. Hello Python 2.7 world!
  4.  
  5.  
  6.  
  7.  
  8.  
  9.  
  10.  

在Python 2中,无需将要打印的内容放在括号内。从技术上说,Python 3中的print 是一个函数,因此括号必不可少。有些Python 2 print 语句也包含括号,但其行为与Python 3中稍有不同。简单地说,在Python 2代码中,有些print 语句包含括号,有些不包含。

动手试一试

在做下面的每个练习时,都编写一个独立的程序,并将其保存为名称类似于name_cases.py的文件。如果遇到了困难,请休息一会儿或参阅附录C提供的建议。

2-3 个性化消息: 将用户的姓名存到一个变量中,并向该用户显示一条消息。显示的消息应非常简单,如“Hello Eric, would you like to learn some Python today?”。

2-4 调整名字的大小写: 将一个人名存储到一个变量中,再以小写、大写和首字母大写的方式显示这个人名。

2-5 名言: 找一句你钦佩的名人说的名言,将这个名人的姓名和他的名言打印出来。输出应类似于下面这样(包括引号):

Albert Einstein once said, “A person who never made a mistake never tried anything new.”

2-6 名言2: 重复练习2-5,但将名人的姓名存储在变量famous_person 中,再创建要显示的消息,并将其存储在变量message 中,然后打印这条消息。

2-7 剔除人名中的空白: 存储一个人名,并在其开头和末尾都包含一些空白字符。务必至少使用字符组合"\t""\n" 各一次。

打印这个人名,以显示其开头和末尾的空白。然后,分别使用剔除函数lstrip()rstrip()strip() 对人名进行处理,并将结果打印出来。