我有一个多行字符串,我想在每一行上做一个操作,如下所示:
inputString = """Line 1
Line 2
Line 3"""
我想迭代每一行:
for line in inputString:
doStuff()
我有一个多行字符串,我想在每一行上做一个操作,如下所示:
inputString = """Line 1
Line 2
Line 3"""
我想迭代每一行:
for line in inputString:
doStuff()
当前回答
inputString.splitlines()
splitlines()方法的目的是将每行分割成一个列表元素。
其他回答
最初的帖子要求代码打印一些行(如果它们在某些条件下为真)加上下面的行。 我的实现是这样的:
text = """1 sfasdf
asdfasdf
2 sfasdf
asdfgadfg
1 asfasdf
sdfasdgf
"""
text = text.splitlines()
rows_to_print = {}
for line in range(len(text)):
if text[line][0] == '1':
rows_to_print = rows_to_print | {line, line + 1}
rows_to_print = sorted(list(rows_to_print))
for i in rows_to_print:
print(text[i])
使用inputString.splitlines()。
为什么分割线更好
与split不同,Splitlines可以正确地处理换行。
在使用True参数调用拆分结果时,它还可以选择返回换行符,这在某些特定场景中非常有用。
为什么不应该使用split("\n")
在跨操作系统共享文件时,使用split会产生非常令人困惑的错误。
\n在Python中表示Unix换行符(ASCII十进制代码10),与运行它的操作系统无关。然而,ASCII换行表示是依赖于操作系统的。
在Windows上,\n是两个字符,CR和LF (ASCII十进制代码13和10,\r和\n),而在现代Unix (Mac OS X, Linux, Android)上,它是一个字符LF。
打印工作正确,即使你有一个字符串的行结束不匹配你的平台:
>>> print " a \n b \r\n c "
a
b
c
然而,显式地在“\n”上进行分裂,具有依赖于操作系统的行为:
>>> " a \n b \r\n c ".split("\n")
[' a ', ' b \r', ' c ']
即使你使用os。Linesep,它只会根据你平台上的换行分隔符进行分割,如果你在其他平台上处理创建的文本,或者只带\n,它会失败:
>>> " a \n b \r\n c ".split(os.linesep)
[' a \n b ', ' c ']
Splitlines解决了所有这些问题:
>>> " a \n b \r\n c ".splitlines()
[' a ', ' b ', ' c ']
以文本模式读取文件在一定程度上缓解了换行表示问题,因为它将Python的\n转换为平台的换行表示。
但是,文本模式只存在于Windows上。在Unix系统上,所有文件都以二进制模式打开,因此在Unix系统中对Windows文件使用split('\n')将导致不希望出现的行为。在网络中传输文件时也会发生这种情况。
在这种特殊情况下可能有点过分,但另一种选择涉及使用StringIO创建类文件对象
for line in StringIO.StringIO(inputString):
doStuff()
我希望注释有适当的代码文本格式,因为我认为@1_CR的答案需要更多的碰撞,我想增加他的答案。无论如何,他引导我使用以下技巧;如果可用,它将使用cStringIO(但是注意:cStringIO和StringIO是不一样的,因为你不能子类化cStringIO…它是内置的…但对于基本操作,语法是相同的,所以你可以这样做):
try:
import cStringIO
StringIO = cStringIO
except ImportError:
import StringIO
for line in StringIO.StringIO(variable_with_multiline_string):
pass
print line.strip()
就像其他人说的
inputString.split('\n') # --> ['Line 1', 'Line 2', 'Line 3']
这与上面的相同,但string模块的函数是不赞成的,应该避免使用:
import string
string.split(inputString, '\n') # --> ['Line 1', 'Line 2', 'Line 3']
或者,如果你想让每一行都包含断点序列(CR,LF,CRLF),使用splitlines方法,参数为True:
inputString.splitlines(True) # --> ['Line 1\n', 'Line 2\n', 'Line 3']