我有一个字符串变量,它代表一个dos路径,例如:
var = “d:\stuff\morestuff\Furtherdown\THEFILE.txt”
我想把这个字符串分成:
[ “d”, “stuff”, “morestuff”, “Furtherdown”, “THEFILE.txt” ]
我尝试过使用split()和replace(),但它们要么只处理第一个反斜杠,要么将十六进制数字插入字符串。
我需要以某种方式将这个字符串变量转换为原始字符串,以便我可以解析它。
最好的方法是什么?
我还应该添加,var的内容,即我试图解析的路径,实际上是一个命令行查询的返回值。这不是我自己生成的路径数据。它存储在一个文件中,命令行工具不会转义反斜杠。
就像其他人解释的那样-你的问题源于使用\,这是字符串字面量/常量中的转义字符。OTOH,如果你有文件路径字符串从其他来源(从文件读取,控制台或由操作系统函数返回)-不会有问题分裂'\\'或r'\'。
就像其他人建议的那样,如果你想在程序文字中使用\,你必须复制它\\或者整个文字必须以r为前缀,比如r'lite\ral'或r"lite\ral",以避免解析器将\和r转换为CR(回车)字符。
还有一种方法——不要在代码中使用反斜杠\ pathnames !自上个世纪以来,Windows可以很好地识别使用正斜杠作为目录分隔符的路径名/!不知何故,没有多少人知道…但它是有效的:
>>> var = "d:/stuff/morestuff/furtherdown/THEFILE.txt"
>>> var.split('/')
['d:', 'stuff', 'morestuff', 'furtherdown', 'THEFILE.txt']
顺便说一下,这将使您的代码在Unix, Windows和Mac上工作…因为它们都使用/作为目录分隔符…即使你不想使用模块os的预定义常量。
真可惜!python os。Path没有os。Path。splitall这样的东西
不管怎样,这是对我有用的,来源:https://www.oreilly.com/library/view/python-cookbook/0596001673/ch04s16.html
import os
a = '/media//max/Data/'
def splitall(path):
# https://www.oreilly.com/library/view/python-cookbook/0596001673/ch04s16.html
allparts = []
while 1:
parts = os.path.split(path)
if parts[0] == path: # sentinel for absolute paths
allparts.insert(0, parts[0])
break
elif parts[1] == path: # sentinel for relative paths
allparts.insert(0, parts[1])
break
else:
path = parts[0]
allparts.insert(0, parts[1])
return allparts
x = splitall(a)
print(x)
z = os.path.join(*x)
print(z)
输出:
['/', 'media', 'max', 'Data', '']
/media/max/Data/