我有一个字符串变量,它代表一个dos路径,例如:
var = “d:\stuff\morestuff\Furtherdown\THEFILE.txt”
我想把这个字符串分成:
[ “d”, “stuff”, “morestuff”, “Furtherdown”, “THEFILE.txt” ]
我尝试过使用split()和replace(),但它们要么只处理第一个反斜杠,要么将十六进制数字插入字符串。
我需要以某种方式将这个字符串变量转换为原始字符串,以便我可以解析它。
最好的方法是什么?
我还应该添加,var的内容,即我试图解析的路径,实际上是一个命令行查询的返回值。这不是我自己生成的路径数据。它存储在一个文件中,命令行工具不会转义反斜杠。
你可以简单地使用最python化的方法(IMHO):
import os
your_path = r"d:\stuff\morestuff\furtherdown\THEFILE.txt"
path_list = your_path.split(os.sep)
print path_list
这将给你:
['d:', 'stuff', 'morestuff', 'furtherdown', 'THEFILE.txt']
这里的线索是使用操作系统。Sep而不是“\\”或“/”,因为这使得它与系统无关。
要从驱动器号中删除冒号(尽管我看不出你为什么要这样做),你可以这样写:
path_list[0] = path_list[0][0]
你可以简单地使用最python化的方法(IMHO):
import os
your_path = r"d:\stuff\morestuff\furtherdown\THEFILE.txt"
path_list = your_path.split(os.sep)
print path_list
这将给你:
['d:', 'stuff', 'morestuff', 'furtherdown', 'THEFILE.txt']
这里的线索是使用操作系统。Sep而不是“\\”或“/”,因为这使得它与系统无关。
要从驱动器号中删除冒号(尽管我看不出你为什么要这样做),你可以这样写:
path_list[0] = path_list[0][0]
我使用下面的代码,因为它使用os.path.basename函数,它不会向返回的列表添加任何斜杠。它也适用于任何平台的斜杠:即窗口的\\\\或unix的/。此外,它不会添加windows用于服务器路径的\\\\\\\\:)
def SplitPath( split_path ):
pathSplit_lst = []
while os.path.basename(split_path):
pathSplit_lst.append( os.path.basename(split_path) )
split_path = os.path.dirname(split_path)
pathSplit_lst.reverse()
return pathSplit_lst
所以对于:
\\\\\\\server\\\\folder1\\\\folder2\\\\folder3\\\\folder4
你会得到:
['server','folder1','folder2','folder3','folder4']