如何将列表的字符串表示转换为列表

我想知道最简单的方法是将如下列表的字符串表示转换为列表：

x = '[ "A","B","C" , " D"]'

即使在用户在逗号之间加空格，在引号内加空格的情况下，我也需要处理它并将其转换为：

x = ["A", "B", "C", "D"]

我知道我可以用strip（）和split（）分隔空格，并检查非字母字符。但代码变得非常笨拙。有没有我不知道的快速功能？

当前回答

如果有字符串化的字典列表，json模块是更好的解决方案。可以使用json.loads（your_data）函数将其转换为列表。

>>> import json
>>> x = '[ "A","B","C" , " D"]'
>>> json.loads(x)
['A', 'B', 'C', ' D']

类似地

>>> x = '[ "A","B","C" , {"D":"E"}]'
>>> json.loads(x)
['A', 'B', 'C', {'D': 'E'}]

2016-02-17 15:39:52

其他回答

为了使用JSON进一步完成Ryan的回答，一个非常方便的Unicode转换函数就在这个答案中。

带双引号或单引号的示例：

>print byteify(json.loads(u'[ "A","B","C" , " D"]')
>print byteify(json.loads(u"[ 'A','B','C' , ' D']".replace('\'','"')))
['A', 'B', 'C', ' D']
['A', 'B', 'C', ' D']

2018-04-27 13:56:02

假设您的所有输入都是列表，并且输入中的双引号实际上无关紧要，这可以通过简单的正则表达式替换来完成。这有点过时，但它就像一种魅力。还要注意，输出现在是一个Unicode字符串列表，您没有指定需要它，但考虑到Unicode输入，它似乎是有意义的。

import re
x = u'[ "A","B","C" , " D"]'
junkers = re.compile('[[" \]]')
result = junkers.sub('', x).split(',')
print result
--->  [u'A', u'B', u'C', u'D']

junkers变量包含我们不需要的所有字符的编译正则表达式（为了速度），使用]作为字符需要一些反斜杠技巧。re.sub将所有这些字符都替换为空，我们在逗号处拆分得到的字符串。

注意，这也会从条目u'[“oh no”]'->[u'ohno']中删除空格。如果这不是您想要的，则需要对regexp进行一些升级。

2009-12-12 22:18:37

从上面使用基本Python包的一些答案中，我比较了几个（使用Python 3.7.3）的性能：

方法1:ast

import ast

list(map(str.strip, ast.literal_eval(u'[ "A","B","C" , " D"]')))
# ['A', 'B', 'C', 'D']

import timeit
timeit.timeit(stmt="list(map(str.strip, ast.literal_eval(u'[ \"A\",\"B\",\"C\" , \" D\"]')))", setup='import ast', number=100000)
# 1.292875313000195

方法2:json

import json
list(map(str.strip, json.loads(u'[ "A","B","C" , " D"]')))
# ['A', 'B', 'C', 'D']

import timeit
timeit.timeit(stmt="list(map(str.strip, json.loads(u'[ \"A\",\"B\",\"C\" , \" D\"]')))", setup='import json', number=100000)
# 0.27833264000014424

方法3：不导入

list(map(str.strip, u'[ "A","B","C" , " D"]'.strip('][').replace('"', '').split(',')))
# ['A', 'B', 'C', 'D']

import timeit
timeit.timeit(stmt="list(map(str.strip, u'[ \"A\",\"B\",\"C\" , \" D\"]'.strip('][').replace('\"', '').split(',')))", number=100000)
# 0.12935059100027502

我很失望地看到，我认为可读性最差的方法是性能最好的方法。。。在选择最具可读性的选项时，需要考虑一些权衡。。。对于我使用Python的工作负载类型，我通常看重可读性，而不是性能稍高的选项，但这通常取决于。

2019-05-01 03:54:25

如果您知道您的列表只包含带引号的字符串，这个pyparsing示例将为您提供剥离字符串的列表（甚至保留原始Unicode特性）。

>>> from pyparsing import *
>>> x =u'[ "A","B","C" , " D"]'
>>> LBR,RBR = map(Suppress,"[]")
>>> qs = quotedString.setParseAction(removeQuotes, lambda t: t[0].strip())
>>> qsList = LBR + delimitedList(qs) + RBR
>>> print qsList.parseString(x).asList()
[u'A', u'B', u'C', u'D']

如果您的列表可以有更多的数据类型，甚至可以在列表中包含列表，那么您将需要一个更完整的语法-如pyparsing-examples目录中的语法，它将处理元组、列表、int、浮点和带引号的字符串。

2009-12-12 21:38:54

在处理存储为Pandas DataFrame的报废数据时，可能会遇到这样的问题。

如果值列表以文本形式显示，则此解决方案非常有用。

def textToList(hashtags):
    return hashtags.strip('[]').replace('\'', '').replace(' ', '').split(',')

hashtags = "[ 'A','B','C' , ' D']"
hashtags = textToList(hashtags)

Output: ['A', 'B', 'C', 'D']

不需要外部库。

2020-05-27 18:44:33

如何将列表的字符串表示转换为列表

推荐文章

最新文章

标签