Python是否有类似空字符串变量的功能,您可以在其中执行以下操作:

if myString == string.empty:

无论如何,检查空字符串值最优雅的方法是什么?我发现每次检查空字符串的硬编码“”都不太好。


当前回答

我对“”、“”和“\n”等字符串进行了一些实验。当且仅当变量foo是至少包含一个非空白字符的字符串时,我希望isNotWhitespace为True。我使用的是Python 3.6。以下是我的结论:

isWhitespace = str is type(foo) and not foo.strip()
isNotWhitespace = str is type(foo) and not not foo.strip()

如果需要,将其包装在方法定义中。

其他回答

您可能会看到Python中的“分配空值或字符串”

这是关于比较空字符串的。因此,你可以测试你的字符串是否等于空字符串,而不是用not测试空字符串。。。

我发现每次检查空字符串的硬编码(sic)“”都不太好。

清洁代码方法

这样做:foo==“”是非常糟糕的做法。“”是一个神奇的值。你不应该检查魔法值(更常见的是魔法数字)

您应该做的是与描述性变量名称进行比较。

描述性变量名称

人们可能认为“empty_string”是一个描述性变量名称。它不是。

在你去做empty_string=“”并认为你有一个很好的变量名来比较之前。这不是“描述性变量名”的意思。

一个好的描述性变量名是基于其上下文的。你必须考虑空字符串是什么。

它从哪里来。为什么在那里。为什么你需要检查它。

简单表单字段示例

您正在构建一个用户可以输入值的表单。你想检查用户是否写了什么。

一个好的变量名可能是not_fill_in

这使得代码非常可读

if formfields.name == not_filled_in:
    raise ValueError("We need your name")

完整的CSV解析示例

您正在解析CSV文件,并希望将空字符串解析为None

(由于CSV完全基于文本,因此在不使用预定义关键字的情况下无法表示None)

一个好的变量名可能是CSV_NONE

如果您有一个新的CSV文件,该文件用“”以外的另一个字符串表示None,则可以轻松更改和调整代码

if csvfield == CSV_NONE:
    csvfield = None

这段代码是否正确是没有问题的。很明显,它做了它应该做的事情。

将此与

if csvfield == EMPTY_STRING:
    csvfield = None

这里的第一个问题是,为什么空字符串值得特殊处理?

这将告诉未来的编码器,空字符串应该始终被视为None。

这是因为它混合了业务逻辑(CSV值应该是None)和代码实现(我们实际比较的是什么)

这两者之间需要分开关注。

如果这对某人有用,这里有一个我构建的快速函数,用于将列表列表中的空白字符串替换为N/a(python 2)。

y = [["1","2",""],["1","4",""]]

def replace_blank_strings_in_lists_of_lists(list_of_lists):
    new_list = []
    for one_list in list_of_lists:
        new_one_list = []
        for element in one_list:
            if element:
                new_one_list.append(element)
            else:
                new_one_list.append("N/A")
        new_list.append(new_one_list)
    return new_list


x= replace_blank_strings_in_lists_of_lists(y)
print x

这对于将列表列表发布到mysql数据库非常有用,该数据库不接受某些字段的空格(在模式中标记为NN的字段。在我的例子中,这是由于一个复合主键)。

以下是适用于任意数量空间的优雅解决方案。

def str_empty(s: str) -> bool:
    """Strip white space and count remaining characters."""
    return len(s.strip()) < 1


>>> str_empty(' ')
True

唯一真正可靠的方法是:

if "".__eq__(myString):

所有其他解决方案都可能存在检查失败的问题和边缘情况。

如果myString是继承自str并重写__len__()方法的类的对象,则len(myString)==0可能失败。myString==“”和myString__如果myString重写__eq__()和__ne__(),则eq__(“”)可能失败。“”==如果myString重写__eq__(),myString也会被愚弄。myString是“”,“”是myString。如果myString实际上不是字符串而是字符串的子类(两者都将返回False),则它们都将失败。此外,由于它们是身份检查,所以它们工作的唯一原因是因为Python使用字符串池(也称为字符串互存),如果字符串被互存,则使用相同的字符串实例(请参见此处:为什么使用“==”或“is”比较字符串有时会产生不同的结果?)。“”从一开始就在CPython实习身份检查的一个大问题是,字符串实习(据我所知)没有标准化哪些字符串被实习。这意味着,理论上“”不是必需的,这取决于实现。此外,使用字符串进行比较通常是一个非常邪恶的陷阱,因为它有时会正常工作,但有时不会,因为字符串池遵循非常奇怪的规则。如果对象重写__bool__(),则依赖字符串的虚假性可能不起作用。

唯一不能被愚弄的方法就是开头提到的“”__eq__(myString)。由于它显式调用空字符串的__eq__()方法,因此不能通过重写myString中的任何方法来欺骗它,并且可以与str的子类一起工作。

这不仅是理论上的工作,实际上可能与实际使用相关,因为我以前见过框架和库将str子类化,并且使用myString is“”可能会返回错误的输出。

也就是说,在大多数情况下,所有提到的解决方案都能正常工作。这主要是学术工作。