这一直让我困惑。看起来这样会更好:
["Hello", "world"].join("-")
除此之外:
"-".join(["Hello", "world"])
有什么具体的原因吗?
这一直让我困惑。看起来这样会更好:
["Hello", "world"].join("-")
除此之外:
"-".join(["Hello", "world"])
有什么具体的原因吗?
当前回答
我同意一开始这是违反直觉的,但有一个很好的理由。联接不能是列表的方法,因为:
它也必须适用于不同的可迭代对象(元组、生成器等)它必须在不同类型的字符串之间具有不同的行为。
实际上有两种连接方法(Python 3.0):
>>> b"".join
<built-in method join of bytes object at 0x00A46800>
>>> "".join
<built-in method join of str object at 0x00A28D40>
如果join是列表的一个方法,那么它必须检查其参数,以决定调用其中的哪一个。而且你不能将byte和str连接在一起,所以它们现在的方式是有意义的。
其他回答
主要是因为someString.jjoin()的结果是字符串。
序列(列表或元组等)不会出现在结果中,只是一个字符串。因为结果是一个字符串,所以它作为字符串的方法是有意义的。
这是因为任何可迭代的都可以连接(例如,列表、元组、dict、集合),但其内容和“joiner”必须是字符串。
例如:
'_'.join(['welcome', 'to', 'stack', 'overflow'])
'_'.join(('welcome', 'to', 'stack', 'overflow'))
'welcome_to_stack_overflow'
使用字符串以外的其他内容将引发以下错误:
TypeError:序列项0:应为str实例,找到int
变量my_list和“-”都是对象。具体来说,它们分别是类列表和str的实例。join函数属于str类。因此,使用语法“-”.join(my_list)是因为对象“-”将my_list作为输入。
-join(my_list)声明您正在从列表中的连接元素转换为字符串。它是面向结果的。(仅为便于记忆和理解)
我做了一份详尽的方法清单,供你参考。
string_methods_44 = {
'convert': ['join','split', 'rsplit','splitlines', 'partition', 'rpartition'],
'edit': ['replace', 'lstrip', 'rstrip', 'strip'],
'search': ['endswith', 'startswith', 'count', 'index', 'find','rindex', 'rfind',],
'condition': ['isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isnumeric','isidentifier',
'islower','istitle', 'isupper','isprintable', 'isspace', ],
'text': ['lower', 'upper', 'capitalize', 'title', 'swapcase',
'center', 'ljust', 'rjust', 'zfill', 'expandtabs','casefold'],
'encode': ['translate', 'maketrans', 'encode'],
'format': ['format', 'format_map']}
这在String方法中讨论过。。。最后一个线程,并被Guido接受。该线程始于1999年6月,str.join包含在2000年9月发布的Python 1.6中(支持Unicode)。Python 2.0(支持str方法,包括join)于2000年10月发布。
本主题提出了四个选项:str.join(seq)顺序连接(str)顺序减少(str)作为内置函数连接Guido希望不仅支持列表和元组,而且支持所有序列/可迭代项。seq.reduce(str)对于新手来说很难。join(str)引入了从序列到str/unicode的意外依赖关系。join()作为独立的内置函数将只支持特定的数据类型。因此,使用内置命名空间是不好的。如果join()支持许多数据类型,那么创建一个优化的实现将是困难的:如果使用__add__方法实现,那么它将是O(n²)。分隔符字符串(sep)不应省略。显式优于隐式。
以下是一些额外的想法(我自己和我朋友的):
Unicode支持即将到来,但还不是最终的。当时UTF-8最有可能取代UCS-2/-4。要计算UTF-8字符串的总缓冲区长度,该方法需要知道字符编码。当时,Python已经决定了一个通用的序列接口规则,用户可以在其中创建一个类似序列的(可迭代的)类。但Python直到2.2才支持扩展内置类型。当时很难提供基本的可迭代类(这在另一条评论中提到)。
Guido的决定记录在历史邮件中,决定str.join(seq):
有趣,但看起来确实没错!巴里,去吧。。。吉多·范罗苏姆