下面使用super()会引发TypeError:为什么?

>>> from  HTMLParser import HTMLParser
>>> class TextParser(HTMLParser):
...     def __init__(self):
...         super(TextParser, self).__init__()
...         self.all_data = []
...         
>>> TextParser()
(...)
TypeError: must be type, not classobj

在StackOverflow上也有类似的问题:Python super()引发TypeError,其中错误是由用户类不是新样式类这一事实解释的。然而,上面的类是一个新型的类,因为它继承自object:

>>> isinstance(HTMLParser(), object)
True

我错过了什么?我如何使用super(),在这里?

使用HTMLParser.__init__(self)而不是super(TextParser, self).__init__()将工作,但我想了解TypeError。

PS: Joachim指出,作为一个新型的类实例并不等同于一个对象。我读过很多次相反的文章,因此感到困惑(基于对象实例测试的新型类实例测试示例:https://stackoverflow.com/revisions/2655651/3)。


当前回答

Super()只能在新型类中使用,这意味着根类需要从'object'类继承。

例如,顶级类需要是这样的:

class SomeClass(object):
    def __init__(self):
        ....

not

class SomeClass():
    def __init__(self):
        ....

所以,解决方案是直接调用父类的init方法,像这样:

class TextParser(HTMLParser):
    def __init__(self):
        HTMLParser.__init__(self)
        self.all_data = []

其他回答

如果你看一下继承树(在2.6版),HTMLParser继承自SGMLParser,而SGMLParser继承自ParserBase,而ParserBase不继承自object。例如,HTMLParser是一个老式的类。

关于你用isinstance检查,我在ipython中做了一个快速测试:

In [1]: class A:
   ...:     pass
   ...: 

In [2]: isinstance(A, object)
Out[2]: True

即使一个类是老式的类,它仍然是object的实例。

问题是super需要一个对象作为祖先:

>>> class oldstyle:
...     def __init__(self): self.os = True

>>> class myclass(oldstyle):
...     def __init__(self): super(myclass, self).__init__()

>>> myclass()
TypeError: must be type, not classobj

仔细观察就会发现:

>>> type(myclass)
classobj

But:

>>> class newstyle(object): pass

>>> type(newstyle)
type    

所以你的问题的解决方案是继承对象以及从HTMLParser。 但是要确保object在MRO类中排在最后:

>>> class myclass(oldstyle, object):
...     def __init__(self): super(myclass, self).__init__()

>>> myclass().os
True

你也可以使用类TextParser(HTMLParser, object):。这使得TextParser成为一个新风格的类,并且可以使用super()。

正确的做法是在旧式的类中不继承object

class A:
    def foo(self):
        return "Hi there"

class B(A):
    def foo(self, name):
        return A.foo(self) + name

Super()只能在新型类中使用,这意味着根类需要从'object'类继承。

例如,顶级类需要是这样的:

class SomeClass(object):
    def __init__(self):
        ....

not

class SomeClass():
    def __init__(self):
        ....

所以,解决方案是直接调用父类的init方法,像这样:

class TextParser(HTMLParser):
    def __init__(self):
        HTMLParser.__init__(self)
        self.all_data = []