Python的对象模型是什么
在面向对象的理论中,有两个核心的概念:类和实例。类可以看成是一个模板,实例就是根据这个模板创建出来的对象。在python中,类和实例都被视为对象,即类对象(或类型对象)和实例对象。
为了避免后续出现歧义,我们这里把对象分为三种:
内置类对象:比如 int、str、list、type、object 等等;
自定义类对象:通过 class 关键字定义的类,当然我们也会把它和上面的内置类对象统称为类对象(或者类型对象);
实例对象:由类对象(内置类对象或自定义类对象)创建的实例;
立即学习“Python免费学习笔记(深入)”;
而对象之间存在以下两种关系:
is-kind-of:对应面向对象理论中子类和父类之间的关系;
is-instance-of:对应面向对象理论中实例对象和类对象之间的关系;
我们举例说明:
class Girl(object): def say(self): return "古明地觉"girl = Girl()print(girl.say()) # 古明地觉
这段代码便包含了上面的三种对象:object(内置类对象),Girl(自定义类对象),girl(实例对象)。
显然 Girl 和 object 之间是 is-kind-of 关系,即 Girl 是 object 的子类。值得一提的是,Python3 里面所有的类(除 object)都是默认继承自 object,即便我们这里不显式继承 object,也会默认继承的,但为了说明,我们就写上了。
除了 Girl 是 object 的子类,我们还能看出 girl 和 Girl 之间存在 is-instance-of 关系,即 girl 是 Girl 的实例。当然如果再进一步的话,girl 和 object 之间也存在 is-instance-of 关系,girl 也是 object 的实例。
class Girl(object): pass girl = Girl()print(issubclass(Girl, object)) # True print(type(girl)) # <class>print(isinstance(girl, Girl)) # Trueprint(isinstance(girl, object)) # True</class>
Girl被实例化后得到一个girl实例,因此调用type(girl)会返回Girl类对象。Girl是Object类的一个实例对象,因为它继承了Object类。至于这其中的原理,我们会慢慢介绍。
Python 也提供了一些手段可以探测这些关系,除了上面的 type 之外,还可以使用对象的 __class__ 属性探测一个对象和其它的哪些对象之间存在 is-instance-of 关系。
而通过对象的 __bases__ 属性则可以探测一个对象和其它的哪些对象之间存在着 is-kind-of 关系。此外 Python 还提供了两个函数 issubclass 和 isinstance 来验证两个对象之间是否存在着我们期望的关系。
class Girl(object): pass girl = Girl()print(girl.__class__) # <class>print(Girl.__class__) # <class># __class__是查看自己的类型是什么,也就是生成自己的类# 而在介绍 Python 对象的时候,我们就看到了# 任何一个对象都至少具备两个东西: 一个是引用计数、一个是类型# 所以 __class__ 是所有对象都具备的# __base__只显示直接继承的第一个类print(Girl.__base__) # <class># __bases__ 会显示直接继承的所有类,以元组的形式print(Girl.__bases__) # (<class>,)</class></class></class></class>
我们画一张图总结一下:
另外需要注意里面的 type 和 object:
type 和 object 存在 is-kind-of 关系,因为 type 是 object 的子类;
object 和 type 存在 is-instance-of 关系,因为 object 是 type 的实例对象;
可能有人会好奇为什么会是这样,而关于这一点,我在 type 与 object 的恩怨纠葛这篇文章讲得很详细了,感兴趣可以点击阅读一下。
简单来说就是,type 在底层对应的结构体为 PyType_Type、object 在底层对应的结构体为 PyBaseObject_Type。而在创建 object 的时候,将内部的 ob_type 设置成了&PyType_Type;在创建type的时候,将内部的 tp_base 设置成了&PyBaseObject_Type。
因此这两者的定义是彼此依赖的,两者是同时出现的,我们后面还会看到。
另外 type 的类型就是 type 本身,所以:
实例对象的类型是类型对象,类型对象的类型是元类;
所有类型对象的基类都收敛于 object;
所有对象的类型都收敛于 type;
因此 Python 算是将一切皆对象的理念贯彻到了极致,也正因为如此,Python 才具有如此优秀的动态特性。
但还没有结束,我们看一下类对象 Girl 的行为,首先它支持属性设置:
class Girl(object): passprint(hasattr(Girl, "name")) # FalseGirl.name = "古明地觉"print(hasattr(Girl, "name")) # Trueprint(Girl.name) # 古明地觉
在其他静态语言中,一旦定义一个类,就不能再添加属性,但在我们的语言中可以。Python是如何实现动态添加属性的呢?一般我们会想到字典
正如 global 名字空间一样,我们猜测类应该也有自己的属性字典,往类里面设置属性的时候,等价于向字典中添加键值对,同理其它操作也与之类似。
class Girl(object): passprint(Girl.__dict__.get("name", "不存在")) # 不存在Girl.name = "古明地觉"print(Girl.__dict__.get("name")) # 古明地觉
和操作全局变量是类似的,但是有一点需要注意:我们不能直接通过类的属性字典来设置属性。
try: Girl.__dict__["name"] = "古明地觉"except Exception as e: print(e) # 'mappingproxy' object does not support item assignment
虽然叫属性字典,但其实是 mappingproxy 对象,该对象本质上就是对字典进行了一层封装,在字典的基础上移除了增删改操作,也就是只保留了查询功能。要给类增加属性,可以使用直接赋值的方式或调用 setattr 函数。
但在介绍如何篡改虚拟机的时候,我们提到过一个骚操作,可以通过 gc 模块拿到 mappingproxy 对象里的字典。
import gcclass Girl(object): passgc.get_referents(Girl.__dict__)[0]["name"] = "古明地觉"print(Girl.name) # 古明地觉
并且这种做法除了适用于自定义类对象,还适用于内置类对象。但是工作中不要这么做,知道有这么个操作就行。
除了设置属性之外,我们还可以设置函数。
class Girl(object): passGirl.info = lambda name: f"我是{name}"print(Girl.info("古明地觉")) # 我是古明地觉# 如果实例调用的话,会和我们想象的不太一样# 因为实例调用的话会将函数包装成方法try: Girl().info("古明地觉")except TypeError as e: print(e) """<lambda>() takes 1 positional argument but 2 were given""" # 实例在调用的时候会将自身也作为参数传进去# 所以第一个参数 name 实际上接收的是 Girl 的实例对象# 只不过第一个参数按照规范来讲应该叫做self# 但即便你起别的名字也是无所谓的print(Girl().info()) """我是<__main__.girl>"""</__main__.girl></lambda>
所以我们可以有两种做法:
# 将其包装成一个静态方法# 这样类和实例都可以调用Girl.info = staticmethod(lambda name: f"我是{name}")print(Girl.info("古明地觉")) # 我是古明地觉print(Girl().info("古明地觉")) # 我是古明地觉# 如果是给实例用的,那么带上一个 self 参数即可Girl.info = lambda self, name: f"我是{name}"print(Girl().info("古明地觉")) # 我是古明地觉
此外我们还可以通过 type 来动态地往类里面进行属性的增加、修改和删除。
class Girl(object): def say(self): passprint(hasattr(Girl, "say")) # True# delattr(Girl, "say") 与之等价type.__delattr__(Girl, "say")print(hasattr(Girl, "say")) # False# 我们设置一个属性吧# 等价于 Girl.name = "古明地觉"setattr(Girl, "name", "古明地觉")print(Girl.name) # 古明地觉
事实上调用 getattr、setattr、delattr 等价于调用其类型对象的__getattr__、__setattr__、__delattr__。
所以,一个对象支持哪些行为,取决于其类型对象定义了哪些操作。并且通过对象的类型对象,可以动态地给该对象进行属性的设置。Python 所有类型对象的类型对象都是 type,通过 type 我们便可以控制类的生成过程,即便类已经创建完毕了,也依旧可以进行属性设置。
但是注意:type 可以操作的类只能是通过 class 定义的动态类,而像 int、list、dict 等静态类,它们是在源码中静态定义好的,只不过类型设置成了 type。一言以蔽之,type 虽然是所有类对象的类对象,但 type 只能对动态类进行属性上的修改,不能修改静态类。
try: int.name = "古明地觉"except Exception as e: print(e)"""can't set attributes of built-in/extension type 'int'"""try: setattr(int, "ping", "pong")except Exception as e: print(e)"""can't set attributes of built-in/extension type 'int' """
内置类和扩展类的属性无法被设置,这是由于内置类在解释器启动后就已被初始化。可以通过报错信息观察到这点。我们所说的扩展类,是指我们使用 Python/C API 编写的扩展模块中的类,其与内置类具有相同的地位。
因此内置类和使用 class 定义的类本质上是一样的,都是 PyTypeObject 对象,它们的类型在 Python 里面都是 type。不同的是,内置类在底层是以静态初始化方式实现的,因此我们无法通过动态设置属性的方式来操作它们(除非使用 gc 模块)。
但是为什么不可以对内置类和扩展类进行属性设置呢?首先我们要知道 Python 的动态特性是虚拟机赐予的,而虚拟机的工作就是将 PyCodeObject 对象翻译成 C 的代码进行执行,所以 Python 的动态特性就是在这一步发生的。
同理,扩展类和内置类在解释器启动后都已经被静态初始化,并直接指向 C 一级的数据结构。它们与解释执行绕开了相应过程,因此无法在其上动态添加属性。
不光内置的类本身,还有它的实例对象也是如此。
a = 123print(hasattr(a, "__dict__")) # False
我们发现它甚至连自己的属性字典都没有,因为解释器对于内置类对象的实例对象,其内部的属性和方法是已知的。由于底层代码已被固定且不允许修改,因此在实现虚拟机时无需创建属性字典,以节省内存。