知行编程网知行编程网  2022-11-28 02:00 知行编程网 隐藏边栏  12 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于一文了解python编程的开发机制的相关知识,包括关于python内存管理,以及python编程入门这些编程知识,希望对大家有参考作用。

一文看懂python编程开发机制

如果你曾经编写或使用过 Python,你可能已经习惯于查看 Python 源代码文件;他们的名字以 .Py 结尾。你可能见过的另一种以 .pyc 结尾的文件是 Python“字节码”文件。 (在Python3中,.pyc后缀的文件不好找,在一个名为pycache的子目录下。).pyc文件可以避免Python每次运行都重新解析源码,大大节省了时间。

Python是如何工作的

Python 通常被描述为一种解释型语言,你的源代码在程序运行时被翻译成 CPU 指令,但这只是部分正确。与许多解释型语言一样,Python 实际上将源代码编译成一组用于虚拟机的指令,Python 解释器是该虚拟机的实现。其中,这种中间格式称为“字节码”。

因此,Python留下的这些.pyc文件是为了让运行速度变得“更快”,或者说是你源代码的“优化”版本;它们是运行在 Python 虚拟机指令上的字节码。

Python 虚拟机内幕

CPython 使用基于堆栈的虚拟机。也就是说,它完全围绕堆栈数据结构(你可以将项目“推”到结构的“顶部”,或将项目“弹出”到“顶部”)。

CPython 使用三种类型的栈:

1.调用栈。这是正在运行的 Python 程序的主要结构。对于每个当前活动的函数调用,它都有一个“框架”项,堆栈的底部是程序的入口点。每个函数调用都会将一个新帧推送到调用堆栈上,并且每次函数调用返回时都会弹出它的帧

2. 在每一帧中,都有一个评估堆栈(也称为数据堆栈)。这个堆栈是执行 Python 函数的地方,执行 Python 代码基本上包括将东西压入这个堆栈、操作它们和弹出它们。

3. 同样在每一帧中,都有一个块栈。 Python 使用它来跟踪某些类型的控制结构:循环、try/except 块和 with 块都会导致将条目推入块堆栈,只要退出其中一个结构,块堆栈就会弹出。这有助于 Python 知道哪些块在任何给定时刻处于活动状态,例如continue 或 break 语句可以影响正确的块。

大多数 Python 字节码指令对当前调用堆栈帧的计算堆栈进行操作,尽管有一些指令可以做其他事情(例如跳转到特定指令,或操作块堆栈)。

为了更好地理解,假设我们有一些调用函数的代码,如下所示

my_function(my_variable,2)。

Python 将转换为一系列字节码指令:

1. 一条LOAD_NAME指令找到函数对象my_function并将其压入计算栈的顶部

2. 另一个 LOAD_NAME 指令找到变量 my_variable 并将其压入计算栈的顶部

3.一个 LOAD_CONST 指令将一个整数 2 推送到计算栈的顶部

4.一个 CALL_FUNCTION 指令

CALL_FUNCTION 指令有 2 个参数,这表明 Python 需要在堆栈顶部弹出两个位置参数;那么这个函数就会被调用,同时它也会被弹出(对于带关键字参数的函数,使用指令-CALL_FUNCTION_KW - 类似的,并使用第三条指令CALL_FUNCTION_EX,适用于函数调用涉及对参数使用 * 或 ** 运算符)

一旦 Python 有了它,它就会在调用堆栈上分配一个新帧,填充函数调用的本地变量,并在该帧内运行 my_function 的字节码。运行完成后,该帧将从调用堆栈中弹出,而在原始帧中,my_function 的返回值将被压入计算堆栈的顶部。

这个东西我们知道,字节码文件我们也知道,但是字节码怎么用呢? ok 不知道也没关系,我们接下来的话题都是围绕字节码展开的。 python中有一个模块可以通过反编译Python代码生成字节码。这个模块就是我们今天要说的--dis模块。

dis模块的使用

dis 模块包括用于操作 Python 字节码的函数,可以将其“反汇编”为更易于阅读的形式。查看解释器运行的字节码也有助于优化代码。此模块对于查找多线程中的竞争条件也很有用,因为它可用于评估代码线程控制可能切换的位置。参考源码Include/opcode.h找到官方的字节码列表。有关详细信息,请参阅官方文档。注意不同版本的python生成的字节码内容可能不同,这里我使用的是Python 3.8。

访问和理解字节码

输入如下内容,然后运行它:

def hello()
    print("Hello, World!")
import dis
dis.dis(hello)

函数 dis.dis() 将反汇编函数、方法、类、模块、已编译的 Python 代码对象或字符串中包含的源代码,并显示人类可读的版本。 dis 模块中的另一个方便的函数是 distb()。你可以向它传递一个 Python traceback 对象,或者在意外发生时调用它,它会在意外发生时反汇编调用堆栈上的最顶层函数,显示其字节码,并插入一个指向导致异常的指令的指针。

它还可用于查看 Python 为每个函数构建的已编译代码对象,因为运行函数将使用这些代码对象的属性。这是一个查看 hello() 函数的示例:

>>> hello.__code__<code object hello at 0x104e46930, file "<stdin>", line 1>>>> hello.__code__.co_consts
(None, 'Hello, World!')>>> hello.__code__.co_varnames
()>>> hello.__code__.co_names
('print',)

code对象可以作为函数中的属性code来访问,它携带了一些重要的属性:

co_consts是存在于函数体内的任意实数的元组

co_varnames 是一个元组,包含函数体内使用的任何局部变量的名称

co_names是在函数体内引用的任意非本地名字的元组

许多字节码指令——尤其是那些将值加载到堆栈上,或将值存储在变量和属性中的指令——将索引作为它们的参数放入这些元组中。

所以现在我们可以理解 hello() 函数中列出的字节码了:

1. LOAD_GLOBAL 0:告诉Python在co_names的index 0上查找name指向的全局对象(就是打印函数),然后压入计算栈

2. LOAD_CONST 1:在索引1处带入co_consts的字面值并压入(索引0处的字面值为None,用co_consts表示,因为Python函数调用隐式返回值为None,如果有没有显式返回表达式,返回这个隐式值)。

3. CALL_FUNCTION 1:告诉Python调用一个函数;它需要从堆栈中弹出一个位置参数,然后,函数将调用新的堆栈顶部。

“原始”字节码——一种非人类可读格式的字节——也可用作代码对象的 co_code 属性。如果你有兴趣尝试手动反汇编函数,可以使用 dis.opname 从十进制字节值中查看字节码指令名称。

基本反汇编

函数 dis() 可以打印 Python 源代码(模块、类、方法、函数或代码对象)的反汇编表示。 dis_simple.py 等模块可以通过从命令行运行 dis 来反汇编。

dis_simple.py
#!/usr/bin/env python3
# encoding: utf-8
my_dict = {'a': 1}

输出按列组织,包含原始源代码行号、代码对象中指令的地址、操作码名称以及传递给操作码的任何参数。

对于简单的代码,我们可以通过命令行执行如下命令:

python3 -m dis dis_simple.py

输出

1           0 LOAD_CONST               0 ('a')
              2 LOAD_CONST               1 (1)
              4 BUILD_MAP                1
              6 STORE_NAME               0 (my_dict)
              8 LOAD_CONST               2 (None)
             10 RETURN_VALUE

此处源代码转换为 4 个不同的操作来创建和填充字典,然后将结果保存到局部变量。

首先解释每一行各列参数的含义:

以第一条指令为例:

第一列 数字(1)表示对应源代码的行数。

第二列(可选)指示当前正在执行的指令(例如,当字节码来自帧对象时)[本示例没有]

第三列是一个标签,表示从上一条指令到这条指令可能的JUMP【本例没有】

第四列数字是字节索引对应的字节码中的地址(这些是 2 的倍数,因为 Python 3.6 每条指令使用 2 个字节,这可能与以前的版本不同)指令 LOAD_CONST 在 0 位置。

第五列是指令本身的人类可读名称,这里是“LOAD_CONST”

第六列是Python内部用来获取某些常量或变量、管理堆栈、跳转到特定指令等的指令的参数(如果有的话)。

第七列 计算后的实际参数。

然后让我们看看这个过程:

由于 Python 解释器是基于堆栈的,前几步是使用 LOAD_CONST 将常量以正确的顺序放入堆栈,然后使用 BUILD_MAP 弹出新的键和值以添加到字典中。将生成的带有 STORE_NAME 的字典对象绑定到 my_dict。

反汇编函数

需要注意的是,上述命令行反编译形式不能自动递归反编译函数,所以我们需要使用在文件中导入dis的方式进行反编译,如下图。

#dis_function.py
def f(*args):
    nargs = len(args)
    print(nargs, args)

if __name__ == '__main__':
    import dis
    dis.dis(f)

运行命令

python3 dis_function.py

然后得到以下结果

2           0 LOAD_GLOBAL              0 (len)
              2 LOAD_FAST                0 (args)
              4 CALL_FUNCTION            1
              6 STORE_FAST               1 (nargs)

  3           8 LOAD_GLOBAL              1 (print)
             10 LOAD_FAST                1 (nargs)
             12 LOAD_FAST                0 (args)
             14 CALL_FUNCTION            2
             16 POP_TOP
             18 LOAD_CONST               0 (None)
             20 RETURN_VALUE

要查看函数内部,必须将函数传递给 dis()。因为这里打印的是函数内部的内容,所以不显示函数外层的行号,而是从2开始。

下面解析下每一行指令的含义:

1、LOAD_GLOBAL用于加载全局变量,包括指定的函数名、类名、模块名等全局符号。这是 len 函数。 LOAD_FAST一般是加载局部变量的值,也就是读取值,用于计算或者函数调用传参等,这里是传入参数args。

2、一般是先指定要调用的函数,然后压入参数,最后通过CALL_FUNCTION调用。

3、STORE_FAST 保存值到局部变量。也就是把结果赋值给 STORE_FAST。

4、下面的print因为2个参数LOAD_FAST 2次,POP_TOP删除栈顶(TOS)项。 LOAD_CONST 加载const变量,比如values,strings等,其中value为None因为是print。

5、最后通过RETURN_VALUE来确定函数结尾。

要打印函数的摘要信息,我们可以使用 dis 的 show_code 方法,其中包含有关使用的参数和名称的信息。 show_code 的参数是函数对象。代码如下:

def f(*args):
    nargs = len(args)
    print(nargs, args)

if __name__ == '__main__':
    import dis
    dis.show_code(f)

运行结果

Name:              f
Filename:          dis_function_showcode.py
Argument count:    0
Kw-only arguments: 0
Number of locals:  2
Stack size:        3
Flags:             OPTIMIZED, NEWLOCALS, VARARGS, NOFREE
Constants:
   0: None
Names:
   0: len
   1: print
Variable names:
   0: args
   1: nargs

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享