写猫语:Python是一种容易入门的语言,初学者可以轻松地完成各种任务,但Python的用途和界限也很广,值得我们研究的主题太多了。今天,我将继续给大家分享一篇优质的高级文章,让我们一起学习进步吧!
作者:Prodesire(经作者许可转载)
来源:
零前缀
去年11月,PyCon China 2018杭州站分享了PyCon源代码加密,解释了如何修改PyCon解释程序对PyCon代码进行加密解密。但是笔者因为拖延症发作,一直没有及时整理成文字版,现在才战胜它,才有了这篇文章。
本系列首先介绍了现有源代码加密方案的思想、方法、优点和缺点,介绍了如何自定义Python解释程序,以便更好地加密和解密源代码。
由于python的动态特性和开源功能,python代码很难加密。社区的一些声音认为,这些限制是真的,必须通过法律手段(而不是加密来源)实现商业保护。有些声音是想拥有无论如何都能加密的手段。(阿尔伯特爱因斯坦,声音名言)因此,人们想到了各种加密或混淆方案,达到了保护酱的目的。
2.1想法
我们的目的是通过一系列转换使代码越来越不容易理解,所以可以这样开始。-移除注释和文档。没有这样的解释,在一些重要逻辑中就不能那么容易理解。-变更缩排。完美的缩进看着舒服,缩进长着短着看着也会烦躁。-在令牌之间添加空格。类似于更改缩进。-重命名函数、类和变量。命名直接影响可读性,乱七八糟的名字是阅读理解的一大障碍。-在空行上插入无效代码。这就是眼罩,用无关的代码扰乱阅读节奏。
2.2方法
方法1:使用oxyry混淆
这是一个在线混淆Python代码的网站,很容易混淆。
假设有包含类、函数、参数等的python代码。
# coding: UTF-8
a类(对象):
单击“”
Description
单击“”
Def _ _ init _ _ (self,x,y,default=none) :
=x y
=default
Def name(self):
Return 'No Name '
Def always():
Return True
Num=1
A=A(num,999,100)
A.name()
Always()
通过Oxyry的混淆,得到以下代码:
a类(实体): #行33604
#line:7
Def __init__ (O0O0O)
0OO00OO000O0 ,OO0O0OooO0000O0OO ,OO0OO00O00OO00OOO ,OO000OOO0O000OOO0 =None ):#line:9 O0O0O0OO00OO000O0 .z =OO0O0OOOO0000O0OO +OO0OO00O00OO00OOO #line:10 O0O0O0OO00OO000O0 .default =OO000OOO0O000OOO0 #line:11 def name (O000O0O0O00O0O0OO ):#line:13 return 'No Name'#line:14 def always ():#line:17 return True #line:18 num =1 #line:21 a =A (num ,999 ,100 )#line:22 a .name ()#line:23 always ()混淆后的代码主要在注释、参数名称和空格上做了些调整,稍微带来了点阅读上的障碍。
方法二:使用 pyobfuscate 库进行混淆
pyobfuscate 算是一个颇具年头的 Python 代码混淆库了,但却是“老当益壮”了。
对上述同样一段 Python 代码,经 pyobfuscate 混淆后效果如下:
# coding: utf-8 if 64 - 64: i11iIiiIii if 65 - 65: O0 / iIii1I11I1II1 % OoooooooOO - i1IIi class o0OO00 ( object ) : if 78 - 78: i11i . oOooOoO0Oo0O if 10 - 10: IIiI1I11i11 if 54 - 54: i11iIi1 - oOo0O0Ooo if 2 - 2: o0 * i1 * ii1IiI1i % OOooOOo / I11i / Ii1I def __init__ ( self , x , y , default = None ) : self . z = x + y self . default = default if 48 - 48: iII111i % IiII + I1Ii111 / ooOoO0o * Ii1I def name ( self ) : return 'No Name' if 46 - 46: ooOoO0o * I11i - OoooooooOO if 30 - 30: o0 - O0 % o0 - OoooooooOO * O0 * OoooooooOO def Oo0o ( ) : return True if 60 - 60: i1 + I1Ii111 - I11i / i1IIi if 40 - 40: oOooOoO0Oo0O / O0 % ooOoO0o + O0 * i1IIi I1Ii11I1Ii1i = 1 Ooo = o0OO00 ( I1Ii11I1Ii1i , 999 , 100 ) Ooo . name ( ) Oo0o ( ) # dd678faae9ac167bc83abf78e5cb2f3f0688d3a3相比于方法一,方法二的效果看起来更好些。除了类和函数进行了重命名、加入了一些空格,最明显的是插入了若干段无关的代码,变得更加难读了。
2.3 优点
- 简单方便,提高了一点源码破解门槛
- 兼容性好,只要源码逻辑能做到兼容,混淆代码亦能
2.4 不足
- 只能对单个文件混淆,无法做到多个互相有联系的源码文件的联动混淆
- 代码结构未发生变化,也能获取字节码,破解难度不大
3 使用 py2exe
3.1 思路
py2exe 是一款将 Python 脚本转换为 Windows 平台上的可执行文件的工具。其原理是将源码编译为 .pyc 文件,加之必要的依赖文件,一起打包成一个可执行文件。
如果最终发行由 py2exe 打包出的二进制文件,那岂不是达到了保护源码的目的?
3.2 方法
使用 py2exe 进行打包的步骤较为简便。
1)编写入口文件。本示例中取名为 :
print 'Hello World'2)编写 :
from di import setup import py2exe setup(console=[''])3)生成可执行文件
python py2exe生成的可执行文件位于 dist\。
3.3 优点
- 能够直接打包成 exe,方便分发和执行
- 破解门槛比 .pyc 更高一些
3.4 不足
- 兼容性差,只能运行在 Windows 系统上
- 生成的可执行文件内的布局是明确、公开的,可以找到源码对应的 .pyc 文件,进而反编译出源码
4 使用 Cython
4.1 思路
虽说 Cython 的主要目的是带来性能的提升,但是基于它的原理:将 .py/.pyx 编译为 .c 文件,再将 .c 文件编译为 .so(Unix) 或 .pyd(Windows),其带来的另一个好处就是难以破解。
4.2 方法
使用 Cython 进行开发的步骤也不复杂。
1)编写文件 x 或 :
def hello(): print('hello')2)编写 :
from di import setup from Cy import cythonize setup(name='Hello World app', ext_modules=cythonize('x'))3)编译为 .c,再进一步编译为 .so 或 .pyd:
python build_ext --inplace执行 python -c "from hello import hello;hello()" 即可直接引用生成的二进制文件中的 hello() 函数。
4.3 优点
- 生成的二进制 .so 或 .pyd 文件难以破解
- 同时带来了性能提升
4.4 不足
- 兼容性稍差,对于不同版本的操作系统,可能需要重新编译
- 虽然支持大多数 Python 代码,但如果一旦发现部分代码不支持,完善成本较高
下文我们将重点介绍一种新的保护源码的方法。