盘点Python爬虫中的常见加密算法,建议收藏!!
基础常识
加密(Encryption): 将明文数据变换为密文的过程 解密(Decryption): 加密的逆过程,即由密文恢复出原明文的过程。
对称加密:即加密与解密时使用的是相同的密钥,例如RC4、AES、DES等加密算法 非对称加密:即加密与解密时使用不相同的密钥,例如RSA加密算法等 散列算法:又称为是哈希函数。对不同长度的输入消息产生固定的输出,该输出值就是散列值
Base64伪加密
Base64
严格意义上来说不算做事加密的算法,只是一种编码的方式,它是一种用64个字符,分别是A-Z
、a-z
、0-9
、+
、/
这64个字符,实现对数据的编码,可用于在HTTP
环境下传递较长的标识信息。采用Base64
编码具有不可读性,需要解码后才能阅读。我们使用Python
来对任意网址进行Base64
的编码操作,代码如下import base64
# 想将字符串转编码成base64,要先将字符串转换成二进制数据
url = "www.baidu.com"
bytes_url = url.encode("utf-8")
str_url = base64.b64encode(bytes_url) # 被编码的参数必须是二进制数据
print(str_url)
output
b'd3d3LmJhaWR1LmNvbQ=='
那么同样地,我们也可以对其进行解码的操作,代码如下
url = "d3d3LmJhaWR1LmNvbQ=="
str_url = base64.b64decode(url).decode("utf-8")
print(str_url)
www.baidu.com
MD5加密
MD5
是一种被广泛使用的线性散列算法,且加密之后产生的是一个固定长度(32位或者是16位)的数据,由字母和数字组成,大小写统一。其最后加密生成的数据是不可逆的,也就是说不能够轻易地通过加密后的数据还原到原始的字符串,除非是通过暴力破解的方式。
我们在Python当中来实现一下MD5
加密
import hashlib
str = 'this is a md5 demo.'
hl = hashlib.md5()
hl.update(str.encode(encoding='utf-8'))
print('MD5加密前为 :' + str)
print('MD5加密后为 :' + hl.hexdigest())
output
MD5加密前为 :this is a md5 demo.
MD5加密后为 :b2caf2a298a9254b38a2e33b75cfbe75
就像上文提到的,针对MD5加密可以通过暴力破解的方式来降低其安全性,因此在实操过程当中,我们会添加盐值(Salt)或者是双重MD5加密等方式来增加其可靠性,代码如下
# post传入的参数
params = "123456"
# 加密后需拼接的盐值(Salt)
salt = "asdfkjalksdncxvm"
def md5_encrypt():
m = md5()
m.update(params.encode('utf8'))
sign1 = m.hexdigest()
return sign1
def md5_encrypt_with_salt():
m = md5()
m.update((md5_encrypt() + salt).encode('utf8'))
sign2 = m.hexdigest()
return sign2
AES/DES对称加密
DES
加密,全称是Data Encryption Standard
,即数据加密标准,在对称性加密当中比较常见的一种,也就是加密和解密过程当中使用的密钥是相同的,因此想要破解的话,通过暴力枚举的方式,只要计算的能力足够强还是可以被破解的。AES
的全称是Advanced Encryption Standard
,是DES
算法的替代者,也是当今最流行的对称加密算法之一。想要弄清楚AES
算法,首先就得弄明白三个基本的概念:密钥、填充和模式。密钥
填充
填充
这一概念,AES的分组加密的特性我们需要了解,具体如下图所示AES
算法在对明文加密的时候,并不是把整个明文一股脑儿地加密成一整段密文,而是把明文拆分成一个个独立的明文块,每一个明文块的长度为128比特。AES
加密器的复杂处理之后,生成一个个独立的密文块,将这些密文块拼接到一起就是最终的AES
加密的结果了。填充
来发挥作用了,默认的填充方式是PKCS5Padding
以及ISO10126Padding
。模式
AES
的工作模式,体现在了把明文块加密成密文块的处理过程中,主要有五种不同的工作模式,分别是CBC
、ECB
、CTR
、CFB
以及OFB
模式,同样地,如果在AES加密过程当中使用了某一种工作模式,解密的时候也必须采用同样地工作模式。最后我们用Python
来实现一下AES
加密import base64
from Crypto.Cipher import AES
def AES_encrypt(text, key):
pad = 16 - len(text) % 16
text = text + pad * chr(pad)
text = text.encode("utf-8")
encryptor = AES.new(key.encode('utf-8'), AES.MODE_ECB)
encrypt_text = encryptor.encrypt(text)
encrypt_text = base64.b64encode(encrypt_text)
return encrypt_text.decode('utf-8')
AES
加密算法的实现过程,基本上也都是大同小异的,由于篇幅有限,今天暂时就先介绍到这里,后面要是大家感兴趣的话,会去分享一下其他加密算法的实现原理与特征。