1.HTTP基本概念

1.1 HTTP是什么？

　　 HTTP (超文本传输协议）协议被用于在 Web 浏览器和网站服务器之间传递信息， HTTP 协议以明文方式发送内容，不提供任何方式的数据加密，如果攻击者截取了 Web 浏览器和网站服务器之间的传输报文，就可以直接读懂其中的信息，因此， HTTP 协议不适合传输一些敏感信息，比如：信用卡号、密码等支付信息。

　　 HTTP 是一种无状态协议。无状态是指客户机和服务器之间不需要建立持久连接，这意味着当一个客户端向服务器发出请求，然后服务器返回响应，连接就被关闭了，在服务器端不保留连接的有关信息， HTTP 遵循请求/应答模型。

1.2 HTTP 为什么不安全？

　　 HTTP 协议由于是明文传输，主要存在三大风险：窃听风险、篡改风险、冒充风险。

1.2.1 窃听风险

　　中间人可以获取到通信内容，由于内容是明文，所以获取明文后有安全风险。

1.2.2 篡改风险

　　中间人可以篡改报文内容后再发送给对方，风险极大。

1.2.3 冒充风险

　　比如你以为是在和某宝通信，但实际上是在和一个钓鱼网站通信。

2.常见加密方式

2.1 对称加密

对称加密：

　　采用单密钥系统的加密方式，同一个密钥可以同时用作信息的加密和解密，加密和解密所用的密钥是相同的，加密速度快，效率高。

2.2 非对称加密

非对称加密：

　　用两个密钥进行加密和解密，一个是公钥一个是私钥，缺点是运算速度非常慢。

　　可以通过公钥对明文进行加密，形成密文，通过密钥对密文进行解密，形成明文。同理，也可以通过密钥对明文进行加密，公钥对明文进行解密，但是公钥是公开的，也就明文也随之公开了。

3.浅谈 HTTPS

2.1 HTTPS 是什么？

　　为了解决HTTP协议的安全缺陷，需要使用另一种协议：安全套接字层超文本传输协议HTTPS。为了数据传输的安全，HTTPS 通过SSL/TLS（安全套阶层）来加密数据包，SSL再通过数字证书来验证服务器的身份，以此来实现数据在客户端到服务器之间的传输安全。

2.2 安全通信的四大原则

　　一般我们认为安全的通信需要包括以下四个原则: 机密性、完整性，身份认证和不可否认。

　　★ 机密性：即对数据加密，解决了窃听风险，因为即使被中间人窃听，由于数据是加密的，他也拿不到明文；

　　★ 完整性：指数据在传输过程中没有被篡改，不多不少，保持原样，中途如果哪怕改了一个标点符号，接收方也能识别出来，从来判定接收报文不合法；

　　★ 身份认证：确认对方的真实身份，即证明“你妈是你妈”的问题，这样就解决了冒充风险，用户不用担心访问的是某宝结果却在和钓鱼网站通信的问题；

　　★ 不可否认: 即不可否认已发生的行为，比如小明向小红借了 1000 元，但没打借条，或者打了借条但没有签名，就会造成小红的资金损失。接下来我们一步步来看看 HTTPS 是如何实现以满足以上四大安全通信原则的。

2.3 HTTPS 通信原理

2.3.1 对称加密：HTTPS 的最终加密形式

　　既然 HTTP 是明文传输的，那我们给报文加密不就行了，既然要加密，我们肯定需要通信双方协商好密钥吧。一种是通信双方使用同一把密钥，即对称加密的方式来给报文进行加解密。

对称加密：通信双方使用同一把密钥进行加、解密

　　对称加密具有加解密速度快，性能高的特点，也是 HTTPS 最终采用的加密形式。

　　但是，这里有一个关键问题：对称加密的通信双方要使用同一把密钥，这个密钥是如何协商出来的？如果通过报文的方式直接传输密钥，之后的通信其实还是在裸奔，因为这个密钥会被中间人截获甚至替换掉，这样中间人就可以用截获的密钥解密报文，甚至替换掉密钥以达到篡改报文的目的。

　　有人说对这个密钥加密不就完了，但对方如果要解密这个密钥还是要传加密密钥给对方，依然还是会被中间人截获的，这么看来：直接传输密钥无论怎样都无法摆脱俄罗斯套娃的难题，是不可行的。

2.3.2 非对称加密：解决单向对称密钥的传输问题

　　直接传输密钥，无论从哪一端传都是不行了，这里我们试一下另一种加密方式：非对称加密。

　　非对称加密即加解密双方使用不同的密钥，一把作为公钥，可以公开的，一把作为私钥，不能公开，公钥加密的密文只有私钥可以解密，私钥加密的内容，也只有公钥可以解密。

注意：

　　私钥加密其实这个说法其实并不严谨，准确的说私钥加密应该叫私钥签名。因为私密加密的信息公钥是可以解密的，而公钥是公开的，任何人都可以拿到，用公钥解密叫做验签。

　　这样的话，对于 Server 来说，保管好私钥，发布公钥给其他 Client, 其他 Client 只要把对称加密的密钥加密传给 Server 即可。如此一来由于公钥加密只有私钥能解密，而私钥只有 Server 有，所以能保证 Client 向 Server 传输是安全的，Server 解密后即可拿到对称加密密钥，这样交换了密钥之后就可以用对称加密密钥通信了。

　　但是问题又来了， Server 怎么把公钥安全地传输给 Client 呢？如果直接传公钥，也会存在被中间人调包的风险。

2.3.3 数字证书：解决公钥传输信任问题

　　如何解决公钥传输问题呢？

　　从现实生活中的场景找答案：员工入职时，企业一般会要求提供学历证明，显然不是什么阿猫阿狗的本本都可称为学历，这个学历必须由第三方权威机构（Certificate Authority，简称 CA）即教育部颁发。同理，Server 也可以向 CA 申请证书，在证书中附上公钥，然后将证书传给 Client，证书由站点管理者向 CA 申请，申请的时候会提交 DNS 主机名等信息，CA 会根据这些信息生成证书。

　　这样当 Client 拿到证书后，就可以获得证书上的公钥，再用此公钥加密对称加密密钥传给 Server 即可。看起来确实很完美，不过在这里要考虑两个问题:

问题一：如何验证证书的真实性？如何防止证书被篡改？

　　想象一下上文中我们提到的学历，企业如何认定你提供的学历证书是真是假呢？答案是用学历编号，企业拿到证书后用学历编号在学信网上一查就知道证书真伪了，学历编号其实就是我们常说的数字签名，可以防止证书造假。

　　回到 HTTPS 上，证书的数字签名该如何产生的呢？一图胜千言：

　　步骤如下：

　　1、首先使用一些摘要算法（如 MD5）将证书明文（如证书序列号，DNS 主机名等）生成摘要，然后再用第三方权威机构的私钥对生成的摘要进行加密（签名）。

　　消息摘要是把任意长度的输入揉和而产生长度固定的伪随机输入的算法，无论输入的消息有多长，计算出来的消息摘要的长度总是固定的。一般来说，只要内容不同，产生的摘要必然不同（相同的概率可以认为接近于 0），所以可以验证内容是否被篡改了。

　　为什么要先生成摘要再加密呢，不能直接加密？

　　因为使用非对称加密是非常耗时的。如果把整个证书内容都加密生成签名的话，客户端验签也需要把签名解密，证书明文较长，客户端验签就需要很长的时间，而用摘要的话，会把内容很长的明文压缩成小得多的定长字符串，客户端验签的话就会快得多。

　　2、客户端拿到证书后，首先，使用第三方权威机构的公钥对签名进行解密（验签），得到验签的结果（摘要）。然后，用同样的摘要算法对证书明文计算摘要。两者一笔对就可以发现报文是否被篡改了。

　　为什么要用第三方权威机构（Certificate Authority，简称 CA）私钥对摘要加密呢？

　　因为摘要算法是公开的，中间人可以替换掉证书明文，再根据证书上的摘要算法计算出摘要后把证书上的摘要也给替换掉！这样 Client 拿到证书后计算摘要发现一样，误以为此证书是合法就中招了。所以，必须要用 CA 的私钥给摘要进行加密生成签名，这样的话 Client 得用 CA 的公钥来给签名解密，拿到的才是未经篡改合法的摘要（私钥签名，公钥才能解密）。

　　Server 将证书传给 Client 后，Client 的验签过程如下：

　　这样的话，由于只有 CA 的公钥才能解密签名，如果客户端收到一个假的证书，使用 CA 的公钥是无法解密的，如果客户端收到了真的证书，但证书上的内容被篡改了，摘要比对不成功的话，客户端也会认定此证书非法。

　　细心的你一定发现了问题，CA 公钥如何安全地传输到 Client ？

　　如果还是从 Server 传输到 Client，依然无法解决公钥被调包的风险。实际上此公钥是存在于 CA 证书上，而此证书（也称 Root CA 证书）被操作系统信任，内置在操作系统上的，无需传输，如果用的是 Mac 的同学，可以打开 keychains 查看一下，可以看到很多内置的被信任的证书。

　　Server 传输 CA 颁发的证书，客户收到证书后使用内置 CA 证书中的公钥来解密签名，验签即可，这样的话就解决了公钥传输过程中被调包的风险。