HTTPS常见问题详解

随着网络不断融入日常生活和工作当中,网络安全问题一直都是一个不能忽略的问题。据CNCERT监测发现,2015年网页仿冒、拒绝服务攻击等已经形成成熟地下产业链的威胁仍然呈现增长趋势,针对中国网站的仿冒页面(URL链接)191699个,较2014年增长85.7%,涉及IP地址20488个,较2014年增长199.4%。网页篡改、网站后门等攻击事件层出不穷,党政机关、科研机构、重要行业单位网站依然是黑客组织攻击特别是APT攻击的重点目标。2015年被植入后门的中国网站数量为75028个,较2014年增长86.7%,其中政府网站为3514个,较2014年增长130%。


2014年底,百度已对部分地区开放HTTPS加密搜索服务,随后,百度实行全站化HTTPS安全加密服务,百度HTTPS安全加密已覆盖主流浏览器,旨在用户打造了一个更隐私化的互联网空间、加速了国内互联网的HTTPS化。同时也希望更多网站加入到HTTPS的队伍中来,为网络安全贡献一份力量。在此,百度站长学院向大家详细介绍一下HTTPS,后续还会有更详细深入的方案教程推出,各位敬请期待。


HTTPS是什么? HTTPS的工作原理

HTTPS是什么

HTTPS(全称:Hyper Text Transfer Protocol over Secure Socket Layer),是以安全为目标的HTTP通道,简单讲是HTTP的安全版。即HTTP下加入SSL层,HTTPS的安全基础是SSL,因此加密的详细内容就需要SSL。 HTTPS存在不同于HTTP的默认端口及一个加密/身份验证层(在HTTP与TCP之间)。这个系统提供了身份验证与加密通讯方法。现在它被广泛用于万维网上安全敏感的通讯,例如交易支付方面。


传统的HTTP模式,存在着大量的灰色中间环节,相关信息很容易被窃取,但HTTPS却是通过认证用户与服务器,将数据准确地发送到客户机与服务器,并采用加密方式以防数据中途被盗取,大大降低了第三方窃取信息、篡改冒充身份的风险。


HTTPS安全原理解析

HTTPS主要由有两部分组成:HTTP + SSL / TLS,也就是在HTTP上又加了一层处理加密信息的模块。服务端和客户端的信息传输都会通过TLS进行加密,所以传输的数据都是加密后的数据。HTTPS与HTTP的原理区别可以观察下图:

HTTP工作原理:

①客户端的浏览器首先要通过网络与服务器建立连接,该连接是通过TCP来完成的,一般TCP连接的端口号是80。 建立连接后,客户机发送一个请求给服务器,请求方式的格式为:统一资源标识符(URL)、协议版本号,后边是MIME信息包括请求修饰符、客户机信息和许可内容。

② 服务器接到请求后,给予相应的响应信息,其格式为一个状态行,包括信息的协议版本号、一个成功或错误的代码,后边是MIME信息包括服务器信息、实体信息和可能的内容。

HTTPS的工作原理:

①. 客户端将它所支持的算法列表和一个用作产生密钥的随机数发送给服务器;

②. 服务器从算法列表中选择一种加密算法,并将它和一份包含服务器公用密钥的证书发送给客户端;该证书还包含了用于认证目的的服务器标识,服务器同时还提供了一个用作产生密钥的随机数;

③. 客户端对服务器的证书进行验证(有关验证证书,可以参考数字签名),并抽取服务器的公用密钥;然后,再产生一个称作pre_master_secret的随机密码串,并使用服务器的公用密钥对其进行加密(参考非对称加/解密),并将加密后的信息发送给服务器;

④. 客户端与服务器端根据pre_master_secret以及客户端与服务器的随机数值独立计算出加密和MAC密钥(参考DH密钥交换算法)。

⑤. 客户端将所有握手消息的MAC值发送给服务器;

⑥. 服务器将所有握手消息的MAC值发送给客户端。

HTTPS的数据加密性:

HTTPS中数据的保密性主要是通过加密完成的。加密算法一般分为两种,一种是非对称加密(也叫公钥加密),另外一种是对称加密(也叫密钥加密)。

HTTPS使用非对称加解密主要有两个作用,一个是密钥协商,另外可以用来做数字签名。所谓密钥协商简单说就是根据双方各自的信息计算得出双方传输内容时对称加解密需要使用的密钥。如下图:

对称加密就是加密和解密都使用的是同一个密钥。如下图:

HTTS多次握手和复杂的加密机制有效的加大了网站的安全性,加密机制与认证机制可以减少网站被劫持和假冒的风险!


搭建HTTPS网站的准备工作和注意事项

搭建HTTPS网站的准备工作

简单来说,HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议,所以HTTPS网站搭建中比较重要的内容都是围绕着SSL证书进行的。

那我们应该做什么准备工作,如下图:

网站选型:

HTTPS会提升网站安全性,同样也拉高技术成本,所以我们建议一些涉及到用户隐私信息的网站进行HTTPS建设,公开性的内容是根据网站自身情况进行选择;

证书申请:

①CSR文件制作:申请SSL证书之前,需要制作CSR文件,CSR,Certificate Signing Request,是制作SSL 证书的必要步骤。一个 CSR 文件中描述了 SSL 证书持有人的信息(如个人姓名或公司名称)、联系地址等,用于验证 SSL 证书和域名是同一个人持有,以确保网站的合法性。制作完成后向 SSL 证书提供商上传这个文件,以获得最终的 SSL 证书。

在申请服务器证书时,不要出现某些特殊字符,否则在您提交CSR后,会出现"105"的错误代码。这个错误是由于在您生成CSR时,输入的信息中包含一些特殊字符,如:(@,#,&,!,等等,例如:您可以将"&"用"and"代替)。

在您生成CSR时,公用名(Common Name)是必须填写的,但许多客户填写这一项时,经常填错或不符合标准。

公用名(Common Name) 是您的主机名+域名,比如:www.willrey.com维瑞的服务器证书是颁发给某一台主机的,而不是一个域,您的公用名(Common Name)必须与您要使用服务器证书的主机的全名完全相同,因为www.domain.com与domain.com是不同的。 

要生成CSR文件,你必须为服务器创建一对密钥对。密钥对和证书是不可分开的,一旦您遗失了公钥、私钥或密码,重新生成密钥对后,和原来的证书就不匹配了。如果您申请的是全球信SSL证书,可以重新提交CSR免费重发证书;如果您申请的是闪快SSL证书,就必须重新付费申请证书。 

②CA认证证书申请:将CSR提交给CA,CA一般有2种认证方式:

 1)域名认证:一般通过对管理员邮箱认证的方式,这种方式认证速度快,但是签发的证书中没有企业的名称;

 2)企业文档认证:需要提供企业的营业执照。

 也有需要同时认证以上2种方式的证书,叫EV ssl证书,这种证书可以使IE7以上的浏览器地址栏变成绿色,所以认证也最严格。

③证书安装:

在收到CA的证书后,可以将证书部署上服务器,一般APACHE文件直接将KEY+CER复制到文件上,然后修改httpD.CONF文件;TOMCAT等,需要将CA签发的证书CER文件导入JKS文件后,复制上服务器,然后修改SERVER.XML;IIS需要处理挂起的请求,将CER文件导入。

鉴于对建站成本的考虑,需要高级别ssl 证书的往往是大中型网站,如网上银行、购物网站、金融证券、政府机构等,诸如个人博客之类的小型站点完全可以先尝试免费ssl证书。

服务器选购:

考虑到CSR和SSL证书与服务器的环境配置及功能支持有必不可分的联系,建议在再选购服务器之前做好充分的考虑。尤其是对服务器是否支持SSL功能,是否与证书匹配等功能需要重视;

网站开发:

由于网站功能与开发语言各不相同,在这就不详细说明网站开发的准备工作了,HTTPS网站与HTTP网站在开发期间基本是一致的,只是使用协议不同。

HTTPS网站搭建中的注意事项

HTTPS网站的加密功能决定了在搭建过程中一定要注意一些问题:

1、衡量投入与产出无论是做一个新的HTTPS站还是从HTTP转成HTTPS的网站,都需要投入硬件、软件、人力等新的成本,所以在未评估之前建议不要做;一旦做好,轻易不要关闭HTTPS网站倒退回HTTP,这种倒退行为很容易造成不利影响;

2、证书申请机构:在选择申请机构之前一定要考察核对该机构是否有可信资质,有些机构没有被国际机构认可(浏览器上会没有小绿锁),也有些机构在访问地域上有所限制,还有的机构出现过公钥泄露的情况,所以请慎重选择;

3、证书的选择:因为网站的开发语言、使用功能和服务器环境不同,证书的选择也不同,所以在选择时要考虑好需要什么证书,避免浪费成本;

4、网站路径方式:在HTTP网站上绝对路径和相对路径并没有明显的区别,但是在HTTPS和HTTP共存的情况如果使用绝对路径容易出现协议混淆的情况,如果混淆后可能会出现链接打不开,或者蜘蛛抓取失败等现象,这个应该十分注意!

5、服务器的访问速度:由于HTTPS多次握手的特性,网站速度是一定会受到影响的,所以在搭建网站的同时要注意网站速度的优惠,可以适当考虑使用CDN等产品。



HTTPS有什么优点和缺点

网站要不要做HTTPS(来自社区调研)

百度站长社区对于做不做HTTPS网站的问题进行了相关调研,如下图:


调研中发现,大多数人对HTTPS持观望态度,他们对HTTPS安全性是认可的,但是从各个层面进行考虑后,做出了目前不做HTTPS网站的决定,主要有以下两种观点:

正方观点

1、HTTPS具有更好的加密性能,避免用户信息泄露;

2、HTTPS复杂的传输方式,降低网站被劫持的风险;

3、搜索引擎已经全面支持HTTPS抓取、收录,并且会优先展示HTTPS结果;

4、从安全角度来说个人觉得要做HTTPS,不过HTTPS可以采用登录后展示;

5、HTTPS绿锁表示可以提升用户对网站信任程度;

6、基础成本可控,证书及服务器已经有了成型的支持方案;

7、网站加载速度可以通过cdn等方式进行弥补,但是安全不能忽略;

8、HTTPS是网络的发展趋势,早晚都要做;

9、可以有效防止山寨、镜像网站;

反方观点

1、HTTPS会降低用户访问速度,增加网站服务器的计算资源消耗;

2、目前搜索引擎只是收录了小部分HTTPS内容,应该保持观望制度;

3、HTTPS需要申请加密协议,增加了运营成本;

4、百度目前对HTTPS的优先展现效果不明显,谷歌较为明显;

5、技术门槛较高,无从下手;

6、目前站点不涉及私密信息,无需HTTPS;

7、兼容性有待提升,如robots不支持/联盟广告不支持等;

8、HTTPS网站的安全程度有限,该被黑还是被黑;

9、HTTPS维护比较麻烦,在搜索引擎支持HTTP的情况,没必要做HTTPS;

HTTPS的优点与缺点

根据案例反馈,目前HTTPS的优缺点主要分布在三方面:


HTTPS的优点:

安全性方面

在目前的技术背景下,HTTPS是现行架构下最安全的解决方案,主要有以下几个好处:

1、使用HTTPS协议可认证用户和服务器,确保数据发送到正确的客户机和服务器;

2、HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议,要比HTTP协议安全,可防止数据在传输过程中不被窃取、改变,确保数据的完整性。

3、HTTPS是现行架构下最安全的解决方案,虽然不是绝对安全,但它大幅增加了中间人攻击的成本。

HTTPS的缺点:

技术方面

1、相同网络环境下,HTTPS协议会使页面的加载时间延长近50%,增加10%到20%的耗电。此外,HTTPS协议还会影响缓存,增加数据开销和功耗。

2、HTTPS协议的安全是有范围的,在黑客攻击、拒绝服务攻击、服务器劫持等方面几乎起不到什么作用。

3、最关键的,SSL 证书的信用链体系并不安全。特别是在某些国家可以控制 CA 根证书的情况下,中间人攻击一样可行。

成本方面

1、SSL的专业证书需要购买,功能越强大的证书费用越高。个人网站、小网站可以选择入门级免费证书。

2、SSL 证书通常需要绑定 固定IP,为服务器增加固定IP会增加一定费用;

3、HTTPS 连接服务器端资源占用高较高多,相同负载下会增加带宽和服务器投入成本;

既然HTTPS有这么多缺点,那是不是就不该做呢,当然不是的,随着技术的发展很多缺点是可以优化和弥补的。比如:

打开速度问题完全可以通过CDN加速解决,很多IDC也在着手推出免费证书和一站式HTTPS搭建服务,HTTPS成本在未来将会大大缩小!


百度搜索对HTTPS站点的支持和友好度

2015年5月25日,百度站长平台发布公告,宣布全面放开对HTTPS站点的收录,HTTPS站点不再需要做任何额外工作即可被百度抓收。处于HTTPS的安全性,百度对HTTPS一直持支持态度,为了提升百度搜索对HTTPS网站的友好度,特别进行了一系列升级。

站长平台:百度平台目前已经完美支持HTTPS验证,并为HTTPS准备了相应的数据提交接口,第一时间对HTTPS进行数据接收;

HTTPS站点如何在百度站长平台上的验证

在平台添加HTTPS站点时,一定要带上https://进行验证,否则默认为HTTP的站点;

百度搜索:目前Baidu Spider3.0已经顺利升级,可以正常抓取HTTPS内容,并进行正常的收录和索引,根据HTTPS网站的普及情况,还将会进行优先展示HTTPS结果等策略升级;

其他支持:目前百度各方面也在全力支持HTTPS,已经推出HTTPS服务有百度开放云的CDN和云主机


2015年5月25日,百度站长平台发布公告,宣布全面放开对HTTPS站点的收录,HTTPS站点不再需要做任何额外工作即可被百度抓收。采用了本文之前建议的HTTPS站点可以关闭HTTP版,或者将HTTP页面跳转到对应的HTTPS页面。

百度搜索引擎目前不主动抓取HTTPS网页,导致大部分HTTPS网页无法收录。但是如果网站一定要使用HTTPS加密协议的话该如何做到对百度搜索引擎友好呢。其实很简单:

1,为需要被百度搜索引擎收录的HTTPS页面制作HTTP可访问版。

2,通过user-agent判断来访者,将Baiduspider定向到HTTP页面,普通用户通过百度搜索引擎访问该页面时,通过301重定向至相应的HTTPS页面。如图所示,上图为百度收录的HTTP版本,下图为用户点击后会自动跳入HTTPS版本。





3,HTTP版本不是只为首页制作,其它重要页面也需要制作HTTP版本,且互相链接,切不要出现这种情况:首页HTTP页面上的链接依然链向HTTPS页面,导致Baiduspider无法继续抓取——我们曾经遇到这种情况,导致整个网点我们只能收录一个首页。

如下面这个做法就是错误的:http://www.abc.com/ 链向https://www.adc.com/bbs/

4,可以将部分不需要加密的内容,如资讯等使用二级域名承载。比如支付宝站点,核心加密内容放在HTTPS上,可以让Baiduspider直接抓取的内容都放置在二级域名上。

百度站长平台链接提交工具的Sitemap工具已也支持站长提交HTTPS数据。那么针对HTTPS,大家肯定还有一些疑问,于是我们专门请教了处理HTTPS数据的工程师:

1、HTTP站点转为HTTPS后,对站点原本的评价权重得分是否有影响?
答:无影响,后续会有正向收益,认为HTTPS更安全,在排序上会有倾斜。

2、转HTTPS后,需要做301跳转,在这个过程中,HTTP已有的排名是否会有变动?快照是否有变动?301需要永久存在吗?
答:快照和排名不会有变化,建议301永久存在,不管是对搜索引挚还是对用户来说都更好一些。

3、传闻说百度不会主动抓取HTTPS的站点?目前情况是什么样的?是否需要站点主动提交?
答:百度现在已经支持HTTPS的收录,特别是会从HTTP跳转到HTTPS上的。纯HTTPS的收录(指的是之前没有HTTP站),依赖于外链形式以及已收录网页的更新抓取,会有一些更新不及时或收录慢的情况,可以使用百度站长平台的链接提交工具进行提交。

4、针对HTTPS的站点,百度在抓取技术层面上有哪些建议?
答:如果以前有HTTP站点,建议永久保留跳转行为。之后注意通过百度站长平台的抓取诊断工具和抓取异常工具关注抓取结果。

百度搜索对HTTPS站点全流程支持方案(专家演讲课件分享)

5月25日,VIP大讲堂用3个小时的时间给大家介绍网站HTTPS改造方案等内容,那么百度搜索对HTTPS站点的支持到底怎样了吗?让我们赶紧看看搜索工程师是怎么说的。


































站长常见HTTP状态码及解决方案

HTTP状态码是用以表示网页服务器HTTP响应状态的3位数字代码。各位站长在平时维护网站过程中,可能会在站长工具后台抓取异常里面或者服务器日志里看到各种各样的响应状态码,有些甚至会影响网站的seo效果,下面百度工程师为大家整理了一些常见的HTTP状态码及处理解决的方法:

301:(永久移动)请求的网页已被永久移动到新位置。服务器返回此响应(作为对GET或HEAD请求的响应)时,会自动将请求者转到新位置。

使用环境及影响:当站点迁移,域名变更、网站改版时,建议使用301返回码,除了能减少网站改版带来的流量损失,还能通过此代码通知Baiduspider某个网页或网站已被永久移动到新位置,从而将权重和排名尽快转移到目标页面。

IIS服务器解决方案:打开internet信息服务管理器,在欲重定向的网页或目录上按右键,选择“重定向到URL”,在“重定向到”输入框中输入要跳转到的目标网页的URL地址,选中“资源的永久重定向”(切记),最后点击“应用”。
      Apache服务器解决方案:在Apache中,只需要找到.htaccess文件,通过对它的设置,即可实现301设置。找到redirectpermanent/old-url.htmlhttp://new-url.com:修改这句即可。

302:(临时移动)服务器目前正从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。此代码与响应GET和HEAD请求的301代码类似,会自动将请求者转到不同的位置。

使用环境及影响:302代码一般默认为临时跳转,仅用于暂时跳转至新的临时性的URL或网址。一般来说Baiduspider仍会继续抓取原有位置并将其编入索引。因经常被用于域名网址劫持等黑帽作弊,很多站长觉得百度对302并不友好,若是永久移动某个页面或者网站不建议使用该代码。

解决方案:若是永久移动某个页面,IIS服务器只需跟设置301步骤一样,最后一项记得选择”该资源将永久跳转“,Apache服务器则在.htaccess文件中进行Rewrite重写即可;一般在批量设置URL重定向规则时要用到正则表达式。

400:(错误请求)服务器不理解请求的语法。

使用环境及影响:一般出现这个状态码分为两种情况:1、语义有误,当前请求无法被服务器理解。2、访问的页面域名不存在或者请求错误。

解决方案:在确定域名或URL没有输错的前提下,首先可以Ping一下域名,看看是否解析到服务器或空间所在的IP,如果是,可以去空间的管理面板看有没有绑定域名,如果有,那有可能是空间提供商的问题了,找空间提供商解决即可!

403:(已禁止)服务器已经理解请求,但是拒绝执行它。

使用环境及影响:一般出现这个状态码可以简单理解为没有访问权限,通常需要对服务器上的文件或目录进行权限设置时使用;若在Baiduspider尝试抓取你网站上的有效网页时显示此状态代码,则可能是你的服务器或主机拒绝Baiduspider对其进行访问,如果长期返回403,搜索引擎会认为该URL是失效链接,将会对其进行删除,为此对搜索引擎并不友好。

解决方案:解决服务器403问题要分情况而定,若是因为DNS解析错误,或者因为连接用户过多,服务器繁忙导致,则可通过重建dns缓存来解决;若是文件夹安全属性设置错误导致,则要修改文件夹安全属性;确实有某些页面不希望被搜索引擎收录的,建议通过写进robots规则文件来屏蔽蜘蛛收录即可。

另外几种解决403forbidden错误的办法:

apache导致的403forbidden错误的解决办法

打开apache的配置文件httpd.conf,找到这段代码:

OptionsFollowSymLinks

AllowOverrideNone

Orderdeny,allow

Denyfromall

有时候由于配置了php后,这里的“Denyfromall”已经拒绝了一切连接。把该行改成“allowfromall”,修改后的代码如下,问题解决。

OptionsFollowSymLinks

AllowOverrideNone

Orderdeny,allow

Allowfromall

之所以会出现错误,是因为大多数的国外主机在配置Apache的时候启用了mod_security,也就是开启了安全检查,如果提交的信息中包含select,%,bin等关键字,Apache就会禁止,并给出403,404,500等错误。

HawkHost空间出现403Forbidden错误的解决方法

有的时候在共享服务器上安装了Modsecurity,当网址包含有“%”号等其它敏感字符时,也会被Modsecurity阻止。解决方法是

在.htaccess文件里添加如下代码:

SecFilterEngineOff

SecFilterScanPOSTOff

直接放在网站的根目录或者程序运行的目录下。

404:(未找到)服务器找不到请求的网页。

使用环境及影响:例如,如果请求是针对服务器上不存在的网页进行的,那么服务器通常要返回此代码。Baiduspider通常会认为该网页已经失效,从而在搜索结果中进行删除,并且短期内spider再次发现这条URL也不会抓取。

这里不得不提的一点,很多站长想自定义404页面,需要做到确保spider访问时返回状态码为404,若因为404页面跳转时设置不当,返回了200状态码,则容易被搜索引擎认为网站上出现了大量重复页面,从而造成降权。

解决方案:对于存在的网页内容由于路径改变而导致访问不了时,应该使用301永久重定向跳转到新的地址,让服务器返回301状态码,这对搜索引擎是最友好的;若某个页面内容确实已经被删除,或者过期失效,则应该制作一个友好的404文件页面,同时确保该页面返回的是404状态码。

408:(请求超时)服务器等候请求时超时。

使用环境及影响:客户端没有在服务器预备等待的时间内完成一个请求的发送时返回此代码;若Baiduspider在对网站进行访问时,长期返回此代码,则搜索引擎会认为该网站空间访问速度不稳定,从而影响排名;

解决方案:检查Web服务器的工作量,看是由于访问量激增导致,还是客户端系统的工作量导致,如果两者都不是,建议检查服务器网络或者更换更好的空间服务商。

410:(已删除)请求的资源已被永久移除。

使用环境及影响:这个状态码的使用跟404有点类似,当一个文件从服务器上被永久地移除(而非转移到其它位置)时,可以使用410状态码,告诉搜索引擎删除已经收录的链接,避免搜索引擎再次访问时出现死链。

解决方案:当服务器出现该状态码时,需要检查该资源是否确定被永久移除,若网址还是有效的,那就表示Web服务器的设置有一些错误,需要进行相应的设置。若是被转移,则应使用301代码指定该资源的新位置。

500:(服务器内部错误)服务器遇到错误,无法完成请求。

使用环境及影响:页面代码出错时返回的状态。一般来说当访问的网站或者页面ASP或者PHP等出现代码错误,如语法错误、数据库连接错误等,而恰好服务器环境关闭了出错信息的输出提示,则出现500错误反馈。网站若返回大量500错误,不仅对用户体验不友好,也会影响搜索引擎对该页面的评分从而影响排名。

解决方案:首先检查下网页的源代码,看下是否存在不规范的语法错拼、代码缺少等导致页面验证失败,或者数据库连接语句出错等问题。若没有,则检查下服务器是否正常响应,是否安装了服务器不支持的组件等,必要的话可以重启下服务器。

502:(错误网关)服务器作为网关或代理,从上游服务器收到了无效的响应。

使用环境及影响:该代码一般由于网关错误而造成的(不一定是自身的web服务器),当作为网关或代理的服务器与上层内容服务器联络时,收到无效的响应时则返回该代码。

解决方案:首先在排除是我们浏览器使用了代理前提下,可以尝试清除浏览器缓存,再者检查下网关是否配置正确,或者刷新服务器,尝试重新发送请求。

503:(服务不可用)目前无法使用服务器(由于超载或进行停机维护)。通常,这只是一种暂时的状态。

使用环境及影响:网站临时关闭或其他临时情况,如宽带超限、服务器响应不及时等,应该返回此代码。一般来说Baiduspider会认为该网页临时不可访问,不会把这条URL直接删除,短期内会再访问。届时如果网页恢复,则正常抓取。这也是503和404的区别,如果是404则通常会从搜索结果中删除,并后续不会再抓取。

解决方案:一般这种情况是由网站服务器关闭或维护造成的,联系服务器管理员或者服务商解决即可!

504:(网关超时)服务器作为网关或代理,未及时从上游服务器接收请求。

使用环境及影响:作为网关或者代理工作的服务器尝试执行请求时,未能及时从上游服务器(URI标识出的服务器,例如HTTP、FTP、LDAP)或者辅助服务器(例如DNS)收到响应。

解决方案:这个错误完全是由后端电脑之间IP通讯缓慢而产生,可能包括Web服务器。为此该问题一般需要站长和互联网服务供应商(ISP)及Web服务器软件供应商联络,检查在其控制下的不同电脑之间的IP数据传输的流通状况来进行解决。

505:(HTTP版本不受支持)

使用环境:服务器不支持,或者拒绝支持在请求中使用的HTTP版本。这暗示着服务器不能或不愿使用与客户端相同的版本。

解决方案:如果出现这个错误,可以通过升级Web服务器软件。如果版本1.x的请求失败,很可能是因为你的Web服务器不是很好地支持1.x协议版本,而不是完全不支持。


站点切换HTTPS不会对流量产生负面影响

随着互联网不断发展,网站产生交易量、保留用户数据量大幅增加,信息安全成为非常重要的事情,同时百度已经全面实现了HTTPS,越来越多的站点也开始考虑HTTPS化。最近院长不断接到站点的询问:我们网站也想上全量HTTPS,但担心对线上流量产生负面影响,我们该怎么做才能消取这种影响呢?为此站长平台工程师中伟请教了多位不同领域的Baiduspider工程师后,终于搞清楚了几个问题:

timg (7).jpg


问:对于
HTTPHTTPS,Baiduspider会不会区别对待?
答:不会区别对待。说得再全整专业一些:Baiduspider在对于http和HTTPS站点的调度和解析方面没有任何区别。至于建索引库,年初的时候百度进行过升级,目前对HTTPS站点也是全力支持的。

问:
Baiduspider可以抓取HTTPS网站吗?站点HTTPS以后应该做些什么?
答:在抓取方面,Baiduspider完全支持HTTPS链接的抓取。站长需要注意的一点是要保证HTTP链接到HTTPS链接良好的重定向(使用301或302),这样百度可以做到无缝切换。另外可以使用链接提交工具提交HTTPS链接,尽快通知百度。

问:站点切换
HTTPS以后,新产生的HTTPS页面,百度会将其视为新页面重新收录?重新计算排名?
答:不是的,不涉及重新收录的问题。

问:
HTTPS以后可以使用改版工具向百度提交HTTPHTTPS的对应关系吗?
答:HTTP站和HTTPS站会被百度视为同一个站点,不属于改版,不适用改版工具。

问:
HTTPS以后,排序有可能发生什么变化?
答:在rank方面,现在对两种链接无区别对待,从安全性考虑,以后可能会优待HTTPS的链接。

关于HTTPS的常见问题

百度已发布HTTPS全流程支持方案,可是还有很多站长们对HTTPS改造存有疑问,下面一起来看下官方解答:

u=4105820907,1022798798&fm=11&gp=0.jpg

Q:站点是不是一定要做HTTPS?

是否HTTPS化,要看站点具体需求;从网站安全和用户体验上来讲,HTTPS站点更为安全优质,且百度搜索在索引的时候会考虑优先展现用户体验较好的页面;总体来讲,如果条件允许建议做HTTPS。

Q:站点使用平台HTTPS认证工具,有什么收益?

通过HTTPS认证后,站点在百度搜索的所有快照都会变成HTTPS格式,蜘蛛也会优先抓取HTTPS的链接,让用户在搜索中获得更安全的链接

Q:站点使用平台HTTPS认证工具,有什么要求?

1、保证HTTPS站点正常访问,且页面内引入资源为HTTPS格式,包括引入的视频、图片、CSS、JS等元素;

2、如果站点存在HTTP和HTTPS两种协议的页面,必须将HTTP的URL 301到HTTPS的URL上,仅有HTTPS站点的可以直接认证;

3、必须保证HTTP站点与HTTPS的链接一一对应,没有HTTPS对应的HTTP链接可能会被判断成死链接;

Q:如果站点没有全站HTTPS怎么办?

这种情况一般,没有全站HTTPS,申请站长平台HTTPS认知是不会通过的,但是如果系统没有检测到这个情况而通过验证的话,会导致没改造的这部分页面产生死链,所以大家在认证前一定要检测好

Q: 站点使用平台HTTPS认证工具后如果不想做HTTPS站了又如何退回呢

站点通过认证后,只需要点击退场按钮,就可以退回到HTTP站点了;

需要强调的是,点击回退按钮后,要等到显示回退成功了再做其他操作,否则有可能导致网站产生死链接。

Q:怎么样从日志中分析HTTP劫持

日志中通常是分析不出来的,之前TV猫分享过,TV猫能分析出来是因为发现HTTP劫持了,后面加了一个参数,这个参数不是网站自己加的,是(黑客)加了一个,参数后面跟了一个。

Q:很多网站不仅仅流量来自于百度,还有极少一部分流量来自于其他的厂商,比如说神马360,云加速是怎么处理的?

国内的现状,百度在技术这个方面走得最前面,对于ADS整个后端的支持,是做的比较靠前的,云加速服务器会从源上区分,识别爬虫还是厂商抓取,并根据不同的来源,判断抓取对HTTPS的友好度,从后端上推荐内容。

Q:云加速单个的UR缓存问题不支持单个刷新?

是支持的。

Q:网站做HTTPS的好处是什么?

A:HTTPS是公认的防止被劫持的有利手段

Q:HTTPS改造的缺点是什么?

A:需要站点投入人力成本,技术改造视站点情况而定,且HTTPS协议证书可能会产生费用

Q:HTTPS站点在站长平台如何提交数据?

A: 站长平台已经全面支持HTTPS站点,HTTPS站点使用平台工具与http站点没有任何不同

Q:HTTPS站点如何能被百度快速收录?

A:1)确认站点全站都是HTTPS之后,请使用HTTPS认证工具,此工具可加快搜索对网站的识别

2)纯HTTPS站点,请先使用HTTPS认证工具,然后使用链接提交工具向百度提交数据

Q: 如果网站未全站做HTTPS改造,新产生的HTTPS内容如何被搜索快速抓取?

A:需在http站点与HTTPS间做301跳转关系,另外HTTPS内容需使用链接提交工具提交数据

Q:网站做了HTTPS改造后,是否需要重新提交移动适配?

A:不需要


HTTPS常见问题详解相关百科

    没有找到您想要的百科