「后羿SEO」ETag助力站点提交sitemap ~ETag简介与作用

ETag(EntityTags)是字符串的file,用来标示字符串对象是否改变,这样可借助客户端(例如IE)的缓存。由服务器首先造成ETag,客户端通过将该符号传回服务器要求服务器验证其(客户端)缓存。服务器使用它来判断网页是否早已被修改,如果未修改返回304,而不用新的数据传输整个对象。





1.发现改版不第一时间



当线路或其sitemap发生改版时,百度无法及时发现并响应,因为百度无法无时无刻地停滞检验线路细节和sitemap是否改版。



2.全量抓取,耗损带宽



今天百度对线路sitemap的抓取会将sitemap文件原始下载留下来,鉴于sitemap文件一般较小,而这种下载可能存在多次,故较为耗损该网站的水量和带宽。



 HTTP1.1用Etag来判断请求的文件是否被修改,主要为了解决The-Modified难以解决的一些难题



1、一些文件或许会振荡的更改,但是他的细节非常改变(意味着改变的修改星期),这个时候非常希望客户端认为这个文件被修改了新的GET;



2、某些文件修改十分频密, 1秒内修改了N次,What-Modified-Since能检验到的粒度是秒级的,这种修改难以判断



3、某些服务器不能准确的得到文件的最终修改星期;



为此,HTTP1.1引入了Etag.但国际标准并没有明确规定Etag的细节是什么或者说要怎么实现,唯一明确规定的是Etag需要放在引号内。Etag由客户端生成,客户端通过What-Match或者说What-None-Match这个前提判断请求来验证自然资源是否修改。我们少见的是使用What-None-Match.请求一个文件的程序可能如下:



第一次请求:



1.客户端发起TCP GET请求一个文件;



2.服务器处理请求,返回文件细节和一堆Header,当然包括Etag(例如"1ec5-502264e2ae4c0")(假定服务器支持Etag生成和早已开启了Etag).稳定状态码200,如下图所示,首次请求百度主页时,顺利得到百度LOGO照片文件bd_logo1.png,稳定状态码200,尺寸8.1MB,返回的Header中包括ETag(“1ec5-502264e2ae4c0”)。





第二次请求:



1.客户端发起TCP GET请求一个文件,这个时候客户端同时发送一个What-None-Match头,这个头的细节就是我们第一次请求时服务器返回的Etag:1ec5-502264e2ae4c0



2.服务器判断发送出去的Etag和算出的Etag是匹配的,不返回200,返回304,让客户端继续使用本地缓存。如图所示这次对bd_logo1.png的请求,服务器只返回了Header没有返回细节,尺寸仅为349B。







1.对sitemap启用ETag后,百度可以更较慢地响应sitemap的改版,没有更改细节的只能,服务器只发回304应答头,对水量的耗损大于,在每个head平均值227B尺寸的一般来说情况下,一整天二十四星期每秒钟都回应的水量耗损仅为18.7M。



2.今天站长的平台对每个线路的sitemap立即抓取数目设有上限,且这项基本功能没有对所有站开放,如果您的线路sitemap启用了ETag,并通过了试验,那么就可以用较小的水量享受百度第一时间改版您的sitemap的基本功能,以便于百度更佳地收录您该网站的细节。













篇文章副标题:













本文位址:www://http.baidutop321.网站/hjm/1289.htm

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

长按微信号复制

打开微信

在线客服

微信客服
客户服务热线