许多搜索引擎优化人员经常说网站日志中304的返回值是怎么回事?
至
我经常遇到网站管理员抱怨蜘蛛爬网返回代码始终为304,并且爬网次数正在减少。 为了获得自己的用户体验,搜索引擎将尽最大努力提高检索呼叫率,准确性和新鲜度,这将导致引擎不得不将重点放在具有高质量内容源的网站上。 只有这样,搜索结果的质量才能更符合搜索者的体验。
至
因此,我们认为:搜索引擎爬网程序将偏爱具有频繁内容来源的网站。 通过在特定时间段内对网站进行爬网返回的状态码来调整对网站进行爬网的频率。 如果网站在一段时间内处于[304:无更改]的状态,则引擎搜寻器可能会减少网站的搜寻次数。 相反,如果网站更改的频率非常快,并且每次爬网都可以获取一个新版本,则爬网者的回访率会随着时间的推移而增加。
至
不管是爬行还是304,这都是一种现象,而不是问题的原因。 假设该网站返回200,是否可以达到提高排名和带来流量的目的? 相反,我们应该考虑生成304的原因是什么? 304的更改对网站目标有什么影响? 总体目标不可忽略,应该强调处理的细节,而解决304应解决200。
至
304状态如何产生?
为了提高网站访问速度,服务器为某些先前访问的页面开发了一种缓存机制。 当客户端在此处请求这些页面时,服务器将基于缓存的内容确定该页面是否与以前相同。 如果相同,则将直接返回304。这时,客户端将在客户端调用缓存的内容,而无需进行二次下载。 可以说,从某种角度来看,304在减少服务器带宽和提高蜘蛛爬网效率方面发挥了作用。
至
造成304状态的原因是什么?
1.页面更新周期长或未更新
2.纯静态页面或强制生成静态html
304状态处理思路?
1.首先,细分304页。 哪些类型的页面返回304? 这些页面应该返回304吗?
2本这些页面的生成方式是什么? 有更新机制吗? 更新机制是否符合网络的爬网频率?
3.页面更新区域的位置是否合理? 它位于页面的主要内容中吗?
过多的304状态代码将导致以下问题:
1.网站快照停止
2.减少列入
3.减轻重量
那么如何减少304返回码呢?
至
据我所知,首先,内容更新应迎合炫佑蜘蛛,分析日志并记录蜘蛛访问的时间,您可以大致了解蜘蛛访问的频率,然后在此基础上更新文章: 原稿+转载,不能纯收藏。 重印还需要最新,最优质的资源。 让蜘蛛来这里吃饭。 从而返回更多200个正常代码。
至
可能您还想看