您所在的位置: 首页>行业资讯>菏泽谷歌 SEO 入门指南 2018 年版(一):Google 抓取

菏泽谷歌 SEO 入门指南 2018 年版(一):Google 抓取

发表于:2021-09-03 阅读:0 关键词: 谷歌搜索引擎优化 SEO指南 页面抓取 网站SEO优化

HzXuanYou.Com“ target =” _ blank“> Google SEO入门指南2018版(2):页面内容优化Google SEO入门指南2018版(3):网站结构优化Google SEO入门指南2018版(4):内容优化Google SEO 2018入门指南(5):网站移动性和促销前言如果您通过Google 搜索,操作,管理或推广在线内容,或通过在线内容获利,则本指南适用于您。 如果您是一家快速发展的企业,拥有十几个网站的网站站长或网络代理商中的SEO 专家,或对搜索机制有浓厚兴趣的DIY SEO专家,那么本指南也适用于您。 如果您根据我们的最佳做法对SEO感兴趣 要完全理解基础知识,那么本指南也适用于您。 本指南将不提供任何 (抱歉!),但是如果您遵循下面列出的最佳做法,则可以使搜索引擎更轻松地对内容进行爬网,理解和编制索引。 搜索引擎优化(SEO) 通常是指对网站的各个部分进行细微更改。 单独地,这些修改可能只是增量的,细微的改进,但是与其他优化结合使用时,它们可能会对自然搜索结果中的用户体验和网站性能产生重大影响。 您可能已经熟悉本指南中的许多主题,因为它们是任何网页的基本元素,但您可能没有充分利用它们。 您应该优化您的网站以满足用户需求。 搜索引擎是您的用户之一,它可以帮助其他用户发现您的内容。 搜索引擎优化是指帮助搜索引擎理解和呈现内容。 您的网站可能比我们的示例网站更简单或更复杂,并且所显示的内容可能完全不同,但是我们下面讨论的优化主题适用于所有规模和类型的网站。 我们希望本指南能为您带来一些有关如何改善网站的新思路,也希望您能在Google网站站长帮助论坛1中积极分享您的问题,反馈和成功案例。 相关术语以下简要词汇表包含了本指南中使用的重要术语:Index-Google will所有已知的网页都存储在其“索引”中。 每个网页的索引条目描述该网页的内容和位置(URL)。 编制索引是指Google抓取,读取网页并将其添加到索引中的过程。 例如:Google今天在我的网站上索引了多个页面。 搜寻-查找新页面或更新页面的过程。 Google会通过以下链接,阅读站点地图或其他各种方法来发现URL。 Google会在网上爬行以查找新页面,然后(在适当时)为这些页面编制索引。 爬网程序自动化的软件,用于从Web上爬网(提取)网页并为其编制索引。 Googlebot-Google搜寻器的通用名称。 Googlebot将继续抓取网页。 SEO-搜索引擎优化:使您的网站更容易被搜索引擎抓取和编制索引的过程。 它还可以引用从事搜索引擎优化的人员的职位。 例如,我们刚刚雇用了一个新的SEO,以增加我们在Internet上的曝光率。 您的网站是否已被Google搜索引擎编入索引? 您可以在Google搜索引擎中的网站首页URL上执行“网站:”搜索。 如果您可以看到结果,那么您的网站就在索引中。 例如“ site:wikipedia.org”。 尽管Google可以抓取数十亿个网页,但不可避免地会遗漏某些网站。 因此,如果不包括您的网站,则可能是由于以下原因引起的:该网站与网络上的其他网站没有密切关系。 您刚刚启动了一个新网站,而Google尚无时间对其进行爬网。 网站的设计使Google难以有效抓取。 Google的内容在尝试爬网时遇到问题。 您的政策禁止Google抓取该网站。 如何使我的网站出现在Google搜索结果中? 在Google搜索结果中包含网站是完全免费的,而且操作简单,即使无需将网站提交给Google。 谷歌 是一种完全自动化的搜索引擎,使用网络搜寻器来连续搜寻网页以查找可以添加到Google索引的网站。 实际上,它已经显示在Google上 搜索结果中的大多数网站不是手动提交的已建立索引,但Google在搜寻网页时已找到并自动添加。 了解Google如何发现,抓取和呈现网页。 我们提供网站站长指南,以帮助网站站长构建易于Google处理的网站。 尽管我们不能保证我们的搜寻器将能够找到特定的网站,但是遵循这些准则应该可以使您的网站出现在我们的搜索结果中。 Google Search Console提供了一系列工具,可帮助您向Google提交内容并监控您的网站/移动应用在Google上的存在情况 在搜索结果中展示。 如果您愿意,当Google在抓取您的网站的过程中发现任何严重问题时,Search Console甚至可以向您发送提醒。 注册Search Console5。 首先,您需要问自己以下有关您网站的基本问题。 我的网站会出现在Google搜索结果中吗? 我是否向用户提供高质量的网站内容? 我的本地公司会出现在Google搜索结果中吗? 各种设备的用户能否轻松快速地找到我网站的内容? 我的网站安全吗? 您可以在http://g.co/webmasters6上找到其他入门信息,以帮助Google发现您的内容。 为了使您的网站出现在Google搜索结果中,第一步是确保Google可以找到它。 最好的方法是提交站点地图。 站点地图是网站上的文件,可以将网站上的新页面或更新页面通知搜索引擎。 详细了解如何构建和提交站点地图。 Google还会通过其他网页上的链接找到该网页。 让Google知道哪些网页不应该被抓取。 最佳实践。 如果信息不敏感,则可以使用robots.txt防止不必要的抓取。 “ robots.txt”文件将告诉搜索引擎它们是否可以访问您网站的各个部分并执行爬网。 该文件必须命名为“ robots.txt”,并且应位于网站的根目录中。 被robots.txt阻止的页面也可能会被抓取,因此您应使用更安全的方法来保护敏感页面。 你您可能不希望对网站的某些页面进行爬网,因为当这些页面显示在搜索引擎的搜索结果中时,这些页面对用户可能没有用。 如果您想防止搜索引擎抓取您的网页,请使用Google Search Console提供了一个方便的robots.txt生成器,可帮助您创建此文件。 请注意,如果您的网站使用子域,而您想要 Google不会在特定子域上抓取某些页面,因此您必须为该子域创建一个单独的robots.txt文件。 应避免的事情:请勿让Google抓取内部搜索结果页面。 用户不想点击搜索引擎结果,然后登录到您网站上的其他搜索结果页面。 允许对代理服务器创建的URL进行爬网。 如果它是敏感信息,请使用一种更安全的方法来防止用户访问敏感或机密信息,Robots.txt 这不是适当或有效的方法。 它仅告诉运行良好的爬网程序不要对相应的页面进行爬网,但不会阻止您的服务器将这些页面发送到请求它们的浏览器。 原因之一是:如果在Internet上某个位置(例如引荐来源网址日志)有指向这些禁止的URL的链接,则搜索引擎仍可以引用这些URL(仅显示URL,但不显示标题或摘要) 显示)。 此外,不同意不遵守机器人排除标准的搜索引擎或流氓搜索引擎可能会违反您的 robots.txt文件中的指令。 最后,用户可能出于好奇而看了您的robots.txt 文件中的目录或子目录,然后猜测您不希望看到的内容的URL。 在这些情况下,如果只希望页面不显示在Google中,则可以使用noindex标记,而不必担心任何用户都会通过链接访问该页面。 但是,为了真正安全,您应该使用适当的授权方法(例如,要求用户密码才能访问)或将网页从网站中完全删除。