搜索引擎利用蜘蛛爬行程序在互联网上抓取页面进行存储的过程, 为搜索引擎提供数据支持, 这便是页面收录。然后对进行收录的页面进行页面分析, 页面分析是处理整个页面的重要环节。
。搜索引擎利用蜘蛛爬行程序在互联网上抓取页面进行存储的过程, 为搜索引擎提供数据支持, 这便是页面收录。然后对进行收录的页面进行页面分析, 页面分析是处理整个页面的重要环节。首先会对原始页面建立索引, 根据URL地址实现对页面的快速定位, 然后提取页面的正文信息, 并对正文信息进行切词, 为这些关键字建立索引, 从而得到关键字与页面的对应关系, 最后对关键字执行重组, 建立关键字与页面对应的反向索引列表, 从而能根据关键字快速找到相应网页。搜索引擎还会对页面进行排序, 搜索引擎结合页面的内外因素计算出页面与关键字相关程度, 从而得到与关键字相关页面排序列表。当搜索引擎接收来自用户的关键字查询请求后并对查询的信息进行切词, 匹配信息, 向用户返回相应的页面列表。
可能您还想看