数据的检索首先由用户提出查询请求,并且把关键词提交给检索代理,检索代理将检索的关键词传送到索引存储器当中,将检索的结果按照相关度重新进行排序,然后传送到用户的检索界面,并呈现到用户的面前,从而显著提升检索速度以及能力。 1 检索请求分析 检索用户在搜索引擎上输入关键字,并且提交检索请求,慢慢的发现与之相匹配的网页内容,搜索引擎会详细分析这次搜索请求,并且对搜索请求展开细致的分析,并作出分词处理。中文分词通常采用基于字符串匹配、理解分词方法以及统计分词方法。 2 匹配检索请求 当用户提出请求以后,搜索引擎会展开系统分析,匹配出与之符合的URL,其数量较大,只有采用搜索引擎遵循YRL 匹配程度对其排序,才可以有序呈现出最终的结果。系统对文档内容全面分析以后所获得的信息、网页当中的PageRank 值,最终都会和链接文件当中与网页内容相关的信息联系在一起,此时其检索结果也会相应的确定,从而可以客观的在网页当中显示出来,能够最大限度确保所有结果与用户希望查询的结果一致。 --基于云计算的大数据信息检索技术
|