搜索引擎工作原理图_搜索引擎的工作原理及发展历程 焦点报道
1、搜索引擎的工作原理总共有四步:第一步:爬行,搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,所以称为爬行。
(资料图片)
2、第二步:抓取存储,搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。
3、第三步:预处理,搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。
4、第四步:排名,用户在搜索框输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程与用户直接互动的。
5、不同的搜索引擎查出来的结果是根据引擎内部资料所决定的。
6、比如:某一种搜索引擎没有这种资料,您就查询不到结果。
7、扩展资料:定义一个搜索引擎由搜索器、索引器、检索器和用户接四个部分组成。
8、搜索器的功能是在互联网中漫游,发现和搜集信息。
9、索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。
10、检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。
11、用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。
12、起源所有搜索引擎的祖先,是1990年由Montreal的McGill University三名学生(Alan Emtage、PeterDeutsch、Bill Wheelan)发明的Archie(Archie FAQ)。
13、Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。
14、Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。
15、Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件 。
16、由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。
17、Jughead是后来另一个Gopher搜索工具。
18、参考资料来源:百度百科-搜索引擎。
本文就为大家分享到这里,希望小伙伴们会喜欢。