‘壹’ 什么是搜索引擎
搜索引擎是一个帮助用户搜索他们需要内容的计算机程序。换一种说法,搜索引擎把计算机中存储的信息与用户的信息需求(information need)相匹配,并把匹配的结果展示出来。
搜索引擎是由搜索器、索引器、检索器以及用户接口组成的。
搜索器的作用是在互联网中发现和搜集信息。
索引器的作用是分析理解搜索器搜索到的信息,并且从中提取到索引项,用于表示信息以及生成文库的索引表。
检索器的作用是根据用户所查询的关键词信息在索引库中快速检索出的信息,并对信息与查询关键词的相关度进行评价,然后按照一定的规则排序反馈给用户。
‘贰’ 什么是搜索引擎作用是什么
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。比如网络就是一款比较流行的搜索引擎。
‘叁’ 什么是搜索引擎
搜索引擎其实就是从互联网上采集的一些信息,对于信息进行组织并且处理,为用户提供一些检索的服务。
搜索引擎的一般包括爬虫以及索引,检索,排序等等,当用户进行搜索的时候,排在最前面的一般都是用户体验比较好的。
在当前的大数据时代,如何让用户更快的从海量的数据中精准的找到用户自己想要的信息呢?其实说白了,这些还是一个用户体验的问题,当用户进行搜索的时候,展现在最前面的就是用户体验好一点到。
而大数据和搜索引擎是并行,而且是融合的,搜索引擎技术会融合大数据来做一些个性化的推荐。但是本质上还是搜索引擎为大数据带来的数据。为什么这么说呢?因为有人搜索才会产生数据的来源,而这些数据则是通过大数据里面筛选出来的一些数据。
希望以上的说法对你有所帮助。
‘肆’ 什么是搜索引擎
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上采集信息,在对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。
搜索引擎是工作于互联网上的一门检索技术,它旨在提高人们获取搜集信息的速度,为人们提供更好的网络使用环境。从功能和原理上搜索引擎大致被分为全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎等四大类。
搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。
搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。
搜索引擎发展到今天,基础架构和算法在技术上都已经基本成型和成熟。搜索引擎已经发展成为根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
‘伍’ 名词解释:什么是搜索引擎
搜索引擎(英语:search engine)是一种信息检索系统,旨在协助搜索存储在计算机系统中的信息。搜索结果一般被称为“hits”,通常会以表单的形式列出。网络搜索引擎是最常见、公开的一种搜索引擎,其功能为搜索万维网上储存的信息。
搜索引擎为一组项目提供了一个接口,使用户能够指定关于感兴趣的项目的标准,并让引擎找到匹配的项目,这些标准称为搜索查询。在文本搜索引擎的情况下,搜索查询通常表示为识别一个或多个文档可能包含的期望概念的一组单词。
有多种样式的搜索查询语法在严格性上有差异。它也可以在以前的站点中搜索搜索引擎中的名称。而一些文本搜索引擎要求用户输入由白色空格分隔的两个或三个字,其他搜索引擎可以使用户能够指定整个文档,图片,声音和各种形式的自然语言。
一些搜索引擎对搜索查询进行改进,以增加通过称为查询扩展的过程提供质量集合的可能性。查询理解方法可用于标准化查询语言。
(5)什么是搜索引擎扩展阅读:
一个完整的搜索引擎需要有网页爬取和收录,建立索引,查询词分析,搜索排序,推荐系统五个部分组成。
1、网页爬取和收录。
网络爬虫技术是网页爬取的核心技术,可以通过编写一定的程序或者脚本来对互联网的信息进行抓取。在网页抓取之后,要构建相应的数据库来存储我们爬取的网页信息。
但是互联网的信息具有冗余性,主要原因是各大网站也都会在后台进行爬虫爬取,他们也会通过爬虫来检测一些热点的内容或者文章,然后爬取其信息并对格式进行重新的组织,但其实网页的内容几乎都是一致的。
所以在收录爬虫爬取的网页信息之前,我们还要加入一个关键的环节——网页去重,来确保我们数据库中网页的唯一性。
2、建立索引
在抓取了网页的信息之后,需要对网页的信息进行解析,抽取到网页的主题内容和类别信息。其主要涉及的技术为文本识别和文本分类技术。
网页解析后的输出往往是一些结构化的信息(每个网页的信息完整度是不同的,需要统一对数据进行结构化操作),一般的结构化信息包括网页的URL、网页编码、网页标题、作者、生成时间、类别信息、摘要等等。
在获取了网页结构化信息后,就要构建相应的索引了。为了加快响应用户査询的速度,网页内容通过"倒排索引"这种高效查询数据结构来保存,而网页之间的链接关系也会予以保存。
之所以要保存链接关系,是因为这种关系 在网F相关性排序阶段是可利用的,通过"链接分析"可以判断页面的相对重要性,对于为用 户提供准确的搜索结果帮助很大。
由于互联网的网页信息是海量的,所以搜索引擎的构建离不开大数据处理平台和云计算技术,目前较为常用的大数据处理平台为Hadoop生态架构。
3、查询词分析。
查询词分析就是query分析或者query聚类。当搜索引擎接收到用户的査询词后,首先需要对查询词进行分析,希望能够结合查询词和用户信息来正确推导用户的真正搜索意图。
比如,一个用户输入的查询词为“养水仙花”,那么除了基本的内容匹配外,搜索引擎需要读懂用户,其实用户的查询词还可以这样被理解“水仙花的养法”,“水仙花好养不” 等等近意的查询词。
在此之后,首先在缓存中査找,搜索引擎的缓存系统存储了不同的查询意图对应的搜索结果,如果能够在缓存系统找到满足用户需求的信息,则可以直接将搜索结果返回给用户,这样既省掉了重复计算对资源的消耗,又加快了响应速度。
4、搜索排序
搜索引擎在分析了用户的查询词以后,如果缓存的信息无法满足用户的查询需求,搜索引擎要根据索引来查询数据库的网页内容,并根据网页内容与用户需求来进行网页排序。
网页排序需要众多的因素,其中最为主要的因素为网页内容与用户查询内容的相似度(匹配度),这个不难理解,搜索引擎的基本功能就是查询。
如果一个搜索引擎无法为用户提供用户需要查询的内容,那其也就不能称为是一个搜索引擎,所以网页内容与用户查询内容的相似度是网页排序的一个首要依据;
另外网页的重要程度也是以关键元素,一个网页的重要程度关乎了网页内容的质量,在满足用户需求的基础之上,用户更加希望获得高质量的内容,这是无可厚非的。
根据上述因素,搜索引擎对查询到的结果进行排序,然后展示给用户。
5、推荐系统
其实从不严格的角度来说,整个网页排序的过程就属于一种推荐策略。从严格意义上来说,推荐系统并不属于一个搜索引擎架构的必要环节,而且推荐系统在上述示意图中并没有显示。
但是一个优秀的搜索引擎不止要能分析出用户查询的基本需求,进一步来讲,要能了解到或者猜测用户的可能的下一步需求。
目前随着大数据的热潮,各大互联网公司和众多专家认为推荐系统是解决互联网大数据的一种有效途径。而且,最近越来越多个性化推荐知识受到了热捧。其实推荐系统在搜索引擎中往往是以中间页的形式展示的,它的主要作用就是为推荐系统进行导流。
参考资料来源:网络——搜索引擎
‘陆’ 搜索引擎的概念是什么
搜索引擎(search
engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。
搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。
早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。
随着yahoo!的出现,搜索引擎的发展也进入了黄金时代,相比以前其性能更加优越。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。以搜索引擎权威yahoo!为例,从1995年3月由美籍华裔杨致远等人创办yahoo!开始,到现在,他们从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,充分说明了搜索引擎的发展从单一到综合的过程。
然而由于搜索引擎的工作方式和因特网的快速发展,使其搜索的结果让人越来越不满意。例如,搜索“电脑”这个词汇,就可能有数百万页的结果。这是由于搜索引擎通过对网站的相关性来优化搜索结果,这种相关性又是由关键字在网站的位置、网站的名称、
标签等公式来决定的。这就是使搜索引擎搜索结果多而杂的原因。而搜索引擎中的数据库因为因特网的发展变化也必然包含了死链接。
‘柒’ 名词解释:什么是搜索引擎
摘要 搜索引擎是指从因特网搜集信息经过一定整理之后,提供给用户进行查询的系统。
‘捌’ 搜索引擎是什么
什么是搜索引擎,你知道吗?
搜索引擎与浏览器是完全不同的,浏览器并不是搜索引擎。想必大家已经是一头雾水,那么就让小编帮大家解开疑惑吧!
首先我们来了解何为搜索引擎。它是将与用户检索内容相关的信息展示给用户的系统。而浏览器是指可以显示网页服务器或是文件系统的HTML文件内容,让用户与这些文件交互的一种软件。简单来说搜索引擎就是一个网站,为用户提供收集到的信息资料,类似于中介的身份。
浏览器上的搜索框实质上是搜索引擎和浏览器合作的产物。曾经听过一个很形象的比喻:如果把互联网比作商场,搜索引擎就是导购,浏览器就是逛商场时穿的鞋子。搜索引擎需要用浏览器访问,它是一项检索服务,是根据一定的策略,用特定的计算机程序,从网上搜集、
整理信息并呈现给用户。如网络、360、搜狗等都是搜索引擎。
每一个浏览器都有自己默认的搜索引擎,像IE的默认搜索引擎是Bing搜索,360极速浏览器的搜索引擎是360搜索,搜狗浏览器默认的搜索引擎是搜狗搜索。
目前我们主流的搜索引擎有360 、网络、搜狗、有道等。
下面小编就给大家科普一下几个主要的搜索引擎。
1. 网络搜索引擎。网络是目前全球最大的中文搜索引擎,也是国内使用量最大的搜索引擎,它的创始人是李彦宏、徐勇。它是于2000年1月诞生于北京中关村。
2. 360搜索引擎。它是在2012年8月16日由奇虎360推出的搜索引擎,因为360搜索是依靠360 安全卫士和360安全浏览器所拥有的广大用户群,所以在一开始上线时就获得了很大的流量。360搜索的前身为好搜搜索,后于2016年2月1日更名为360搜索。
3. 搜狗搜索。是全球首个第三代互动式中文搜索引擎,诞生于2004年8月3日,其属于搜狐旗下,搜狗搜索的优势在于搜狐原有的网游、博客、论坛等业务已吸引了海量的用户,这使得搜狗在搜索引擎中很快就占据了一席之地。
‘玖’ 搜索引擎是什么意思怎么使用
搜索引擎(search
engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
(如、网络、谷歌、淘宝、阿里巴巴、雅虎、中搜等)每一个都是有自己独立的搜索引擎,全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有着名的网络搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和网络就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。
‘拾’ 搜索引擎是指什么
所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出指定信息反馈给用户的一门检索技术。