『壹』 什麼是搜索引擎
搜索引擎是一個幫助用戶搜索他們需要內容的計算機程序。換一種說法,搜索引擎把計算機中存儲的信息與用戶的信息需求(information need)相匹配,並把匹配的結果展示出來。
搜索引擎是由搜索器、索引器、檢索器以及用戶介面組成的。
搜索器的作用是在互聯網中發現和搜集信息。
索引器的作用是分析理解搜索器搜索到的信息,並且從中提取到索引項,用於表示信息以及生成文庫的索引表。
檢索器的作用是根據用戶所查詢的關鍵詞信息在索引庫中快速檢索出的信息,並對信息與查詢關鍵詞的相關度進行評價,然後按照一定的規則排序反饋給用戶。
『貳』 什麼是搜索引擎作用是什麼
搜索引擎(Search Engine)是指根據一定的策略、運用特定的計算機程序從互聯網上搜集信息,在對信息進行組織和處理後,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統。
搜索引擎包括全文索引、目錄索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、門戶搜索引擎與免費鏈接列表等。比如網路就是一款比較流行的搜索引擎。
『叄』 什麼是搜索引擎
搜索引擎其實就是從互聯網上採集的一些信息,對於信息進行組織並且處理,為用戶提供一些檢索的服務。
搜索引擎的一般包括爬蟲以及索引,檢索,排序等等,當用戶進行搜索的時候,排在最前面的一般都是用戶體驗比較好的。
在當前的大數據時代,如何讓用戶更快的從海量的數據中精準的找到用戶自己想要的信息呢?其實說白了,這些還是一個用戶體驗的問題,當用戶進行搜索的時候,展現在最前面的就是用戶體驗好一點到。
而大數據和搜索引擎是並行,而且是融合的,搜索引擎技術會融合大數據來做一些個性化的推薦。但是本質上還是搜索引擎為大數據帶來的數據。為什麼這么說呢?因為有人搜索才會產生數據的來源,而這些數據則是通過大數據裡面篩選出來的一些數據。
希望以上的說法對你有所幫助。
『肆』 什麼是搜索引擎
搜索引擎是指根據一定的策略、運用特定的計算機程序從互聯網上採集信息,在對信息進行組織和處理後,為用戶提供檢索服務,將檢索的相關信息展示給用戶的系統。
搜索引擎是工作於互聯網上的一門檢索技術,它旨在提高人們獲取搜集信息的速度,為人們提供更好的網路使用環境。從功能和原理上搜索引擎大致被分為全文搜索引擎、元搜索引擎、垂直搜索引擎和目錄搜索引擎等四大類。
搜索引擎依託於多種技術,如網路爬蟲技術、檢索排序技術、網頁處理技術、大數據處理技術、自然語言處理技術等,為信息檢索用戶提供快速、高相關性的信息服務。
搜索引擎技術的核心模塊一般包括爬蟲、索引、檢索和排序等,同時可添加其他一系列輔助模塊,以為用戶創造更好的網路使用環境。
搜索引擎發展到今天,基礎架構和演算法在技術上都已經基本成型和成熟。搜索引擎已經發展成為根據一定的策略、運用特定的計算機程序從互聯網上搜集信息,在對信息進行組織和處理後,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統。
『伍』 名詞解釋:什麼是搜索引擎
搜索引擎(英語:search engine)是一種信息檢索系統,旨在協助搜索存儲在計算機系統中的信息。搜索結果一般被稱為「hits」,通常會以表單的形式列出。網路搜索引擎是最常見、公開的一種搜索引擎,其功能為搜索萬維網上儲存的信息。
搜索引擎為一組項目提供了一個介面,使用戶能夠指定關於感興趣的項目的標准,並讓引擎找到匹配的項目,這些標准稱為搜索查詢。在文本搜索引擎的情況下,搜索查詢通常表示為識別一個或多個文檔可能包含的期望概念的一組單詞。
有多種樣式的搜索查詢語法在嚴格性上有差異。它也可以在以前的站點中搜索搜索引擎中的名稱。而一些文本搜索引擎要求用戶輸入由白色空格分隔的兩個或三個字,其他搜索引擎可以使用戶能夠指定整個文檔,圖片,聲音和各種形式的自然語言。
一些搜索引擎對搜索查詢進行改進,以增加通過稱為查詢擴展的過程提供質量集合的可能性。查詢理解方法可用於標准化查詢語言。
(5)什麼是搜索引擎擴展閱讀:
一個完整的搜索引擎需要有網頁爬取和收錄,建立索引,查詢詞分析,搜索排序,推薦系統五個部分組成。
1、網頁爬取和收錄。
網路爬蟲技術是網頁爬取的核心技術,可以通過編寫一定的程序或者腳本來對互聯網的信息進行抓取。在網頁抓取之後,要構建相應的資料庫來存儲我們爬取的網頁信息。
但是互聯網的信息具有冗餘性,主要原因是各大網站也都會在後台進行爬蟲爬取,他們也會通過爬蟲來檢測一些熱點的內容或者文章,然後爬取其信息並對格式進行重新的組織,但其實網頁的內容幾乎都是一致的。
所以在收錄爬蟲爬取的網頁信息之前,我們還要加入一個關鍵的環節——網頁去重,來確保我們資料庫中網頁的唯一性。
2、建立索引
在抓取了網頁的信息之後,需要對網頁的信息進行解析,抽取到網頁的主題內容和類別信息。其主要涉及的技術為文本識別和文本分類技術。
網頁解析後的輸出往往是一些結構化的信息(每個網頁的信息完整度是不同的,需要統一對數據進行結構化操作),一般的結構化信息包括網頁的URL、網頁編碼、網頁標題、作者、生成時間、類別信息、摘要等等。
在獲取了網頁結構化信息後,就要構建相應的索引了。為了加快響應用戶査詢的速度,網頁內容通過"倒排索引"這種高效查詢數據結構來保存,而網頁之間的鏈接關系也會予以保存。
之所以要保存鏈接關系,是因為這種關系 在網F相關性排序階段是可利用的,通過"鏈接分析"可以判斷頁面的相對重要性,對於為用 戶提供准確的搜索結果幫助很大。
由於互聯網的網頁信息是海量的,所以搜索引擎的構建離不開大數據處理平台和雲計算技術,目前較為常用的大數據處理平台為Hadoop生態架構。
3、查詢詞分析。
查詢詞分析就是query分析或者query聚類。當搜索引擎接收到用戶的査詢詞後,首先需要對查詢詞進行分析,希望能夠結合查詢詞和用戶信息來正確推導用戶的真正搜索意圖。
比如,一個用戶輸入的查詢詞為「養水仙花」,那麼除了基本的內容匹配外,搜索引擎需要讀懂用戶,其實用戶的查詢詞還可以這樣被理解「水仙花的養法」,「水仙花好養不」 等等近意的查詢詞。
在此之後,首先在緩存中査找,搜索引擎的緩存系統存儲了不同的查詢意圖對應的搜索結果,如果能夠在緩存系統找到滿足用戶需求的信息,則可以直接將搜索結果返回給用戶,這樣既省掉了重復計算對資源的消耗,又加快了響應速度。
4、搜索排序
搜索引擎在分析了用戶的查詢詞以後,如果緩存的信息無法滿足用戶的查詢需求,搜索引擎要根據索引來查詢資料庫的網頁內容,並根據網頁內容與用戶需求來進行網頁排序。
網頁排序需要眾多的因素,其中最為主要的因素為網頁內容與用戶查詢內容的相似度(匹配度),這個不難理解,搜索引擎的基本功能就是查詢。
如果一個搜索引擎無法為用戶提供用戶需要查詢的內容,那其也就不能稱為是一個搜索引擎,所以網頁內容與用戶查詢內容的相似度是網頁排序的一個首要依據;
另外網頁的重要程度也是以關鍵元素,一個網頁的重要程度關乎了網頁內容的質量,在滿足用戶需求的基礎之上,用戶更加希望獲得高質量的內容,這是無可厚非的。
根據上述因素,搜索引擎對查詢到的結果進行排序,然後展示給用戶。
5、推薦系統
其實從不嚴格的角度來說,整個網頁排序的過程就屬於一種推薦策略。從嚴格意義上來說,推薦系統並不屬於一個搜索引擎架構的必要環節,而且推薦系統在上述示意圖中並沒有顯示。
但是一個優秀的搜索引擎不止要能分析出用戶查詢的基本需求,進一步來講,要能了解到或者猜測用戶的可能的下一步需求。
目前隨著大數據的熱潮,各大互聯網公司和眾多專家認為推薦系統是解決互聯網大數據的一種有效途徑。而且,最近越來越多個性化推薦知識受到了熱捧。其實推薦系統在搜索引擎中往往是以中間頁的形式展示的,它的主要作用就是為推薦系統進行導流。
參考資料來源:網路——搜索引擎
『陸』 搜索引擎的概念是什麼
搜索引擎(search
engines)是對互聯網上的信息資源進行搜集整理,然後供你查詢的系統,它包括信息搜集、信息整理和用戶查詢三部分。
搜索引擎是一個為你提供信息「檢索」服務的網站,它使用某些程序把網際網路上的所有信息歸類以幫助人們在茫茫網海中搜尋到所需要的信息。
早期的搜索引擎是把網際網路中的資源伺服器的地址收集起來,由其提供的資源的類型不同而分成不同的目錄,再一層層地進行分類。人們要找自己想要的信息可按他們的分類一層層進入,就能最後到達目的地,找到自己想要的信息。這其實是最原始的方式,只適用於網際網路信息並不多的時候。隨著網際網路信息按幾何式增長,出現了真正意義上的搜索引擎,這些搜索引擎知道網站上每一頁的開始,隨後搜索網際網路上的所有超級鏈接,把代表超級鏈接的所有詞彙放入一個資料庫。這就是現在搜索引擎的原型。
隨著yahoo!的出現,搜索引擎的發展也進入了黃金時代,相比以前其性能更加優越。現在的搜索引擎已經不只是單純的搜索網頁的信息了,它們已經變得更加綜合化,完美化了。以搜索引擎權威yahoo!為例,從1995年3月由美籍華裔楊致遠等人創辦yahoo!開始,到現在,他們從一個單一的搜索引擎發展到現在有電子商務、新聞信息服務、個人免費電子信箱服務等多種網路服務,充分說明了搜索引擎的發展從單一到綜合的過程。
然而由於搜索引擎的工作方式和網際網路的快速發展,使其搜索的結果讓人越來越不滿意。例如,搜索「電腦」這個詞彙,就可能有數百萬頁的結果。這是由於搜索引擎通過對網站的相關性來優化搜索結果,這種相關性又是由關鍵字在網站的位置、網站的名稱、
標簽等公式來決定的。這就是使搜索引擎搜索結果多而雜的原因。而搜索引擎中的資料庫因為網際網路的發展變化也必然包含了死鏈接。
『柒』 名詞解釋:什麼是搜索引擎
摘要 搜索引擎是指從網際網路搜集信息經過一定整理之後,提供給用戶進行查詢的系統。
『捌』 搜索引擎是什麼
什麼是搜索引擎,你知道嗎?
搜索引擎與瀏覽器是完全不同的,瀏覽器並不是搜索引擎。想必大家已經是一頭霧水,那麼就讓小編幫大家解開疑惑吧!
首先我們來了解何為搜索引擎。它是將與用戶檢索內容相關的信息展示給用戶的系統。而瀏覽器是指可以顯示網頁伺服器或是文件系統的HTML文件內容,讓用戶與這些文件交互的一種軟體。簡單來說搜索引擎就是一個網站,為用戶提供收集到的信息資料,類似於中介的身份。
瀏覽器上的搜索框實質上是搜索引擎和瀏覽器合作的產物。曾經聽過一個很形象的比喻:如果把互聯網比作商場,搜索引擎就是導購,瀏覽器就是逛商場時穿的鞋子。搜索引擎需要用瀏覽器訪問,它是一項檢索服務,是根據一定的策略,用特定的計算機程序,從網上搜集、
整理信息並呈現給用戶。如網路、360、搜狗等都是搜索引擎。
每一個瀏覽器都有自己默認的搜索引擎,像IE的默認搜索引擎是Bing搜索,360極速瀏覽器的搜索引擎是360搜索,搜狗瀏覽器默認的搜索引擎是搜狗搜索。
目前我們主流的搜索引擎有360 、網路、搜狗、有道等。
下面小編就給大家科普一下幾個主要的搜索引擎。
1. 網路搜索引擎。網路是目前全球最大的中文搜索引擎,也是國內使用量最大的搜索引擎,它的創始人是李彥宏、徐勇。它是於2000年1月誕生於北京中關村。
2. 360搜索引擎。它是在2012年8月16日由奇虎360推出的搜索引擎,因為360搜索是依靠360 安全衛士和360安全瀏覽器所擁有的廣大用戶群,所以在一開始上線時就獲得了很大的流量。360搜索的前身為好搜搜索,後於2016年2月1日更名為360搜索。
3. 搜狗搜索。是全球首個第三代互動式中文搜索引擎,誕生於2004年8月3日,其屬於搜狐旗下,搜狗搜索的優勢在於搜狐原有的網游、博客、論壇等業務已吸引了海量的用戶,這使得搜狗在搜索引擎中很快就占據了一席之地。
『玖』 搜索引擎是什麼意思怎麼使用
搜索引擎(search
engine)是指根據一定的策略、運用特定的計算機程序從互聯網上搜集信息,在對信息進行組織和處理後,為用戶提供檢索服務,將用戶檢索相關的信息展示給用戶的系統。
(如、網路、谷歌、淘寶、阿里巴巴、雅虎、中搜等)每一個都是有自己獨立的搜索引擎,全文搜索引擎是名副其實的搜索引擎,國外代表有Google,國內則有著名的網路搜索。它們從互聯網提取各個網站的信息(以網頁文字為主),建立起資料庫,並能檢索與用戶查詢條件相匹配的記錄,按一定的排列順序返回結果。根據搜索結果來源的不同,全文搜索引擎可分為兩類,一類擁有自己的檢索程序(Indexer),俗稱「蜘蛛」(Spider)程序或「機器人」(Robot)程序,能自建網頁資料庫,搜索結果直接從自身的資料庫中調用,上面提到的Google和網路就屬於此類;另一類則是租用其他搜索引擎的資料庫,並按自定的格式排列搜索結果,如Lycos搜索引擎。
『拾』 搜索引擎是指什麼
所謂搜索引擎,就是根據用戶需求與一定演算法,運用特定策略從互聯網檢索出指定信息反饋給用戶的一門檢索技術。