網路上的資訊繁多龐雜,如果不借助一些服務對資訊進行整理和排序,要找到您需要的內容會如同大海撈針。Google排名系統旨在實現這一目標:它們會對Google搜尋索引中的數千億個網頁進行整理和排序,以便瞬間找出最相關、最實用的結果,並將這些結果以一種有助於您查詢所需內容的方式呈現出來。
這些排名系統由一系列演算法組成,而不是一個演算法。為了向您提供最實用的資訊,Google搜尋演算法會考慮很多因素,包括您查詢的字詞、網頁的相關性和可用性、來源的專業度,以及您所在的位置和您採用的設定。系統為每個因素賦予的權重因查詢的性質而異,例如,與字典定義的查詢結果相比,對於時事新聞主題的查詢結果,內容的新鮮度更加重要。
為了協助確保Google搜尋演算法符合嚴苛的相關性和品質標準,我們制定了嚴格的流程,不僅展開現場測試,更有數千位來自世界各地訓練有素的外部Google搜尋品質評分者參與評估。這些品質評分者會遵循嚴格的指南,該指南明確指出了Google搜尋演算法的目標,可供所有人檢視。
下文詳細介紹了Google搜尋會根據哪些主要因素來確定對於每個查詢要返回哪些結果:
分析您的字詞
理解搜尋字詞的含義對於返回優質結果至關重要。因此,為了找到包含相關資訊的頁面,我們的第一步就是分析您的搜尋查詢中的字詞的含義。我們建立了語言模型,試圖了解應該使用關鍵詞的哪些部分在索引中進行查詢。
這會涉及到看起來如同解析拼寫錯誤一樣簡單的步驟,並會擴充套件到通過將自然語言理解方面的部分最新研究成果付諸應用來嘗試理解您輸入的查詢的型別。例如,即便一個字詞有多種定義,我們的同義詞系統也能幫助Google搜尋理解您的意思。該系統的開發過程歷時超5年,大幅改善了超過30%的搜尋的結果(涵蓋各種語言)。
我們還會嘗試理解您要尋找的資訊所屬的類別。是非常具體的搜尋還是寬泛的查詢?是否存在“稽核”、“照片”或“營業時間”等能夠表明搜尋所蘊含的具體資訊需求的字詞?您是否在搜尋暗示您想查詢當天所釋出內容的熱門關鍵字?或者,您是否在搜尋附近的商家並需要獲得相關的本地資訊?
對於這種查詢分類,一個非常重要的方面在於,我們會分析您的查詢是否要查詢新鮮內容。如果您搜尋熱門關鍵字,我們的新鮮度演算法會將其解讀為這樣一種訊號:最新資訊比日期較早的網頁更有用。也就是說,當您搜尋最新的“NFL比分”、《與星共舞》比賽成績或“埃克森美孚的收益”時,您看到的結果會是最新資訊。
與您的搜尋內容相符
接下來,我們會尋找包含與相應查詢匹配的資訊的網頁。當您搜尋時,在最基本的層面上,我們的演算法會在索引中查詢您的搜尋關鍵詞以找到適當的網頁。這些演算法會分析相關關鍵字在某個網頁上(不論是在標題中還是在正文中)的出現頻率和顯示位置。
當某個網頁中包含與您的搜尋查詢內容相同的關鍵字時,這是表示搜尋到的資訊可能與您要查詢的內容相關的最基本訊號。如果網頁或者文字的標題或正文中出現這些關鍵字,則表示該資訊與您要查詢的內容相關的可能性更大了。除了簡單的關鍵字匹配之外,我們還使用經過彙總和匿名化處理的互動資料來評估搜尋結果是否與查詢內容相關。我們會將這些資料轉換為訊號,以協助我們的機器學習系統更好地評估相關性。
除了匹配關鍵字,我們的演算法還會尋找線索來衡量潛在搜尋結果能從多大程度上滿足使用者的搜尋需求。當您搜尋“狗”時,您想看到的應該不是含有數百個“狗”字的網頁。我們會盡力確定網頁是否包含與您的查詢對應的答案(而非只是重複您的查詢)。因此,Google搜尋演算法會分析網頁是否包含相關內容,例如狗的圖片、視訊,甚至是品種列表。最後,我們會檢查網頁所用的語言是否與您的查詢所用的語言相同,以便優先顯示採用您的首選語言的網頁。
需要說明的是,儘管我們的系統確實會通過尋找這類可量化的訊號來評估相關性,但並不會因此用於分析主觀觀念,例如分析網頁內容的觀點或政治傾向。
為實用網頁排名
對於一項典型的查詢,含有可能相關的資訊的網頁會多達數千個甚至數百萬個。因此,為了幫助將最符合需求的網頁排在靠前的位置,我們還編寫了演算法來評估這些網頁的實用性。
這些演算法會分析數百種不同的因素-從內容的新鮮度,到您的搜尋關鍵詞的出現次數以及網頁能否提供出色的使用者體驗-以盡力呈現網路所能提供的最有用的資訊。為了評估內容在相關主題方面的可信度和權威性,我們會尋找那些看起來在類似查詢中受到大量使用者青睞的網站。如果與該主題相關的其他知名網站連結到了相應頁面,則可充分說明此頁面上的資訊具有較高的品質。
網路中有很多垃圾網站會試圖通過再三重複關鍵字或購買可提升PageRank的連結等各種不當手段,矇混到搜尋結果中靠前的位置。這些網站提供的使用者體驗非常糟糕,甚至可能會傷害或誤導Google使用者。因此,我們編寫了演算法來識別網路垃圾並將那些違反Google網站站長指南的網站從結果中移除。
網路和更廣闊資訊生態系統中的內容在不斷變化,因此我們不會停止衡量和評估自身系統的品質,確保在資訊相關性和權威性之間實現適當的平衡,讓使用者始終信任看到的搜尋結果。
返回最佳結果
在為您提供結果之前,我們會評估所有相關資訊的綜合效果:這些搜尋結果是隻有一個主題,還是有很多主題?是否有過多的頁面在著重探討一條狹義的詮釋?我們會努力根據您的搜尋型別以最有用的格式提供一系列多樣的資訊。此外,隨著網路不斷髮展,我們會不斷優化排名系統,以便為更多查詢提供更優質的結果。
這些演算法會通過分析相關訊號來評估是否所有使用者都能檢視搜尋結果。例如:網站是否能在不同的瀏覽器中正常顯示;網站是否適合各種型別和尺寸的裝置(包括桌面裝置、平板電腦和智慧手機);以及網頁載入時間對於網際網路連線速度較慢的使用者而言是否合適。
鑑於網站所有者可以提高其網站的易用性,我們會在對Google搜尋演算法做出重大更改時儘量提前通知網站所有者以便其可以做出應對。例如,在2018年1月,我們宣佈Google搜尋演算法將開始把網站的“網頁速度”納入考量範圍,這一通知比更改的正式實施時間提早了6個月。為協助網站所有者,我們提供了詳細的指導以及PageSpeedInsights和Webpagetest.org等工具,這樣網站所有者就可以了解他們需要調整哪些方面(如果有)來使其網站更適合移動裝置。
考慮具體環境
您的位置、過往搜尋記錄和搜尋設定等資訊可幫助我們即時地為您量身顯示最實用且最相關的結果。
我們使用您的國家/地區和位置資訊來提供與您所在區域相關的內容。例如,如果您身處芝加哥並搜尋“橄欖球”,Google便極有可能會先為您顯示有關美國橄欖球和芝加哥熊隊的結果。但如果您是在倫敦搜尋“足球”,Google則會在比較靠前的位置顯示有關英式足球和英超聯賽的結果。搜尋設定也是一項重要的指標,可表明哪些結果可能會對您有用。例如,如果您設定了首選語言或已選擇啟用安全搜尋(一種有助於濾除露骨結果的工具)。
在某些情況下,我們可能還會使用您的近期搜尋活動的相關資訊為您提供個性化的結果。例如,如果您搜尋“巴塞羅那”,而且您最近搜尋過“巴塞羅那vs阿森納”,系統便可能會將您的這條搜尋記錄視為一個重要線索,從而推斷出您十有八九是想查詢與足球俱樂部(而非城市)相關的資訊。您可通過訪問myaccount.google.com來控制系統可使用哪些搜尋活動來提升您的搜尋體驗,包括調整哪些資料會儲存到您的Google帳號。
Google搜尋還有其他一些功能也有助於根據您Google帳號中的搜尋活動記錄為您顯示個性化的搜尋結果。例如,如果您搜尋“附近的活動”,Google可能會專門向您推薦我們認為您可能感興趣的那些類活動。這些系統旨在協助Google搜尋提供與您的興趣相符的資訊,而不會推斷敏感性特徵,例如您的種族、宗教或黨派。
您可以在myaccount.google.com上控制系統為提升您的搜尋體驗可使用的搜尋活動資訊,包括設定系統可將哪些資料儲存到您的Google帳號中。要停用Google搜尋根據您帳號中的活動記錄提供個性化結果的功能,請關閉“網路與應用活動記錄”。
百度搜索google seo 劉俊了解更多。