針對搭建線上服務平臺的企業,網站流量是關乎于網站成敗的關鍵。而網站流量的獲取又跟搜索引擎息息相關。像百度、搜狗、360、谷歌等這些大家常用的搜索引擎,不一定會全部收錄企業網站的信息,沒有收錄就難以獲得好的排名,詢盤、訂單也會因此受到影響,導致企業業績難以提升。
那么,以百度為主的搜索引擎收錄原理是什么呢?
搜索引擎工作過程大體分為三個階段:爬行和抓取、預處理、排名。
一、蜘蛛的爬行和抓取
為了在Internet上自動抓取數萬個網頁,搜索引擎必須具有完全自動化的頁面抓取工具,這個用來爬行和訪問頁面的程序被稱為蜘蛛或爬蟲。蜘蛛是百度等搜索引擎的一種重要抓取技術,也是網站被收錄的來源,而源代碼就相當于它的網,讓它爬行于任意網頁的源代碼中。
當在源代碼中發現另一個新的鏈接時,它就會通過這個鏈接穿梭到另一個頁面繼續抓取→爬行→抓取→爬行…從而達到網頁被收錄的目的。
權重越高的網站,蜘蛛的抓取頻率會越高。對于新站來說,至少養3個月到半年的時間,權重會有所提升。與此同時,新站還要保持較高的更新頻率。如果新站長時間不更新內容,蜘蛛多次來時都沒有發現可抓取的新信息,就會慢慢減少抓取頻率,從一個月一次到幾個月一次。
但在實際工作中,蜘蛛的帶寬資源,時間都是有限的,不可能爬完所有頁面。實際上最大的搜索引擎也只是爬行和收錄了互聯網的一小部分。
二、預處理篩選
通過蜘蛛的爬行和抓取,原始數據庫建立完畢,搜索引擎會對網頁進行文字提取的處理。除了頁面上顯示的文字外,搜索引擎還會對諸如meta標簽、flash替代文件,錨文本、alt標簽等部分的文字進行提取。并針對“的”、“了”、“呀”之類沒有實際意義的詞、大量重復內容和頁面進行剔除,從而提高搜索引擎的計算效率。
三、排名的相關性計算
網站排名相關性計算不是憑單一站點的優化或者站點的點擊率來判斷,是搜索引擎通過各種綜合評分給出的排名。
1、關鍵詞位置的重要性
在網站的頁面的源代碼中包含了很多標簽,有些標簽代表小標題,有些代表圖片…當關鍵詞出現在某些標簽位置時,關鍵詞和頁面的相關性會更高,這些位置往往會包含標題、黑體字體、圖片Alt標簽等等。
2、錨文本關鍵詞與鏈接內容
如果我們在外部網站如博客、論壇、社區平臺,在相匹配的關鍵詞錨文本中添加了我們的網站頁面,這對頁面相關性的提升有很好的幫助。
3、頁面權重越高,導入鏈接相關性越高
如果你的網站鏈接能夠出現在某一個權威性的網站,并且鏈接了與網站相關的錨文本關鍵詞,那么你的頁面的相關性會越高。
近幾年,為了引導廣泛合理的SEO行為,打擊利用惡意手段獲取與網頁質量不符的排名行為,使互聯網生態圈得到更加健康有序的發展,百度等各大搜索引擎不斷改進算法規則,對用戶體驗及搜索結果質量影響嚴重的,去除作弊部分獲得的 權值并降低網站的權重,直至從搜索結果中徹底清理掉。因此,企業選擇一個專業的搜索營銷團隊是很重要的。
搜索引擎算法規則與搜索營銷行為間是一種良性的共生關系。專業的搜索營銷人員會根據企業發展需求適時調整規劃戰略,在算法規則允許的范圍內、利用正規的優化手段做搜索營銷,網站才能在最短時間內被收錄,獲得穩定的排名,從而抓住更多成單機會,促進業務持續增長。