網站建設
時間 : 2020-05-08 09:34 瀏覽(lan)量 : 44百度勁風算法上線
百度搜(sou)(sou)索(suo)近期將上線的(de)“勁風(feng)算(suan)法”,旨在(zai)控制惡意(yi)構(gou)(gou)造(zao)聚合頁的(de)問題對搜(sou)(sou)索(suo)用戶(hu)的(de)影響,為保障搜(sou)(sou)索(suo)用戶(hu)的(de)體驗、保證搜(sou)(sou)索(suo)結果公平,該算(suan)法針(zhen)對搜(sou)(sou)索(suo)結果中(zhong)通過惡意(yi)構(gou)(gou)造(zao)聚合頁面(mian)內容來獲取搜(sou)(sou)索(suo)排名的(de)行為。
聚合頁(ye),是指頁(ye)面并無(wu)文章主(zhu)(zhu)體內容,而是多個(ge)頁(ye)面的索引鏈接圍(wei)繞(rao)在特定主(zhu)(zhu)題下(xia)的信息整合頁(ye)。
簡單來說,勁風算法(fa)的(de)(de)面世,主要打擊業內(nei)一(yi)些單純以獲取(qu)流量為目(mu)的(de)(de),不管用(yong)戶搜(sou)索需求滿足度以及搜(sou)索體(ti)驗(yan)的(de)(de)聚合頁(ye)。
惡劣聚(ju)合頁問題主要包括以下四種類型:
1.內容跨領域
頁面內容與站(zhan)點本身所屬領(ling)域不(bu)符(fu),或站(zhan)點無專(zhuan)注領(ling)域,多為采集拼湊內容。
問(wen)題(ti)示例1:站點內容(rong)領(ling)域分(fen)散
內容(rong)與站點領(ling)域不符指的是(shi)網站中包(bao)含了太多領(ling)域的詞匯。
例(li)如:做游戲、又做教育,還參與了加盟(meng),甚至(zhi)有電(dian)影。
這不(bu)僅搜(sou)索(suo)引擎無(wu)法識別你網站(zhan)自身(shen)的(de)(de)(de)專注領(ling)域,用戶訪問你站(zhan)點的(de)(de)(de)聚合頁后,得到的(de)(de)(de)體驗也是極差的(de)(de)(de)。
2.題文不符
頁(ye)面(mian)內(nei)容與(yu)標題及頁(ye)面(mian)中(zhong)標記的標簽不符。
問題示例2:頁面內容與標題不(bu)符(fu)
所指(zhi)的(de)(de)標題可以理解為是聚合頁面的(de)(de)關(guan)鍵(jian)(jian)詞,例(li)如:聚合頁所部署的(de)(de)關(guan)鍵(jian)(jian)詞是SEO培訓(xun),而里面調取的(de)(de)內(nei)容則是游戲(xi)、電(dian)影(ying)等介紹,與關(guan)鍵(jian)(jian)詞本(ben)身(shen)不相關(guan)的(de)(de)內(nei)容。
這樣即便搜索用戶進(jin)入到該聚(ju)合頁,仍是不能很好的解決用戶需求。
3.靜態搜索結果頁
由網站搜索功能生成的(de)靜態(tai)搜索結(jie)果頁。
問(wen)題示例(li)3:靜態搜(sou)索結果頁
利用(yong)站(zhan)內(nei)搜索功(gong)能(neng),批(pi)量生成靜態頁(ye)面,這種(zhong)操作是批(pi)量生成聚合頁(ye)的慣用(yong)手法。多(duo)為(wei)內(nei)容(rong)量較大的網(wang)站(zhan)盛行。
這種頁面生(sheng)成(cheng)的技術含量難點在于自身搜(sou)索引(yin)擎的技術能力。而很多網站又(you)沒有(you)專業的搜(sou)索引(yin)擎團隊,即便生(sheng)成(cheng)出來的內容,相(xiang)關性(xing)差、頁面可讀性(xing)低。
4.空短、失效聚合頁
空短、無有效信息、失效的聚合頁。
問題示例4:無有效信息(xi)的聚合(he)頁
批量生成的聚(ju)(ju)合頁,以(yi)SEO為(wei)首(shou),單(dan)純(chun)以(yi)獲取流(liu)量為(wei)目的的頁面(mian)。大多都會存在聚(ju)(ju)合頁內,調(diao)取的內容過少(shao),甚(shen)至(zhi)為(wei)空的現象(xiang)。
這種類(lei)型的頁面可想而知(zhi),毫無用戶體(ti)驗可言(yan)。所以勁風算法對其進行懲(cheng)罰(fa)也是早晚的事情。
以上四類惡劣(lie)聚合頁問題(ti)就是這次勁風算法的主要內容。
命中勁風算(suan)法后(hou),如(ru)何進行(xing)整改及恢復
當(dang)百度(du)上(shang)線(xian)某個算法的時候,都可(ke)借助(zhu)歷史趨勢數據或網站監控的一些功能,來了解這(zhe)些算法對網站帶來的影響。
1.針對網站領域過于分散的
建議確定(ding)好一個(ge)主要的領域(yu),且(qie)將其他領域(yu)的內容robots掉,屏蔽搜索引擎(qing)抓取,且(qie)不再參(can)與搜索引擎(qing)排名(ming);
或對(dui)其(qi)他領域(yu)的(de)內容(rong)進行刪(shan)除(chu)(chu),并將(jiang)刪(shan)除(chu)(chu)的(de)內容(rong)URL在百度搜索(suo)資(zi)源(yuan)平臺提交(jiao)404,確(que)保網站(zhan)無恙。
2.針對題文不相符的
可以(yi)對應(ying)每一個聚(ju)合(he)頁的(de)主題(ti)進行審查,確保聚(ju)合(he)頁下內(nei)容都是針對當前聚(ju)合(he)頁主題(ti)所延展的(de)相(xiang)關內(nei)容。
通(tong)過內(nei)容(rong)(rong)相似度計算的方(fang)式將(jiang)網頁(ye)內(nei)的主(zhu)體文本進行(xing)提取(qu)計算。得出當前聚合頁(ye)的主(zhu)題(ti)與內(nei)容(rong)(rong)的相似度得分。
并通過實際觀(guan)察,確(que)保相似(si)度得(de)分在(zai)哪個(ge)值上,是可以(yi)解決搜索用戶需求的(de)。
3.針對利用搜索批量生成的
針對(dui)搜(sou)索調取的內容(rong)相關進行大幅度提升(sheng),從而提升(sheng)用戶體驗(yan)度。
利用相似度判斷(duan)方式,讓(rang)編輯協助完成(所計劃的(de)相似度得分值(zhi))聚合頁的(de)內容撰寫工作。
如最終還是無法確保滿足用戶需求的,建議刪(shan)除或(huo)者robots操(cao)作。
4.針對內容為空或過于少,甚至無效的
將(jiang)更多(duo)品類的內容進行搜(sou)索(suo)整(zheng)理,從而(er)提升聚合頁下內容整(zheng)體(ti)的豐富度,前期要保(bao)證(zheng)相關性。
其次(ci),可將聚合頁關鍵(jian)詞進行(xing)分類。
例(li)如:爬蟲(chong)抓取、爬蟲(chong)算法、搜索(suo)引擎爬蟲(chong)、baiduspider,被認為是一類(lei)聚合頁。
當內容為空(kong)或少(shao)于X條時,可(ke)以通過擴展調(diao)取的維度(du)進行補全(quan)。
另(ling)外,由于(yu)所做的404頁面已被(bei)收錄或者爬蟲抓取了,建議(yi)再(zai)提交百度搜索資(zi)源平臺的死鏈提交工具進(jin)行完(wan)備(bei),確保不會讓搜索引擎認為網(wang)站存在大量死鏈接。
上一篇: 37獲客營銷|網絡推廣霸屏之強力壓制對手