網(wǎng)站首頁百度不收錄的原因分析以及解決方法
經(jīng)常有客戶來咨詢小編網(wǎng)站建設(shè)的相關(guān)方案,尋求網(wǎng)站的SEO優(yōu)化推廣的方法,近日我們對此也做了一系列的總結(jié),希望能幫助到一部分網(wǎng)絡(luò)新人。
第一、網(wǎng)站首頁不收錄的幾點問題
1.網(wǎng)站模板是套用的模板
沒有做任何的布局或者框架改動,很多網(wǎng)絡(luò)公司為了省時、省力、省錢。直接給客戶套用的模板。導(dǎo)致網(wǎng)絡(luò)重復(fù)率過高,百度不喜歡重復(fù)率過高的東西。
解決方法:
在套用模板的基礎(chǔ)上適當(dāng)?shù)母囊幌虏季郑♂屢幌戮W(wǎng)絡(luò)相似度,能提高收錄的成功率。*好的解決方法就是人工設(shè)計網(wǎng)站架構(gòu)。
2.網(wǎng)站內(nèi)容過少
網(wǎng)站剛剛制作出來就上線,百度蜘蛛來爬取之后發(fā)現(xiàn)沒有任何有用的價值。
解決方法:
網(wǎng)站制作完先本地測試或者服務(wù)器域名測試,測試無誤后開始添加內(nèi)容,*起碼把內(nèi)容填充滿頁面之后再解析域名上線,百度蜘蛛再來抓取能抓取到很多內(nèi)容。能大大的提高收錄幾率。
3.robots.txt設(shè)置的問題
robots設(shè)置了蜘蛛禁止爬取或者你的站內(nèi)沒有robots文件。
解決方案:
查看你站內(nèi)是否有robots.txt文件,如果沒有,那么你制作一個上傳。網(wǎng)站必須要有robots文件。
查看方法直接在你的域名后面輸入:域名/robots.txt能打開就是有,打不開就是沒有。
4.有的robots.txt自動屏蔽動態(tài)頁面,你的內(nèi)容是動態(tài)的所以導(dǎo)致不收錄。
解決方法:
把你的網(wǎng)站生成靜態(tài)頁面,很多程序自帶生成靜態(tài)頁面功能;
把robots禁止抓取動態(tài)取消掉即可。
常規(guī)robots.txt的相關(guān)寫法
User-agent:*這里的*代表的所有的搜索引擎種類,*是一個通配符
Disallow:/admin/這里定義是禁止爬尋admin目錄下面的目錄
Disallow:/require/這里定義是禁止爬尋require目錄下面的目錄
Disallow:/ABC/這里定義是禁止爬尋ABC目錄下面的目錄
Disallow:/cgi-bin/*.htm禁止訪問/cgi-bin/目錄下的所有以”。htm”為后綴的URL(包含子目錄)。
Disallow:/*?*禁止訪問網(wǎng)站中所有包含問號(?)的網(wǎng)址
Disallow:/.jpg$禁止抓取網(wǎng)頁所有的。jpg格式的圖片
Disallow:/ab/adc.html禁止爬取ab文件夾下面的adc.html文件
Allow:/cgi-bin/這里定義是允許爬尋cgi-bin目錄下面的目錄
Allow:/tmp這里定義是允許爬尋tmp的整個目錄
Allow:.htm$僅允許訪問以”。htm”為后綴的URL
Allow:.gif$允許抓取網(wǎng)頁和gif格式圖片
Sitemap:網(wǎng)站地圖告訴爬蟲這個頁面是網(wǎng)站地圖
5.內(nèi)容違反百度規(guī)定
例如你的站是灰色行業(yè)或者黑色行業(yè)。百度當(dāng)然不會讓你收錄的。
解決方法:
利用heimao技術(shù)從代碼上騙過百度蜘蛛,認為你是正規(guī)行業(yè),而客戶訪問的時候顯示的是你要宣傳的產(chǎn)品。
以上五點是新站不收錄的主要原因,還有很多次要原因如以下:
1.服務(wù)器不穩(wěn)定:這個不會是影響首頁收錄的主要因素,服務(wù)器不穩(wěn)定會影響內(nèi)頁的收錄。
2.過多的js代碼:百度不喜歡js代碼,如果你站內(nèi)js代碼過多,又加上網(wǎng)站不是很討人喜歡,那么恭喜你。怎么會給你收錄。
3.域名以前被K過:以前被K過的域名短期內(nèi)是不會被收錄的,注冊購買域名的時候需謹慎。
二、網(wǎng)站內(nèi)頁不收錄的原因和解決方法
1.文章內(nèi)容過少
隨著做seo時間越來越長你會慢慢的發(fā)現(xiàn),文章越長越容易收錄。
原因和解決方法:
因為文章長會減少網(wǎng)絡(luò)相似度,百度會判定你為原創(chuàng)的幾率高。文章長說明內(nèi)容豐富,不豐富幾句就完事。
在合理的情況下盡量的增加文章內(nèi)容,但并不意味著是復(fù)制黏貼。
2.在1的基礎(chǔ)上增加內(nèi)容的豐富度
在文章里合理的穿插圖片,所謂的圖文并用,能大大提高文章的質(zhì)量。切記:圖片要標示一個和文章標題相似或者相關(guān)的alt。
圖片內(nèi)容要和文章相關(guān),不要隨意穿插圖片。
3.網(wǎng)站架構(gòu)問題,樣板文字過多。
用站長工具模擬蜘蛛搜索可以看出,百度對比的都是頁面。
由于頁面本身架構(gòu)和內(nèi)容過多,會提高文章的相似度。對于你站內(nèi)來說你更新的大部分文章百度會認為是一篇。因為相似度太高。
4.直接抄襲
很多人懶到了極致,抄襲文章都不帶改的。甚至都沒有閱讀一遍,連別人的文章內(nèi)有超鏈接、品牌詞等一起抄襲了過來。
不知道你這么做的意義何在?*起碼給被抄襲的人帶來了宣傳。
解決方法:
復(fù)制的內(nèi)容要走一遍txt,去掉相關(guān)的格式和鏈接;
抄襲的文章要進行修飾修改,閱讀一遍在原文章的基礎(chǔ)上改的更利于閱讀。
5.網(wǎng)站層次問題
由于你的網(wǎng)站層次太深,百度蜘蛛無法抓取到你的內(nèi)容,既然抓取不到何來收錄之說?
解決方法:
減少網(wǎng)站的層次,層次比較少又比較重要的內(nèi)容在首頁增加一個入口。
6.網(wǎng)站權(quán)重問題
百度曾經(jīng)說過第三方工具的權(quán)重不準,說明百度是有權(quán)重等級的,只是沒有公布出來。所以權(quán)重越高越利于收錄。
解決方法:
在優(yōu)化過程中多多提高網(wǎng)站的權(quán)重。站得高才能尿的遠。權(quán)重高了才是王道。
7.外鏈
不光你的首頁需要外鏈,你的內(nèi)頁有的時候也需要外鏈。內(nèi)容適當(dāng)?shù)陌l(fā)布幾個外鏈,能大大的提高該內(nèi)容的收錄率。
8.空間不穩(wěn)定、內(nèi)部鏈接不合理。
這兩條網(wǎng)站不收錄的次要因素也是主要因素。因為你的空間非常不穩(wěn)定,幾乎打不開。那能收錄就怪了。