搜索引擎蜘蛛爬行網(wǎng)頁的方式,網(wǎng)絡(luò)蜘蛛一般有兩種策略:廣度優(yōu)先和深度優(yōu)先。下面啟邁
合肥網(wǎng)站建設(shè)對搜索引擎蜘蛛爬行網(wǎng)頁的廣度優(yōu)先和深度優(yōu)先解析:
搜索引擎蜘蛛爬行網(wǎng)頁的方式一:廣度優(yōu)先是指網(wǎng)絡(luò)蜘蛛會(huì)先抓取起始網(wǎng)頁中鏈接的所有網(wǎng)頁,然后再選擇其中的一個(gè)鏈接網(wǎng)頁,繼續(xù)抓取在此網(wǎng)頁中鏈接的所有網(wǎng)頁。這是最常用的方式,因?yàn)檫@個(gè)方法可以讓網(wǎng)絡(luò)蜘蛛并行處理,提高其抓取速度。如:很多優(yōu)化人員在網(wǎng)站地圖上放上網(wǎng)站的所有鏈接。
搜索引擎蜘蛛爬行網(wǎng)頁的方式二:深度優(yōu)先是指網(wǎng)絡(luò)蜘蛛會(huì)從起始頁開始,一個(gè)鏈接一個(gè)鏈接跟蹤下去,處理完這條線路之后再轉(zhuǎn)入下一個(gè)起始頁,繼續(xù)跟蹤鏈接。這個(gè)方法有個(gè)優(yōu)點(diǎn)是網(wǎng)絡(luò)蜘蛛在設(shè)計(jì)的時(shí)候比較容易。
兩種策略的區(qū)別,用圖來進(jìn)行說明。搜索引擎蜘蛛抓取策略由于不可能抓取所有的網(wǎng)頁,有些網(wǎng)絡(luò)蜘蛛對一些不太重要的網(wǎng)站,設(shè)置了訪問的層數(shù)。
例如,在上圖中,A為起始網(wǎng)頁,屬于1層,B、C、D屬于第2層,E、F、G屬于第3層,H屬于第4層。如果網(wǎng)絡(luò)蜘蛛設(shè)置的訪問層數(shù)為3的話,網(wǎng)頁H是不會(huì)被訪問到的。這也讓有些網(wǎng)站上一部分網(wǎng)頁能夠在搜索引擎上搜索到,另外一部分不能被搜索到。對于網(wǎng)站優(yōu)化人員來說,扁平化的網(wǎng)站結(jié)構(gòu)設(shè)計(jì)有助于搜索引擎抓取其更多的網(wǎng)頁。