為什么你搜索的結(jié)果和我搜索的結(jié)果不一樣?
來(lái)源:http://www.premium-option.com 發(fā)布時(shí)間:2016-06-23
今天有位SEO的朋友告訴我,他在上個(gè)月接了個(gè)SEO單子,承諾三個(gè)月內(nèi)將其客戶(hù)的關(guān)鍵詞優(yōu)化到baidu自然排名前10,今天他例行檢查排名,發(fā)現(xiàn)其關(guān)鍵詞已經(jīng)做到了一位,十分開(kāi)心,立即通知客戶(hù),叫客戶(hù)簽收,等著收除款,但客戶(hù)那邊說(shuō)搜不到,并沒(méi)有像他說(shuō)的那樣排在百度一 ,一頁(yè)根本沒(méi)有他們的關(guān)鍵字。朋友開(kāi)始疑問(wèn)了,明明自己看到關(guān)鍵了排在百度一,為何到了客戶(hù)那里結(jié)果就變了呢?相信大家都遇到過(guò)吧!
導(dǎo)致以上的結(jié)果出現(xiàn)可能是百度有很多的服務(wù)器,存在這樣的更新不同步問(wèn)題,導(dǎo)致地區(qū)的差異性。
這樣就能解釋?zhuān)瑸槭裁磿?huì)有不同搜索結(jié)果的問(wèn)題了。但為什么我的朋友跟客戶(hù)在同一城市里,也會(huì)存在搜索結(jié)果的不同呢?這里就涉及到一個(gè)IP定位的問(wèn)題了,互聯(lián)網(wǎng)怎么劃分你是屬于什么區(qū)域呢?就是將IP進(jìn)行分配,比如山東內(nèi)的,就放220.***.***.***號(hào)段的IP,而浙江就放222.***.***.***,那么服務(wù)器能根據(jù)用戶(hù)IP來(lái)判斷你所在的區(qū)域了。但是問(wèn)題又來(lái)了,現(xiàn)在的網(wǎng)絡(luò)服務(wù)商越來(lái)越多,不僅僅是電信一家獨(dú)門(mén)生意了,這樣導(dǎo)致很多的IP數(shù)據(jù)庫(kù)趕不上了IP的誕生速度,從而有了很多IP,被無(wú)法識(shí)別,被劃分錯(cuò)區(qū)域。
我這也遇到過(guò)類(lèi)似的情況就是我這邊搜索的客戶(hù)的網(wǎng)站一直是在一頁(yè),但是一段時(shí)間之后忽然客戶(hù)那邊搜不到了,但是我這邊還在,后跟客戶(hù)交流一下,應(yīng)該確定是緩存問(wèn)題。緩存是因?yàn)樵谝欢ǖ臅r(shí)間段內(nèi)的搜索的關(guān)鍵詞集中在一定的范圍內(nèi),并且這些搜索相對(duì)穩(wěn)定。例如每天搜索"美女"的人總有10萬(wàn),20萬(wàn),而結(jié)果在這段時(shí)間相對(duì)穩(wěn)定, 因此沒(méi)有必要每次去檢索索引文件, 而將上一個(gè)人搜索的結(jié)果直接返回便可以了。
搜索引擎緩存策略也同搜索引擎的算法密切相連,除了搜索緩存,索引緩存也是一個(gè)好方法。獨(dú)立或者分布一些權(quán)重較高的文檔也是一種提高效率的方法。例如我們有1000萬(wàn)的網(wǎng)頁(yè)的權(quán)重(可以簡(jiǎn)單的理解為pagerank)比較高,那么這些網(wǎng)頁(yè)上海國(guó)際男子醫(yī)院的排序相比另外一些權(quán)重較低的網(wǎng)頁(yè)相對(duì)較為穩(wěn)定,就不妨獨(dú)立出來(lái)進(jìn)行相對(duì)獨(dú)立的索引緩存。
關(guān)于緩存的分布,一般的小型搜索引擎不會(huì)用到,但是如果每天處理上億次的搜索,緩存的分布就應(yīng)當(dāng)有一定的分布規(guī)劃,例如根據(jù)提交的關(guān)鍵詞構(gòu)成hash table, 然后對(duì)應(yīng)于不同的搜索服務(wù)器,實(shí)現(xiàn)緩存的分布。
讓我們看看實(shí)際例子吧,我們拿百度,google, yisou, 中搜,tag.bokee.com 進(jìn)行簡(jiǎn)單的測(cè)試:
因?yàn)闇y(cè)試, 要搜索一些在過(guò)去7天沒(méi)有人搜索過(guò)的關(guān)鍵詞, 或者組合詞。為了保證沒(méi)有人搜索過(guò), 我選擇在各個(gè)網(wǎng)站優(yōu)化在線(xiàn)咨詢(xún)搜索引擎里搜索"a s d f v g h" , 這是我在鍵盤(pán)上隨機(jī)打出的一些組合, 相信這世界上在7天沒(méi)有人相同搜索,這樣保證我的一次的搜索是 fresh search, 就是一定需要搜索引擎去檢索索引文件, 而不是通過(guò)緩存策略。
以下是結(jié)果:
百度: 0.279秒
google: 0.24 秒
一搜: 0.24 秒
中搜: 0.001秒(無(wú)結(jié)果?。。。。?/p>
博客搜索: 0.041 秒
下面是第二次搜索的結(jié)果:
百度: 0.001秒
google: 0.05 秒
一搜: 0.09 秒
中搜: 0.002秒(無(wú)結(jié)果!?。。。?/p>
博客搜索: 0.019 秒
經(jīng)過(guò)簡(jiǎn)單的測(cè)試, 可以看出緩存機(jī)制只有在Baidu和google搜索引擎里都有, 但是各自效率不一樣, 如下是簡(jiǎn)單的比例:
百度: 100
google: 5
一搜: 沒(méi)有明顯的緩存
中搜: 沒(méi)有明顯的緩存
博客搜索: 沒(méi)有明顯的緩存
而在緩存效率上百度要遠(yuǎn)遠(yuǎn)大于google, 這點(diǎn)大概是因?yàn)間oogle的gfs本身的分布效率已經(jīng)相當(dāng)不錯(cuò), 因此進(jìn)行緩存也不會(huì)有數(shù)量級(jí)的提升。
而百度, 根據(jù)測(cè)試可能是集中方式的數(shù)據(jù)存儲(chǔ), 但是根據(jù)搜索進(jìn)行hash分布, 因此才會(huì)在緩存上有顯著的提升。(這個(gè)屬于猜測(cè),大家要有更合理的解釋?zhuān)部梢愿覀兘涣?。?/p>
相關(guān)文章
多年
成立于2010年
多年經(jīng)驗(yàn)不斷發(fā)展
多家客戶(hù)
超過(guò)多家客戶(hù)伴隨我們成長(zhǎng)
多家企業(yè)
服務(wù)于多家企業(yè)客戶(hù)
助力品宣的提升
幾十項(xiàng)
服務(wù)項(xiàng)目為您服務(wù)
夯實(shí)成長(zhǎng)的基石