日本少妇高潮久久久久久_东京热一区二区三区无码视频_国内精品人妻久久毛片app_男人撕开奶罩揉吮奶头视频_少妇交换做爰做到高潮_睡错了人妻公h_国产男女猛烈无遮挡a片漫画_男女啪啪做爰高潮全过有多钱_国产猛男猛女超爽免费视频

Categories


Tags


人工智能在搜索算法中的應(yīng)用

2016年以來(lái),IT行業(yè)最大的技術(shù)突破應(yīng)該是人工智能了,不僅在一年左右時(shí)間,在最后一個(gè)人類曾經(jīng)自以為機(jī)器很難戰(zhàn)勝人類的游戲項(xiàng)目上完勝人類,前幾天更是出現(xiàn)了逆天的AlphaGo Zero,完全不用借鑒人類知識(shí),自學(xué)3天就超越了人類。

人工智能領(lǐng)域最牛X的公司,國(guó)外是Google,國(guó)內(nèi)是百度。都是搜索引擎。這恐怕也不是什么巧合,而是因?yàn)樗阉饕媸亲钸m合開(kāi)發(fā)人工智能的公司,他們擁有最大量的數(shù)據(jù),包括文字、圖片、視頻,還有地圖、路況、用戶使用數(shù)據(jù)等等。

搜索引擎公司的AI成果在多大程度上運(yùn)用到了他們的核心業(yè)務(wù)-搜索中?他們都沒(méi)有明確地對(duì)外說(shuō)明,從搜索工程師的零碎發(fā)言中猜測(cè),至少目前還沒(méi)有大規(guī)模使用,并沒(méi)有改變搜索算法的基礎(chǔ)。畢竟人工智能雖然概念存在了幾十年,但效果突飛猛進(jìn)只是近幾年的事,還沒(méi)有出現(xiàn)通用人工智能,在圍棋這種規(guī)則簡(jiǎn)單明確的領(lǐng)域中牛X,遷移到規(guī)則模糊的系統(tǒng)中,比如搜索,還需要一些時(shí)間。

但我想,人工智能大規(guī)模應(yīng)用于搜索算法是早晚的事。據(jù)說(shuō)以前百度大搜索部門(mén)和人工智能/深度學(xué)習(xí)部門(mén)之間是有些矛盾的,現(xiàn)在吳恩達(dá)離開(kāi)了百度,陸奇對(duì)百度又進(jìn)行了很多人事調(diào)整,搜索部門(mén)對(duì)人工智能的排斥也許就大大降低了。

其實(shí)人工智能已經(jīng)在搜索算法中有所運(yùn)用。舉兩個(gè)例子。

百度DNN模型

前幾個(gè)月看到了百度朱凱華的一篇《AI賦能的搜索和對(duì)話交互》演講報(bào)道。數(shù)年前和朱凱華還做過(guò)一次訪談,那時(shí)候他還是Google的主任架構(gòu)師,是著名的熊貓算法的主要參與者之一,現(xiàn)在他是百度的首席架構(gòu)師了。演講內(nèi)容很多,感興趣的搜索標(biāo)題就能找到全文,很值得深入讀一下。這么長(zhǎng)時(shí)間SEO行業(yè)很少人注意到這篇這么有價(jià)值的關(guān)于搜索算法的公開(kāi)信息,還是挺意外的。

演講里提到了百度2013年上線的DNN模型,極大提高了語(yǔ)義相關(guān)性的判斷范圍和準(zhǔn)確性,2013年百度相關(guān)性提高的34%來(lái)自于DNN模型,2014年全年相關(guān)性提升的25%來(lái)自DNN模型。DNN模型使用的就是深度學(xué)習(xí)方法,通過(guò)100億的用戶點(diǎn)擊數(shù)據(jù)訓(xùn)練模型,有超過(guò)1億個(gè)參數(shù)。下面介紹的Google RankBrain是2015年上線的,所以百度是世界上第一個(gè)將人工智能應(yīng)用到實(shí)際搜索算法中的公司。

下圖是DNN訓(xùn)練的示意圖:

百度DNN模型是人工智能在算法中的第一次應(yīng)用

簡(jiǎn)單說(shuō),就是對(duì)同一個(gè)查詢?cè)~,模型分析了真實(shí)用戶點(diǎn)擊了的頁(yè)面的標(biāo)題,和沒(méi)有點(diǎn)擊的頁(yè)面標(biāo)題,從而更深入理解哪些標(biāo)題是滿足了用戶需求的。經(jīng)常出現(xiàn)的情況是,頁(yè)面標(biāo)題并不包含查詢?cè)~,用戶卻更愿意點(diǎn)擊這些頁(yè)面,說(shuō)明這些頁(yè)面滿足了用戶需求,這些頁(yè)面的標(biāo)題,即使不包含查詢?cè)~,也是與查詢?cè)~語(yǔ)義相關(guān)的。這是經(jīng)典的頁(yè)面-關(guān)鍵詞相關(guān)性算法無(wú)法計(jì)算出來(lái)的。

演講中提到的例子:

百度DNN模型案例

在DNN上線之前,用戶搜索“ghibli車頭如何放置車牌“時(shí),由于相關(guān)信息很少,沒(méi)有什么頁(yè)面是以這個(gè)查詢?cè)~為標(biāo)題或者頁(yè)面出現(xiàn)這些關(guān)鍵詞的,所以搜索結(jié)果質(zhì)量不高,傳統(tǒng)搜索算法只能按關(guān)鍵詞匹配返回一些ghibli相關(guān)信息,卻沒(méi)幾乎有“車頭如何放置車牌”的信息。

(注:看到這里的讀者不用去百度搜索“ghibli車頭如何放置車牌”了,您看到的將是被這篇帖子污染的搜索結(jié)果,會(huì)看到本帖,以及被轉(zhuǎn)載、抄襲的本帖。)

DNN上線之后的搜索結(jié)果是這樣的:

百度DNN模型上線效果

可以看到,搜索結(jié)果中還是沒(méi)有以“ghibli車頭如何放置車牌“為標(biāo)題的頁(yè)面,但解決了用戶的需要,算法理解了“前”、“前面”和“車頭”是一個(gè)意思,“放哪里啊”、“怎么裝”、“咋掛”和“任何放置“是一個(gè)意思,所以”ghibli車牌咋掛“這種頁(yè)面回答了“ghibli車頭如何放置車牌“這個(gè)查詢,雖然他們包含的關(guān)鍵詞是不一樣的。

這種對(duì)相關(guān)性的理解不是傳統(tǒng)以關(guān)鍵詞匹配為基礎(chǔ)的搜索算法能算出來(lái)的,而是真實(shí)用戶的點(diǎn)擊數(shù)據(jù)告訴搜索算法的。用戶搜索“ghibli車頭如何放置車牌“時(shí),經(jīng)常點(diǎn)擊”ghibli車牌咋掛“、”ghibli前面車牌照怎么裝“這些頁(yè)面,DNN模型被訓(xùn)練后知道,這些詞之間是語(yǔ)義相關(guān)的。

Google RankBrain

2015年上線的Google RankBrain解決的也是對(duì)查詢?cè)~的深入理解問(wèn)題,尤其是比較長(zhǎng)尾的詞,找到與用戶查詢?cè)~不完全匹配、但其實(shí)很好回答了用戶查詢的那些頁(yè)面。和百度DNN是非常類似的。Google沒(méi)有具體說(shuō)明RankBrain的訓(xùn)練方法,估計(jì)和百度DNN也是類似的。

2015年RankBrain上線時(shí),15%的查詢?cè)~經(jīng)過(guò)RankBrain處理,2016年所有查詢?cè)~都要結(jié)果RankBrain處理。

Google自己經(jīng)常舉的RankBrain例子是這個(gè)查詢:

What’s the title of the consumer at the highest level of a food chain

這個(gè)查詢?cè)~相當(dāng)長(zhǎng)尾,完全匹配的結(jié)果比較少,而且查詢中的幾個(gè)詞容易有歧義,比如consumer通常是消費(fèi)者的意思,food chain也可以理解為餐飲連鎖,但這個(gè)完整的查詢和商場(chǎng)、消費(fèi)者、飯館之類的意思沒(méi)有任何關(guān)系,RankBrain能理解其實(shí)用戶問(wèn)的是食物鏈頂端的物種是什么名字。同樣,搜索結(jié)果不能按照傳統(tǒng)的關(guān)鍵詞匹配來(lái)處理。

這種長(zhǎng)尾查詢數(shù)量很大,每天Google收到的查詢里有15%是以前都沒(méi)出現(xiàn)過(guò)的。這種查詢要靠關(guān)鍵詞匹配就比較難以找到高質(zhì)量頁(yè)面,數(shù)量太少,甚至沒(méi)有,但理解了查詢的語(yǔ)義和意圖,就能找到滿足用戶需求的、關(guān)鍵詞并不完全匹配的頁(yè)面。

對(duì)SEO的影響以后再詳細(xì)寫(xiě),這里只是先簡(jiǎn)單提示一下:頁(yè)面要包含關(guān)鍵詞,這在目前的關(guān)鍵詞優(yōu)化過(guò)程中是必然的,現(xiàn)在搜索引擎能理解兩句不同的話意思是一樣的了,以后創(chuàng)作或編輯頁(yè)面內(nèi)容時(shí),是不是還一定要包含關(guān)鍵詞呢?

2019年2月10號(hào)更新:Google工程師Gary Illyes在Reddit上舉辦的一次問(wèn)答活動(dòng)上這樣描述RankBrain的工作原理:

RankBrain is a PR-sexy machine learning ranking component that uses historical search data to predict what would a user most likely click on for a previously unseen query. It is a really cool piece of engineering that saved our butts countless times whenever traditional algos were like, e.g. “oh look a “not” in the query string! let’s ignore the hell out of it!”, but it’s generally just relying on (sometimes) months old data about what happened on the results page itself, not on the landing page

就我的理解,基本上和百度DNN模型一樣,對(duì)某些查詢量很小,甚至以前沒(méi)出現(xiàn)過(guò)的查詢?cè)~,RankBrain使用歷史搜索數(shù)據(jù)(搜索結(jié)果頁(yè)面上的點(diǎn)擊數(shù)據(jù),不是網(wǎng)頁(yè)本身數(shù)據(jù))預(yù)測(cè)用戶最可能點(diǎn)擊哪個(gè)頁(yè)面。

來(lái)源:SEO每天一貼 Zac 昝輝


Public @ 2012-06-09 16:14:23

如何分析競(jìng)爭(zhēng)對(duì)手網(wǎng)站和做好自己網(wǎng)站的SEO(2)

1. 競(jìng)爭(zhēng)對(duì)手網(wǎng)站分析 - 網(wǎng)站結(jié)構(gòu):了解競(jìng)爭(zhēng)對(duì)手的網(wǎng)站結(jié)構(gòu),并分析其是否用戶友好、易于導(dǎo)航和瀏覽。 - 關(guān)鍵詞研究:研究競(jìng)爭(zhēng)對(duì)手使用的關(guān)鍵詞,并了解關(guān)鍵詞的競(jìng)爭(zhēng)程度和潛在價(jià)值。 - 內(nèi)容分析:分析競(jìng)爭(zhēng)對(duì)手的內(nèi)容,包括類型、質(zhì)量和數(shù)量,發(fā)現(xiàn)他們的優(yōu)勢(shì)和劣勢(shì)。 - 外部鏈接:研究競(jìng)爭(zhēng)對(duì)手的外部鏈接,找到他們的鏈接來(lái)源并分析其質(zhì)量和數(shù)量。 - 社交媒體:了解競(jìng)爭(zhēng)對(duì)手在社交媒體上的活動(dòng)和表現(xiàn),包括他們的

Public @ 2023-07-24 15:50:50

新網(wǎng)站上線一個(gè)月都沒(méi)有被收錄的原因及處理方式

一、原因: 1. 站點(diǎn)新建時(shí)間不夠長(zhǎng):盡管Google等搜索引擎可以收錄新的網(wǎng)站,但是它們并不會(huì)立即做出反應(yīng),因此,新建的網(wǎng)站一般需要等待一段相當(dāng)長(zhǎng)的時(shí)間才能被收錄。 2. 網(wǎng)站內(nèi)容無(wú)優(yōu)勢(shì):網(wǎng)站內(nèi)容不足,比如網(wǎng)站只有十幾個(gè)頁(yè)面,內(nèi)容不夠豐富,搜索引擎收錄率會(huì)大打折扣。 3. 缺乏外鏈:搜索引擎獲取網(wǎng)站信息主要依靠外部來(lái)源,如用戶分享或社交媒體,而不是主要依靠網(wǎng)站內(nèi)部的文章。如果網(wǎng)站缺乏外鏈,搜

Public @ 2023-03-04 15:00:34

人工智能在搜索算法中的應(yīng)用

人工智能在搜索算法中可以應(yīng)用在以下幾個(gè)方面: 1. 機(jī)器學(xué)習(xí)算法:機(jī)器學(xué)習(xí)算法可以幫助搜索引擎更好地理解和分類搜索結(jié)果,提高搜索結(jié)果的準(zhǔn)確性和相關(guān)性。 2. 自然語(yǔ)言處理:自然語(yǔ)言處理可以幫助搜索引擎更好地處理搜索關(guān)鍵詞、語(yǔ)義解析和搜索結(jié)果的呈現(xiàn)。 3. 個(gè)性化推薦:通過(guò)分析用戶的搜索記錄、行為軌跡等數(shù)據(jù),人工智能可以實(shí)現(xiàn)個(gè)性化推薦,為每個(gè)用戶提供最優(yōu)的搜索結(jié)果。 4. 搜索廣告:人工智能

Public @ 2023-04-11 04:00:21

人工智能在搜索算法中的應(yīng)用

人工智能在搜索算法中應(yīng)用廣泛。以下是幾種常見(jiàn)的應(yīng)用: 1. 排序算法:使用人工智能技術(shù),例如神經(jīng)網(wǎng)絡(luò),可以對(duì)搜索結(jié)果進(jìn)行排序,以提高搜索引擎的精度和速度。 2. 路徑規(guī)劃算法:人工智能算法可以幫助計(jì)算最短路徑、最優(yōu)路徑等,以實(shí)現(xiàn)電子地圖等應(yīng)用。 3. 圖像搜索算法:使用計(jì)算機(jī)視覺(jué)技術(shù),搜索引擎可以通過(guò)圖像中的特征識(shí)別進(jìn)行圖像搜索。 4. 自然語(yǔ)言處理算法:搜索引擎可以使用自然語(yǔ)言處理技術(shù),

Public @ 2023-04-12 15:01:10

更多您感興趣的搜索

0.469326s