AlphaGo戰(zhàn)勝柯潔,證明了人工智能的長足發(fā)展即將從量變到質(zhì)變,阿爾法狗打敗柯潔其實(shí)是在預(yù)料之中的事,人工智能可以在海量數(shù)據(jù)中找出規(guī)律。近年來,人工智能在人臉識(shí)別、機(jī)器翻譯等領(lǐng)域被廣泛應(yīng)用。我們都知道谷歌是一家搜索科技為主的公司,人工智能的發(fā)展勢(shì)必應(yīng)用于搜索引擎。SEO技術(shù)隨時(shí)都會(huì)變革,在這里我們先領(lǐng)略下SEO前輩是怎么看待人工智能未來對(duì)搜索引擎的影響。
這位前輩就是昝輝,也許你更多的是關(guān)注他的《SEO每日一貼》,下面是ZAC大神的筆記,非常具有前瞻性。
關(guān)于未來兩三年的SEO趨勢(shì),我談以下幾點(diǎn):
1、未來兩三年,人工智能可能全面影響SEO領(lǐng)域:
只有互聯(lián)網(wǎng)公司才能實(shí)現(xiàn)的勝利
深度學(xué)習(xí)的意義在于實(shí)現(xiàn)“無人監(jiān)督的學(xué)習(xí)”
深度學(xué)習(xí)系統(tǒng)應(yīng)用于搜索會(huì)怎么樣?
未來,系統(tǒng)將自己去思想,自已去琢磨哪些因素最終決定網(wǎng)站的質(zhì)量
2、關(guān)鍵詞相關(guān)性計(jì)算相對(duì)于傳統(tǒng)的改變:
語義分析是一種相關(guān)性判斷的新思路
它對(duì)未來的影響包括:寫作方式,文章長度、內(nèi)容深度
3、人工智能下的SEO,將促使網(wǎng)站不求大,而求內(nèi)容強(qiáng)
4、在深度學(xué)習(xí)的邏輯下,未來體現(xiàn)用戶體驗(yàn)的每一個(gè)環(huán)節(jié),都可能被納入SEO的判斷因素。
“點(diǎn)石互動(dòng)”成立到現(xiàn)在已經(jīng)第十個(gè)年頭了。十年前我們四個(gè)人成立點(diǎn)石的時(shí)候,他們幾個(gè)才20幾歲,也就我30多歲。在那之前我們互相連面都沒見過,只是在MSN聊天特別投緣,熱情一來就聯(lián)合開SEO博客。那年秋天,我們?cè)诒本┙M織了第一次SEO分享會(huì),一轉(zhuǎn)眼就是十年。
關(guān)于SEO,通常我們?cè)诰W(wǎng)上,或者看書的時(shí)候,內(nèi)容主要涉及的是基本SEO概念和技巧。但我希望做SEO的人,有時(shí)候停下來,看看世界,看看未來怎么走,大方向怎么走。
比如做網(wǎng)站的,假如在今天你有一批15年的老域名,那你現(xiàn)在可能做得很輕松,因?yàn)槟菚r(shí)候有多少人想得到現(xiàn)在的情景,而且即使當(dāng)時(shí)你擁有這些域名,還要一直維護(hù)著它。那么現(xiàn)在,我們是不是仍有機(jī)會(huì)看到未來10年需要怎么做?我想應(yīng)該還有的。
關(guān)于未來兩三年的SEO趨勢(shì),我今天談以下四點(diǎn):
第一,人工智能可能全面影響SEO
1、只有互聯(lián)網(wǎng)公司才能實(shí)現(xiàn)的勝利。
上個(gè)月李世石和AlphaGo的圍棋大戰(zhàn),李世石以1:4不敵人工智能的機(jī)器人。賽前預(yù)測(cè)時(shí),多數(shù)言論認(rèn)為機(jī)器勝算不大,包括棋圣聶衛(wèi)平在賽前也認(rèn)為電腦存在不可逾越的技術(shù)障礙,電腦完全無法戰(zhàn)勝人腦。但當(dāng)時(shí)我就在博客上寫了有戰(zhàn)勝的可能勝,因?yàn)楣雀杷玫娜斯ぶ悄芟缕逶砀覀兺ǔK胂蟮南缕宸椒ㄍ耆灰粯印?/span>
當(dāng)年IBM的電腦深藍(lán)打敗卡斯帕羅夫時(shí),那時(shí)的算法和現(xiàn)在是不一樣的。國際象棋可以用窮舉的暴力算法來計(jì)算每一步的后續(xù)可能性。而圍棋的困難在于不可能進(jìn)行窮舉,對(duì)美一種可能性進(jìn)行計(jì)算的話,其可能性超過全宇宙的原子數(shù)量。
另外,象棋每個(gè)子有相對(duì)容易賦值的子力,車馬炮都各自有規(guī)定的走法和優(yōu)勢(shì)。但圍棋不一樣,棋手落的每一個(gè)字可能是廢子,可能被提掉,但也可能隨著棋局變化變成手筋,因此沒法對(duì)它的每一個(gè)子賦值。
那么,它是怎么完勝了人類的?為什么是Google,而不是傳統(tǒng)的科技公司?因?yàn)楫?dāng)今最高端、最復(fù)雜的計(jì)算系統(tǒng)是在百度、Google,基本上只有互聯(lián)網(wǎng)公司才有這個(gè)能力完成這種計(jì)算。
AlphaGo的算法分為兩部分:
一是Policy network,即落子部分,刪選出有利但有限的地方來落子;
另一種則是Value network,對(duì)局勢(shì)進(jìn)行判斷的系統(tǒng)。判斷當(dāng)前的棋局形勢(shì)如何,它不是按既定的圍棋規(guī)則,也不是按人類棋手的技術(shù)去的,而是將歷史上過往巨量棋局輸入服務(wù)器,系統(tǒng)知道每盤棋的所有過程和最終誰勝利,因而人工智能系統(tǒng)在實(shí)戰(zhàn)時(shí)計(jì)算的是大數(shù)據(jù)支撐下某種局勢(shì)下勝率是多少。局勢(shì)判斷系統(tǒng)才是AlphaGo決勝的關(guān)鍵。
這就是深度學(xué)習(xí)帶來的。
2、深度學(xué)習(xí)的很大意義在于實(shí)現(xiàn)“無人監(jiān)督的學(xué)習(xí)”。
有監(jiān)督的學(xué)習(xí),是事先人為設(shè)定決定因素。比如我要建立一個(gè)廈門房?jī)r(jià)計(jì)算系統(tǒng),我可以會(huì)輸入面積、價(jià)格、朝向、區(qū)域等我們認(rèn)為相關(guān)的因素,然后系統(tǒng)會(huì)根據(jù)這些計(jì)算出規(guī)律。未來,當(dāng)我給出相應(yīng)的條件,系統(tǒng)就能預(yù)測(cè)出房?jī)r(jià)。
無人監(jiān)督的深度學(xué)習(xí)下,你只需告訴系統(tǒng)大量數(shù)據(jù),不需要告訴系統(tǒng)結(jié)果由什么因素決定,讓系統(tǒng)自己去學(xué)習(xí)。系統(tǒng)學(xué)習(xí)的過程對(duì)人來講是個(gè)黑箱,它可能會(huì)加入一些平常我們想象不到的因素。還是房?jī)r(jià)系統(tǒng)的例子,如果我們只是輸入所有交易相關(guān)的數(shù)據(jù),讓系統(tǒng)自己去學(xué)習(xí),它可能會(huì)加入我們想不到的因素,比如天氣對(duì)成交的影響,也許是年齡、性別對(duì)成交的影響。
而且人工智能系統(tǒng)能進(jìn)行自我訓(xùn)練,也就是自己跟自己對(duì)局。
3、深度學(xué)習(xí)系統(tǒng)應(yīng)用于搜索會(huì)怎么樣?
當(dāng)前搜索引擎辨別高質(zhì)量網(wǎng)站靠的是數(shù)據(jù)+人工。數(shù)據(jù)搜索引擎都會(huì)有網(wǎng)站的所有數(shù)據(jù),還包括關(guān)鍵詞布局,點(diǎn)擊方式、訪問方式這些判斷因素,這些數(shù)據(jù),他們都有,但哪些是真正高質(zhì)量網(wǎng)站,系統(tǒng)不一定知道。
Google就有一批人工監(jiān)測(cè)員來評(píng)估網(wǎng)站質(zhì)量。他們3月份剛剛發(fā)布一份質(zhì)量指南,告訴這些監(jiān)測(cè)員,你應(yīng)該怎么去判斷這個(gè)網(wǎng)站,通過人工打分,把網(wǎng)站分成五級(jí)。或列舉搜索的10個(gè)結(jié)果,讓人工去看,這樣的判斷跟用戶的判斷高度吻合,因?yàn)闄z測(cè)員就是普通用戶。將這兩方面數(shù)據(jù)結(jié)合,Google就有辦法通過深度學(xué)習(xí)準(zhǔn)確地評(píng)測(cè)網(wǎng)站的質(zhì)量。
4、未來,系統(tǒng)將自己去思想,自已去琢磨哪些因素最終決定網(wǎng)站的質(zhì)量。
a.規(guī)則為基礎(chǔ)的算法會(huì)被人工智能的黑箱取代;
b.系統(tǒng)工程師也不知道排名因素和權(quán)重——我們只知道輸入,結(jié)果,但過程中系統(tǒng)所采用的因素到底是什么可能誰也沒想到;
c.鉆空子會(huì)變得非常困難。因?yàn)槟闶窃诟晃?3段棋手在對(duì)戰(zhàn),只要有輸入,就會(huì)有輸出,這種算法可能運(yùn)用在任何領(lǐng)域,它具有全世界第一的判斷力,比人的水平還高;
d.Panda,penguin算法很可能已經(jīng)用到了人工智能。雖然google沒有官方確認(rèn)。目前應(yīng)該還沒有大規(guī)模的使用在搜索引擎中,但未來必然會(huì)大規(guī)模應(yīng)用。
(備注:google推出Google Panda,即熊貓算法,旨在反垃圾,保護(hù)原創(chuàng)。2012年4月24號(hào)周二,谷歌推出新的算法更新方案,代號(hào)“Penguin Update”。Penguin,直譯為企鵝,是谷歌繼2011年2月24號(hào)發(fā)布的“熊貓”之后再次推出的新算法調(diào)整。)
e.百度也有人工智能。百度和google比基本上是落后兩三年,研究google基本上等于研究未來兩到三年的百度。
第二,關(guān)鍵詞相關(guān)性計(jì)算相對(duì)于傳統(tǒng)的改變
傳統(tǒng)的關(guān)鍵詞排名算法基本邏輯是這樣的:
如果關(guān)鍵詞在所有文件中都出現(xiàn),意味著關(guān)鍵詞對(duì)文件的額區(qū)別能力非常小,基本為零,比如助詞“的地得”。
如果有些詞,只在比較少的一部分文件中出現(xiàn),被人為對(duì)相關(guān)性計(jì)算的意義較大。
1、語義分析是一種相關(guān)性判斷的新思路。
某些相關(guān)文件傾向于使用語義相關(guān)的詞,比如談減肥的文章中經(jīng)常出現(xiàn)卡路里,有氧運(yùn)動(dòng),跳繩等,有時(shí)會(huì)出現(xiàn)羽毛球。林丹離羽毛球近點(diǎn),離運(yùn)動(dòng)、有氧有一定距離,離減肥就更遠(yuǎn)。
這樣的計(jì)算邏輯下,如果一篇談減肥的文章沒有提到有氧運(yùn)到,系統(tǒng)可能會(huì)認(rèn)為它跟減肥的相關(guān)性實(shí)際上低一些,雖然減肥這個(gè)詞大量出現(xiàn)。按這種判斷邏輯, 如果你減肥寫兩篇貼子,分別在一篇談飲食,另一篇談?dòng)醒酰到y(tǒng)就會(huì)認(rèn)為第一篇文章跟減肥相關(guān)性低一些,或者認(rèn)為不是真正的減肥專家寫出的東西。
2、它對(duì)未來的影響包括:寫作方式,文章長度、內(nèi)容深度,關(guān)鍵詞分配方式,網(wǎng)站結(jié)構(gòu)等。
未來的內(nèi)容可能必須要寫得長,內(nèi)容必須要寫得更有深度,要不然你可能提不到語義相關(guān)關(guān)鍵詞。
百度百科、知乎的自然流量排名都非常高。知乎類文章都是專家寫的,都是有深度的文章。
關(guān)鍵詞的分配方式變了,做網(wǎng)站的思路也變了,以前網(wǎng)站可能想做大點(diǎn),頁面要多,每個(gè)關(guān)鍵詞都配上文章。
以后,則需要更強(qiáng)、更緊湊。不要想每個(gè)關(guān)鍵詞都配文章,而是怎么把文章寫得更有深度,覆蓋更多詞。
第三,頁面數(shù)據(jù)與用戶體驗(yàn)數(shù)據(jù)結(jié)合
我們通常認(rèn)為用戶訪問數(shù)據(jù)的噪聲較大,因?yàn)檫@上面比較容易做弊,比如早些年就出現(xiàn)過針對(duì)百度的頁面點(diǎn)擊工具來騙取更高的搜索排名。雖然谷歌和百度都沒有明確承認(rèn) ,但當(dāng)前在搜索引擎的算法中頁面點(diǎn)擊率應(yīng)該是個(gè)因素。
在有了人工智能系統(tǒng)的情況下,這種情況將會(huì)改觀。用戶訪問數(shù)據(jù)會(huì)更有用,因?yàn)橄到y(tǒng)會(huì)綜合看很多條件,包括用戶是誰,在什么條件下點(diǎn)擊,輸入什么關(guān)鍵詞,于是噪聲問題就有可能被消除了。
第四,頁面數(shù)據(jù)與用戶體驗(yàn)數(shù)據(jù)結(jié)合
在人工智能普及下,用戶體驗(yàn)也是SEO。
在深度學(xué)習(xí)的邏輯下,未來體現(xiàn)用戶體驗(yàn)的每一個(gè)環(huán)節(jié),都可能被納入SEO的判斷因素,包括:
網(wǎng)站打開速度。這已經(jīng)是排名算法的一部分;
搜索結(jié)果點(diǎn)擊率。
頁面停留時(shí)間、訪問頁面數(shù)(有深度學(xué)習(xí)系統(tǒng)的話,有可能這些數(shù)據(jù)都能呈現(xiàn)出來。)
頁面跳出率。
廣告、彈窗數(shù)據(jù)、位置。
增加頁面互動(dòng)。讓用戶在你頁面上做些東西,而不只是看和讀
轉(zhuǎn)化率。
圖片、視頻 。內(nèi)容的制造成本越高、質(zhì)量就越高。
上面所說的觀點(diǎn)純屬個(gè)人預(yù)測(cè),但很有可能是未來兩三年必須要做的東西。
謝謝大家!
來源:ZAC