激光切割機_光纖激光切管機_手持激光焊接機_PCB雕刻機_北京中航北工科技有限公司

北京中航北工科技有限公司

激光切割及自動化設備供應及定制服務

全國咨詢熱線

當前位置:主頁 > 資訊動態 > 行業動態 >

AI在內容分發上的絆腳石

文(wen)章(zhang)出處:未知 人氣:發表時間:2018-10-26 20:10:01

自(zi)(zi)從互聯網商(shang)業(ye)化(hua)發(fa)展以來,不論是(shi)新聞客戶(hu)端、視(shi)頻網站(zhan)或(huo)是(shi)電商(shang)平臺……所有的(de)平臺,都是(shi)把自(zi)(zi)己(ji)默認為(wei)一個(ge)優秀的(de)飼養🅰員,它(ta)按照(zhao)自(zi)(zi)己(ji)的(de)想法,把內容🌠(rong)(飼料)Push(喂(wei))給用(yong)戶(hu)。

 

這些(xie)飼(si🦄)養員(yuan)都是受過訓(xun)練(lian)的專業人士(shi),行話叫做---由網站編(bian)輯為用(yong)戶(hu)設置議(yi)程,按(ꦓan)照大多數用(yong)戶(hu)的口味挑選內容。

 

后(hou)來編輯實在忙(mang)不過來,采用(yong)機器幫忙(mang)---最簡單的機器方式(shi)則是“熱門推薦”,比(bi)如按🥃照點擊(ji)量或其它數據來做排序。

 

飼養員(yuan)模式最大(da)的(de)問題是不知道食(shi)客胃🅺口如何,這會導致兩個顯著的(de)后(hou)果:一是食(shi)客不滿意(yi),用戶個性化需求(qiu)不能得(de)到滿足;二是自身資源浪費,大(dꦓa)量長尾資源長期得(de)不到曝光,增加沉(chen)沒成本(ben)。

 

有(you)人發現了(le)機(ji)器(qi)(qi)的(de)(de)(de)好處。機(ji)器(qi)(qi)可以是根據用(yon🍌g)戶特征來(lai)推薦(jian)內容(rong)(rong)。正如一個高明的(de)(de)(de)廚子可以根據每一個食客的(de)(de)(de)口味提供飯菜,如果機(ji)器(qi)(qi)足夠(gou🔥)聰明,在一定程度上(shang)可以解決所有(you)用(yong)戶的(de)(de)(de)個性化需(xu)求。這豈(qi)不是內容(rong)(rong)產業的(de)(de)(de)C2M?

 

準確的說,這是內(nei)容分發(fa)的C2M,它以單(dan)個用戶為對(dui)象進行溝通(tong),跳出了大眾傳(chuan)播/分眾傳(chuan)播窠(ke)臼,是不是足ꦰ以革了所有(you)的搜(sou)索引(yin)擎和門戶網站的命(ming)?

 

這(zhe)種智能化▨的(de)內容(rong)C2M有深刻的(de)時(shi)(shi)代(dai)背景。今天(tian),你已(yi)經站(zhan)在(zai)時(shi)(shi)代(dai)邊緣,眼睜(zheng)睜(zheng)的(de)看著AI技(ji)術點燃(ran)了IOT的(de)引線,接(jie)下來(lai)你將發現自己(ji)無可拒絕的(de)進入下一個信息核爆(bao)的(de)時(shi)(shi)代(dai):信息終端(duan)爆(bao)炸、信息規模爆(bao)炸、信息平臺爆(b🐈ao)炸……

 

在信息高速公路上(shang),你開過(guo)的(de)(de)車,你走(zou)過(guo)的(de)(de)路,全都(dou)變了規則(ze),你所(suo)熟悉的(dꦗe)(de)一切的(de)(de)基于飼養員(yuan)模(mo)式的(de)(de)知識框架都(dou)面臨🌄顛覆。

 

在這個時代,飼(si)養員模(mo)式已🧜經🦩失(shi)靈了,聰明的機(ji)器將成為最大的變量。

 

第一(yi)個出現的場景是人類(lei)生(s♔he𝕴ng)產內(nei)容(rong),機器分發內(nei)容(rong)。

 

下(xia)一個(ge)出現的場(chang)景是機器(qi)🌞生產內容(rong𒉰),機器(qi)分發(fa)內容(rong)。

 

內容產業面臨C2M革命,行不行?

 

“當(dang)然不(bu)行,機器很(hen)蠢。”如果你這樣(yang)想,那么很(hen)遺憾,你注🎉定是看不(bu)到明天的太陽了。

 

“當然行。”如果(g༒uo)你這(zhe)么想,那(nei)么祝賀(he)你🎀掉進(jin)坑里了。

 

真實的情況(kuang),你可能意(yi)想不到。

 

一、內容C2M之路本質是走(zou)向個體化溝通

 

作(zuo)為(wei)一個(ge)獨立的研(yan)究方向,推(tui)薦系統(to🌄ng)的源頭可以追溯到90年代初(chu)的協同過(guo)濾算法(fa),中期的代ꦗ表則是(shi)(shi)傳統(tong)的機器(qi)學習(xi)(xi)算法(fa),比如Netflix大賽所推(tui)動的隱語義模型,現在則是(shi)(shi)更加復雜的深度學習(xi)(xi)模型。

 

近些年(nian),深(shen)度(du)學習突飛猛進,使得機(ji)器推薦變(bian)成了整(zhen♒g)個互(hu)聯網的太陽(yang)。在新技(ji)術的推動(dong)下,個性化溝通(tong)(tong)也變(bian)得更加可行(xing),而且(qie)越(yue)來越(yue)接近單用戶溝通(tong)(tong)。

 

(一)協同過(guo)濾蹣跚起步(bu)

 

按♎照百科詞條解釋,協同過濾是利用用戶群體的喜(xi)好來為你(ni)推(tui)薦感興(xing)趣的信(xin)息,這(zhe)些(xie)用戶要么興(xing)趣相投、要么具有共同經驗,然后網站結合你(ni)的反饋(如(ru)評(ping)分(fen)),進(jin)行過濾分(fen)析(xi),進(jin)而幫助別(bie)人篩選(xuan)信(xin)🍰息。

 

當然,用(yong)戶喜好不(bu)一定局限(xian)෴于特別(bie)感興趣的信息,特別(bie)不(bu)感興趣信息的紀錄也相(xiang)當重要(yao)。協(xie)同過濾表現(xian)出了(le)出色的效(xiao)果,開始在互聯(lian)網行(xing)業稱王稱霸。

 

起先,協同過(guo)濾應用于郵件過(guo)濾。

 

1992年,施樂公司的(de)科(ke)學(xue)家提(ti)出了Tapestry系統(tong)(tong)。這是(shi)最早應用協同過濾系統(tong)(tong)的(de)設(she)計,主要(yao)是(shi)解決Xerox公司在Palo Alto的(de)研(yan)究中心資(zi)訊過載的(de)問題。這個研(yan)究中心的(de)員工每天會收到非(fei)常多(duo)的(de)電子郵(you)(you)件卻無從篩選(xuan)分類(lei),于是(shi)研(ya✅n)究中心便發展這項實驗性的(de)郵(you)(you)件系統(tong)🐈(tong)來(lai)幫助員工解決這項問題。

 

接(jie)著,協同過(guo)濾思路開始應用于內容推薦。

 

1994年,美國Minnesota的GroupLens項目(mu)組創辦(ban)了一個新(xin)聞篩選系(xi)(xi)(xi)統(tong),這個系(x💝i)(xi)(xi)統(tong)可以(yi)(yi)幫助(zhu)新(xin)聞的閱聽(ting)者過濾其感興(xing)(xing)趣(qu)的新(xin)聞內容,閱聽(ting)者看過內容后(hou)給一個評(ping)比的分(fen)數,系(xi)(xi)(xi)統(tong)會(hui)將(jiang)分(fen)數記錄起來(lai)以(yi)(yi)備未(wei)來(lai)參考之用,假設(she)前(qian)(qian)提是(shi)閱聽(ting)者以(yi)(yi)前(qian)(qian)感興(xing)(xing)趣(qu)的東西在未(wei)來(lai)也(ye)會(hui)有(you)興(xing)(xing)趣(qu)閱聽(ting),若閱聽(ting)者不(bu)愿揭露自己的身(shen)分(fen)也(ye)可以(yi)(yi)匿名(ming)進行評(ping)分(fen)。作為最老牌的內容推(tui)(tui)薦研究團隊,GroupLens于(yu)1997年創建了電影(ying)推(tui)(tui)薦系(xi)(xi)(xi)統(tong)MovieLens,還(huan)有(you)性質相(xiang)近的音樂推(tui)(tui)薦系(xi)(xi)(xi)統(tong)Ringo,以(yi)(yi)及影(ying)音推(tui)(tui)薦系(xi)(xi)(xi)統(tong)Video Recommender等等。

 

后來,出現了另一個里程(cheng)碑——電子商務推薦系統。

 

1998年,亞๊(ya)馬遜的林登和他的同(tong)事(shi)申請的基于物品的協(xie)同(tong)過(guo)濾(item-to-item)技術專利,是亞(ya)馬遜早(zao)期使用的經(jing)典算(suan)法,一度引爆流行。

 

協同(tong)過濾算不(bu)算人工智能?從技術的角度來看(kan),它(ta)也🦋(ye)屬于AI范疇。但必須(xu)指出的是(shi)協同(tong)過濾算法(fa)比較弱智,無論(lun)是(shi)基(ji)于用戶的協同(tong)過濾,還是(shi)基(ji)于物品的協同(tong)過濾,推(tui)薦效果(guo)總是♉(shi)差強(qiang)人意。

 

怎樣通過一個成體系的(de)方法論(lun)來(lai)引導推薦系統(tong)的(de)不斷(duan)優(you)化(hua)?如何才能把復雜的(de)現(xian)實因素糅合到推薦結果(guo)中🙈?攻城獅們一度非常(chang)非常(chang)頭大,重賞之下必有勇(yong)夫,后來(lai),終于有人發現(xian)了更加靈活的(de)思路。

 

(二)傳統機器(qi)學習開始加速(su)

 

2006年,Netflix宣布舉辦(ban)Netflix Prize。Netflix是一家老牌的(de)在線影(ying)片租賃網(wang)站,舉辦(ban)大賽的(de)目的(de)旨在解決電(dian)影(ying)評分預測問(wen)題的(de)機器學習(xi)和數據挖(wa)掘問(wen)題。主辦(ban)方為此下了血本(ben),宣稱對于那些能夠將Netflix的(de)推(tui)薦系統Cinematch的(🙈de)準(zhun)確率提(ti)升10%的(de)個人或團隊,獎勵100萬美(mei)元!

 

Netflix在自家blog上♏(s💝hang)披露(lu)了許多龐大的(de)數據(ju),舉(ju)例如(ru)下:

 

  • 我們有幾十(𓆏shi)億的用戶(hu)評分ꦑ(fen)數據,并且以(yi)每(mei)天幾百萬的規模(mo)在增長(chang)。

  • 我們的(de)系統每(mei)天產生幾百萬的(de)播(bo)放(fang)點擊(ji),并且包(bao)含很多特征,例(li)如:播(bo)放(fang)時(s🦄hi)長、播(bo)放(fang)時(shi)間點和設備類型。

  • 我們的用戶每(mei)天將幾百萬部視頻添加到他(ta)們的播放列表(biao)。

 

ܫ 顯然,在這些海(hai)量數據面前,我們已經不能靠由(you)純人工或(huo)者小型系統建立起(qi)來的分類標(biao)準對整個平臺用戶喜好進行標(biao)準化。

 

比賽開始一年后,Korbell的團隊以8.43%的提升贏(ying)得了(le)第一個階段獎。他們付出(chu)了(le)超💜過2000個小時的努力,融合了(le)107種算法。其(qi)中兩種最🍃有效的算法:矩陣分解(通常被叫做SVD,奇異值分解)和局限(xian)型(xing)玻爾茲曼機(RBM)。

 

矩(ju)陣(zhen)(zhen)分(fen)解作為(wei)協同過濾(lv)的補充,核心是將一個非常(chang)稀疏(shu)的用戶評分(fen)矩(ju)陣(zhen)(zhen)R分(fen)解為(wei)兩個矩(ju)陣(zhꦡen)(zhen):User特(te)性的矩(ju)陣(zhen)(zhen)P和Item特(te)性的矩(ju)陣(zhen)(zhen)Q,并用已(yi)知的數(shu)據構建這些向量,使用它們來預測(ce)未知的項。該算(suan)法在有效提高(gao)計(ji)算(suan)精(jing)度的同時,還能夠加入各種建模元素,使更(geng)多元化的信息融(rong)合進來,更(geng)好地利用大量數(shu)據。

 

然而矩(ju)陣(zhen)分解(jie)也有不足。不足之處在(zai)ജ于,矩(ju)陣(zhen)分解(jie)和(he)協同過濾(lv)算法(fa)一(yi)樣,都屬(shu)于監督學習范疇(chou),粗糙且(qie)簡單,適用于小型系統。擺在(zai)網絡巨頭們面前的問題是,如(ru)果需要(yao)建立(li)一(yi)個大型推薦系統,協同過濾(lv)和(he)矩(ju)陣(zhen)分解(jie)則會(hui)花費較(jiao)長的時間。怎么辦?

 

于是,一(yi)些攻城獅將眼光(guang)轉移到無(wu)監(jian)督學習(xi)中。無(wu)監(jian)督學習(xi)中的(de)(de)聚(ju)類算法(fa)的(de)(de)本(ben)質是識別用(yong)戶(hu)組,并對這(zhe)個組內的(de)(de)用(yong)戶(hu)推薦相(xiang)同(tong)的(de)(de)ও內容。當我們(men)擁有足夠的(de)(de)數據(ju),最好使用(yong)聚(ju)類作為(wei)第一(yi)步,來(lai)縮(suo)減協同(tong)過濾算法(fa)中相(xiang)關鄰居的(de)(de)選擇(ze)范圍。

 

隱語(yu)義模型運用了聚類分析方法,其一大(da)優勢(shi)是既可以(yi)做評分預測,又(you)可以(yi)同ꦆ時對文本(ben)內容建模,使得(de)通(tong)過內容來進(jin)行(xing)推薦的效果得(de)到較大(da)提(ti)升。

 

傳統的(de)(de)(dꦏe)分析方(fang)式(shi)在對(dui)用(yong)戶(hu)(hu)打標簽,并(bing)根據標簽映射(she)到(dao)結果(guo)的(de)(de)(de)兩個步(bu)驟(zou)中(zhong)(zhong)準確(que)度不(bu)高(gao)。比(bi)如用(yong)戶(hu)(hu)填(tian)寫的(de)(de)(de)年(nian)齡不(bu)一(yi)定真實,或者并(bing)非所有青少年(nian)都喜歡漫(man)畫。而隱語義(yi)模型的(de)(de)(de)核(he)心(xin),是超(chao)越這些(xie)表層(ceng)語義(yi)標簽的(de)(de)(de)維度,通過機器學習技術,挖掘用(yong)戶(hu)(hu)行(xing)為(wei)中(zhong)(zhong)更(geng)深層(ceng)的(de)(de)(de)潛在關聯,使得推薦精度﷽更(geng)高(gao)。

 

Netflix Prize百萬美꧂(mei)元武林大賽號令之下,天下英(ying)才頻(pin)出。2009年達到(dao)了(le)(le)(le)一個(ge)高峰(feng),成為推(tui)薦(jian)系統領域(yu)最(zui)標致性的(de)事件,這次比(bi)賽吸引了(le)(le)(le)眾多專業人士投身于(yu)(yu)推(tui)薦(jian)系統領域(yu)的(de)研究,也讓(rang)這項技術從專業圈子滲透(tou)到(dao)了(le)(le)(le)商業領域(yu),引發了(le)(le)(le)熱烈的(de)討論(lun)并逐漸ಌ勾起了(le)(le)(le)主(zhu)流網站(zhan)的(de)垂涎(xian),基(ji)(ji)于(yu)(yu)內(nei)容(rong)的(de)推(tui)薦(jian)、基(ji)(ji)于(yu)(yu)知識的(de)推(tui)薦(jian)、混合(he)推(tui)薦(jian)、基(ji)(ji)于(yu)(yu)信任網絡的(de)推(tui)薦(jian)等(deng)等(deng)走上了(le)(le)(le)快速(su)發展的(de)通道。

 

這些推(tui)薦(jian)ܫ引擎與(yu)協同過(guo)濾不同,例如基于內(nei)容的(de)(de)推(tui)薦(jian)是建立在項目的(de)(de)內(nei)容信息上(shang)作出推(tui)薦(jian)的(de)(de),而不需要(yao)依據用(yong)戶對項目的(de)(de)評價意見,更(geng)多地需要(yao)用(yong)機器學(xue)習的(de)(de)方(fang)法從(cong)關于內(nei)容的(de)(de)特征描述的(de)(de)事(shi)例中得到用(yong)戶的(de)🔜(de)興(xing)趣資料。內(nei)容過(guo)濾主要(yao)采用(yong)自然語言處理(li)、人工智能、概率(lv)統計和機器學(xue)習等技術進行過(guo)濾。

 

百萬(wan)美元花得值不值?據2016年(nian)的(🐻de)Netflix用戶數據:注(zh๊u)冊(ce)會員6500萬(wan)人,每天觀(guan)看視頻的(de)總時長1億(yi)(yi)個小時。Netflix說(shuo),每年(nian)靠這套系統能(neng)夠節(jie)省10億(yi)(yi)美元。

 

(三)深度學習帶來“無人駕駛”

 

近些年來,用戶(hu)的(de)大痛點(dian)出現。智能手(shou)機的(de)普及,讓龐大的(de)信息量和(he)狹(xia)小的(de)閱讀屏幕(mu)(mu)成為一(yi)對難以化(hua)解的(de)矛盾,用戶(hu)閱讀場景(jing)不再是(shi)固守于電腦屏幕(mu)(mu),而是(shi)向移動(dong)化(hua)碎片化(hua)轉變,搜(sou)索引擎失靈了(le),人工推薦忙(mang)不過來,機器推薦也不夠(gou)用了(le),這(zhe)種轉變對大內(nei)容平臺簡直(zhi)是(shi)生死(si)考驗。能滿(man)足需求(qiu)▨則(ze)生,不滿(man)足則(ze)死(si)。

 

面對(dui)這(zhe)一問題,♓YouTube和Facebook提出了(le)(le)新(xin)解(jie)決思路:運用深度(du)學習,制造聰明(ming)的(de)機器。近(jin)十(shi)年來(lai),深度(du)學習已經取得了(le)(l𓆉e)巨大(da)的(de)飛躍,對(dui)于(yu)解(jie)決大(da)數據量更有優勢。

 

如(ru)果說人工內容(rong)推薦(jian)如(ru)同司(si)機開車,那(nei)么深度學習所帶來的內容(rong)推薦(jian),則如(ru)無人駕(jia)駛汽車。在這種技術是利用用戶(hu)數(shu)(shu)(shu)據(ju)(ju)來“感(gan)知”用戶(hu)喜(xi)好,其(qi)推薦(jian)系統基(ji)本可以分(fen)為(wei)數(shu)(shu)(shu)據(ju)(ju)層、觸發層、融合(he)過濾層和排(pai)序層,當數(shu)(shu)(shu)據(ju)(ju)層生成和存儲的數(shu)(shu)(shu)據(ju)(ju)進(jin)入候選層后,也就觸發了核(he)心的推薦(jia✨n)任務。

 

以YouTube為(wei)例,其最(zui)新公(gong)開的(de)(de)推(tui)(tui)薦系統算法由兩個神經網絡組成,一個用于候(hou)選生꧟(sheng)成,一個用于排序。首先(xian),以用戶的(de)(de)瀏(liu)覽歷史為(wei)輸入(ru),候(hou)選生(sheng)成網絡可以顯著減小可推(tui)(tui)薦的(de)(de)視(shi)頻數量,從龐大的(de)(de)庫(ku)中選出💦一組最(zui)相關(guan)的(de)(de)視(shi)頻。

 

這樣生成的候(hou)選(xuan)(xuan)(xuan)視(shi)(shi)(shi)頻(pin)與用(yong)戶(hu)(hu)的相關性最高,再進一(yi)步對用(yong)戶(hu)(hu)評分(fen)進行預測。這個網絡的目標(biao),只(z𓂃hi)是通過協(xie)同過濾提供更(geng)廣泛的個性化(hua)。排序網絡的任(ren)務則(ze)是仔細分(fen)析候(hou)選(xua𒊎n)(xuan)(xuan)內容,精選(xuan)(xuan)(xuan)出少量最優選(xuan)(xuan)(xuan)擇。具(ju)體操作為(wei)根據視(shi)(shi)(shi)頻(pin)描(miao)述(shu)數據和用(yong)戶(hu)(hu)行為(wei)信息,使(shi)用(yong)設(she)計好的目標(biao)函數為(wei)每個視(shi)(shi)(shi)頻(pin)打分(fen),將(jiang)得分(fen)最高的視(shi)(shi)(shi)頻(pin)呈獻給用(yong)戶(hu)(hu)。

 

在這種模(mo)式下(xia),機器(qi𝓡)全然接管了平臺。在深度學(xue)習(xi)的持續(xu)訓練下(xia),機器(qi)越來越聰(cong)明,與人打交道的智(zhi)商(shang)會逐漸(jian)提升,在某種意(yi)義上也逐漸(j♏ian)承擔起看門狗的責(ze)任。

 

二、內容(rong)產(chan)業是否(fou)即將被(bei)C2M顛覆

 

世界(jie)之大(da)無(wu)奇不有(you),美國得克薩斯州科(ke)珀(po)斯—克里斯蒂市一家銀行的一臺自動取款機(ATM)竟然在11日吐出了字條,上面寫著“救我(wo)”,這條新聞很快♛傳遍中文網絡,成為許(xu)多(duo)網站(zhan)的頭條。

 

你需要從N個網站(zhan)上看到(dao)一模一樣的文章(zhang)嗎?

 

這些(xie)冗(rong)余的(de)(de)信息(xi)消耗了你的(de)(de)精力(li)和流量(liang),就(jiu)像你打開任何一個電視頻道,都能看到許(xu)多(duo)方(fang)便面廣♊告(gao)一樣,讓人很難從大量(liang)的(de)(de)信息(xi)中快速找到自己想要的(de)(de)內(nei)容。

 

如何解決用戶信息冗余的尷(gan)尬?

 

過去(qu)曾經有(you)🐈許多(duo)不成(cheng)(cheng)功(gong)的技術方案,個人門戶(hu)曇花一現,RSS訂閱不成(cheng)(cheng)氣候,跨站跟蹤上不了臺面(m༺ian)。能引領未來者,只有(you)C2M。

 

C2M模(mo)式(shi)可以像今日頭條(tiao)這樣應📖用(yong)于(yu)全網,也(ye)可以像Facebook那般基(ji)于(yu)巨(ju)頭的(de)平臺。其核心就在于(yu)基(ji)于(yu)用(yong)戶(hu)(hu)行為(wei)習慣、特(te)征和訴(su)求,對海量(liang)的🧸(de)信息進行提(ti)取(qu)、分揀然后傳遞給用(yong)戶(hu)(hu),這是克服痛點的(de)秘密。

 

但(dan)質疑(yi💝)的(de)(de)聲音也不少。比如(ru)有(you)觀點認為(wei),協(xie)同過濾這(zhe)樣(yang)的(de)(de)推(tui)薦容易讓用戶(hu)形成信息繭房、無(wu)法(fa)識(shi)別閱讀(du)場(chang)景、即時(shi)性差(cha)、耗時(shi)長等缺(que)點,而今日(ri)頭條這(zhe)樣(yang)的(de)(de)模式(shi)也常常被(bei)詬(gou)病,還(huan)要(yao)應付難以捕(bu)捉的(de)(de)用戶(hu)興趣、用戶(hu)數據的(de)(de)隱(yin)私和管(guan)理等多項挑戰(zhan)。

 

支持和質疑各(ge)執一端(duan),孰是孰非?🌸未來雖有兩大機遇(yu),但是目前(qian)要跨越三座(zuo)大山。

 

1.支持(chi)的理由如下:

 

①千人千面,眾口可(ke)調。

 

個(ge)性化的內(nei)容(rong)推薦機制能夠根據(ju)用(yong)戶(hu)(hu)的喜好(hao)為其推薦信息。通(tong)(tong)過各種算法,通(tong)(tong)過分(fen)析用(yong)戶(hu)(hu)的歷史行為,ꦺ對(dui)比相(xiang)關用(yong)戶(hu)(hu)和相(xiang)關物品猜測用(yong)戶(hu)(hu)可能喜歡的內(nei)容(rong),列出候選集并進(jin)行驗證,用(yong)戶(hu)(hu)可以(yi)得(de)到較(jiao)為準(zhun)確的內(nei)容(rong),使信息分(fen)發做到千(qian)人千(qian)面(mian),實現內(nei)容(rong)與用(yong)戶(hu)(hu)的精準(zhun)連接(jie),而不是(shi)傳統意(yi)義上的千(qian)人一面(mian)般的投放。

 

②海里撈(lao)針(zhen),提高(gao)效率(lv)

 

個性化推薦(jian)省去了(le)(le)(le)用(y🌟ong)(yong)戶(hu)在(zai)海量信息中(zhong)進行提取和搜(sou)(sou)尋(xun)☂的(de)(de)環節(jie)。用(yong)(yong)戶(hu)無需(xu)在(zai)海量信息中(zhong)摸針,在(zai)一定程度上為(wei)用(yong)(yong)戶(hu)去除了(le)(le)(le)部分(fen)無用(yong)(yong)信息,縮小了(le)(le)(le)用(yong)(yong)戶(hu)信息搜(sou)(sou)索的(de)(de)范圍(wei),提高了(le)(le)(le)用(yong)(yong)戶(hu)的(de)(de)閱讀效(xiao)率(lv)。

 

③投其所好,增強粘性(xing)

 

不斷為用(yong)戶(hu)推(tui)薦(jian)(jian)適合他(ta)的(de)內容能夠增加用(yong)戶(hu)粘(zhan)性。個(ge)性化推(tui)薦(jian)(ji🙈an)技(ji)術(shu)通過算法進行用(yong)戶(hu)感興趣(qu)(qu)的(de)內容的(de)精準推(tui)薦(jian)(jian),幫助用(yong)戶(hu)快(kuai)捷發現(xian)感興趣(qu)(qu)的(de)內容,當你看完一個(ge)🍸內容后,會立馬給你推(tui)薦(jian)(jian)相(xiang)關的(de)東西,可以增加用(yong)戶(hu)粘(zhan)性,提高(gao)用(yong)戶(hu)體驗(yan)。

 

④挖(wa)掘長(chang)尾,打(da)破兩極(ji)

 

個(ge)性化推(tui)薦(jian)能(neng)(neng)夠通過相關算法(fa)幫助(zhu)用(y꧑ong)戶(hu)(hu)挖掘長(chang)尾(wei)內(nei)容,避免兩(liang)極(ji)分(fen)化的(de)馬太(tai)效應。當A用(yong)戶(hu)(hu)喜歡(huan)比較(jiao)冷門(men)的(de)長(chang)尾(wei)內(nei)容,而B用(yong)戶(hu)(hu)又有跟A用(yong)戶(hu)(hu)有相同或相似的(de)興趣和行為習(xi)慣(guan)時,系統就能(neng)(neng)夠把A用(yong)戶(hu)(hu)喜歡(huan)的(de)冷門(men)內(nei)容推(tui)薦(jian)給B用(yon🌳g)戶(hu)(hu),這樣就使冷門(men)內(nei)容得(de)到更多(duo)的(de)曝光,幫助(zhu)用(yong)戶(hu)(hu)發現更多(duo)的(de)長(chang)尾(wei)內(nei)容,避免內(nei)容生產生態兩(liang)極(ji)分(fen)化。

 

⑤雙向交流(liu),深度優化

 

基于(yu)用(yong)戶(hu)進行個性化推(tui)(tui)(tui)薦(jian)是對(dui)用(yong)戶(hu)進行深度分析和交(jiao)(jiao)流的(de)結果(guo),提(ti)(ti)升了(le)(le)(le)用(yong)戶(hu)的(de)交(jiao)(jiao)互式體驗(yan)。傳(chuan)統的(de)人工推(tui)(tui)(tui)薦(jian)是遍地(di)(di)撒網地(di)(di)推(tui)(tui)(tui)薦(jian),沒有對(dui)用(yong)戶(hu)進行細致(zhi)地(di)(di)劃分和篩選(xuan),機器推(tui)(tui)(tui)薦(jian)以用(yong)戶(hu)特點和習慣為基礎進行推(tui)(tui)(tui)薦(jian),用(yong)戶(hu)能夠得到雙向(xiang)的(de)交(jiao)(jiao)流和溝通(tong),用(yong)戶(hu)的(de)行為也能對(dui)下(xia)一(yi)步(bu)的(de)推(tui)(tui)(tui)薦(jian)產(chan)生影響,在一(yi)定程度上得到了(le)(le)(le)反饋,提(ti)(ti)升了(le🌃)(le)(le)用(yong)戶(hu)的(de)交(jiao)(jiao)互式體驗(yan)。

 

⑥分門(men)別類,運營細化

 

個性化(hua)推💦薦也有(you)利于(yu)平(ping)(ping)臺對(dui)內容進(jin)行分(fen)類,從(cong)而利于(yu)平(ping)(ping)臺精細化(hua)管理和運(yun)營。信(xin)息時使(shi)得(de)平(ping)(ping)臺不斷涌現,各種形式的(de)內容越來越豐富,用戶手(shou)機端(duan)展示的(de)區域有(you)限,個性化(hua)推薦能夠使(shi)商(shang)家更(geng)好(hao)地針對(dui)不同客戶對(dui)內容進(jin)行分(fen)類,有(you)利于(yu)精細化(hua)運(yun)營。

 

2.質疑的(de)觀(guan)點主(zhu)要有:

 

①畫地為牢(lao),思維設限

 

個(ge)性化新聞體驗容(rong)易(yi)讓思想(xiang)裹足不(bu)前。個(ge)性化推(tui)薦的(de)(de)結果是(shi)基于用戶(hu)(hu)的(de)(de)歷史數據和(he)歷史行(xing)為(wei),基于相似用戶(hu)(hu)或者相似物品進行(xing)的(de)(de)推(tui﷽)薦,在(zai)一定(ding)程度上將用戶(hu)(hu)感興趣的(de)(de)內容(rong)固(gu)定(ding)在(zai)一個(ge)特定(ding)的(de)(de)閉環里,在(zai)為(wei)用戶(hu)(hu)篩選(xuan)信息(xi)的(de)(de)同(tong)時(shi)也為(wei)用戶(hu)(hu)隔斷了很(hen)多信息(xi)。個(ge)性化推(tui)薦的(de)(de)內容(rong)采(cai)集(ji)自(zi)你(ni)的(de)(de)興趣,又決定(ding)了你(ni)的(de)(de)興趣。因此,無(wu)法(fa)接觸“新”事物自(zi)然(ran)就不(bu)能培養新的(de)(de)興趣,容(rong)易(yi)讓用戶(hu)(hu)越(yue)來越(yue)狹隘(ai)。

 

②人心變(bian)幻,機器何解

 

機器推薦無法(fa)識別閱讀(du)場景的變(bian)化而帶來的需(xu)求(qiu)的變(bian)🐻化,無法(fa)感知用戶(hu)為什么需(xu)要閱讀(du),難(nan)以匹配人類情感的復雜程度。例如在某一個階段,我們因為大家都在討(tao)論(lun)某件(jian)事(shi)(shi)而去關注這(zhe)件(jian)事(shi)(shi),但(dan)這(zhe)并不(bu)意味著我們對類似(si)的事(shi)(shi)情都感興趣。

 

③審美下(xia)線,好(hao)壞(huai)難分

 

個性化推(tui)薦(jian)的(de)(de)(de)難度對(dui)推(tui)薦(jian)內(nei)容(rong)(rong)的(de)(de)(de)質量(liang)(liang)帶來(lai)了(le)挑戰。以(yi)往評價(jia)(jia)一(yi)篇文章(zhang)的(de)(de)(de)好壞(huai)對(dui)編輯(ji)來(lai)說都沒(mei)那么容(rong)(rong)易,𒆙如今機器推(tui)薦(jian)很容(rong)(rong)易忽略(lve)質量(liang)(liang)這一(yi)維度。機器算法不準確(que)會使標(biao)題黨(dang)內(nei)容(rong)(rong)混(hun)雜出現,機器推(tui)薦(jian)可能(neng)(neng)會把(ba)一(yi)篇沒(mei)有(you)價(jia)(jia)值(zhi)的(de)(de)(de)文章(zhang)推(tui)薦(jian)的(de)(de)(de)很高,也有(you)可能(neng)(neng)把(ba)真(zhen)正有(you)價(jia)(jia)值(zhi)的(de)(de)(de)文章(zhang)埋沒(mei)掉,機器推(tui)薦(jian)只能(neng)(neng)從外(wai)部數據(ju)來(lai)衡量(liang)(liang)你(ni)的(de)(de)(de)文章(zhang)有(you)沒(mei)有(you)價(jia)(jia)值(zhi),目前還沒(mei)有(you)辦法從內(nei)容(rong)(rong)的(de)(de)(de)本(ben)質上分析有(you)沒(mei)有(you)價(jia)(jia)值(zhi)。

 

④耗時較(jiao)長,總慢半拍

 

基于海(hai)量數(shu)據的(de)(de)個性化推(tui)薦(jian)行(xing)✃為耗時較長(chang),即時性較差。如新(xin)聞推(tui)薦(jian)存在及時性問題(ti),需要(yao)不(bu)斷更新(xin),通過(guo)分析用(yong)戶的(de)(de)歷史行(xing)為、對比類似用(yong)戶等數(shu)據分析工作耗時較長(chang),不(bu)易在第一時間形成推(tui)薦(jian)結果。并且協同(tong)過(guo)濾(lv)等方(fang)法還存在冷(leng)啟動(dong)的(de)(de)問題(ti),即在用(yong)戶體(ti)驗之(zhi)初,并未形成成熟的(de)(de)歷史數(shu)據🧸時,需要(yao)經過(guo)很長(chang)的(de)(de)時間收集用(yong)戶點擊日志(zhi)數(shu)據,從而(er)產生推(tui)薦(jian)。

 

⑤熱點共通,個體趨(qu)同

 

并不是所有的(de)(de)(de)(de)用戶(hu)(hu)都彼(bi)此(ci)相(xiang)等,但(dan)協(xie)同過濾(lv)方(fang)法不考(kao)慮用戶(hu)(hu)之間的(de)(de)(de)(de)個(ge)體差異。例如,我們觀察到娛(yu)樂(le)新聞不斷推(tui)薦(jianꦺ)給大多(duo)數用戶(hu)(hu),即使用戶(hu🌱)(hu)不點(dian)擊(ji)娛(yu)樂(le)的(de)(de)(de)(de)故事(shi)。原(yuan)因是,娛(yu)樂(le)新聞一般都是非常流行(xing)的(de)(de)(de)(de),因此(ci)總是從一個(ge)用戶(hu)(hu)的(de)(de)(de)(de)“鄰居”的(de)(de)(de)(de)娛(yu)樂(le)故事(shi)足(zu)夠的(de)(de)(de)(de)點(dian)擊(ji)進(jin)行(xing)推(tui)薦(jian)。

 

3.未來的(de)機(ji)遇在哪里?

 

未來的(de)機遇在于兩大推動力(li):業界對長(chang)尾金(jin)礦的(de🤪)商業動力(li);用戶強烈的(de💯)個性化(hua)需求的(de)推動。

 

①長尾金礦

 

個性化推薦(jian)能夠幫助(zhu)用戶(hu)發現更多優質的(de)長尾內容(rong)(rongꦏ),提高平臺(tai)商業價(jia)值(zhi)。一般平臺(tai)用戶(hu)訪問的(de)只局限在(zai)熱(re)門的(de)10%左右(you)的(de)內容(rong)(rong),很多小眾的(🐟de)、冷門的(de)內容(rong)(rong)卻沉在(zai)數據庫中不易被發現,我們將(jiang)其稱之為長尾內容(rong)(rong)。

 

按(an)長尾(wei)(wei)(wei)理論,由于(yu)成(cheng)本(ben)和效率的因(yin)素,當(dang)商品(pin)꧋(pin)儲存(cun)流(liu)通展示的場地和渠道足夠(gou)寬廣,商品(pin)(pin)生產成(cheng)本(ben)急劇下降以至于(yu)個人都(dou)可(ke)以進行生產,并且商品(pin)(pin)的銷售成(cheng)本(ben)急劇降低時,幾乎任何以前看似需求極低的產品(pin)(pin),只要有賣,都(dou)會有人買。個性化(hua)推(tui)薦能夠(gou)通過協同過濾中基于(yu)用戶的推(tui)薦技術(shu)將小(xiao)眾喜(xi)歡的長尾(wei)(wei)(wei)內容擴散開來,充分挖掘長尾(wei)(wei)(wei)內容,產生長尾(wei)(wei)(wei)金礦。

 

②時代剛需

 

我們(men)所(suo)處的(de)(de)(de)時代已經(jing)變(bian)化了(le)(le)。經(jing)過20年發展,互聯網變(bian)成(c𒀰heng)了(le)(le)移(yi)動互聯網,現在即將融(rong)合AI進入(ru)IOT時代,終端(duan)和(he)(he)信息(ꦺxi)(xi)正(zheng)在以核爆的(de)(de)(de)態勢發生急劇膨脹,用(yong)戶在海量的(de)(de)(de)數據中想要找(zhao)到他們(men)需(xu)要的(de)(de)(de)信息(xi)(xi)將變(bian)得越來越難。在這(zhe)種情況下,傳統的(de)(de)(de)搜(sou)(sou)索(suo)引擎(qing)已經(jing)力不從心。早先(xian)最具代表性(xing)的(de)(de)(de)就是分類目錄(lu)的(de)(de)(de)雅虎和(he)(he)搜(sou)(sou)索(suo)引擎(qing)的(de)(de)(de)谷歌,已經(jing)進入(ru)死胡同,想要通(tong)過搜(sou)(sou)索(suo)引擎(qing)去了(le)(le)解(jie)一(yi)個陌生領域的(de)(de)(de)知識,效率(lv)極(ji)低!

 

要(yao)滿足時代剛需,希望在(zai)于個性化推薦。機器需要(yao)盡可能的(de)了解用戶,并且根(gen)據用戶的(de)數據,主動推薦讓用戶有興趣和需求的(de)信息。目前這20來年,雖說(shuo)取得了一點(dian)點(dian)成就,但僅僅是(shi)唐僧取經邁(mai)出了第一步,🍌還有很長的(de)路(lu)要(yao)走。

 

4.當下需要跨越(yue)的三座大山

 

個(ge)性化推薦(jian)(jian)在發展(zhan)過(guo)程中面臨很多諸如難(nan)(nan)以預(yu)測用戶興趣、用戶相關數(shu)據涉及隱私以及數(shu)據的處理難(na🃏n)(nan)度(du)等問題(ti),都(dou)給個(ge)性化推薦(jian)(jian)帶來了很大的威脅和挑戰。

 

第一座山,準(zhun)確。

 

用(yong)(yong)戶的(de)(de)興趣(qu)易受多重因(yin)素影(ying)(ying)響而不(bu)斷變化,這對個性化推(tui)薦(jian)來(lai)說是(shi)個不(bu)可避免的(de)(de)挑戰。個性化推(tui)薦(jian)系統的(de)(de)基礎部分(fen)是(shi)用(yong)(yong)戶興趣(qu)建模(mo),用(yong)(yong)戶興趣(qu)建模(mo)的(de)(de)質量直(zhi)接決定了個性化推(tui)薦(jian)的(de)(de)質量。但(dan)是(shi)用(yong)(yong)戶興趣(qu)隨時都會受到社(she)交、場(chang)景、環境等多重因(yin)素影(ying)(ying)響,用(yong)(yong)戶興趣🌟(qu)地(di)不(bu)斷變化使得根據(ju)以往數據(ju)預測用(yong)(yong)戶未來(lai)傾向的(de)(de)工作(zuo)變得很難,也會影(ying)(ying)響推(tui)薦(jian)結果的(de)(de)準確性。

 

第二座山(shan),隱私。

 

對以用(yong)戶數據為基礎進行(xing)的個性化(hua)推(tui)薦(jian)來說(shuo),如何保護用(yong)戶隱(yin)私是個不(bu)小(xiao)的難題。傳(chuan)統(tong)的內容推(tui)薦(jian)系統(tong)對用(yong)戶的頁面訪問(wen)記錄(lu)進行(xing)數據挖掘,找(zhao)出(chu)用(yong)戶的訪問(wen)習慣,然后(hou)在服務器(qi)端根據用(yong)戶需求進行(xing)信(xin)息篩選,試圖為用(yong)戶提(ti)供信(xin)息推(tui)薦(jian)服務和垃圾信(xin)息過濾服務。但如何能在保護用(yong)戶隱(yin)私的同時,又為用(🌳yong)戶提(ti)供更準確的內容推(tui)薦(jian)服務是一個不(bu)小(xiao)的挑﷽戰(zhan)。

 

第三座山(shan),價值(zhi)觀。

 

除(꧋chu)了三座大山(shan)外(wai),還(huan)有一(yi)個(ge)問題也值得重視。現在的(de)機器推薦等于(yu)“沒(mei)有三觀”、“沒(mei)有審(shen)美(mei)”,在中文圈運營,由(you)于(yu)眾所(suo)周知的(de)原因,一(yi)定會(hui)遇到(dao)相當的(de)挑戰。

 

流(liu)量造假和(he)作(zuo)弊(bi)是(shi)比(bi)較(jiao)明(ming)顯(xian)的(de)例子。比(bi)如有網友告訴筆者說:網上經常(chang)看到(dao)一(yi)(yi)些視頻(pin)學習人(ren)數(shu)幾(ji)萬(wan)、幾(ji)十(shi)萬(wan),數(shu)字大的(de)得(de)令我們(men)懷疑人(ren)生,結(jie)果(guo)測(ce)試了(le)一(yi)(yi)下(xia),頁面(mian)刷新一(yi)(yi)次人(ren)數(shu)就加(jia)三而新課程加(jia)幾(ji)十(shi),瞬間明(ming)了(le)。半(ban)夜測(ce)試某些視頻(pin)直(zhi)播(♊bo),對著墻拍,從啟動直(zhi)播(bo)十(shi)分鐘(zhong)直(zhi)播(bo)粉絲(si)(si)還能(neng)蹭蹭往上漲(zhang)(zhang),進(jin)一(yi)(yi)個真粉絲(si)(si)時人(ren)數(shu)又一(yi)(yi)波漲(zhang)(zhang),作(zuo)弊(bi)一(yi)(yi)時爽(shuang),但心里不(bu)踏實。

 

曾經有企🏅(qi)業在智能推薦的(de)(de)(de)客戶(hu)端上投過一些非常垂直大號的(de)(de)(de)廣(guang)告,有的(de)(de)(de)效果真好(hao),有的(de)(de)(de)造假太(tai)明(ming)顯---在閱(yue)(yue)讀量瞬間(jian)破萬的(de)(de)(de)時候帶過來的(de)(de)(de)流量,還不如自己閱(yue)(yue)讀🔥破千的(de)(de)(de)號效果好(hao)。如此種(zhong)種(zhong),數據是正經的(de)(de)(de),就看用(yong)它的(de)(de)(de)人正經不正經了。

 

未來,個性化推(tui)(tui)薦如(ru)何在(zai)技術和管理(li)上繼續(xu)革新(xin),人工(gong)智能因(yi🍨n)素的(de)參與能否改善現存的(de)諸多問題,為用戶產(chan)生(sheng)更優質的(de)推(tui)(tui)薦結果將成為一個重要課🔯題。

 

三、巨頭正在開辟的技(ji)術路線

 

其實,無論支(zhi)持(chi)還質疑有多么大,個性化推薦(jian🅺)已經引得無數(shu)巨頭競(jing)折腰。

 

目前在市(shi)場(chꦿang)上(shang),依然(ran)是新(xin)(xin)老技(ji)(ji)術(shu)各占一(yi)(yi)方地盤,新(xin)(xin)派深度(du)學習技(ji)(ji)術(shu)快速(su)崛起,咄(duo)(duo)咄(duo)(duo)逼人;老派技(ji)(ji)術(shu)也(ye)在不斷優化,以防不測。新(xin)(xin)老技(ji)(ji)術(shu)之爭,是當下的(de)一(yi)(yi)個熱點,也(ye)是決定未來(lai)發展的(de)兩大路線。

 

(一)老派技൲術認ꦯ(ren)為(wei):傳(chuan)統推(tui)薦技術可以自(zi)我完善

 

1.Google新聞的套(tao)路(lu),不(bu)斷優化

 

Google新(xin)聞(wen)是一個在(zai)線信息門(men)戶站(zhan)點,它聚集數(shu)千家信息源的新(xin)🀅聞(wen)報道(在(zai)將相似新(xin)聞(wen)分組(zu)后)并以(yi)(yi)個性化的方法展(zhan)現給登(deng)錄用戶。由于文章(zhang)和用戶數(shu)量巨(ju)大(da),以(yi)(yi)及給定的響應(ying)時(shi)間(jian)要求,純(chun)粹(cui)的基于記(ji)憶的方法是不適(shi)用的,需要一種(zhong)可擴展(zhan)的算法,因此Google新(xin)聞(wen)組(zu)合使用了基于模型和基于記(ji)憶的技術。

 

Google新聞(wen)的(de)(de)套路依(yi)然是協(xie)同過濾的(de)(de)底子。它(ta)在個性化推薦(jian)方面采用的(de)(de)是基于(yu)模型(xing)和基于(yꦬu)記憶的(de)(de)技(ji)術(shu)相結(jie)合的(de)(de)協(xie)同過濾技(ji)術(shu)。根據《推薦(jian)系統(tong)》一書的(de)(de)介(jie)紹,基于(yu)模型(xing)的(de)(de)那部分(fen)依(yi)賴兩(liang)種(zhong)聚類技(ji)術(shu):

 

♛ ①概率潛在語義索引(yin)(PLSI):協同過(guo)濾的(🍸de)“第二(er)代”概率技術,為了識別出(chu)有相似(si)想法的(de)用戶(hu)和(he)相關物品的(de)聚類(lei),引(yin)入了隱藏(zang)變量,對應每個(ge)用戶(hu)—物品對的(de)有限狀(zhuang)態集合,能適應用戶(hu)可能同時對多個(ge)主題感興(xing)趣的(de)情況。

 

②MinHash:根據兩個(ge)(ge)用(yong)戶瀏覽過物品的交集(ji)將兩者放入相同的聚類(哈希桶)。為了讓這(zhe)種哈希過程具(ju)有可(ke)擴展性,采用(yong)了一種特殊方法尋找(z💫hao)近鄰(lin),并采用(yong)Google自己的MapReduce技🔯術在(zai)幾個(ge)(ge)機群之間分發計算任務。

 

基(ji)于記憶的(de)(de)(de)方法主(zhu)要是(shi)分析“伴隨瀏(liu)(liu)覽(lan)(lan)量”。“伴隨瀏(liu)(liu)覽(lan)(lan)量”指的(de)(de)(de)是(shi)一篇(pian)文(wen)章在預(yu)先定(ding)義的(de)(de)(de)一段(duan)時間內(nei)被相同用(yong)戶瀏(liu)(liu)覽(lan)(lan)過。預(yu)測時需要遍(bian)歷活躍用(yong)戶最近的(de)(de)(de)歷史(shi)數據和從內(nei)存(cun)里(li)獲取鄰近的(de)(de)(de)文(wen)章。運行時,預(yu)先設定(ding)集合里(li)候(hou)選物(wu)品的(de)(de)(de)綜合推(tui)薦評分是(shi)這三(san)種方法(MinHash、PLSI和♊伴隨瀏(liu)(liu)覽(lan)(lan))獲得的(de)(de)(de)分數的(de)(de)(de)線性(xing)組合計(ji)(ji)算值,然后(hou)再(zai)根據計(ji)(ji)算值的(de)(de)(de)高低進(jin)行推(tui)薦結果(guo)的(de)(de)(de)輸出(chu)。

 

2.Linkedin為四個場(chang)景開(kai)發的系統

 

Linkedin主要是(shi)(shi)通過自主研(yan)發設(she)計(ji)的(de)(de)協(xie)同過濾推薦(jian🥂)平臺(tai)Browsemap實(shi)現個性(xing)化(hua)(hua)推薦(jian)。Browsemap是(shi)(shi)Linkedin開(kai)發的(de)(de)一個實(shi)現了物品(p𝓰in)協(xie)同過濾推薦(jian)算(suan)法的(de)(de)泛化(hua)(hua)平臺(tai),該(gai)平臺(tai)可支(zhi)持Linkedin中所有實(shi)體(ti)的(de)(de)推薦(jian),包括求職者(zhe)、招聘貼(tie)、企(qi)業、社會群體(ti)(如學(xue)校(xiao)等)、搜索(suo)詞等,若要通過該(gai)平臺(tai)實(shi)現某個新的(de)(de)實(shi)體(ti)協(xie)同過濾推薦(jian),開(kai)發者(zhe)要做的(de)(de)工作(zuo)僅(jin)僅(jin)包括:相(xiang)關(guan)行(xing)為日志的(de)(de)接入、編(bian)寫(xie)Browsemap DSL配置文件和調整相(xiang)關(guan)過期參數等簡單(dan)工作(zuo)。

 

論文(wen)指出,Browsemap平臺(tai)在(zai)Linkedin最常用的有四個(ge)推(tui)薦(jian)(jian)(jian)場景:給求職者推(tui)薦(jian)(jian)(jian)公(gong)司、相(x🌠iang)似公(gong)司推(tui)薦(jian)(jian)(jian)、相(xiang)似簡歷(li)推(tui)薦(jian)(jian)(jian)和搜索詞推(tui)薦(jian)(jian)(jian)等等。

 

①給求職者推(tui)薦公(gong)(gong)司(si):通過Browsemap實現基于(yu)物品的協同過濾,計算用戶和潛在意向公(gong)(gong)司(si)的相🤪(xiang)似度值(zhi),得(de)到相(xiang)關(guan)公(gong)(gong)司(si)特(te)征;將相(xiang)關(guan)公(gong)(gong)司(si)特(te)征和用戶/公(gong)(gong)司(si)內容特(te)征(包括用戶位(wei)置、工(gong)作經驗;企業產品、相(xiang)關(guan)描述)一起分(fen)(fen)析得(de)到最終的偏好(ha🍰o)分(fen)(fen)值(zhi)。

 

②相(xiang)(xiang)似公司(si)推薦(ji😼an):與給求(qiu)職者推薦(jian)公司(si)有兩點不同(tong):一是內容特征相(xiang)(xiang)似度變(bian)為(wei)公司(si)畫像(xiang)之(zhi)間的相(xiang)(xiang)似度;二是基于多(duo)種用戶行為(wei)構(gou)建browsemap。

 

③相似簡(jian)(jian)歷(用(yong)戶(hu))推(tui)薦(j🔜ian):通過公(gong)司(si)詳情(qing)頁瀏覽行為和用(yong)戶(hu)畫像(xiang)特(te)征(zheng)實現該(gai)部分推(tui)薦(jian)。同時(shi)將相似簡(jian)(jian)歷的屬性用(yong)于補足簡(jian)(jian)歷的缺失屬性,得到該(gai)用(yong)💯戶(hu)的虛擬(ni)簡(jian)(jian)歷。

 

🧸 ④搜索詞(ci)推薦(jian)提供了四(si)種關聯(lian)方式:一是協(xie)同過濾:在計算搜索詞(ci)間(jian)相關性時會加入(ru)時間(jian)和空間(jian)因素(su);二是基(ji)于(yu)推薦(jian)搜索詞(ci)搜索結(jie)(jie)果(guo)(guo)的(de)(de)點擊(ji)率;三是基(ji)于(yu)搜索詞(ci)之間(jian)的(de)(de)重合度;四(si)是基(ji)于(yu)推薦(jian)搜索詞(ci)的(de)(de)點擊(ji)率。但實驗結(jie)(jie)果(guo)(guo)表明協ﷺ(xie)同過濾的(de)(de)結(jie)(jie)果(guo)(guo)最好(hao),甚(shen)至(zhi)也(ye)好(hao)于(yu)將(jiang)這四(si)種方式綜合的(de)(de)結(jie)(jie)果(guo)(guo)。

 

3.今日頭(tou)條的(de)三個階段(duan)

 

作為國內當(dang)紅的個性化推薦產(chan)品(pin),今日(ri)頭條技術(shu)經(jing)歷▨了三個階段(duan):

 

早期階(jie)段,以非個(ge)(ge)性化推薦(jian)(jian)🌱為主,重點解決熱文(wen)推薦(jian)(jian)和(he)新文(wen)推薦(jian)(jian),這個(g෴e)(ge)階(jie)段對于用戶和(he)新聞的刻畫粒度也比較粗,并沒有大規(gui)模運用推薦(jian)(jian)算(suan)法(fa)。

 

中期階段(duan),以個性化推(tui)薦(jian)算法為主(zhu),主(zhu)要基于協(xie)同過(guo)濾和(he)(he)(he)內容(rong)推(tui)薦(jian🧸)兩種方式。協(xie)同過(guo)濾技術思想和(he)(he)(he)前(qian)文介紹的(de)并無差別。基于內容(rong)推(tui)薦(jian)的(de)方式,則是(shi)先對新(xin)聞進行刻畫,然后利用用戶(hu)的(de)正反饋(如(ru)點擊,閱讀(du)時長、分享、收藏、評論等)和(he)(he)(he)負反饋(如(ru)不(bu)感興(xing)趣(qu)等)建立用戶(hu)和(he)(he)(he)新(xin)聞標簽之間的(de)聯系,從而來進行統計建模(mo)。

 

當前階段,以大(da)規模(mo)(mo)實時機(ji)器學(xue)習(xi)算法為(wei)主,用(yong)(yong)到(dao)的特(te)(te)征(zheng)達千億(yi)級別,能做到(dao)分(feওn)(fen)鐘級更新模(mo)(mo)型。架構分(fen)(fen)為(wei)兩層(ceng)(ceng):檢索(suo)層(ceng)(ceng),有多個檢索(suo)分(fen)(fen)支,拉出用(yong)(yong)戶(hu)感興(xing)趣的新聞候選(xuan);打(da)分(fen)(fen)層(ceng)(ceng),基于用(yong)(yong)戶(hu)特(te)(te)征(zheng)、新聞特(te)(te)征(zheng)、環境(jing)特(te)(te)征(zheng)三大(da)類特(te)(te)征(zheng)使ꦿ用(yong)(yong)實時學(xue)習(xi)進行建模(mo)(mo)打(da)分(fen)(fen)。值得(de)一提(ti)的是,實際排(pai)(pai)序(xu)時候并不完(wan)全按(an)照模(mo)(mo)型打(da)分(fen)(fen)排(pai)(pai)序(xu),會(hui)有一些(xie)特(te)(te)定(ding)的業務邏輯綜合在(zai)一起進行最終排(pai)(pai)序(xu)并吐給用(yong)(yong)戶(hu)。

 

頭條為(wei)何能取(qꦇu)得成功(gong)?文(wen)章分(fen)析,很(hen)多(duo)人(ren)♓會說(shuo)是頭條的(de)(de)(de)個性(xing)化(hua)推(tui)薦(jian)技(ji)術(shu)做得好,其(qi)實不(bu)盡(jin)然。原因在于,今日頭條的(de)(de)(de)個性(xing)化(hua)推(tui)薦(jian)也是經(jing)歷著(zhu)復雜的(de)(de)(de)演變過程:從人(ren)工推(tui)薦(jian)到機(ji)器推(tui)薦(jian)再到最終不(bu)斷迭代算法和(he)技(ji)術(shu),反復的(de)(de)(de)進(jin)行驗證,日益完(wan)善。

 

(二)新派技(ji)術認為(wei):深度(du)學習才是明智選擇

 

新派技術主要指(zhi)采(cai)用了深度學習的個性化推薦(jian)系(xi)統。

 

深(she🌊n)度學(xue)習(xi)(xi)是機器學(xue)習(xi)(xi)中一種基于對數據進行表(biao)征學(xue)習(xi)(xi)的(de)方法(fa)(fa)。觀測值(例(li)如一幅圖像)可以使用(yong)多種方式來表(biao)示(shi)(shi),如每(mei)個像素強(qiang)度值的(de)向量,或(huo)(huo)者更抽象地表(biao)示(shi)(shi)成一系列(lie)邊、特(te)定形狀的(de)區域等。而(er)使用(yong)某些特(te)定的(de)表(biao)示(shi)(shi)方法(fa)(fa)更容(rong)易(yi)從實例(li)中學(xue)習(xi)(xi)任務(例(li)如,人臉識別或(huo)(huo)面部表(biao)情識別)。深(shen)度學(xue)習(xi)(xi)的(de)好處是用(yong)非監督(du)式或(huo)(huo)半監督(du)式的(de)特(te)征學(xue)習(xi)(xi)和分層特(te)征提取高效算法(fa)(fa)來替(ti)代手工獲取特(te)征。

 

當常規推(tui)薦(jian)(jian)算法已經無法及時(shi)地分析處理體量(liang)較(jiao)大的數據并準確地針對(dui)獨立用戶做出(chu)推ꦆ(tui)薦(jian)(jian)時(shi),具備相(xiang)應技術水平的公司(si)開始(shi)(shi)利用深度學(xue)習解決(jue)海(hai)量(liang)內(nei)容分析推(tui)薦(jian)(jian)的痛點(dian)。我們以較(jiao)早開始(shi)(shi)引入(ru)深度學(xue)習的YouTube、Facebook為例進(🔯jin)行分析。

 

1.YouTube的神經網絡

 

YouTube的(de)推(tui)薦(jian)系(xi)統(tong)是是世界上規模(mo)最(zui)大(da)、最(zui)復(fu)雜的(de)推(tui)薦(jian)系(xi)統(tong)之(zhi)一。YouTube的(de)全球(qiu)用(yong)(yong)戶已經超過⛦十億(yi),每秒上傳的(de)視頻(pin)長度以(yi)小時計。視頻(pin)“語料”庫存日益增(zeng)長,就(jiu)需要一個推(tui)薦(jian)系(xi)統(tong)及(ji)時、準確地(di)將用(yong)(yong)戶感興趣的(de)視頻(pin)不斷推(tui)薦(jian)給用(yong)(yong)戶。

 

相比其他商業推薦系統,Youtube推薦系統面臨三(san)個主(zhu)要的(de)挑🌌戰:

 

ꦺ①規模(mo)。現(🌳xian)有絕大多(duo)數可行的(de)推薦(jian)算法,在處(chu)理YouTube級別(bie)的(de)海量視頻就力不從(cong)心(xin)了。

 

②新鮮度(du)。YouTube視(shi)(shi)頻“語料”庫不僅僅是儲量巨大,每(mei)時(shi)(shi)(shi)每(mei)刻(ke)上(shang)傳(chuan)的(de)新增視(shi)(shi)頻也是源(yuan)源(yuan)不斷。推薦(jiaᩚᩚᩚᩚᩚᩚ⁤⁤⁤⁤ᩚ⁤⁤⁤⁤ᩚ⁤⁤⁤⁤ᩚ𒀱ᩚᩚᩚn)系統要及時(shi)(shi)(shi)針對用戶上(shang)傳(chuan)的(de)內容(rong)進行分析建(jian)模,同時(shi)(shi)(sh✅i)要兼顧已(yi)有(you)視(shi)(shi)頻和(he)新上(shang)傳(chuan)視(shi)(shi)頻的(de)平衡。

 

③噪聲。🐟由于用戶行為的稀疏性和不可觀測的影響(xiang)因素,用戶的歷史記錄本質上難以預測。

 

為(wei)了(le)解決這些問題,YouTube推(tui)薦(jian)系統(tong)將研究重(zhong)點轉(zhuan)移到深度(du)學習(xi),使用Google Brain開(kai)發(fa)(fa)的(de)(de)TensorFl𝄹ow(Google研發(fa)(fa)的(de)(de)第二(er)代人(ren)工智能學習(xi)系統(tong))系統(tong)為(wei)推(tui)薦(jian)系統(tong)帶(dai)來(lai)了(le)開(🍸kai)發(fa)(fa)測試上的(de)(de)靈活性。

 

YouTube推薦系統主要由(you)兩個深度神經網絡(l🌌uo)(luo)組成:第(di)一個神經網絡(luo)(luo)用(yong)來生成候選視(shi)(shi)頻列(lie)表(biao);第(di)二個神經網絡😼(luo)(luo)用(yong)來對輸入視(shi)(shi)頻列(lie)表(biao)打分排名,以(yi)便將(jiang)排名靠前的視(shi)(shi)頻推薦給用(yong)戶。

 

候選視(shi)頻(pin)生(sheng)成(cheng)是依靠ꦿ協(xie)同過濾算(suan)法產生(sheng)一(yi)個(ge)寬泛的(de)(de)針對(dui)用(yong)戶(hu)的(de)(de)個(ge)性(xing)化推(tui)薦(jian)(jian)候選名單。排名神經(jing)網絡是基于第一(yi)個(ge)候選生(sheng)成(cheng)網絡的(de)(de)列表,提供(gong)更精細的(de)(de)區分(fen)細化,從(cong)來(lai)達到較(jiao)高(gao)的(de)(de)推(tui)薦(jian)(jian)命中(zhong)率。通過定(ding)義(yi)目(mu)標函數來(lai)提供(gong)一(yi)系列描述(shu)視(shi)頻(pin)和(he)用(yong)戶(hu)的(de)(de)特征,排名網絡則根據(ju)目(mu)標函數來(lai)給每一(yi)個(ge)視(shi)頻(pin)打分(fen)。分(fen)數最高(gao)的(de)(de)一(yi)組視(shi)頻(pin)就被推(tui)薦(jian)(jian)給用(yong)戶(hu)。

 

正是(shi)YouTube海量(liang)級別的視頻才(cai)產(chan)🦄生了(le)(le)深度學習(xi)的需要,有效(x🔜iao)彌(mi)補了(le)(le)協同過濾存(cun)在地處理數據(ju)耗時長(chang)等問題(ti)。

 

2.Facebook邁出的一大步

 

Facebook近10年來(lai)一直ꦑ沿用其(qi)Newsfeed功能(neng)實(shi)現(xian)個(ge)性(xing)化推薦。2006年9月份,NewsFeed(信息流)問世(shi),同(tong)時(shi)問世(shi)的(de)還(huan)有MiniFeed(個(ge)人動態)。NewsFeed是一個(ge)系(xi)統(tong)自動整合生(sheng)成的(de)內容信息流,它自行來(lai)決定我們(men)讀到哪些(xie)新聞、動態、事件。它所覆蓋(gai)的(de)范圍(wei),其(qi)信息推送(song)的(de)精準度,以及其(qi)影響力遠超過我們(men)的(de)想象,可以說NewsFeed是Facebook在(🍃zai)人工(gong)智能(neng)上(shang)所走的(de)一大步(bu)。

 

Facebook是如何利(li)用深度學習來評價內容和用戶的呢?

 

第(di)一,在(zai)檢視(shi)文本方面,Facebook使用“自然語(yu)言處(chu)理(li)”技術ꦺ來掃描每個人發的(de)(de)(de)“狀態(tai)”和(he)“日(ri)志(zhi)”,以(yi)便“真(zhen)正理(li)解文本的(de)(de)(de)語(yu)義(yi)”,不(bu)僅如此(ci)還要將(jiang)它們(men)評級。日(ri)志(zhi)在(zai)掃描的(de)(de)(de)過程中(z🎃hong),系統會(hui)自動識別出“過度(du)(du)標題黨”或者(zhe)“過度(du)(du)商業化(hua)”的(de)(de)(de)內容(rong),而且這樣的(de)(de)(de)內容(rong)在(zai)NewFeed里(li)面是越來越少見到(dao)了。

 

第二,在(zai)內容(rong)翻譯(yi)上,當(dang)在(zai)處理非英(ying)語(yu)的(de)語(yu)言(yan)時,Facebook工(gong)程師專門開(kai)發了(le)一個(ge)深度學(xue)習平臺,每一天會對100多種語(yu)言(yan)所寫成的(de)文本進行分析(xi),翻譯(yi)。比如當(dang)一個(ge)朋(peng)友以(yi)德語(yu)發表(biao)了(le)一條(tiao)動態(tai)時,NewsFeed會以(yi)英(ying)語(yu)體ಞ(ti)現出(ch🍨u)來給一個(ge)美國的(de)朋(peng)友,營造了(le)一個(ge)能夠(gou)跨(kua)過語(yu)言(yan)障(zhang)礙的(de),人人實現互聯互通的(de)數字虛擬環(huan)境。

 

第三,在識🌃(shi)別物體方(fang)面(mian),Facebook也在利用(yong)深(shen)度學習技術(shu)來(lai)識(shi)別照(zhao)片和視頻里面(mian)的物體,不僅如此,它還能進一步地去探究誰有可能對這些照(zhao)片感興趣,或者(zhe)這些照(zhao)片跟(gen)哪(na)些用(yong)戶相關聯,從而推薦給(gei)目(mu)標用(yong)戶。

 

(三)深(shen)度學習之困境

 

深度學(xue)習能打(da)遍天下無敵手嗎(ma)?

 

至(zhi)少目(mu)前來(lai)看(kan),深度學習只是(shi)在Speech和(🍷he)Image這(zhe)種(zhong)比(bi)較“淺層”的智能問題上效果是(shi)比🎃(bi)較明顯的,而對(dui)于語言理(li)解和(he)推(tui)理(li)這(zhe)些問題效果就有點失(shi)分,也許未(wei)來(lai)的深度神經網絡(luo)可以更“智能”的解決這(zhe)個問題,但(dan)目(mu)前還(huan)差點火候。

 

深(shen)度學習(xi)在推(tui)薦系統領(🅺ling)域的研(yan)究(jiu)與應用(yong)還(huan)處(chu)于(yu)早期🌳階段。即使(shi)深(shen)度學習(xi)被認(ren)為能(neng)夠(gou)解(jie)決協(xie)同過濾的冷啟動、數據處(chu)理較慢的問題,但是風光(guang)之(zhi)(zhi)下,它也有自己的難言之(zhi)(zhi)隱。

 

第一(yi),成(cheng)本太高。數據對(dui)深(shen)(shen)(shen)度學習的(de)(de)(de)(de)進一(yi)步發展和(he)應(ying)用(yong)至(zhi)關重要。然(ran)而(er)過(guo)分倚重有(you)(you)標注(zhu)的(de)(de)(de)(de)大數據也恰恰是(shi)深(shen)(shen)(shen)度學習的(de)(de)(de)(de)局(ju)限(xian)性(xing)之(zhi)一(yi)。數據收集是(shi)有(you)(you)成(cheng)本的(de)(de)(de)(de),而(er)且標注(zhu)成(cheng)本已經開始水(shui)漲船高,這就(jiu)使(shi)⭕得(de)深(shen)(shen)(shen)度學習的(de)(de)(de)(de)成(cheng)本過(guo)高。而(er)且對(dui)于體量較小(xiao)、數據較少的(de)(de)(de)(de)眾多小(xiao)公司來說,即使(shi)有(you)(you)能力(li)用(yong)深(shen)(shen)(shen)度學習改善(shan)個性(xing)化(hua)推薦結果,也面(mian)臨著沒有(you)(you)數據支撐的(de)(de)(de)(de)尷(gan)尬(ga)境地。

 

第二,降低(di)成本的(de)方案有(you)沒有(you)?有(you),但是難以實(shi)現(xian)。深(shen)(shen)(shen)度學(xue)(xue)習(xi)(xi)分為(wei)有(you)監(jian)督(du)(du)(du)(du)學(xue)(xue)習(xi)(xi)和無監(jian)督(du)(du)(du)(du)學(xue)(xue)習(xi)(xi),大量(liang)無監(jian)督(du)(du)(du)💫(du)數據(ju)的(de)獲取成本卻是微乎其(qi)微的(de)。目前一般用的(de)都是監(jian)督(du)(du)(du)(du)學(xue)(xue)習(xi)(xi),但本質(zhi)上基于監(jian)督(du)(du)(du)(du)學(xue)(xue)習(xi)(xi)的(de)大多數推薦(jian)(jian)模型都很難徹底規避現(xian)存問題從而提(ti)高推薦(jian)(jian)質(zhi)量(liang)。無監(jian)督(du)(du)(du)(du)學(xue)(xue)習(xi)(xi)由(you)于無需對數據(ju)進行加標(biao)簽等原因(yin)成本較有(you)監(jian)督(du)(du)(du)(du)學(xue)(xue)習(xi)(xi)較低(di),但目前深(shen)(shen)(shen)度學(xue)(xue)習(xi)(xi)對無監(jian)督(du)(du)(du)(du)數據(ju)的(de)學(xue)(xue)習(xi)(xi)能力嚴重不(bu)足,因(yin)此(ci)深(shen)(shen)(shen)度學(xue)(xue)習(xi)(xi)在推薦(jian)(jian)系統中(zhong)的(de)應用仍處于早(zao)期階段(duan)。

 

新老(lao)派(pai)兩大力量相(xiang)互(hu)抗爭、相(xiang)互(hu)促進但(d𒉰an)又(you)相(xiang)互(hu)交融(rong)。傳統推薦(jian)技(ji)術在深度(du)學習的(de)沖擊(ji)下(xia)不斷完(wan)(wan)善,深度(du)學習帶著(zhu)趕超(chao)傳統推薦(jian)技(ji)術的(de)強勢勁頭不斷革新但(dan)也(ye)面臨著(zhu)發(fa)展窘(jiong)境。但(dan)正(zheng)是(shi)在多個平臺(tai)的(de)這種(zhong)自我發(fa)展和革新的(de)過程(cheng)中,新老(lao)派(pai)的(de)界(jie)限𒊎也(ye)變得越(yue)來越(yue)模糊,越(yue)來越(yue)走向融(rong)合。即使堅持完(wan)(wan)善傳統推薦(jian)技(ji)術的(de)公司也(ye)開(kai)始慢(man)慢(man)涉(she)足(zu)到深度(du)學習的(de)領域中,深度(du)學習發(fa)展較為成熟的(de)新派(pai)也(ye)并沒有完(wan)(wan)全摒棄老(lao)派(pai)技(ji)術,那么(me),未來到底何派(pai)為王?

 

四.未來鹿死(si)誰手(shou)?

 

內容C2M,本質(zhi)上是對人(ren)(ren)心的(de)(de)一(☂yi)種(zhong)洞察和預測(ce)。技術與人(ren)(ren♑)心的(de)(de)斗法(fa),并非一(yi)朝一(yi)夕便能奏(zou)功。人(ren)(ren)類(lei)思想的(de)(de)根本特征(zheng)在于“意識(shi)”,即個體理解(jie)自己與他人(ren)(ren)的(de)(de)心理狀態,包括情緒意圖、期(qi)望、思考和信(xin)念等,并借(jie)此信(xin)息預測(ce)和解(jie)釋(shi)他人(ren)(ren)行為的(de)(de)一(yi)種(zhong)能力(li)。

 

但(dan)是,當前的(de)人工(gong)智能(neng)領域中(zhong)存在著一個(ge)很嚴重(zhong)的(de)問(wen)題:人們誤(wu)解(jie)了(le)深度學(xue)習模(mo)(mo)型的(de)工(go𝓀ng)作機理,并高估了(le)網絡模(mo)(mo)型的(de)能(neng)力(li)。

 

通過(guo)深度(du)學習,我們可(ke)以訓練(lian)出一個(ge)模(mo)型,它可(ke)以根據圖(tu)片(pian)內容生成(cheng)文(wen)(wen)字描(miao)述(shu)。這(zhe)個(ge)過(guo)程被(bei)視作機器(qi)(qi)“理解&🌱rdquo;了(le)圖(tu)片(pian)和它生成(cheng)的(de)文(wen)(wen)字。當(dang)某個(ge)圖(tu)像存在輕微改變,導致模(mo)型開始產(chan)生相(xiang)當(dang)荒謬的(de)字幕時,結(jie)果就會讓人非常驚訝—模(mo)型失靈了(le)。機器(qi)(qi)能找出一只貓,但機器(qi)(qi)仍然(ran)不能識別跟貓相(xiang)關的(de)所(suo)有信息。

 

回顧(gu)歷🐈(li)史不難發現,技術一直追求的目🍌標,與其說(shuo)是讓機(ji)器(qi)替(ti)代人類,而不如(ru)說(shuo)是制(zhi)造聰明的機(ji)器(qi)來(lai)提高效率(lv)。協同(tong)過濾技術的發展便是個明顯的例子。

 

最近幾年來,互(hu)聯網(wang)(wang)巨頭制造“聰明的(de)機器”的(de)積極性異常高(gao)漲,也是(shi)效率使然。根據微軟(ruan)研(yan)究院的(de)估計,亞馬遜(xun)網(wang)(wang)站上(shang)大約30%的(de)頁面瀏覽來自于推(tui)薦系統;Netflix首(shou)席產品官聲稱80%以上(shang)的(de)電影觀看來自于推(tui)薦系統,并稱Netflix推(tui)薦系統的(de)價(jia)值每年高(gao)達十億(yi)美元;據阿(a)里(li)巴(ba)巴(ba)✅披(pi)露數字,2013年當天由推(tui)薦直接引(yin)導的(de)成交(jiao)總額為56.8億(yi)元。今日頭條則(ze)將公司(si)核(he)心業(ye)務(wu)架(jia)構在推(tui)薦引(yin)擎上(sh🧸ang),是(shi)當今最重視(shi)推(tui)薦技術的(de)公司(si)之一……

 

在(zai)(zai)內(nei)容(rong)C2M發展歷(li)程(cheng)中,盡(jin)管深度學習存在(zai)(zai)許多(duo)不足,但(dan)深度學習主導(📖dao)未來是(shi)大概率事(shi)件。我們(men)看到代表著(zhu)傳統推薦技術(shu)和深度學習的(de)新(xin)老(lao)派在(zai)(zai)相互促(cu)進(jin)和相互融合,在(za🐽i)(zai)全(quan)球流量(liang)前(qian)20的(de)平臺中,雖然有不少公(gong)司(si)依然沿用采用協(xie)同過濾技術(shu),比(bi)如Google新(xin)聞,LinkedIn等,但(dan)是(shi)其中一些公(gong)司(si)也已經準(zhun)備甚至已經采用深度學習等技術(shu)來改進(jin)自身不足。而YouTube、Facebook等先(xian)行者已開始享受(shou)深度學習的(de)紅利。

 

從飼養員🀅模式到聰明的(de)機器,內(ne🦂i)容產業的(de)C2M已然成勢,顛覆(fu)日,不(bu)遠了。

 

我們可以相信,雖然深度(du)學習還(huan)存在著(zhu)一(yi)些(xie)制(zhi)約因素(su),但(dan🙈)是(shi),隨著(zhu)AI技術和產業的強勁發展,技術上的瓶(ping)頸終究會被突破🌸。

 

需(xu)要警惕ꦛ的(de)(de)是(shi),在C2M跨越(yue)了準確、隱私兩座大(da)山后,人類通(tong)過AI掌握(wo)了新的🏅(de)(de)力量,掌握(wo)者的(de)(de)欲(yu)望和野心,也應該(gai)受到(dao)一定的(de)(de)控制,尤其(qi)是(shi)價值觀問(wen)題,將顯(xian)得越(yue)發(fa)重要。

返回頂部