Myspace首席技術(shù)官譚曉生:移動(dòng)社區搜索
2008/12/19
12月18日-19日,第二屆CNGI工程技術(shù)論壇暨移動(dòng)互聯(lián)網(wǎng)國際峰會(huì )在北京召開(kāi),會(huì )上,工信部副部長(cháng)奚國華、中國移動(dòng)副總裁沙躍家、中國工程院副院長(cháng)鄔賀銓、以及各大設備廠(chǎng)商、終端制造商、內容服務(wù)提供商等出席了會(huì )議并做了主題演講。
以下是Myspace首席技術(shù)官譚曉生的演講實(shí)錄。
譚曉生:謝謝主持人,剛才前面幾位嘉賓很多都談到了facebook和Myspace,今年三月份我們給這個(gè)網(wǎng)站起了一個(gè)中文名字叫做聚友網(wǎng),Myspace對中國很多用戶(hù)聽(tīng)起來(lái)都會(huì )有很多的困難的。Myspace是從互聯(lián)網(wǎng)起家的SNS網(wǎng)站。因為它有非常龐大的互聯(lián)網(wǎng)的基礎,所以開(kāi)始比較早的進(jìn)入到手機的應用,從Web的應用到嵌入式客戶(hù)端的應用都有,目前在Myspace.com有各種各樣的傳統的操作系統方面的應用,也有比較新的像iphone上面的,像Google的系統下面都有客戶(hù)端的SNS的應用,但是應用的模式基本上還是從互聯(lián)網(wǎng)到手機的擴展,沒(méi)有太多的做完全基于手機的SNS,更多的把互聯(lián)網(wǎng)上SNS的功能移植到手機的客戶(hù)端上,方便用戶(hù)的使用,目前還是處于這樣的階段。
對于Myspace中國來(lái)說(shuō),聚友網(wǎng)我們在08年推出了第一個(gè)免費版本,也是考慮到中國手機的用戶(hù)和互聯(lián)網(wǎng)的用戶(hù),其實(shí)用戶(hù)使用體驗和西方的用戶(hù)差別都比較大。今天談到的題目是移動(dòng)社區搜索,在07年5月份我們就組建了一支團隊,是來(lái)做個(gè)性化的信息搜索,這里面正好在移動(dòng)社區收縮當中可以使用到這樣一個(gè)技術(shù)。首先這是一個(gè)背景數字,我就不過(guò)多的做介紹了,中國互聯(lián)網(wǎng)的用戶(hù)市場(chǎng)仍然是保持非常快速的增長(cháng)的。社區交友的用戶(hù)量也非常大,而且尤其在東亞區,對SNS的使用比例也是比較高的。
用戶(hù)為什么在社區里面要使用搜索?這種使用其實(shí)還是有點(diǎn)不太一樣,在社交網(wǎng)絡(luò )里面,他如果要來(lái)搜索,第一個(gè)會(huì )在已經(jīng)存在的人際關(guān)心網(wǎng)絡(luò )里面找到其中某一個(gè)人,或者某一個(gè)人的信息,在SNS里面分,分network和networking兩種不同的分支,第一個(gè)network是把已經(jīng)有的社交網(wǎng)絡(luò )搬到移動(dòng)互聯(lián)網(wǎng)或者客戶(hù)端進(jìn)行訪(fǎng)問(wèn),這種要找已經(jīng)有的這些朋友,找到已經(jīng)有的聯(lián)系人,然后找到已經(jīng)有的聯(lián)系人,基本上一個(gè)要看他最近有什么樣新的動(dòng)向,比如說(shuō)他web狀態(tài)信息是什么,或者他現在和誰(shuí)又成為了朋友,他新發(fā)了一張照片或者新寫(xiě)了一篇博客等等,這是對已有朋友的了解,找到這個(gè)人以及這個(gè)人相關(guān)的信息。還有一種需求是在陌生的環(huán)境里,他要交新的朋友,像networking這種應用,就是要找一個(gè)人去聊一聊,要結識新的朋友,一般的目的一個(gè)是為了打發(fā)時(shí)間,另外就是為了找一些艷遇這也是非常正常的。在陌生人的網(wǎng)絡(luò )里面,陌生人的量是非常大的,在Myspace有3億多注冊用戶(hù),在聚友網(wǎng)內也有差不多將近600萬(wàn)的用戶(hù),在這里面你找到什么樣的人是你所需要的,如果一個(gè)個(gè)看和聊成本是非常高的。另外他不是為了找人,他上來(lái)是為了找有趣的內容,比如很多上聚友網(wǎng)的內容很多的是為了看博客和照片,尤其是看照片是第一需求,找各種各樣的照片看,看到誰(shuí)比較來(lái)電,就會(huì )去看看這個(gè)人寫(xiě)的博客,或者去他的空間看一看,這是一種比較典型的應用。我們如果在手機終端上做這樣的服務(wù)就相當的困難,比互聯(lián)網(wǎng)還要難。手機終端的展現能力比較有限,你看照片的話(huà)不可能看尺寸太大的照片,如果看空間的話(huà),往往都是抽象出來(lái),比如說(shuō)這個(gè)名字是什么,昵稱(chēng)是什么,多大年齡,是男的還是女的,這些信息的展現非常有限,和互聯(lián)網(wǎng)的應用有很大的差別。在這種情況下,用戶(hù)的互動(dòng)也不會(huì )像電腦上一樣,找的如果不太合適很方便的翻頁(yè),可以瀏覽的比較快,通過(guò)手機終端去做的時(shí)候,交互的速度相對比較慢,通過(guò)大量得按鍵操作,這個(gè)時(shí)間也相對來(lái)講比較長(cháng),這里面就有如何我們給用戶(hù)提供,僅僅是給自己有用的信息。其實(shí)我們有一個(gè)理念,什么東西是信息呢?信息是用戶(hù)能夠信任的,并且和用戶(hù)息息相關(guān)的這些消息才稱(chēng)之為信息,對于用戶(hù)是有用的這些信息。
怎么解決這些問(wèn)題?我們從去年5月份實(shí)踐就是要做個(gè)性化的信息提取,第一包括了用戶(hù)個(gè)人的信息空間,和他自己要檢索的信息空間,和我們這個(gè)社區里面已經(jīng)有的信息空間,在里面要做一些匹配,目前我們做了一些嘗試,首先看我們有什么樣的東西,就是在這種社交網(wǎng)絡(luò )里面有用戶(hù)的姓名,有他所在的國家或者地區,有他所在的地域信息,其實(shí)這里面地域信息一個(gè)是通過(guò)IP地址自動(dòng)提取的歸屬地在哪里,另外就是有年齡和性別,在Myspace我們還會(huì )要求用戶(hù)填他的性取向,其實(shí)在中國目前比較開(kāi)放的國家,他填的還是蠻開(kāi)放的,同性戀什么的也都會(huì )填上去,而且基本上也不會(huì )隱諱這些東西。用戶(hù)會(huì )來(lái)填寫(xiě)自己的興趣和個(gè)性,是喜歡聽(tīng)音樂(lè ),喜歡古典還是什么音樂(lè ),有些什么愛(ài)好,都是自己填出來(lái)。還有他會(huì )填自己受教育和工作的經(jīng)歷,在Myspace這種陌生人的交友網(wǎng)絡(luò )上填的相對小一些。比如像facebook,像國內的校內網(wǎng)用戶(hù)的信息就會(huì )填得很好,你幫他檢索所需要的人或者是內容的時(shí)候,都會(huì )非常有用。他感興趣的群體這個(gè)是在Myspace填的很多的,就是你上來(lái)為了干什么,你為了結交什么樣的人?這是用戶(hù)自己所聲明的信息,這是我們作為用戶(hù)興趣顯性挖掘的時(shí)候,我們當做顯性信息。
還有其他隱性的東西就是這個(gè)用戶(hù)在上面交了什么樣的朋友,他的朋友都有什么樣的特性,我們通過(guò)這個(gè)都是能夠知道的。還有這些用戶(hù)自己都產(chǎn)生了什么樣的內容,他說(shuō)他自己上來(lái)是為了找音樂(lè )愛(ài)好者的,但是如果他整天看的都是美女圖,看的這些博客的內容也都是在某一個(gè)另外的傾向上,我們可以認為用戶(hù)自己聲稱(chēng)的東西和實(shí)際的表現是有差別的,這是用戶(hù)的行為。這些用戶(hù)自己產(chǎn)生和消費的內容,比如他讀了什么東西,寫(xiě)了什么東西,他都看過(guò)什么樣的空間,他和朋友互動(dòng)的時(shí)候,這里面用戶(hù)在社區里面經(jīng)常會(huì )碰到美女,認識一下,交換一下QQ號,還有就是直接的問(wèn),你有沒(méi)有興趣我們晚上一起出去什么的,這種都會(huì )有,也是反映用戶(hù)的行為特性的,我們雖然說(shuō)從隱私保護來(lái)講別的用戶(hù)不會(huì )知道這些信息,但是我們做后臺分析的時(shí)候這是能夠知道的,有多少人的興趣是一夜情,這個(gè)我們也是可以知道的。比如對廣告點(diǎn)擊的歷史也可能知道,他感興趣的內容是什么,比如說(shuō)現在投了三星的廣告,這個(gè)用戶(hù)是不是點(diǎn)擊了這個(gè),點(diǎn)擊了這個(gè),這個(gè)階段他對手機感興趣是相對比較大的。他安裝了一些什么樣的SNS,現在Myspace也是做了開(kāi)放平臺,今年4月份的時(shí)候我們做的,在這西面用戶(hù)安裝了什么樣類(lèi)型的也是一個(gè)隱含的信息,他喜歡展示類(lèi)的還是喜歡和人去互動(dòng)類(lèi)的,還是安裝的是一個(gè)比較偏暴力的游戲,這些信息部分我們叫做隱性的挖掘,就是用戶(hù)隱性信息的挖掘,根據他的行為,不是他自己聲明的,是自己實(shí)際做的。
這個(gè)項目是在去年5月份立項的,今年年初我們開(kāi)始和國內一家機構進(jìn)行合作,這個(gè)方面也非常有意思,個(gè)性化信息檢索是我們國家自然科學(xué)基金一個(gè)項目,研究機構有一個(gè)痛苦的地方,他們沒(méi)有用戶(hù)海量的數據和用戶(hù)行為的數據,Myspace正好有這樣一個(gè)特點(diǎn),我們和國內一家科研機構達成一個(gè)合作,由他們幫我們做一些基礎的科研,我們提取一部分用戶(hù)數據來(lái)作為科研輸入的東西,以及作為驗證的一些資料,同時(shí)我們自己有一個(gè)三四個(gè)人的團隊,由他們來(lái)做商業(yè)化,就是怎么樣轉化到實(shí)際中的應用,到后面大家會(huì )看到我們有一個(gè)系統,是一個(gè)內部使用的,在我們產(chǎn)品上實(shí)際上已經(jīng)投放了,在內部要評估,叫做information for you。在這里面可以看到,這是inforU的截平,每個(gè)ID對照的是一個(gè)用戶(hù),這個(gè)ID對照的用戶(hù)來(lái)說(shuō),我們這里面提取出來(lái)的可能會(huì )有的興趣,這個(gè)提取是顯示和隱性?xún)刹糠侄加械模约郝暶鞯氖鞘裁矗麑?xiě)的博客是什么,目前還沒(méi)有加入到用戶(hù)人和人之間的互動(dòng),而是自己產(chǎn)生的內容,他在博客里面寫(xiě)的,和在論壇里面發(fā)的東西,我們提取他對什么感興趣,這個(gè)里面有閱讀、輪滑,喜歡電視,又練瑜珈,又看了《狼圖騰》這個(gè)書(shū),這些東西其實(shí)在做用戶(hù)匹配的時(shí)候,給他推薦朋友的時(shí)候,我們現在在傳播的模塊里面有一個(gè)這個(gè)人你可能會(huì )認識,或者這個(gè)人你會(huì )感興趣,給他推薦的時(shí)候會(huì )加上這樣的匹配。這里面有一個(gè)我們是同行,或者我們過(guò)去是同事,或者是同學(xué),這個(gè)比較多的是從顯性化里面的,他如果填了社交網(wǎng)絡(luò )可以填業(yè)緣。地緣我們是同一個(gè)城市的,或者我通過(guò)IP地址可以看到你是非常近的區域的,我和你所處的地理位置比較近,比如像一些群組里面,比較明顯的要做一些線(xiàn)下活動(dòng),給他推薦的地域至少是同一個(gè)城市,可能產(chǎn)生一些事情,這是地緣。音緣,Myspace在整個(gè)全球里面有980萬(wàn)的音樂(lè )人,在中國雖然中國的本土音樂(lè )很少,但是畢竟音樂(lè )是Myspace的一個(gè)招牌,很多人上來(lái)也是為了聽(tīng)歐美的音樂(lè )或者和音樂(lè )人有一些交往,音緣就是你們都是喜歡某種類(lèi)型的音樂(lè ),我們會(huì )記錄用戶(hù)所有的音樂(lè )消費歷史,在空間的玩法里面,用戶(hù)為了找某一個(gè)音樂(lè )放在自己的空間里面當做空間的背景音樂(lè ),大多數用戶(hù)都有這樣的選擇。他歷史上都選擇過(guò)什么樣的音樂(lè ),我們都是給他記錄下來(lái)的,叫做歌單,從這個(gè)歌曲來(lái)說(shuō),其實(shí)最后可以分出來(lái),這個(gè)音樂(lè )是屬于什么類(lèi)型的音樂(lè )。在音緣里面,給他推薦個(gè)性化信息的時(shí)候,這首歌你可能會(huì )喜歡,或者這個(gè)人他的音樂(lè )方面的愛(ài)好和你非常像,你愿不愿意看看是不是可以成為朋友。
這是我們實(shí)際在產(chǎn)品里面的體現,就是你可能認識他們,但是這個(gè)產(chǎn)品的體驗做得還不是很好,我們馬上要推出的版本里面會(huì )直接告訴你為什么我推薦他。這是我們的一個(gè)問(wèn)題,給他推薦了,但是沒(méi)告訴他為什么你可能會(huì )和這個(gè)人有緣,這里面的信息有,只是沒(méi)有把這個(gè)展現出來(lái),在下一個(gè)版本里面這些東西就都會(huì )有的。
這是Myspace日本的手機客戶(hù)端,Myspace在全球里面,在手機上做得最好的是Myspace日本,美國目前Myspace.com所做的產(chǎn)品,基本上就是把Web上的功能引到手機上,就是所有的功能都可以有,但是用戶(hù)的使用體驗的確用起來(lái)不是很方便。包括Myspace中國我們是把Iphone也開(kāi)發(fā)出來(lái)了,應該這幾天就可以發(fā)布。這個(gè)版也是繼承了美國的風(fēng)格,就是僅僅是完成了所有的功能,功能很全,我們估計中國用戶(hù)用的時(shí)候不是很方便。像剛才說(shuō)的我們的推薦,這部分內容也沒(méi)有帶進(jìn)去,第一個(gè)版本也沒(méi)有帶進(jìn)去,但是下面會(huì )集成進(jìn)去,第一個(gè)我們當做練手的Iphone,下面會(huì )往手機平臺上做。這是Myspace最新的一些消息,這是網(wǎng)站推薦的內容,這是網(wǎng)站推薦的人,還有這些朋友請求,這個(gè)版本比較多的就是功能性的,在這里面可以看到有音樂(lè )內容,可以給你推薦音樂(lè )內容,允許用戶(hù)對別人進(jìn)行評價(jià),這邊是做廣告的,這里面在Myspace Japan里面會(huì )有TV,在中國TV是進(jìn)不來(lái)的。這是要找某一個(gè)音樂(lè )人的界面,這是對于用戶(hù)的空間來(lái)進(jìn)行評級,對音樂(lè )來(lái)進(jìn)行評級,對于視頻進(jìn)行評級,這部分的東西一個(gè)是和搜索相關(guān),另外就是和方式相關(guān)。在這里面有非常大的改進(jìn)空間,可以做個(gè)性化的,根據用戶(hù)過(guò)去消費的歷史進(jìn)行匹配。
回過(guò)頭來(lái)做一個(gè)總結,個(gè)性化信息檢索目前處于一個(gè)什么階段?個(gè)性化信息檢索,研究的開(kāi)始其實(shí)在上個(gè)世紀的80年代就開(kāi)始的,包括斯坦福、卡內基梅隴、微軟的美國研究院,以及國內的北大研究室,復旦大學(xué)、中科院計算所、哈爾濱工業(yè)大學(xué)等等這些研究機構或者是學(xué)校,其實(shí)早就開(kāi)始在做個(gè)性化信息的檢索。但是真正的個(gè)性化信息檢索開(kāi)始引起足夠的重視,比如說(shuō)進(jìn)入到國家自然科學(xué)基金應該是去年到今年的事情,而研究機構在這方面其實(shí)是面臨著(zhù)很大的困難,經(jīng)費還是小事,最主要的沒(méi)有數據,而這方面的研究,其實(shí)大量的要靠樣本,原有的數據拿過(guò)來(lái)做模型,看這個(gè)模型訓練的結果,最后再看評估體系,往往還是加上是人介入的。就是一般的比如編輯拿過(guò)來(lái),用人工來(lái)判定,人工來(lái)判定當做一個(gè)學(xué)習的資料去學(xué),再由人工判定的資料做一個(gè)自動(dòng)的判定,最后往往還有大量人工的判定,檢測模型的效果,不行的話(huà)再進(jìn)行調整,這是用的主流的方法之一。在這里面包括了要建用戶(hù)檢索的信息空間模型,在做這種個(gè)性化信息檢索里面,還會(huì )挖掘人和人之間的關(guān)系,挖掘人的社會(huì )屬性,他的朋友是什么樣子的,他的朋友的信息也會(huì )當做他檢索模型里面的信息要推送過(guò)來(lái)。同時(shí)最后還會(huì )做一些協(xié)同過(guò)濾方面的東西,就是和他相似的這些人檢索信息的時(shí)候有什么樣的特色,最終也會(huì )當做他所檢索信息的一些屬性進(jìn)來(lái)。就是他的朋友以及系統給他自動(dòng)聚類(lèi)出來(lái)的,這些人他們可能在現實(shí)生活當中不認識,但是他們檢索信息的模式非常相近,這部分也會(huì )當做檢索信息的內容給出來(lái)。目前還是一個(gè)非常初級的階段,在Myspace的產(chǎn)品里面,我們目前僅僅是用到了推薦朋友,給他推薦新朋友,第二個(gè)是閱讀博客,或者閱讀論壇的時(shí)候,尤其是閱讀博客的時(shí)候,會(huì )給他再推薦一些其他的內容,用到內容推薦,這是目前非常初步的應用。
預計在明年年初的時(shí)候,我們和科研機構第一期會(huì )出來(lái)一些成果,這些成果出來(lái)之后,會(huì )繼續的用在網(wǎng)站和手機版的推薦上面,應該會(huì )再往前走一步。當然真正從科研項目來(lái)說(shuō),時(shí)間是五年,我們還有四年時(shí)間,只是一個(gè)初步的,所以它仍然在發(fā)展。但是在企業(yè)上,在商業(yè)上的應用應該是已經(jīng)基本上能夠用了,成熟期還談不上,但是應該是可以用了。存在的問(wèn)題就是潛在有隱私的問(wèn)題,當這個(gè)研究目的,比如說(shuō)用戶(hù)的數據我們拿出去做分析,簽有關(guān)的保密協(xié)議等等這些東西,在中國畢竟用戶(hù)的隱私大家還不是那么在意,如果這個(gè)事在美國的話(huà)弄不好可能會(huì )被告了,但是做一個(gè)研究也是很無(wú)奈的事情。對于它的前景來(lái)說(shuō),我個(gè)人是非常看好的,因為它存在非常大的需求,讓用戶(hù)很快的找到信息,用戶(hù)的方便性。中國之所以能夠樹(shù)立一個(gè)非常高的互聯(lián)網(wǎng)的門(mén)檻,跨國的互聯(lián)網(wǎng)公司進(jìn)來(lái)很多發(fā)展的不是很順利,和用戶(hù)的使用心理有很大的關(guān)系,中國的互聯(lián)網(wǎng)用戶(hù)非常懶,而且不主動(dòng),如果你不能夠主動(dòng)的把信息推到他的面前去看,讓他尋找去學(xué)習的話(huà)就非常難以成功。我們去年當時(shí)發(fā)布Myspace是原汁原味的產(chǎn)品,結果我們被罵得狗血淋頭,磚頭真的是滿(mǎn)天飛,有一個(gè)月時(shí)間我們壓力特別大,這也是中國互聯(lián)網(wǎng)公司的機會(huì ),因為它直接拷貝進(jìn)來(lái)的話(huà)非常難以成功,Google是另外一個(gè)特例,Google的搜索之類(lèi)的東西其實(shí)是非常簡(jiǎn)化了,但是如果在社區上面,在中國絕對需要這個(gè)方面的創(chuàng )新。目前我們做的個(gè)性化信息檢索項目不是Myspace全球做的,僅僅是Myspace中國自己開(kāi)始的一個(gè)項目,在這方面是能夠提高用戶(hù)體驗的一個(gè)方式。
我的演講就到這里,謝謝大家,謝謝主持人,祝大家中午有一個(gè)好胃口。
搜狐IT
相關(guān)鏈接:
亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩
安庆市|
屏边|
家居|
木兰县|
巴楚县|
调兵山市|
泽州县|
同仁县|
大英县|
榆树市|
晴隆县|
滁州市|
绵竹市|
丹棱县|
永清县|
宜城市|
汉沽区|
黑河市|
蕉岭县|
娄底市|
华亭县|
呼玛县|
崇仁县|
即墨市|
肇源县|
海盐县|
惠安县|
富锦市|
新化县|
客服|
湟中县|
家居|
湘阴县|
常山县|
贺州市|
天镇县|
高阳县|
兴安县|
崇礼县|
京山县|
荆门市|
http://444
http://444
http://444
http://444
http://444
http://444