社交網絡:挖掘數據的價值

你不止是你,你是數據世界的一部分。或者你可以看看這個世界上正在發生什麼—你,就是數據本身。

社交網絡:挖掘數據的價值

放在尼奧(Neo)面前的是一粒紅藥丸和一粒藍藥丸。想象你是 Neo,吞下那粒紅藥丸,你會看到什麼?

一個赤裸裸的數字世界。它未必是那個一切由意念而生的雪白房間,但你身上會有原本看不見的數據接口,你所有的個人信息都由它們通向計算機和人工智能終端。

和《黑客帝國》那個噼啪閃爍着電光、機器章魚亂竄的暗黑世界不一樣的是,我們或許能在終端看見一個叫Color的插口,一個叫Foursquare的插口,一個叫Zynga的插口,或者是Amazon以及Google─你的一舉一動都隨時隨地被記錄下來,以數據的形式存儲在這個“真實”世界裏。這就是你的生活。

泡沫?

Color,一個照片分享軟件,當你打開你的iPhone攝像頭,它開始蒐集包括噪音水平、藍牙識別、光線信號甚至時間和你手機對準的方向在內的一切數據,並據此判斷誰和你同時出現在方圓30米內,你們會自動形成一個羣組並自動共享此前上傳到Color平台的所有圖片,當然,還可以聊天。

你可能更熟悉Instagram和Foursquare,前者同為照片分享軟件,你通過十幾種內置的濾鏡實時處理並上傳你隨手拍下來的各種東西,你還能“follow”別人,訂閲並評論他們的照片─鑑於有200萬用户,這是一個移動平台上的Flickr。後者再定義了“簽到”這個詞:你隨時隨地在手機上向朋友們宣告你在哪兒,在做什麼。不管你對這種行為持何看法,全球有700萬人就這樣被記錄下行蹤。

這些都是迄今為止最為火爆的移動互聯網應用。現在Foursquare即將迎來第三輪融資,XX萬至4000萬美元; XX年3月,Color在產品還沒上線的時候,僅僅憑藉一個“彈性社交網絡”概念便獲得了包括紅杉資本在內多家風投的4100萬美元投資─這也是今年“科技泡沫”最重要的一個標誌。

面對類似 Color這樣的新新事物,所有風投都會擔心自己被落下,尤其是在新應用和新技術層出不窮的XX年。爭相砸錢的風投讓硅谷的融資路徑看起來空前順暢,雖然被投資的對象連一個清晰的盈利模式都沒有。

自上線以來,Instagram還沒找到一個“簡單且不破壞用户體驗”的盈利模式。他們曾經考慮過標籤功能,即聯合品牌做展示廣告。比如百事可樂旗下的Brisk Iced Tea讓Instagram用户上傳帶有“#Brisk Iced Tea”標籤的照片,中選的將被印在限量版產品的外包裝上。更多的應用開發商則直接承認自己沒找到有效的盈利模式,比如目前擁有2500萬用户的信息共享應用Bump,創始人戴維·利布(David Lieb)表示今年年初拿到的1600萬美元將用來擴大員工規模。

當然,另一個原因是這些炫酷應用都依附在那個更大的疑似泡沫─Facebook上,它目前的估值已經達到850億美元。這個繼搜索之後最重要的互聯網應用被認為是一個偉大的產品:擁有最佳設計界面及對各種應用開發者開放的API體系,最重要的是:它在6億全球用户的前提下實時接收各種用户自主提交的數據,由於信息不能被搜索引擎抓取,Facebook被認為已經構建出來一個谷歌無法觸及的封閉網絡。

再加上Facebook建立在數據分析上的各種廣告系統:比如任何人通過填寫一張表格就能隨便定義自己想觸及的人羣,“俄亥俄州25歲至30歲有小孩但是沒有數碼照相機的女性”,或者,把用户剛剛更新的“街角的星巴克真是難喝”變成一條顯示廣告,Facebook在廣告這件事上似乎比谷歌蒼白的關鍵詞廣告有效得多。“Facebook能否打敗谷歌”─這一度是XX年初硅谷最熱門的話題。

當然,不是所有人都這麼看。一個月前,《彭博商業週刊》報道了一個叫Jeff Hammerbacher的數學天才,XX年,他從哈佛畢業一年後加入還處於嬰兒發展期的Facebook,馬克·扎克伯格給了他一個很棒的頭銜:Research Scientist(研究科學家),職責是研究人們通常如何使用社交網絡,更具體地説,找出Facebook為什麼在一些學校成功而另一些則行不通的原因。Facebook藉此蒐集數據並奠定整個公司業務的基石─精準廣告。

但在Facebook待了兩年之後,Hammerbacher開始懷疑人生:“我們這一代最聰明的人竟然都在這裏思考着怎樣讓人們去大量地點擊廣告,真衰。”於是XX年,他從Facebook辭職了。

數學家

泡沫當然有可能存在,但如果換個角度,技術創新浪潮與泡沫幾乎同時產生。我們大可以淡定一點,即便是被《彭博商業週刊》預言為“這次什麼都不會剩下”的泡沫,也還是能看出不那麼悲觀的地方:目前硅谷最受歡迎的人,還沒蠢到是營銷天才的地步,當然也不是工程師,而是數學家。

讓我們來看看Zynga,這是一個同樣被關注的公司,自去年第四季度以來,它的估值激增了81%,達到了80億美元。對玩家來説,Zynga是寄生在Facebook這樣的社交網站或iPhone 等智能手機上的遊戲平台,它的小遊戲如FarmVille或者Mafia Wars極易上手,強調與朋友的合作。Zynga比其他社交遊戲公司更為厲害的一點是:它總是知道如何埋下一個個小鈎子,讓用户不斷回來重温遊戲,比如定時獎勵、任務型的激勵措施以及在與朋友的交往之中積累虛擬財富。

《彭博商業週刊》披露,這個社交遊戲巨頭大約每天要收集600億個數據點,包括人們一般玩多久遊戲,什麼時候玩,喜歡購買什麼遊戲物品等等。該公司的數學極客們用這些數據來分析哪些人喜歡逛自己朋友的農場和城市(Zynga開發的遊戲),人們都喜歡買哪些虛擬物品以及他們給自己的朋友贈送虛擬物品的頻率等。然後他們就會得出這樣一個重大的發現:經常收到朋友虛擬禮物的人會更喜歡玩遊戲,收不到或不那麼經常收到的則不太喜歡玩遊戲。Zynga的數據分析部門副總裁Ken Rudin表示:根據這個發現,一羣數學極客們又想出瞭解決辦法─那些不那麼經常收到禮物的玩家我們會讓他們更加容易的找到建城(Zynga遊戲)的工具,這樣他們就不會過於依靠他人的禮物了。但是,如果Zynga每天分析600億次只是為了廣告,事情未免有點太離譜了。聰明的頭腦不值得為“怎麼才能讓更多人掏信用卡”這件事絞盡腦汁,同樣,600億次運算更不值得。

廣告是這些數據最容易實現的價值,如果你再往前推一步,思考一下獲得廣告精準投放的那些數據還意味着什麼,你就會理解Zynga的意圖:分析用户行為,揣摩用户心理,然後適時為每個獨特行為習慣的用户提供更有針對性的服務。它知道如何粘住你。

Zynga的數據分析系統能做到每一個更新內容設計三個不同的版本,從後台同時推送給不同的用户羣,在一個小時之內把數據統計結果發回來並分析用户使用比例和頻率。從某種意義上來説,像Zynga這樣的公司可能比你自己還清楚地知道你的潛意識決策,通過數據分析。

感覺到哪裏不一樣了嗎?它們都以一個龐大的數據庫記錄你的行為特點,判斷你的行為可能。

SoLoMo

這些只是今年喧囂的互聯網世界裏的一部分而已。著名風投、美國KPCB風險投資公司(Kleiner Perkins Caufield &Byers)合夥人約翰·杜爾(JohnDoerr)在今年2月的時候第一次提出了“SoLoMo”這個概念。他把最熱的三個關鍵詞整合到了一起:Social(社交)、Local(本地化)和Mobile(移動)。

“我們正處於一個新時代的開始,社交網絡創新者正為用户重新想象和重新定義一個網絡 ,這一網絡超越文檔和網站。”杜爾説。理解這三個關鍵詞並不難。從Color到Facebook這樣的“So”已經無處不在;而“Lo”則代表着以LBS(Location Based Service)服務為基礎的各種定位和簽到,它是Foursquare或者“街旁”,也包括谷歌縱橫(Google Latitude)和Facebook Places;“Mo”則是拜蘋果和谷歌Andriod帶來的各種移動互聯網應用。

另一個風投、聯合廣場創業投資公司(Union Square Ventures)的合夥人弗雷德·威爾遜(Fred Wilson)則提出了SoMoCloGlo。除了So和Mo與約翰·杜爾一致以外,還提出了雲端內容服務(Clo,Cloud)和全球化(Glo,Global),前者最好的例子是Netflix (北美線上DVD 出租服務),後者則不用多説,Skype、Twitter、Google這些互聯網公司,80% 以上的用户都來自美國以外的地區。

這些拗口的時髦概念,SoLoMo和SoMoCloGlo,你會發現它們彼此之間的界限不會那麼清晰,像Color這樣的應用可以涵蓋所有元素。

試着像一個哲學家一樣去思考它─Lo這個針對地理位置提供的服務顯然説的是“我在哪裏”;So表示的社交,其實説的是“我們是誰”,如果你考慮到人類有史以來一直在以區分“我們”和“他們”的方式尋求同類和安全感,理解社交乃至社會的重要性就很簡單; Mo,你當然可以説它代表手機或者移動互聯網,但試着從“丟了手機的那些數據你就什麼都不是”的角度思考一下,其實它更多代表了identity─你的身份,或者更直白的,“我是誰”─真是一個古老的命題。

Data Value

這裏沒有太多的隱喻。但這些足夠説明數據的重要價值了,這也是這麼多人為之興奮的原因。那些此起彼伏的SNS應用並不僅僅是Social Networking Services,它們在解決你的存在感問題。你的存在感?對的,是存在感。

“我們是一家數據挖掘公司,而非照片分享網站。”Color的創始人Bill Nguyen在接受媒體採訪時説。他在創業之初就打定主意要好好利用智能手機上那些傳感器所蒐集到的數據,並且拉來了DJ Patil來開發一整套算法技術。在此之前,Patil是一名理論數學家,通過數據挖掘來從事對天氣變化、沙丁魚數量減少,沙丘形成原因等方面的研究。他在算法方面的研究使得他一度是社交網站LinkedIn的首席科學家。

Color一開始推出一個能抓取照片、視頻和文字的應用只是偶然。但Bill Nguyen相信當人們打開攝像頭的那一刻,那會是它們的大機會,它們不會放過手機上任何一個傳感器能接收到的信息。通過這些數據的計算,能識別出你和哪些人在同一個區域。通過這樣的數據積累,Color試圖計算出你和他人的親疏遠近,就像在現實生活中那個與你總在不同場合出現的人必定是你的熟人一樣。因此Color無需用户手動添加好友,也不像其它程序那樣需要導入聯繫人信息。

這就是那個真實世界─我們説的存在感。Color在替你總結你的偶遇和你的熟人,Foursquare在記錄你的行蹤,Instagram在記錄你行走時的所見。如果你願意,你可以通過Viddy拍下一整段的視頻並分享給你的朋友,然後所有這一切彙集到Facebook上被熱烈討論。這些都倒映成千變萬化的數據─你有沒有懷疑過,你所處的世界可能不是如你所見的那樣?

XX年2月,Instagram向開發者開放API,許許多多基於Instagram的子SNS湧現出來,例如時裝照片分享服務Fancy、美食照片分享服務Foodspotting和iPhone電子日記應用Momento。這意味着,Instagram所蒐集的大量信息可以為其它公司所用,它們各取所需,做自己想做的事。

不過,你現在看到的這些只是移動互聯網裏的小玩意,它表現出來的數據價值,可能還真比不上馬克·扎克伯格看重的廣告價值,當然更比不上Zynga提供更優質服務的價值。但你不能忽略的是,那些每天發生600億次的數據抓取,以及這些基於一個既有SNS平台的衍生應用獲得的數據,其實只是規模區別而已─他們本質上都是對用户行為的解析,並同樣存在於那個龐大的“Clo”中,被涵蓋在“Glo”的範圍裏。

這個時候你一定知道為什麼最受歡迎的是數學家了。《彭博商業週刊》裏提到的那個小夥子,Jeff Hammerbacher,他又與人合夥創建了一家名叫Cloudera的公司,從事數據分析軟件的開發。他發現所有的公司和機構都面臨着他當初為之服務的消費網絡公司所面臨的相同問題—怎樣從海量的信息中獲得一些有價值的東西,比如生物公司每天都在製造大量的DNA測序數據,能源公司也能得到大量的地震波數據等。Hammerbacher和Cloudera公司找到了方向:幫助客户將大量的數據打散成相對容易消化並能分佈在廉價計算機上的數據塊,通過這種模式顧客就能迅速的提出問題並獲得答案了。

理論上他的工作與在Facebook時並無不同,只是當時他要面對的是一羣朋友“最喜歡什麼”這樣的問題,這一次的問題可能是“那些癌症病人都有哪些相同的基因”。

跟Hammerbacher一樣,Singha和他的同事正在分析從8.5091萬次臨牀試驗和6.9795萬次臨牀事件中挖掘來的各種數據,他是惠普贊助2500萬美元給斯坦福大學的Lucile Packard兒童醫院(LPCH)這一項目中從事數據挖掘工作的科學家,他研究的數據包括從收縮壓、肝功能測試、鎮痛藥物的使用、服用藥物的劑量到神職人員的探視。這些數據能用於建立一個對每個正在被治療兒童都進行快速反應的模型:“這套系統使用了大量的複雜分析,當系統獲得新的數據,就能基於模型給醫生和護士一些預測性的提示,這樣他們能立刻注意到問題所在。”

根據LPCH的報告,在使用了這套系統之後,“在開始的19個月內拯救了33名病人的生命”。

順着這個思路下去,在各種龐大的database裏,除了“騙人”點擊廣告,除了研究如何讓玩家患上網絡遊戲依賴綜合症,還有積極的那一面,比如Hammerbacher和Singha正做的。類似解讀其實可以延伸到各種方面:英特爾曾經通過記錄行為在人腦裏反映的相應變化宣佈自己瞭解“讀心術”這回事; 前一段出盡風頭、在哥倫比亞廣播公司問答節目裏擊敗最聰明的人類的IBM機器人Waston; 以及,5月12日,谷歌在谷歌I/OXX開發者大會上與福特聯手宣佈的概念產品“雲汽車”,它通過收集駕駛者的信息、雲計算和谷歌Prediction API應用程序可以讓未來的汽車主動為駕駛者提供行駛建議,甚至優化燃油效率。

當然還有不那麼複雜的。一個叫Waze的應用可以利用用户手機的GPS功能記錄他們的行駛路線。當這些路線的數據足夠多時,城市的地圖因此被繪製出來。用户可以實時分享交通狀況,也能通過別人提供的數據得知路況。

所有這些都是對大量人類行為的數據佔有,而這些小兒科的應用,只是開始。

墨菲斯告訴 Neo,如果他吃了那粒紅藥丸,就會看到Matrix,那個真實的世界。現在,Facebook、Color、Twitter等等,正在紅藥丸的背後營造屬於我們這個世界的database─在將來,它就是那個巨大的Matrix。

16年前,麻省理工學院教授尼古拉斯·尼葛洛龐蒂(Nicholas Negroponte)説:“計算不再只和計算機有關,它決定我們的生存。”他想象未來世界的基本構成將會從原子變成比特,多點觸控和語音識別會是主流的人機交互界面,而互動、娛樂與資訊終將合為一體。他把這些命名為《數字化生存》(Being Digital)。經過16年的發展,隨時在線、帶寬和手機在移動互聯網上的應用已經一一實現─遙遠的信息革命終於不只是預言而已,“數字化”成為一種更“現實”的存在。它正在構建你的存在感。

那些野心勃勃的公司,那些肯為一個idea就付出4100萬美元的風險投資商,它們只是賭自己的公司或者自己選擇投資的公司更懂得SoLoMo,更知道:你是誰,你在哪裏,你們是誰。

一個爆炸性的概念

XX年2月,著名風投、美國KPCB風險投資公司(Kleiner Perkins Caufield &Byers)合夥人約翰·杜爾(John Doerr)第一次提出了“SoLoMo”這個概念。他把最熱的三個關鍵詞整合到了一起:Social(社交)、Local(本地化)和Mobile(移動)。

“我們正處於一個新時代的開始,社交網絡創新者正為用户重新想象和重新定義一個網絡 ,這一網絡超越文檔和網站。”杜爾説。

不到三個月,SoLoMo概念已經風靡全球。你幾乎找不到哪一個與互聯網、創業有關的論壇不提及這個詞。