從理論上來說,從收到用的螺旋式循環是一個巨大的渦輪,只有先數據化運營,然后才能運營數據。
 |
作者:車品覺 出版:浙江人民出版社 |
讀《決戰大數據:駕馭未來商業的利器》的前言有種奇怪的感覺。通常,作者總要在序言中交代寫作動機、闡明主要內容,而車品覺的前言一開篇就要讀者“忘掉大數據”——按理,不是應該強調大數據的趨勢重要性、對企業的戰略意義嗎?可車品覺是怎么寫的呢:“大數據的概念紛繁復雜,媒體上充斥了各種關于大數據的報道,但其中不乏牽強附會、濫竽充數的言論,某些媒體甚至把簡單的統計也冠上了‘大數據’的頭銜”。所以,目前人們最應該做的,就是“暫且忘記大數據的概念”,因為行勝于言,只有具備實效性的數據才是正道。
原來,車品覺試圖告訴每個讀者,大數據的具體運作到底是什么樣的,數據量絕對不是最重要的問題。我們要的不是數據的量,而是有“質”的量。由此就不難解釋,為什么這本《決戰大數據》的正文第一章,當我們想當然地以為會是“何謂大數據”等類似入門、啟蒙的內容時,車品覺卻一針見血直奔主題:討論“大數據,為什么很多人只會談,不會做”?那么,他的結論又是什么呢?他認為,從理論上來說,從收到用的螺旋式循環是一個巨大的渦輪,只有先數據化運營,然后才能運營數據。而現在的情況是,用數據的人不知道大數據從哪里來,做數據的人不知道大數據如何使用。用的人不敢用,因為大數據的真實性;做的人不知道怎么用,因為大數據的復雜性。于是,當數據量變得越來越大,結果卻是越來越無法有效地使用。
能如此清晰看出當下我國的大數據問題所在的,多半來自業界一線;畢竟,只有真正做過大數據,用過大數據的,才有底氣談大數據以及“如何成為決勝未來的商業利器”。確實,車品覺現任阿里巴巴集團商業智能部副總裁、數據委員會會長,擁有十幾年豐富的數據實戰經驗。憑借長期的從業經歷,加之互聯網巨頭阿里巴巴的事業平臺,車品覺對大數據認識的角度、高度和深度自然不同尋常。要知道,目下坊間有關大數據的論著已不少了,影響較大者,前有維克托·邁爾·舍恩伯格的《大數據時代:生活、工作與思維的大變革》開啟了“大數據商業應用之先河”,后有涂子沛從歷史文化提成“數據時代的到來”的《數據之巔》,同時還有被稱為“大數據商業應用的引路人”的大衛·芬雷布的《大數據云圖》、埃里克·西格爾的《大數據預測》,以及講技術算法和統計思維的Anand
Rajaraman寫的《大數據:互聯網大規模數據挖掘與分布式處理》、馮啟思(Kaiser
Fung)的《數據統治世界》等。這意味著,要再寫一本討論大數據之作,沒有金剛鉆是不行的。
早在大數據還沒流行以前,車品覺就開始關注這股趨勢了。上世紀90年代初,他就從以博彩為生的朋友那里,從觀看比賽錄像分析賽馬輸贏概率的個案上察覺了“用數據找機會”的手法。車品覺玩大數據玩得早、玩得多,自然玩得轉。譬如,他在書中提出了“大數據的本質就是還原用戶的真實需求”、“‘活’的數據才是大數據”、“無線數據,大數據的顛覆者”(據此,他認為面對無線數據,要解決的主要問題有兩個:一是高效準確的收集;二是培養數據分析師的多屏思維)、“數據的四大分類和五大價值”等觀點。在論證上深入淺出,討論語言通俗易懂,若非長期的實踐與總結,很難說得這么到位。
不過話回來,《決戰大數據》的主要看點,還是阿里巴巴的大數據實例——它到底做了什么,又是怎么做的?身為阿里數據委員會的“家長”,車品覺的言行自然也備受業界同行的關注。其實,有關阿里巴巴的大數據戰略與策略,在本書出版前,車品覺或多或少已向外界透露過。譬如在2013年下半年的《中國企業家》雜志上,車品覺就向記者表示:“一開始,我們在用好數據,但是隨著數據戰略與平臺戰略緊密結合,我們開始刻意地去管理數據(保證數據安全、質量和對于商家的可用性),養數據(有意識地收集外部數據),沉淀數據。”在談及“如何將大數據用好”轉變為“讓大數據更好用”的問題上,阿里巴巴是從以下六個地方入手的:確保數據安全(保護商家和個人的隱私)、保證數據的質量(去除虛假數據)、實現各個部門數據標準的統一(如轉化率)、讓原始數據變得更精細化(更符合商家的應用情景)、獲得外部數據(如并購新浪微博、收購高德地圖,和其他平臺合作、購買數據信息等)、建立數據委員會。
時間再往前推,2012年,馬云正式向外界公布了阿里巴巴分三步走的發展策略,即“平臺、金融、數據”,這意味著阿里巴巴誓要轉型成為一家“互聯網數據公司”;2011年,“頁面點擊”誕生,它可監控每個頁面上每個位置的用戶瀏覽點擊情況。緊接著,天貓攜手阿里云、萬網宣布聯合推出聚石塔平臺,為天貓、淘寶平臺上的電商及電商服務商等提供數據云服務;2011年,阿里巴巴開發數據魔方,通過淘寶數據魔方平臺,商家可以直接獲取行業宏觀情況、自己品牌的市場狀況、消費者在自己網站上的行為等情況;2009年,阿里巴巴的大數據應用開始走向外部,讓淘寶商戶分享數據;2005年,阿里巴巴就意識到數據時代的到來,開發了專門供內部運營人員使用的數據產品——淘數據,公司員工可以利用平臺海量的消費者和商家數據,來完善自身經營狀況。當然,這還不包括阿里旗下基于大數據理念、布局互聯網金融“牛刀小試”的作品——阿里小貸。
到了《決戰大數據》,車品覺的思路更為清晰、深入,而阿里巴巴的大數據做法也被首次系統闡述。車品覺細化了馬云當年提出的“數據化運營”和“運營數據”兩個概念。換言之,當人們談起大數據實踐時,至少在阿里巴巴企業內部,它是分為以上兩步展開的。所謂數據化運營,簡單講就是使用數據幫助企業、客戶解決問題;而運營數據就是在原有的數據基礎上,搜集、整理、分析,進而產生新數據的過程。對此,車品覺分別以“用”和“養”兩個精準的動詞來區分。
緊接著,車品覺用“混、通、曬”來歸納數據化運營,并描述成“內三板斧”,而把“存、管、用”來總結運營數據的“外三板斧”。車品覺認為,作為一名卓有成效的數據分析師,如果不和業務部“混”在一起,商業敏感度就無從談起。帶著業務問題來觀察數據或帶著數據來觀察業務,兼備兩者的敏感,就做到“通”,而更深層次的通存在于公司組織中的數據(部門和部門之間的數據分享)。數據化運營非常重要的一點,正是“曬”的內容。與此同時,“存”是指積極地收集數據,但這不是根本目的,讓收集起來的數據如何產生價值才是最終的目的;學會用數據產品來解決獲取及使用數據的問題。“管”不僅僅是把收集來的分類、存儲那么簡單,阿里巴巴數據管理最不一樣的地方(也可算作“競爭力”)就在于非常依賴數據產品,希望用數據產品來解決獲取以及使用數據的問題,通過數據的分裂和重組,來實現顛覆性創新。
在今年的“西湖品學”大數據峰會上,車品覺和與會者分享了一個有趣的發現。他說,縱觀這幾年美國O'Reilly媒體公司舉辦的Strata大會(美國大數據技術會議)的主題詞演變,就可以明白世界大數據的發展趨勢。2010年是“Data”,2011年是“Talk
Big Data”,2012年是“Apply Big Data”,2013 年是“Data
Engineering”——車品覺特別強調了最后一個用詞的變化:Data
Engineering(數據驅動)。他認為這是大數據從看到用、從說到做非常重要的一個歷史拐點。結合他在《決戰大數據》中總結的“數據十戒”中的第二、第三條,即“在實踐中提煉數據”和“讓數據變成科技,惠及更多人”。他的理論核心再清晰不過:讓數據科技(Data
Technology)成為一種生產力!