因為關注大數據,也寫過若干關于大數據的文章,做過若干關于大數據的演講,所以對有關這一主題的論文和書籍非常有興趣。過去幾年,在這方面讀過十幾本書,上百篇論文和文章。相對而言,舍恩伯格的《大數據時代》是迄今為止我讀過的最好的一本專著,中英文都算上。
此書的一大貢獻是在大數據方興未艾,眾說紛紜的時刻,進一步闡述和厘清了大數據的基本概念和特點,這對許多以為大數據就是數據大的人來說很有幫助。
在人類歷史長河中,即使是現代社會日新月異的發展中,人們還主要是依賴抽樣數據,局部數據,片面數據,甚至是在無法獲得實證數據的時候純粹依賴經驗,理論,假設和價值觀去發現未知領域的規律。所以,人們對世界的認識往往是表面的,膚淺的,簡單的,扭曲的或者是無知的。舍恩伯格指出,大數據時代的來臨使人類第一次有機會和條件在非常多的領域和非常深入的層次獲得和使用全面數據,完整數據和系統數據,深入探索現實世界的規律,獲取過去不可能獲取的知識,得到過去無法企及的商機。
由于大數據的出現,使得通過數據分析獲得知識,商機和社會服務能力從以往局限于少數象牙塔之中的學術精英圈子擴大到普通的機構,企業和政府部門。門檻的降低直接導致了數據的容錯率提高,成本的降低,但正如舍恩伯格所強調的,最重要的是人們可以從對于因果關系的追求中在很大程度上解脫出來,轉而將注意力放在相關關系的發現和使用上。只要發現兩個現象之間存在顯著相關性就可以創造巨大的經濟或社會效益,而弄清二者為什么相關可以留待學者們慢慢研究。大數據之所以可能成為一個“時代”,在很大程度上是因為這是一個可以由社會各界廣泛參與,八面出擊,處處結果的社會運動,而不僅僅是少數專家學者的研究對象。
大數據將逐漸成為現代社會的基礎設施的一部分,和公路、鐵路、港口、水電和通訊網絡一樣不可或缺。但就其價值特性而言,大數據卻和這些物理化的基礎設施不同,不會因為人們的使用而折舊和貶值。例如,一組DNA可能會死亡或毀滅,但數據化的DNA卻永存。所以,舍恩伯格贊同許多物理學家的看法,世界的本質就是數據。因此,大數據時代的經濟學,政治學,社會學和許多科學門類會發生巨大的甚至是本質上的變化和發展,進而影響人類的價值體系,知識體系和生活方式。哲學史上爭論不休的世界可知論和不可知論將會轉變為實證科學中的具體問題。可知性是絕對的,無事無物不可知;不可知性是相對的,是尚未知道的意思。
對于不是網絡業,IT業和從事數據分析和使用的讀者,本書的一大好處是通俗易懂,通過具體實例說明問題,有助于人們的理解和聯想。在時限上,作者概括了直到2012年7月大數據方向上的最新發展,避免了許多同類作品中存在的例證過于陳舊,視野相對狹窄的毛病。
作為一位生活在歐美現代社會中的學者,舍恩伯格是把民主,開放和理性作為已知前提討論大數據革命的。這對生活在發展中國家,社會現代化程度有限的讀者來說,也許是個遺憾,因為書中描述的許多已經發生的事例可能更像是神話。沒有市場經濟制度和法治體系作為基礎支撐,大數據很可能成為發達國家在下一輪全球化競爭中的利器,而發展中國家依然處于被動依附的狀態之中。整個世界可能被割裂為大數據時代,小數據時代和無數據時代。
處于發展中國家前列的中國,目前正面臨著一個重大的歷史抉擇關口。應該說,在過去三十余年的時間里,中國在快速走向工業化,信息化,網絡化方面交出了一份不錯的成績單。適逢世界走向數據化,邁入大數據時代的時刻,無論對個人,企業,還是對社會和國家,都有認真理解,嚴肅決策的必要性和緊迫性。哪怕僅從這一點考慮,讀讀這本書是很值得的。