近幾年,圍繞信息采集和處理的大數據技術逐漸成為發達國家一大科研熱點。英國從政府、研究機構到企業都已經行動起來,以期搶占“數據革命”先機。但是,大數據技術仍不成熟,其面臨的信息收集不足、網絡容量有限、個人信息安全等問題亟待解決。
政府大力支持技術研發
雖然經濟不景氣,財政被迫收緊,但英國政府依然在大數據技術研發上投入大筆資金。今年年初,英國商業、創新和技能部宣布,將注資6億英鎊(1英鎊約合1.52美元)發展8類高新技術,其中大數據技術的研發與應用將獲得1.89億英鎊的資金支持。
負責科技事務的大臣戴維·威利茨說,政府將在基礎設施方面投入巨資,加強數據采集和分析,從而讓英國在“數據革命”中占得先機。
英國政府公布的一份報告稱,借助合理的投資,英國將為“數據革命”做充分準備。雖然從單純計算能力來看,英國并不具有突出優勢,但報告認為,英國擅長處理不同大數據集,強勢在數學和計算機科學領域。此外,英國在醫療保健、人口統計、農業和環境領域有著世界上最好、最完整的數據集。
威利茨說,政府要利用好這些獨特優勢,需要加大對關鍵研究領域的支持力度;成功的高新技術戰略不僅要著眼于科研本身,更應該著力于推動新技術從實驗室到商業應用的轉化。
大數據已應用于多個領域
大數據技術創造價值的能力已經顯現出來。一份行業報告顯示,英國政府通過高效使用公共大數據技術,每年可節省約330億英鎊,相當于英國每人每年節省約500英鎊。
大數據之所以能創造巨大的價值是因為在商業、經濟、政府管理等領域中,決策行為越來越取決于數據和分析,而不再是經驗和直覺。大數據技術可以為決策提供一定的“預見參考”,成功的分析和預見能產生商業和經濟價值。
英國最大的連鎖超市特易購已經開始運用大數據技術來采集并分析其客戶行為信息數據集,以此來制定有針對性的促銷計劃,并調整商品價格。這種“有的放矢”的營銷和定價模式讓特易購找到了更加高效的盈利方法。
具體說來,特易購首先在大數據系統內給每個顧客確定一個編號,然后通過每位顧客的刷卡消費、填寫調查問卷、打客服電話等行為采集他們的相關數據,再用計算機系統建立特定模型,對每位顧客的海量數據進行分析,得出特定顧客的消費習慣、近期可能的消費需求等結論。
對于特易購來說,這些技術的運用不僅提高了營銷效率,還有助于整個集團其他業務的發展,并創造全新的商業模式。比如,在對每位顧客信用程度和相關風險進行準確評估的基礎上,特易購推出了自己的信用卡等金融服務,擴展了自己的盈利鏈條。
5月初,英國首個綜合運用大數據技術的醫藥衛生科研中心在牛津大學成立。據介紹,這個研究中心總投資9000萬英鎊,可容納600名科研人員,旨在通過搜集、存儲和分析大量醫療信息,確定新藥物的研發方向,從而減少藥物開發成本,同時為發現新的治療手段提供線索。
英國首相卡梅倫在揭牌儀式上說,醫學研究新突破離不開信息獲取與共享,而這一中心的成立有望給英國醫學研究和醫療服務帶來革命性變化,它將促進醫療數據分析方面的新進展,從而幫助科學家更好地理解人類疾病并掌握其治療方法。
潛在問題尚需解決
牛津大學統計學教授彼得·多納利對記者說,目前大數據技術的第一個瓶頸就是信息采集不足。
以牛津大學新成立的醫藥衛生科研中心為例,首先要有足夠的病人、藥物等相關信息,這是數據分析的基礎,然而許多病人可能出于隱私考慮不愿提供這些信息,制藥企業也有可能因為商業利益不愿共享藥物成分等敏感信息。
其次,要從海量信息中得出有用的結論,專業的數據分析必不可少。牛津大學教授羅里·柯林斯認為,采集到足夠信息后,需要由相關領域的專業人士與信息技術專家一起對數據進行有針對性地歸納和分析,而這種跨學科、跨領域合作能否順利實現,是大數據技術實際應用中的重要問題。
第三,在技術層面存在網絡容量有限的問題,現有基礎設施無法滿足海量信息分析和處理的需求。因此,如何降低存儲成本以及提升應用價值就成為大數據所面臨的關鍵技術難題。
第四,人們的大量信息在無意識中被采集、分析,可能帶來社會問題。英國劍橋大學心理測量學中心研究員米哈烏·科辛斯基指出,所有的技術使用者都應注意,大數據也意味著大責任。
科辛斯基舉例說,僅從社交網絡上得到的個人統計信息,就可以建立起能夠自動更新的模型,將這些成千上萬看似不重要的數據聚合在一起,就能有效地推斷出個人特征。與任何偉大的技術一樣,這種推測功能既可以為善,也可以作惡。比如商家可能會把顧客玩弄于股掌之中,而圖謀不軌者掌握這些信息后甚至可能威脅到人們的安全。
科辛斯基建議,未來大數據的信息采集應遵循兩項原則:透明度和控制權。使用者首先要幫助用戶了解他們的哪些個人數據是公開的,這些數據目前和潛在的用途是什么。對可用于推斷的數據,用戶應享有完全的控制權。