來源:《經濟日報》
顧客走進商店,在一貨架前只停留片刻,商家就可以通過大數(shù)據技術,立刻知道該顧客的購買習慣,以及是否購買過這個牌子的產品。商家再通過實時分析,確定個性化營銷策略,及時將優(yōu)惠信息發(fā)送到顧客手機上,以激發(fā)顧客的購買欲望,而商家推廣新產品的效率也得到了提高。
近日,在北京舉辦的2012年Hadoop與大數(shù)據技術大會上,中科院計算所所長孫凝暉認為,在未來大數(shù)據會成為一個新的行業(yè),隨著更多有價值的數(shù)據從海量數(shù)據中被發(fā)掘出來,將會產生許多新的商業(yè)形態(tài)、新的企業(yè)和新的服務。
大數(shù)據是信息產業(yè)領域內最具發(fā)展?jié)摿Φ男袠I(yè),全球IT研究與顧問咨詢公司Gartner數(shù)據中心首席分析師張瑾介紹說,最新研究數(shù)據顯示,全球數(shù)據量每年至少增長59%。大數(shù)據將帶來大量就業(yè)機會。到2015年,大數(shù)據將為全球帶來440萬個IT崗位,為中國帶來1萬個技術職位。
大數(shù)據量大且雜。數(shù)據源分為兩類:一類是用戶通過社交媒體、搜索等用戶活動產生的數(shù)據;另一類是機器產生的數(shù)據。IBM中國研究院信息管理與醫(yī)療健康首席科學家潘越認為,大數(shù)據不僅指數(shù)據量大,與傳統(tǒng)數(shù)據的不同點還在于數(shù)據實時處理速度要求高,數(shù)據形態(tài)呈現(xiàn)多樣性,以及大數(shù)據的不確定性。傳統(tǒng)數(shù)據分析周期是以月、周、天來劃分,而大數(shù)據時代的很多分析必須是實時作出決策,否則大數(shù)據價值便無法體現(xiàn)。
在大數(shù)據中,有70%至85%的數(shù)據是“多種數(shù)據混合體”,數(shù)據處理的復雜度高,傳統(tǒng)數(shù)據有87%的性能問題與數(shù)據增長有關。數(shù)據管理的花費也大,是采購存儲花費的3倍。張瑾介紹說,目前大數(shù)據在普通設備上無法運行和備份。大數(shù)據應該實現(xiàn)低成本運算和高可用,也就是通過使用消費級硬件,以及軟件設計、架構設計,來實現(xiàn)大數(shù)據管理,而不是靠以往采用的高性能、高端設備來實現(xiàn)數(shù)據存儲。
在大數(shù)據處理工具Hadoop上,目前集成了很多行業(yè)應用。一些企業(yè)在大會上展示了他們在物流、醫(yī)療、零售業(yè),以及公共服務等領域的應用成果。但有專家建議,在實施“大數(shù)據”前,要明確需求和目標,以免因技術和商業(yè)的不成熟性,給企業(yè)和用戶帶來風險。