行業(yè)動(dòng)態(tài)

大數據:全新機遇還是一紙空談?

2014-12-04

解決方案使用不同類(lèi)型的組件。企業(yè)數據面臨的挑戰是它廣泛分布在各種不同的技術(shù)和數據平臺上。例如,數字化零售、電信業(yè)及社交媒體使用結構化數據,其表現形式相似;而企業(yè)數據則分布在主機、ETL(提取、轉換和加載)工具、虛擬層、關(guān)系數據庫、商業(yè)智能(BI)數據庫、交易數據庫以及數百種其它組件中,這些技術(shù)在過(guò)去30年中已不斷發(fā)展。更糟糕的是,每種應用程序使用不同的數據模型,導致數據與其相關(guān)技術(shù)平臺整合越來(lái)越復雜,因此,利用當前大數據工具訪(fǎng)問(wèn)企業(yè)數據,難以創(chuàng )造直接的價(jià)值。




  這就是企業(yè)大部分業(yè)務(wù)問(wèn)題與大數據無(wú)關(guān)的原因。這些業(yè)務(wù)問(wèn)題實(shí)際上是分布式數據問(wèn)題:在這種模型下,信息、數據、價(jià)值和分析廣泛分布在不同的位置、技術(shù)平臺和數據源內。但我們仍繼續使用與以往相同的集中式模型來(lái)解決這一日趨嚴重的分布式問(wèn)題。當用戶(hù)能夠通過(guò)常見(jiàn)的界面外觀(guān)穩定地訪(fǎng)問(wèn)數據時(shí),這些集中式模型能夠發(fā)揮很大的作用,這在社交媒體、數字化零售等行業(yè)新的成功案例中屢見(jiàn)不鮮。但集中式模型卻無(wú)法解決銀行、保險、醫療行業(yè)及其它廣泛的業(yè)務(wù)問(wèn)題。






  Standish梅隆資產(chǎn)管理公司近期更新大型數據項目成功案例調研報告。更新內容顯示,2003至2012十年間人工成本至少達到1,000萬(wàn)美元的3,555個(gè)大型數據項目中,只有6.4%的項目順利完成。這正是企業(yè)未能高效管理分布式數據源及其相關(guān)技術(shù)所造成的后果。我們仍需運用大數據技術(shù)才能克服這些困難。




  目前,企業(yè)實(shí)現大數據價(jià)值需對多種不同數據及功能體系進(jìn)行數據整合及標準化規劃。如不改變現有數據管理機制,那么企業(yè)解決方案采用越多的分布式組件,項目回報率越低。




  大數據技術(shù)促進(jìn)深度分析及分析性能取得技術(shù)突破,其價(jià)值毋庸置疑。但這種價(jià)值卻被數據提取和/或整合成本破壞,導致價(jià)值/炒作的底線(xiàn)被輕易沖破。目前,市場(chǎng)在數據價(jià)值上多少存在一些分歧,其中一部分行業(yè)尚處于初創(chuàng )時(shí)期,可保持技術(shù)一致性,因此,這些行業(yè)可以暫時(shí)解決分布式數據的問(wèn)題。




  由于技術(shù)孤島仍將持續存在,且數據仍保存在不同的位置,Gartner公司分析師Doug Laney預計到2017年,90%的大數據項目仍無(wú)法發(fā)揮它們的作用。Doug最近總結到,雖然數據復雜性、企業(yè)內外部數據的分布和離散度不斷提升,但也不會(huì )因為大數據技術(shù)作出的各種承諾而承認系統及數據大規模整合項目的合理性,它們只是大數據價(jià)值的體現。




  我們只有意識到大數據技術(shù)雖已占有一席之地,但仍受到分布式數據源的直接影響,才能盡早通過(guò)真正具有成本效益的途徑,根據數據復雜度和分布情況,充分利用數據價(jià)值。




  大多數企業(yè)可靈活使用雙重數據策略:運用大數據技術(shù)對大量同類(lèi)數據進(jìn)行深入分析及機會(huì )辨別;或運用分布式數據應對運營(yíng)、風(fēng)險、管理等復雜但已為人所了解的挑戰。人們將能夠接受這種雙重數據管理策略,充分發(fā)現、挖掘并管理大數據技術(shù)的價(jià)值,并在行業(yè)內實(shí)現不斷靈活創(chuàng )新。