大數據是炙手可熱的IT大生詞,與大數據有關的Hadoop和HBase等技術也在高速成長,分析師們忙于測試各種大數據新技術和方法;商業(yè)領袖則紛紛調整業(yè)務模型,汲取更多大數據的能量。麥肯錫公司稱大數據為“商務新戰(zhàn)線”,認為大數據對商務轉型的影響力堪比過去15年的互聯網。
為了在這種趨勢中占據優(yōu)勢,商業(yè)領袖需要了解最大化挖掘數據價值的關鍵步驟。大數據驅動的商業(yè)成功不僅僅意味著選擇正確的云計算技術或招募優(yōu)秀的數據科學家,還意味著需要創(chuàng)建一套新的業(yè)務為中心的方法,將企業(yè)數據與業(yè)務策略連接起來,實現持續(xù)改進,最終達成與流程、利潤空間和客戶滿意度等有關的核心目標。
根據本人在大數據領域的經驗,總結出來商業(yè)領袖成功實施大數據項目的七大步驟:
一、制定數據策略
你需要一個強有力的數據策略,能夠連接和支撐你的業(yè)務策略,同時又能夠與部門級職責掛鉤。制定一個由很多分段目標構成的計劃,標明你每個階段要實現的數據能力目標,以及這些能力將如何被使用。這實際上相當于某種“消費預期管理”,讓企業(yè)各部門對大數據實施不同階段的數據能力有個正確的預期,同時知道他們的職責、目標和需要實現的業(yè)務成效。好的數據策略能夠將你和部門的目標統(tǒng)一在整體業(yè)務策略之下。
二、面向靈活性的設計
大數據系統(tǒng)非常龐雜,這意味著靈活性會差。例如一個好的BI系統(tǒng)會幫助企業(yè)轉型,但反過來也會要求BI系統(tǒng)做出改變。這就需要你的系統(tǒng)能夠快速適應業(yè)務的發(fā)展速度。部分組件的發(fā)布周期需要12-18個月是可以接受的,但是其余組件的周期最好控制在3-6個月。仔細分析大數據系統(tǒng)的每個組件,保證設計有足夠的靈活性。
三、了解延遲
延遲是傳統(tǒng)BI系統(tǒng)的挑戰(zhàn),大數據將這個問題進一步放大了。大數據解決方案通常采取批處理架構,降低延遲的工作往往放在后面。你必須做出改變,一開始就有限考慮延遲問題。分析大數據系統(tǒng)的幾個關鍵應用場景對延遲的要求,將這些與業(yè)務驅動力放在一起考量。確保為每種需求匹配合適的延遲,讓這些需求來決定你的設計!有些低延遲需求甚至可能需要你采取臨時繞過大數據系統(tǒng)的方式來滿足。
四、在數據質量和元數據上投資
數據質量是所有系統(tǒng)為之奮斗的目標,大數據系統(tǒng)也不例外。而且大數據系統(tǒng)需要更多的自動化和高級計劃。你必須一開始就確保數據質量被作為基礎性的重要工作對待,能獲得足夠的數據源和管理支持。其次,內建多重防線,從主數據管理(例如創(chuàng)建客戶帳號)到數據采集(客戶互動記錄)到元數據(數據組織分類以便用于將來的報告和分析)。第三,將數據質量評定和提升流程和數據質量測量與報告這兩個流程都實現自動化。為你的數據質量團隊提供必要的工作流工具,以及能夠進行大規(guī)模數據分析的工具。
五、善于建立原型
大多數大數據系統(tǒng)的數據量驚人,測試階段沒必要調用全部數據,通?梢圆扇〗⑿∫(guī)模原型進行測試,尤其是當你建立復雜的數據集成、在線算法或用戶界面的時候,建立原型不但能夠以較小的代價測試,還能盡快與你的用戶分享,讓他們在驚喜之余提供寶貴意見。
六、善于采樣
如果操作得法,數據采樣能節(jié)省你大量的時間。正確的采樣需要做三家是:首先建立標準樣本數據集,定期更新,這樣可以幫你的分析師省去大量的回答業(yè)務人員問題的時間。第二,確保團隊里有至少一位高手(例如一位統(tǒng)計師),能夠確保數據采樣的正確性和采樣結果的合理使用。最后,需要教育決策者了解數據采樣的價值和局限性,這樣他們就能接受在采樣數據的基礎上做決策。正確的數據采樣不但提高了生產力,還能提供不打折扣的商業(yè)價值。
七、經常獲取反饋
無論從數據管理還是驅動商業(yè)價值的角度看,大數據都是一個學習型流程。你需要經常調查用戶評估進度?捎眯浴祿|量以及數據延遲等情況都需要從用戶那里獲得反饋。定期的反饋能確保你的大數據系統(tǒng)與業(yè)務決策緊密整合,從而在業(yè)務改進中發(fā)揮關鍵作用。
遵循以上七大步驟將有助于您獲得有效的大數據能力,節(jié)省時間和金錢,為企業(yè)帶來最大化的投資回報。
企業(yè)信息咨詢