IBM眼中的大數據治理:把雞蛋放在一個籃子里
提起數據治理,治理一詞的英文發音Governance與政府的英文發音相似,也使得數據治理涉及到眾多法律法規的問題。記者在采訪IBM杰出工程師、副總裁兼Guardium首席技術官Ron Ben Natan博士時,他認為具體
提起數據治理,“治理”一詞的英文發音“Governance”與“政府”的英文發音相似,也使得數據治理涉及到眾多法律法規的問題。記者在采訪IBM杰出工程師、副總裁兼Guardium首席技術官Ron Ben Natan博士時,他認為具體到大數據治理,比傳統結構化數據的治理更難,形象比喻就是:把雞蛋全都放在了一個籃子里。
這句話如何理解呢?Ron Ben Natan博士認為:“大數據治理的目的不光為了集中數據,更深層次的目的是要進行分析處理并為決策服務,但如果數據質量不高、錯誤數據比較多的話,其最大風險在于:基于大數據治理得出的分析結果是不是正確的,數據準確性會影響企業未來決策。”
IBM杰出工程師、副總裁兼Guardium首席技術官Ron Ben Natan
其實在大數據治理方面,IBM已經有了三年多的積累,在Ron Ben Natan看來,大數據治理并非在數據生成之后開始治理,而是從數據開始生成之時就開始考慮以大數據的方式治理。而且,數據質量和數據整個生命周期的管理是很重要的因素,大數據治理不是一蹴而就,涉及生命周期的全過程。
在以下幾個應用場景下,IBM都能夠提供相應的服務。一方面,IBM解決方案可以把企業多年沉淀的數據轉換成大數據環境下可以供數據集成和轉換的數據;另一方面,IBM擁有協助屏蔽某些數據(即數據漂白)的方案;此外,IBM可以協助企業保護只有特定用戶才能使用、特定應用程序和方法才能訪問的真實數據(即數據加密);最后,IBM已經對現有市場上流行的所有數據源都提供了保護方案。
從2011年到2013年,IBM開始積累并建立了大數據治理策略,未來IBM會繼續增加這一領域的投資,尤其是NoSQL環境治理的工具和方案。具體到NoSQL的開發,Ron Ben Natan認為其語法和使用方式非常容易幫助企業累積數據,可能在短短幾個月時間內就膨脹到極大數據量,這時候對數據治理的考驗更大。
就在采訪Ron Ben Natan之前,記者聆聽了牛津大學教授、大數據權威專家、《大數據時代》作者維克托·邁爾·舍恩伯格的主題演講,其中給人深刻印象的在于其概括的大數據三大特征:全體性,即過去那種隨機抽取數據進行分析的方式給不了這個時代真正的需求,大數據時代就要擁抱更多的數據;混雜性,意味著現今時代不過分追求數據的細節;相關性,即現今時代從因果性轉向相關性,不過分苛求“為什么”,而只去探求“是什么”。針對這些論斷,Ron Ben Natan只強調了一點:如果扔進去的是垃圾,那么出來的肯定也是垃圾。
身為IBM軟件集團大中華區信息管理軟件DSCO銷售總監,甘佳凌女士更了解國內客戶的需求。她告訴記者:“每一個客戶都在談大數據,他們在考慮如何利用不同的數據來源和非結構化來源找到可以讓企業獲利的模式,這是生意的考慮。”
那么大數據是現在的生意還是未來的生意呢?雖然大數據提及熱度非常高,但是如何真正有效利用海量的大數據來源,挖掘出可以提供給客戶的服務和盈利模式,這是大數據真正的挑戰。
針對大數據的特征,IBM為新型分析應用程序提供大數據平臺,能夠幫助用戶集成并管理不同種類、不同速率及不同流量的數據;將高級分析應用于信息并且不改變信息的原本格式;將所有可用信息可視化,供即席分析使用;為新型分析應用程序建立開發環境;優化工作負載并安排進度;確保安全和治理。
這句話如何理解呢?Ron Ben Natan博士認為:“大數據治理的目的不光為了集中數據,更深層次的目的是要進行分析處理并為決策服務,但如果數據質量不高、錯誤數據比較多的話,其最大風險在于:基于大數據治理得出的分析結果是不是正確的,數據準確性會影響企業未來決策。”
IBM杰出工程師、副總裁兼Guardium首席技術官Ron Ben Natan
其實在大數據治理方面,IBM已經有了三年多的積累,在Ron Ben Natan看來,大數據治理并非在數據生成之后開始治理,而是從數據開始生成之時就開始考慮以大數據的方式治理。而且,數據質量和數據整個生命周期的管理是很重要的因素,大數據治理不是一蹴而就,涉及生命周期的全過程。
在以下幾個應用場景下,IBM都能夠提供相應的服務。一方面,IBM解決方案可以把企業多年沉淀的數據轉換成大數據環境下可以供數據集成和轉換的數據;另一方面,IBM擁有協助屏蔽某些數據(即數據漂白)的方案;此外,IBM可以協助企業保護只有特定用戶才能使用、特定應用程序和方法才能訪問的真實數據(即數據加密);最后,IBM已經對現有市場上流行的所有數據源都提供了保護方案。
從2011年到2013年,IBM開始積累并建立了大數據治理策略,未來IBM會繼續增加這一領域的投資,尤其是NoSQL環境治理的工具和方案。具體到NoSQL的開發,Ron Ben Natan認為其語法和使用方式非常容易幫助企業累積數據,可能在短短幾個月時間內就膨脹到極大數據量,這時候對數據治理的考驗更大。
就在采訪Ron Ben Natan之前,記者聆聽了牛津大學教授、大數據權威專家、《大數據時代》作者維克托·邁爾·舍恩伯格的主題演講,其中給人深刻印象的在于其概括的大數據三大特征:全體性,即過去那種隨機抽取數據進行分析的方式給不了這個時代真正的需求,大數據時代就要擁抱更多的數據;混雜性,意味著現今時代不過分追求數據的細節;相關性,即現今時代從因果性轉向相關性,不過分苛求“為什么”,而只去探求“是什么”。針對這些論斷,Ron Ben Natan只強調了一點:如果扔進去的是垃圾,那么出來的肯定也是垃圾。
身為IBM軟件集團大中華區信息管理軟件DSCO銷售總監,甘佳凌女士更了解國內客戶的需求。她告訴記者:“每一個客戶都在談大數據,他們在考慮如何利用不同的數據來源和非結構化來源找到可以讓企業獲利的模式,這是生意的考慮。”
那么大數據是現在的生意還是未來的生意呢?雖然大數據提及熱度非常高,但是如何真正有效利用海量的大數據來源,挖掘出可以提供給客戶的服務和盈利模式,這是大數據真正的挑戰。
針對大數據的特征,IBM為新型分析應用程序提供大數據平臺,能夠幫助用戶集成并管理不同種類、不同速率及不同流量的數據;將高級分析應用于信息并且不改變信息的原本格式;將所有可用信息可視化,供即席分析使用;為新型分析應用程序建立開發環境;優化工作負載并安排進度;確保安全和治理。
責任編輯:何健
免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
-
曹志剛:我們期待風電成為中國的主力能源
2020-11-17風電,能源,主力能源 -
張鈞:未來配電網內涵特征與發展框架研究
2020-11-03配電網,智能配電網,智能配電網建設研討會 -
習近平:持續增強電力裝備、新能源等領域的全產業鏈優勢
2020-11-02電力裝備,新能源,通信設備
-
曹志剛:我們期待風電成為中國的主力能源
2020-11-17風電,能源,主力能源 -
張鈞:未來配電網內涵特征與發展框架研究
2020-11-03配電網,智能配電網,智能配電網建設研討會 -
杜祥琬:創新觀念,推動能源高質量發展
2020-09-28能源,創新,觀點
-
PPT丨王繼業:電力系統儲能發展與挑戰
2020-10-14儲能,電力儲能,儲能應用 -
奮斗姿態書寫人生底色 銀隆儲能“小哥哥”的職場進擊姿勢
2020-10-12銀隆新能源,儲能,新能源汽車 -
鄒驥:通過發展清潔能源 提高中國公信力
2020-06-28鄒驥,清潔能源,綠色低碳能源
-
習近平:持續增強電力裝備、新能源等領域的全產業鏈優勢
2020-11-02電力裝備,新能源,通信設備 -
重磅 | 發改委發文7月起電價降5%
2020-06-29國家發改委,企業,用電成本,電費 -
李克強:放寬配售電業務市場準入 推動建立市場決定能源價格機制
2019-10-12配售電業務市場準入