基于機器學習的數據脫敏系統研究與設計
3 脫敏任務配置
在完成脫敏策略制定后,為使脫敏任務能夠長時間工作,首先需在脫敏系統中對源數據所在業務系統的地址及端口號進行注冊[14]。然后,獲取已制定的脫敏策略,脫敏系統按照選擇的脫敏算法及相關參數生成脫敏代碼。用戶根據應用場景選擇脫敏實現方式,對于靜態脫敏,系統先執行脫敏操作,并將脫敏結果緩存在本地存儲,待目標系統需要獲取脫敏數據時,用戶在脫敏系統中注冊目標系統的地址及端口,最后將本地脫敏數據傳輸至目標系統。而對于動態脫敏,用戶必須先在脫敏系統中注冊目標系統地址、端口以及目標系統使用賬號,然后將脫敏代碼下發至代理服務器,由代理服務器進行在線數據脫敏,并將脫敏結果返回至脫敏系統,最后傳輸至目標系統,由目標系統中的數據需求方的賬號使用。脫敏任務配置流程如
圖4 脫敏任務配置流程Fig.4 Configuration flow chart of data masking task
4 應用驗證
本文以營銷業務應用系統數據庫中的實收電費信息表為例[15],分析人員希望通過分析某一用電用戶的欠費歷史,對該用戶的用電行為進行評估。實收電費信息表中涉及的用戶用電欠費信息和繳費信息均為敏感信息,因此在使用數據表進行分析之前,應對其進行脫敏處理。
在明確敏感信息后,脫敏實現的關鍵點為脫敏算法的選擇。脫敏算法選擇決策樹如
圖5 脫敏算法選擇決策樹Fig.5 Decision tree for masking algorithm selection
欠費信息是統計分析的對象,數據應具有可用性和真實性。同時,由于是分析某一用戶,因此用戶編號字段和欠費信息間的對應關系不能被破壞,數據需要具有關聯性,而時效性、可重現和可配置3個因素在這里則無關緊要。因此,綜合考慮因素分析,系統用戶可按照
在系統用戶完成靜態脫敏任務配置后,脫敏系統可按照選擇的脫敏策略對實收電費信息表進行脫敏,待分析人員的目標地址及端口在脫敏系統中注冊后,即可將脫敏表從本地緩存傳給用于分析的目標系統。
5 結語
數據脫敏將成為大數據時代企業數據化運行維護的必要安全機制。本文從國家電網公司信息化建設實際情況出發,分析并提出了一種數據脫敏系統設計方法,探討利用機器學習方法使脫敏過程更加系統化、智能化、專業化,并結合實際應用場景驗證了脫敏策略制定功能。隨著未來對數據脫敏的進一步研究,脫敏系統將可實現更細粒度的訪問控制、更精確的需求理解能力、更強的擴展能力以及更友好的交互方式,從而滿足更多跨系統、跨專業、跨行業的數據交互、共享和融合需求。

責任編輯:售電衡衡
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市