導讀:隨著更多數字化轉型的完成、物聯網 (IoT) 的不斷擴展以及我們的數字足跡不斷擴大,云數據庫、數據倉庫、數據湖、數據湖房屋和數據海洋正在增長。企業將需要在數據治理方面進行更多投資以應對這種增長。
01 企業數據治理與數字化轉型
永遠不要將數據質量視為理所當然,這一點一直很重要,但在大流行期間尤其如此。執行緊急響應、分發醫療數據或幫助恢復工作的組織密切關注這一重要性,但每個組織都需要信任其數據才能有效。
數據不足的成本體現在很多方面,包括員工每天花在尋找數據而不是使用數據上的時間。知識工作者可以將一半的時間用于尋找數據、發現和糾正錯誤,以及嘗試確認他們不信任的數據。最明顯的影響是在底線。Gartner 的一項研究發現,糟糕的數據質量使組織每年平均損失 1500 萬美元。
為了信任他們的數據,組織需要知道收集數據的地點和頻率。信息管理解決方案可以自動將元數據添加到信息中,為其提供關鍵上下文,從而使組織對其所有數據充滿信心。
2、數據需要上下文才是有價值的
沒有上下文的數據只是隨機信息,無法提供有價值的見解。在大流行的早期,互聯網上充斥著比較不同國家(例如美國和意大利)的感染率的帖子,這些帖子以原始數字為依據,而沒有諸如人口年齡、感染率等背景信息。醫療保健或疾病傳播了多長時間。沒有上下文,這些數字根本沒有任何實際價值。
數據上下文是必不可少的,遠遠超出了簡單的儀表板可視化。了解數據背后的內容也很重要。例如,商業提案可能主要依賴于現有協議和最近的通信,但與提案相關的過去協議或通信,即使它們涉及另一家公司,也可以為決策制定提供信息。
上下文不僅可以添加相關信息,還可以過濾掉可能影響決策的無關的、不重要的噪音。例如,使用由人工智能驅動的高級分析的信息管理平臺可以快速定位相關信息,將數據置于清晰的上下文中,無論手頭的問題涉及合同、合規性、記錄管理、數據治理還是生命周期管理。沒有上下文,數據驅動的決策就不會有效。
3、數據驅動型企業在危機中茁壯成長
無論以何種方式衡量,企業和其他組織都在使用他們的數據。但對許多人來說,發展真正的數據驅動文化已被證明是一個難以實現的目標。面向數據的文化涉及相互信任和以數據為中心的流程,重點關注協作、敏捷軟件開發和部署以及數據的質量和安全性。
具有這種文化的組織已經具備了平穩運行所需的組件。對于其他人來說,他們可以采取具體步驟來創建面向數據的文化,例如實施數據治理,這可以管理組織數據的可用性、完整性和安全性,以及控制對數據的訪問。
以數據為導向的組織將使數據成為所有決策的一部分,這要求數據準確、最新并且可供需要它的每個人使用。它可以幫助組織在危機出現時快速響應并應對隨之而來的任何新數據挑戰。
在新冠疫情出現之前,許多組織已經開始向基于數據的數字化流程轉變,但大流行加速了這些轉變,并在此過程中使數據變得更有價值。展望未來,組織需要實施信息管理實踐,以確保其數據的可用性、質量、完整性、安全性和可共享性。他們的未來將取決于此。
隨著云數據量的不斷增長,企業必須應對保護所有這些數據的挑戰。保護數據的最大問題是誰應該擁有云數據治理,以及哪個人應該負責/負責保護數據。讓我們探索潛在的替代方案。
1、安全團隊
CISO 和安全團隊通常擁有最多的預算和最精通技術的員工。他們熟悉云環境,并且已經被授權防止外人侵入企業基礎設施并檢測/防止敏感數據離開企業。當然,他們應該擁有數據保護,對吧?
雖然安全團隊擅長保護云基礎設施和數據存儲,但他們通常缺乏保護特定數據集或數據字段所需的基本要素:上下文。他們不知道給定字段(隨機命名為“SSX_246”)是否包含敏感數據,或者是否應該將其與其他字段一起存儲在給定表中。他們根本沒有時間跟上每個新的云數據存儲來了解添加到這些云數據存儲中的每個新字段的上下文。因此,CISO 和安全團隊無法單獨保護云數據。
2、數據團隊
因此,如果安全團隊沒有足夠的上下文來保護數據,那么數據團隊肯定應該有足夠的上下文嗎?數據團隊是否應該擁有數據保護?
在大多數組織中,數據團隊負責管理數據集,并負責整個企業的數據可用性、質量和可發現性。數據團隊負責維護數據字典。在某些組織中,數據團隊負責決定哪些員工應該/不應該訪問特定的數據集。
數據團隊當然知道他們數據集的細節。但數據團隊通常不知道組織需要遵守哪些法規和第三方數據處理協議。數據團隊也沒有技術資源來實時或近乎實時地了解誰在訪問數據,他們如何使用數據,數據使用是否表明存在違規或受損憑據,以及要遵循哪個劇本來糾正潛在的違規行為。
換句話說,數據團隊知道數據,但他們不知道法規和安全性。
3、隱私與合規團隊
隱私與合規團隊還擔心保護數據。他們有責任及時了解適用于其組織收集的數據的所有法規。隱私與合規團隊通常負責確保客戶審查并同意組織的隱私政策,并確保組織以準確、及時的方式處理數據編輯、刪除和披露等數據主體請求 (DSR)。隱私與合規團隊還知道必須如何保護數據以保持與第三方 DPA 的合規性。
但是隱私與合規團隊沒有足夠的數據和訪問控制背景。因此,他們依賴于耗時且不準確的手動、定期審計和自我證明。他們依靠數據團隊提供敏感數據審計,并要求安全團隊進行數據基礎設施審計和訪問控制審計。
4、需要良好的基礎設施
在當今的云優先環境中,沒有一個團隊有足夠的上下文來保護端到端的數據。數據治理基本上是跨職能的;真正需要一個跨職能的村莊來有效地管理數據。
安全、合規、隱私和數據團隊需要共同努力,以云規模和云速度保護和管理數據。他們需要定義流程并創建系統
由于數據治理本質上是跨職能的,因此很難實現良好的數據治理。古語有云:“人人有責,無人有責”。由于模糊的所有權和責任制,太多的事情發生在裂縫之間。
5、一個跨職能的治理“村莊”
組織必須通過為跨職能村莊創建基礎設施來正面解決這種模糊性。他們需要定義流程并投資于為跨職能團隊成員提供相同統一上下文的系統,以更好地管理數據并幫助他們無縫協作。
數據治理需要一個村莊。偉大的數據治理需要流程和系統。通過定義明確的跨職能流程和自動化系統,您的村民可以避免手動、耗時的任務和功能孤島,您可以實現出色的數據治理。
成功的企業依靠數據蓬勃發展。但是當數據太多時會發生什么?太多的組織正淹沒在他們從傳感器和設備創建、收集和接收的信息的海量數據中。
過多的數據最終會擾亂運營,使其難以實現真正的價值,并帶來風險和高成本。
曾經只有數據架構師和數據庫管理員單獨負責管理數據,現在是每個人的事。數據管理現在由每個工作日生成、共享、使用和存儲大量數據的任何業務專業人員共享。
您如何幫助您的員工認識到需要進行適當的數據管理以保護關鍵數據不丟失或被盜?他們如何知道有價值數據和多余數據之間的區別?當數據穿越多個部門、設備和人員時,他們如何理解數據的整個生命周期?
答案在于理解和實踐智能數據管理的能力。如果您的組織難以在海量數據中維持生計,這里有六個步驟可幫助您的員工學習如何管理數據并提取關鍵見解以幫助您的業務發展。
1、知道數據在哪里以及如何查找數據
我們大多數人都知道如何在我們的應用程序和共享文件系統(如 DropBox 或其他基于云的存儲服務)中查找數據。但通常,這些數據是部落數據,僅限于我們的角色或部門。據 IDC 稱,對于一個組織中的每 1,000 人,每年平均有 570 萬美元的勞動力成本被浪費在搜索而不是查找數據上。
數據評估有助于將可見性擴展到我們的主要角色和組之外,以發現有多少數據處于動態和靜止狀態。該評估提供了一項數據調查,有助于突出其價值,降低丟失或被盜的風險,并幫助估計任何相關項目的成本、階段和及時性。
評估從發現整個組織的數據庫和非結構化數據孤島的主要存儲資源開始。主存儲可以存在于本地服務器、DAS/NAS/SAN 資源、基于云的數據倉庫和數據湖中。
非結構化數據可以存在于端點中,例如設備、共享驅動器、電子郵件服務器、文件、電子郵件、聊天和應用程序數據。在一些企業規模的組織中,多達 80% 的數據是非結構化的,可以位于數據庫之外,并且永遠不會被分析。
2、識別您的數據
清楚地了解數據所在的位置后,您需要確定您管理的數據類型。您的一些數據可以由您的數據庫識別。但最重要的發現是在非結構化數據池中發現的。
智能數據管理需要對整個企業的數據進行快速有效的分類和識別。您需要使用元數據標記數據源和元素,以提供有關如何組織和處理每個數據的上下文。通過使用元數據標簽對數據進行索引,您將識別每個數據的網絡地址、地理位置和基本特征,例如文件名、時間戳、類型和大小。
3、實踐基本數據質量
一旦你知道你的數據,你就可以開始清理它了。數據質量實踐有助于減少導致不必要成本、流程摩擦和風險的數據蔓延。這通常從搜索您的數據資產開始,以識別重復文件和孤立數據。
然后,您可以創建將目標分配給復雜搜索的數據質量策略。例如,一種策略可能是清除垃圾文件或刪除重復文件。該策略可以生成有限的數據列表,沒有人為錯誤和非常需要的標準,以實現進一步的行動。
4、保護您的數據生態系統
您的數據安全問題可能圍繞著遵守行業法規和網絡安全威脅。智能數據管理實踐可以涵蓋兩者。
強大的安全事件監控和授權、身份和訪問控制是保護企業數據的良好起點。但這些工具還應迅速告知數據利益相關者即將到來的威脅、潛在或引入的數據漏洞以及潛在的隱私或合規性問題。
確定何時以及如何安全地鎖定或丟棄數據。合規性和安全性問題應共享本地、云中或通過服務的數據的決策工作流。這些決定應涵蓋需要保留哪些數據,無論是開展業務所必需的還是滿足公司合規要求的數據。
5、優化您的數據
大多數組織利用各種應用程序來移動和存儲數據。例如,他們的庫存可能包括基于云的存儲庫、基于 SaaS 的生產力應用程序、流數據服務或備份和恢復工具。
智能數據管理應該完全索引這些來源和目的地中的數據,以改進優化,而不是撕掉和替換任何必要的工具。
6、利用您的數據
通常,過多的數據會導致更高的成本和更大的風險。但我們也知道,數據對于企業組織的生存和發展至關重要。為了保持這種平衡,您必須從數據中提取最大價值,無論是用于提高員工的工作效率、提高我們的戰略洞察力以做出更好的決策,還是提供更新的學習型客戶服務。
這要求您將數據與組織最關鍵的用例對齊,然后繼續優化其他基本流程。例如,一家制藥研究公司可能會優先考慮機器學習,而一家財產保險公司可能會傾向于改進事件管理和索賠解決方案。
優化您的數據,以確保對搜索和應用程序查詢的高性能響應,滿足員工和客戶在每個用例中的需求,并實現更高的投資回報率。
然后,您就可以清楚地設置復制、移動、歸檔、檢索和刪除數據的策略,這對這些工作負載更具適應性和響應性。
智能數據管理可以幫助您獲得更大的投資回報率,并與組織中的所有利益相關者進行社交和分享見解。有了真正的可見性和知識,每個人都可以更好地了解他們每天與之交互的數據的性質。
來源:談數據