대량의 데이터를 처리하거나 사용할 때 "데이터 거버넌스" 라는 단어는 사용자에게 친숙할 것입니다. 데이터 거버넌스에 대해 어떻게 생각하십니까? 데이터 거버넌스가 적합합니까? 어떻게 실시할 것인가. 간단히 말해, 데이터 거버넌스는 데이터 수집, 검증, 저장, 액세스, 보호 및 사용 방법과 같은 데이터 처리 전략입니다. 데이터 거버넌스에는 누가 데이터를 보고, 사용하고, 즐길 것인지도 포함됩니다.
빅 데이터 시대가 진행됨에 따라 이러한 문제가 점점 더 두드러지고 있으며 점점 더 많은 기업들이 비즈니스 목표를 달성하기 위해 데이터 수집, 관리, 저장 및 분석에 의존하고 있습니다. 데이터는 이미 기업의 영리 도구, 상업 매체, 영업 비밀이 되었다. 데이터 유출은 법적 분쟁으로 이어져 소비자들이 회사의 핵심 업무에 대한 신뢰를 잃게 할 수 있다.
모든 업무 부서가 스스로 데이터를 관리할 수 있도록 운이 좋다면, 효과적인 데이터 관리가 부족하고, 심지어 모든 부서가 스스로 할 수 있게 된다. (윌리엄 셰익스피어, 햄릿, 행운명언) 너는 모든 부서가 마음대로 제품을 생산, 저장, 판매하는 것을 상상할 수 없다. 데이터의 부적절한 사용은 재고 사용과 마찬가지로 기업에 큰 손실을 초래할 수 있다. 따라서 필요한 데이터의 유효성, 보안 및 가용성을 보장하는 측정을 해야 합니다. 이것이 바로' 데이터 거버넌스' 입니다.
데이터 거버넌스 정책에는 전체 데이터 수명주기가 포함되어야 합니다. 정책에는 데이터 수집, 정리 및 관리가 포함되어야 합니다. 이 수명주기 동안 데이터 거버넌스는 다음 사항에 초점을 맞춰야 합니다.
데이터는 어디에서 왔으며 어떻게 왔습니까?
이것은 데이터 수명주기의 시작입니다. 데이터의 출처는 데이터 거버넌스 전략의 기초를 결정합니다. 예를 들어 데이터 세트의 크기는 데이터 소스에 의해 결정됩니다. 대상 시장, 기존 사용자 및 소셜 미디어에서 데이터를 수집합니까? 아니면 제 3 자를 사용하여 데이터를 수집하거나 수집한 데이터를 분석합니까? 입력 데이터 스트림이란 무엇입니까? 데이터 거버넌스는 이러한 문제에 초점을 맞추고 데이터 수집을 관리하는 정책을 수립해야 하며, 제 3 자가 수집한 데이터를 처리하거나 수집한 데이터를 분석하고 데이터의 경로와 수명주기를 제어할 수 있도록 지시해야 합니다.
데이터 검사
일반적으로 데이터 소스는 매우 크고 다양합니다. 이는 데이터 관리자에게 골치 아픈 문제입니다. 데이터 소음과 중요한 데이터를 구분하는 것은 시작에 불과합니다. 만약 당신이 관련 회사에서 데이터를 수집한다면, 당신은 반드시 데이터가 믿을 만하다는 것을 확보해야 합니다. 수만, 수십만, 수백만 개의 복잡한 관계형 데이터의 경우 Excel 을 통해 수동으로 데이터를 정리하는 것은 비현실적입니다. 대량 조회, 교체, 수정, 풍부하고 복잡한 관계형 데이터를 저장하려면 전문적인 데이터 정리 도구 또는 시스템이 필요합니다. 메타데이터, 마스터 데이터, 트랜잭션 데이터, 참조 데이터 및 데이터 표준을 데이터 정리 도구 또는 시스템에 내장하여 조직 아키텍처, 컨텐츠 제어, 프로세스 제어 등의 관리 메커니즘 및 기술 표준을 결합하여 데이터 관리자의 생산성을 높입니다. 예를 들어, 프로그램에서 수집한 메타데이터를 수동으로 작성해야 합니다. 시스템이 자동으로 가져옵니다. 수동으로 식별하거나 코드를 작성하여 데이터 품질을 검사해야 합니다. 시스템은 자동으로 문제를 식별하는 데 도움이 됩니다. 문서 관리 데이터 사전을 사용하면 시스템이 온라인 관리를 도와줍니다. 이 시스템은 e-메일 및 오프라인 프로세스를 기반으로 온라인 자동화를 지원합니다. 물론, 시스템도 만병 통치약이 아니며, 데이터 거버넌스의 소프트웨어 도구도 다른 소프트웨어 도구와 마찬가지로 마법이 없다. 데이터 거버넌스 인력의 참여와 데이터 거버넌스 추진 없이는 소프트웨어가 아무리 완벽해도 데이터 거버넌스의 전 과정을 완료할 수 없습니다. 이것이 데이터 거버넌스 컨설팅 서비스가 시장을 확보하고 있는 이유이기도 하며, 국내 대부분의 순수 데이터 거버넌스 소프트웨어 프로젝트가 원하는 목표를 달성하지 못한 이유이기도 합니다.
데이터 거버넌스는 스토리지 문제를 해결해야 합니다
데이터 저장소는 데이터 세트의 크기와 밀접한 관련이 있습니다. 큰 데이터의 스토리지는 안전한 중복 시스템에 있어야 합니다. 분류 시스템은 일반적으로 사용 빈도에 따라 데이터를 저장하는 데 사용됩니다. 이러한 방식으로 값비싼 온라인 시스템은 자주 요청되는 데이터를 제공하고, 자주 요청되지 않는 데이터는 더 저렴하고 사용할 수 있는 시스템에 저장됩니다. 물론 요청 빈도가 낮은 민감한 데이터를 보안이 낮은 시스템에 저장하면 위험도 크게 높아집니다. 따라서 데이터 스토리지 시나리오를 개발할 때 좋은 데이터 거버넌스 전략은 모든 측면을 고려해야 합니다.
데이터 거버넌스는 액세스 관리 시스템을 구축하여 요구 사항과 보안 간의 균형을 찾아야 합니다.
해당 권한에 포함된 데이터에만 액세스하는 방문자의 권한을 명시적으로 지정합니다. 법적 요청만 데이터에 액세스할 수 있으며 민감한 데이터는 더 높은 권한과 더 엄격한 검증이 필요합니다. 특정 보안 수준의 사용자에게만 개방됩니다. 사용자 및 데이터 자체에 대한 액세스 수준을 설정해야 합니다. 계정을 관리할 때 인적 자원 및 조달 부서와의 긴밀한 상호 작용이 중요합니다. 회사를 떠난 직원과 협력을 중지한 공급업체는 더 이상 적시에 액세스할 수 없기 때문입니다. 이러한 세부 사항을 처리하고 데이터 소유권과 책임이 전체 데이터 거버넌스 전략의 일부인지 확인합니다.
데이터 사용/* * * 즐거움/분석
데이터 사용 방법은 데이터 거버넌스 이후의 중요한 부분입니다. 데이터는 고객 관리, 고객 경험 향상, 대상 광고 배치, 사용자 애플리케이션 시스템 초기화 기본 데이터 작업, 보조 애플리케이션 시스템 구축, 계열사에 시장 분석 및 데이터 제공 등에 사용될 수 있습니다. 데이터가 순전히 내부 목적으로 사용되어야 하기 때문에 즐기거나 마케팅하는 데 사용할 수 있는 데이터를 신중하게 정의하고 공격과 유출로부터 보호해야 합니다. 데이터를 수집하는 모든 기업이 데이터 보안 및 보증 규정을 준수한다는 사실을 사용자에게 알립니다. 데이터의 합리적인 규정 준수를 보장하는 것도 데이터 거버넌스의 중요한 부분입니다.
데이터 보안 계획의 필수 구성 요소는 수집, 검증, 저장, 액세스 및 사용입니다.
수집, 검증, 저장, 액세스 및 사용은 모두 데이터 보안 계획의 필수적인 부분이며 이러한 및 기타 보안 문제를 해결하기 위한 포괄적인 정책이 있어야 합니다. 데이터 보안 계획은 효과적이고 가용성이 높아야 하지만 데이터 수명 주기의 모든 부분은 공격과 부주의로 인한 손상에 취약합니다. 액세스 제어, 정적 데이터, 데이터 처리, 데이터 전송 후 암호화 등 데이터 거버넌스에서 데이터 보안 체계를 결정해야 합니다.
관리/메타데이터
관리되지 않는 데이터 수명주기는 불완전합니다. 예를 들어 메타데이터는 식별 및 검색을 위해 데이터 세그먼트에 적용됩니다. 메타데이터에는 데이터 출처, 수집 또는 생성 날짜, 정보 액세스 수준, 의미 분류 및 기업에 필요한 기타 정보가 포함됩니다. 데이터 거버넌스는 메타데이터 용어집을 만들고 데이터의 유효 기간을 정의합니다. 데이터도 만료되며, 만료된 후에는 과거 데이터의 분석에만 사용할 수 있습니다.
데이터 거버넌스 구축 과정에서 기업 내부에 약간의 저항이 있을 수 있습니다. 예를 들어, 데이터에 대한 액세스를 잃을까 봐 두려워하는 사람들도 있고, 경쟁 업체와 데이터를 공유하고 싶지 않은 사람들도 있습니다. 데이터 거버넌스 정책은 이러한 문제를 해결하고 모든 당사자가 받아들일 수 있도록 해야 합니다. 고립된 데이터 환경에 익숙한 기업은 새로운 데이터 거버넌스 정책에 적응하기가 어려울 것입니다. 그러나 오늘날 대규모 데이터 세트에 대한 의존도와 그에 따른 보안 문제로 인해 전사적 데이터 정책을 만들고 구현하는 것이 불가피합니다.
데이터는 점점 더 기업 인프라의 일부가 되고 있으며, 결정은 여러 가지 구체적인 상황을 단계적으로 처리하는 과정에서 형성된다. 그것은 일회성, 보통 특정 질문에 답하기 위해서이다. 따라서 기업이 데이터를 처리하는 방식은 부서가 다르거나 부서 내부의 상황이 다르기 때문에 달라진다. 각 부서마다 합리적인 데이터 처리 방안이 있지만, 이러한 방안들은 서로 충돌할 수 있으며, 기업들은 이를 조율할 방법을 강구해야 한다. (윌리엄 셰익스피어, 윈스턴, 데이터 처리, 데이터 처리, 데이터 처리, 데이터 처리, 데이터 처리) 데이터 스토리지의 요구 사항과 요구 사항을 파악하기가 어렵습니다. 잘못하면 마케팅과 고객 보유에 대한 데이터 잠재력을 발휘할 수 없고, 데이터가 유출될 경우 법적 책임을 져야 한다.
또한 대기업에서는 각 부서가 데이터 자원을 놓고 경쟁하고, 각 부서는 자신의 업무 상황에만 초점을 맞추고, 글로벌 관념이 부족하며, 조정을 하지 않으면 타협을 이루기 어렵다.
따라서 기업은 기존 데이터 정책을 시행하고, 충족되지 않은 요구 사항과 잠재적인 보안 문제를 파악하고, 데이터 수집, 관리, 저장, 액세스 및 사용 정책을 규제하는 데이터 거버넌스 정책을 수립해야 하며, 각 부서와 직책의 다양한 요구 사항도 고려해야 합니다. 부서 간 충돌 요구 사항 균형 조정, 보안 및 액세스 요구 사항 조정, 가장 효율적이고 안전한 데이터 관리 정책 보장.
데이터 거버넌스 위원회 설립
모든 데이터 사용자의 요구를 평가하고 내부 사용자, 외부 사용자 및 법적 요구 사항을 충족하는 회사 전체 데이터 관리 정책을 수립합니다. 위원회 구성원은 모든 업무 영역의 이해 관계자를 포함하여 모든 당사자의 요구가 잘 충족되고 모든 유형의 데이터 소유권이 반영되도록 해야 합니다. 위원회도 데이터 보안 전문가가 필요하며 데이터 보안도 중요한 부분입니다. 데이터 거버넌스 위원회의 목표를 이해하는 것이 중요합니다. 따라서 기업이 데이터 거버넌스 전략을 필요로 하는 이유를 고려하고 명확하게 설명해야 합니다.
데이터 거버넌스 프레임워크 개발
이 프레임워크는 기업의 내부, 외부, 심지어 법적 데이터 수요를 포함해야 한다. 프레임워크의 각 부분은 수집, 정리, 저장, 검색 및 보안 요구 사항을 충족하기 위해 하나로 통합되어야 합니다. 이를 위해 기업은 모든 요구 사항과 필요한 작업을 충족하는 프레임워크를 설계하기 위해 완벽한 데이터 정책을 명확하게 설명해야 합니다.
계획적으로 각 부분을 결합하고 서로 지원하는 것은 매우 안전한 환경에서 검색 요구 사항을 수행하는 것과 같은 여러 가지 장점이 있습니다. 규정 준수는 규제 문제를 추적하고 보고할 수 있도록 특별히 프레임워크의 일부로 설계되어야 합니다. 이 프레임워크에는 일상적인 기록 및 기타 보안 조치도 포함되어 있어 공격에 대한 조기 경보를 제공할 수 있습니다. 데이터를 사용하기 전에 데이터 유효성 검사도 프레임워크의 일부입니다. 데이터 거버넌스 위원회는 프레임워크의 각 부분을 이해하고, 그 목적과 데이터 수명주기 전반에 걸쳐 어떻게 작용하는지 명확히 해야 합니다.
데이터 테스트 정책
일반적으로 데이터 정책은 소규모 비즈니스 환경에서 테스트되고, 프레임, 구조 및 계획에 대한 데이터 정책의 결함을 파악하고, 정식 사용을 위해 조정되어야 합니다.
데이터 거버넌스 전략은 시대에 발 맞춰야합니다.
데이터 거버넌스 정책이 새로운 비즈니스 영역으로 확장됨에 따라 정책 조정이 절대적으로 필요합니다. 또한 기술이 발전함에 따라 데이터 정책도 보안 상황, 데이터 분석 방법 및 데이터 관리 도구의 발전에 따라 발전해야 합니다.
성공적인 데이터 정책이 무엇인지 확인하십시오.
우리는 진행 상황을 측정하기 위해 데이터 거버넌스의 성공을 측정하는 명확한 기준을 세워야 한다. 데이터 관리 목표를 설정하면 성공의 중요한 지표를 파악하는 데 도움이 되며, 이를 통해 데이터 거버넌스 전략의 방향이 기업의 요구를 충족시킬 수 있습니다.
대기업이 크든 작든 데이터 사용과 관련하여 유사한 데이터 과제에 직면해 있습니다. 기업이 클수록 데이터가 많아지고 데이터가 많을수록 효과적이고 공식적인 데이터 거버넌스 전략을 개발해야 합니다. 소규모 기업은 비공식적인 데이터 거버넌스 정책만 필요할 수 있지만, 규모가 작고 데이터 의존도가 낮은 기업에만 국한됩니다. 비공식적인 데이터 거버넌스 프로그램도 데이터 사용자와 직원의 수집, 검증, 액세스 및 저장을 최대한 고려해야 합니다.
기업 규모가 커지고 데이터 수요가 여러 부서에 걸쳐 있을 때, 데이터 시스템과 데이터 세트가 너무 커서 통제할 수 없을 때, 비즈니스 발전에 엔터프라이즈급 정책이 필요하거나 법률 또는 규정 요구 사항이 제기될 때 보다 공식적인 데이터 거버넌스 정책을 개발해야 합니다.