빅 데이터는 "클라우드" 에 살고 있습니다! 클라우드 컴퓨팅만이 큰 데이터를 자신의 궤적과 진정한 존재가치를 찾을 수 있습니다. 그러나 큰 데이터는 뿌리가 없는 구름이 아니라, 자신의 뿌리를 가지고 있고, 끊임없이 데이터를 전달하는 뿌리가 있다.
그렇다면 큰 데이터의 "뿌리" 는 어디에 있습니까? 최근 국무부는' 대데이터 발전 추진 행동 방안' (이하' 행동 방안') 을 발표해 답을 찾는 데 도움이 될 것으로 보인다.
행동 강령은 빅데이터 발전을 촉진하는 3 대 중점 임무와 10 대 공사를 분명히 제시했다. 세 가지 중점 작업 중 첫 번째는 정부 데이터 개방을 가속화하고 자원 통합을 촉진하는 것입니다. 상위 10 개 프로젝트의 상위 4 개 프로젝트는 정부 정보, 즉 * * * 액세스 정부 데이터 자원 프로젝트, 국가 빅 데이터 자원 전체 개발 프로젝트, 정부 거버넌스 빅 데이터 프로젝트, 공공 서비스 빅 데이터 프로젝트를 포함합니다. 3 대 중점 임무, 10 대 공사의 키워드는 모두 * * * 즐기고, 정부 데이터 공개는 핵심이라는 것을 쉽게 알 수 있다.
* * * 즐거움은 빅 데이터의 "루트" 입니다.
빅 데이터와 클라우드 컴퓨팅은 마치 신기한 금화의 앞면과 뒷면처럼 많은 사람들에게' 구름 속의 안개' 를 느끼게 하지만 금화의 빛을 실감할 수 있다.
큰 데이터란 무엇입니까? 위키피디아의 정의에 따르면 빅데이터는 감당할 수 있는 시간 범위 동안 일반 소프트웨어 도구에 의해 캡처, 관리 및 처리될 수 없는 데이터 모음입니다. 빅 데이터의 기본 특성은 매스, 다양성, 속도 및 가치, 즉 대용량 데이터 크기, 빠른 데이터 흐름 및 동적 데이터 시스템, 다양한 데이터 유형 및 거대한 데이터 가치로 요약 될 수 있습니다.
빅 데이터 시대' 의 저자인 빅토르 마이어 셰인버그가 제시한 설명은 이해하기 쉬울 것이다. 그는' 빅 데이터' 가 크거나 많은 데이터가 아니라 데이터 샘플의 일부가 아니라 한 현상에 대한 모든 데이터라고 생각한다. 예를 들어, 기업에 대한 데이터 정보에는 기업명, 법정 대표자, 등록 자본, 경영 범위 등의 기본 정보뿐만 아니라 재무 정보, 경영 정보, 대외 관계, 신용 상태 등의 정보도 포함됩니다. 대량의 다차원, 입체, 교차된 정보는 서로 다른 주체, 기업마다 서로 다른 요구에 따라 데이터 기반을 제공할 수 있습니다.
단일 또는 로컬 영역의 데이터와 해당 마이닝 처리를 작은 데이터로 보는 경우 한 학과에 대한 큰 데이터는 서로 연결되어 서로 얽혀 있는 수천 개의 작은 데이터로 구성됩니다. 작은 데이터의 완전한 융합은 큰 데이터 형성의 기초이다. 예를 들어, 물 한 방울은 다른 물방울과 섞여야만 물줄기를 형성할 수 있고, 강바다로 흘러들어와야 물의 가치를 발휘할 수 있다. (윌리엄 셰익스피어, 햄릿, 지혜명언) 이런 융합은 바로 * * * 즐거움이다. 작은 데이터의 즐거움 없이는 큰 데이터 성장의' 뿌리' 가 없다.
대량의 데이터에서 유용한 정보를 신속하게 분석하고 발굴하기 위해 단일 컴퓨터는 더 이상 감당할 수 없고, 클라우드 컴퓨팅, 분산 데이터, 클라우드 스토리지 및 가상화 기술에 의존하는 분산 처리가 필요합니다. 즉, 방대한 컴퓨팅 및 프로세서를 네트워크를 통해 수많은 작은 하위 프로그램으로 자동 분할한 다음 여러 서버로 구성된 방대한 시스템에 검색, 계산 및 분석을 수행하고 처리 결과를 사용자에게 반환합니다. 이것이 바로 큰 데이터에 의존하는 클라우드 컴퓨팅이다. 분명히, 데이터의 즐거움이 없고, 클라우드 컴퓨팅도' 쌀이 없는 밥 짓는 밥' 이다.
물론, 데이터의 사용 여부는 데이터의 개방성, 법적 경계, 데이터 가치의 실현과 관련된 많은 현실적인 장애물과 관련이 있습니다.
누가 데이터의 즐거움을 방해하는가?
우리가 빅데이터의 기묘함과 신기함에 빠져들었을 때, 현실 세계는 이미 우리에게 큰 뺨을 한 대 때렸다! 우리는 많은 정부의 공개 정보가 여전히 분산되고, 분할되고, 폐쇄되어 있다는 것을 경악할 것이다!
각급 정부 부처는 직무 수행 과정에서 대량의 데이터와 정보를 파악했으며, 그중 기업 (개인) 관련 데이터가 가장 풍부하다. 현재 일반적으로 유용하다고 생각하는 기업 정보에는 네 가지 측면이 포함됩니다.
첫 번째는 기업의 기본 상황을 반영하는 정보입니다. 비즈니스 부서에서 제공하는 기업 등록 정보, 등록 자본, 주주 및 고위 경영진 변경 등이 포함됩니다. 을 눌러 섹션을 인쇄할 수도 있습니다 환경 보호 부서에서 제공하는 기업 환경 처벌, 환경 평가 승인, 하수도 허가, 배출권 모기지 등록 등의 정보 품질 감독, 안전 감독, 식품 의약품 감독, 위생 등의 부서에서 제공하는 자격 정보.
두 번째는 기업의 실제 경영 상황을 반영하는 정보다. 세무서가 제공하는 기업 과세 판매, 세금, 세금 환급 등이 포함됩니다. 을 눌러 섹션을 인쇄할 수도 있습니다 인적자원사회보장부가 제공하는 기업사회보증납부, 노동분쟁, 노동보장서면심사 등의 정보 세관 부서에서 제공하는 수출입 정보, 기업 통관 등. 을 눌러 섹션을 인쇄할 수도 있습니다 물, 전기, 가스 등의 부서에서 제공하는 분담금, 체납 등.
셋째, 기업과 기업주의 신용상태와 법을 준수하는 상황을 반영하는 정보입니다. 공안, 법원 등의 부서에서 제공하는 기업 또는 기업주의 사법소송, 집행, 압류 등의 정보를 포함합니다. 상공업, 환경 보호, 인사, 세무, 품질감, 안감, 식약감, 위생, 세관 등의 부서에서 제공하는 처벌 정보.
넷째, 기업 융자, 재산 담보와 담보, 대외보증 등을 반영하는 정보입니다. 포함: 중국 인민은행 징신 시스템 [웨이보] 이 제공하는 대출, 담보 정보 및 상공부가 제공하는 지분 양도, 담보, 압류 정보; 부동산 소유권, 담보, 압류, 임대 정보는 부동산 부서에서 제공한다.
이러한 기업 관련 정보 자원은 여러 정부 부서에 분산되어 있으며, 일반적으로 분리, 격리, 폐쇄 상태에 있으며, 데이터 공유, 연결 및 통합을 실현하지 못하고 있으며, 큰 데이터 가치의 표현은 말할 것도 없습니다.
최근 몇 년 동안 각급 정부는 공공신용정보 플랫폼을 적극 구축하고 사회신용정보체계 건설을 추진해 왔으며, 특히' 사회신용체계 건설 개요 (20 14-2020) 발행에 관한 국무원의 통지' 가 공포된 후 발걸음이 더욱 빨라지면서 대부분의 부처가 자체 정보관리 시스템을 구축했다. "전국 기업 신용 정보 공시 시스템", "신용 저장" 등과 같은 전국, 지역 통합 정보 플랫폼이 있다 해도, 포함된 기업 정보는 매우 제한적이고 불완전하며 시기적절하지 않습니다.
이러한 정보 조각화 상태는 빅데이터의 발전에 불리할 뿐만 아니라, 눈앞의 관점에서 빅데이터를 구체적으로 사용하는 관련 주체의 발전을 가로막는다. 예를 들어, 서비스 실체 경제, 특히 소기업 과정에서 은행업이 직면한 두드러진 병목 현상 중 하나는 정보 병목 현상이다. 은행업이 소기업 신용업무를 발전시키는 데 직면한 가장 큰 곤혹은 정보 비대칭이다. 정보의 비대칭으로 은행은 소기업에 대출을 할 때' 살얼음을 밟는 것' 을 피할 수 없게 돼 많은 거리낌이 있다. 이에 따라 기업의 실제 경영 상황을 반영하는 관련 정보, 기업과 기업주의 신용상황 등을 제대로 파악하고 이해할 수 있을까. , 소기업에 대한 은행의 대출 의지와 소기업 신용 분야에 개입하는 깊이를 크게 결정짓는다.
현재 기업 정보가 즐기기 어려운 객관적 상황은 부서의 이익에 뿌리를 두고 있다. 정부 관련 부서는 공공신용정보플랫폼 건설에 참여할 때 여러 가지 이유로 소리를 지르며 적게 하는 경우가 많다. 일부 부서는 자신의 상업적 이익을 위해 자신이 보유한 대량의 공공 정보를' 사유재산' 으로 간주하고 유상을 정보 제공 조건으로 삼고 있다. 또는 영업 비밀 유지, 부서 기밀 관련 등의 이유로 자신의 기업 정보를 다른 부서와 공유하거나 상징적으로 몇 개의' 뼈' 를 던지고, 인위적으로 기업 정보의 분할과 기형을 일으키는 많은' 좀비' 정보 플랫폼을 만드는 것을 꺼린다. (윌리엄 셰익스피어, 좀비, 좀비, 좀비, 좀비, 좀비, 좀비, 좀비, 좀비) 일부 정보의 즐거움은 장애물이 되어서는 안 된다. 다만 데이터가 있는 일부 부서는' 힘들고 비위를 맞추지 않는다' 고 느끼고 능동적으로 데이터를 제공할 의욕이 부족하기 때문이다.
물론 개별 지방정부가 현지 이익에서 출발하고 현지 기업의 발전, 정보 및 데이터 향락에 영향을 줄 수 있는 부정적, 신뢰할 수 없는 정보 공개를 차단하는 것도 배제할 수 없습니다. 심층적인 이유는 사회신용체계 건설 법제화 속도가 느리고, 공공정보 수집 메커니즘이 미비하고, 관련 부처가 관련 정부 정보를 제공 및 공개하는 데 효과적인 제약이 부족하고, 신용정보 공개와 기밀의 법적 경계가 불분명하기 때문이다.
어떻게 데이터를 즐길 수 있습니까?
행동 강령' 은 정부 데이터 개방 공유 가속화, 자원 통합 촉진을 최우선 과제로 삼고, 정부 데이터 자원 개방, 국가 대데이터 자원 전체 개발, 정부 관리 대데이터 공사, 공공 서비스 대데이터 공사 등 프로젝트 건설을 대데이터 발전을 촉진하는 기초공사로 삼고 있다. 정부 고위층이 정보 향유 문제에 큰 관심을 갖고 있음을 설명한다.
분명히, 데이터 공유를 촉진하는 출발점은 정부 부처 간의 정보 공유이며, 이것이 바로 어려운 부분입니다. 이것은 체계적이고 어려운 공사이자 점진적인 과정으로, 사회징신체계의 법제화 과정을 가속화해야 할 뿐만 아니라 정부와 관련 부서의 혁신적 사고도 필요하다.
통일되고 개방적이며 투명한 사회신용 정보 공유 플랫폼을 구축하여 정부 부문 정보를 효과적으로 통합합니다. 다양한 관리 자원을 보유한 정부에게는 비교적 완벽한 정보 플랫폼 프레임워크를 구축하는 것이 어렵지 않고 정보를 충분히 즐길 수 있는지 여부가 어려울 수 있습니다. 정보 플랫폼에 참여하는 정부 부처가 공개적으로 이용할 수 있는 데이터와 정보를 통합 정보 플랫폼으로 능동적이고 시기 적절하며 완벽하게 활용할 수 있도록 하는 방법은 정보 수집의 행정 구속력을 강화하고 공공 정보 공유 플랫폼의 보장 메커니즘을 구축하는 데 있다.
현행 체제 하에서 필자는 성과 평가가 정보 향유를 촉진하는' 지휘봉' 이나' 신기' 라고 생각한다. "사회신용체계 건설계획개요 (20 14-2020)" 시행과 정무공개제도의 시행을 중점적으로 추진하며, 공공신용정보의 데이터정보신고상황을 정부의 관련 부처에 대한 평가에 포함시킨다. 특히 각종 정보공개를 정의하는 법률경계를 충분히 연구하면, 특히 각종 위법정보와 부정직행위 정보 공개에 관한 방면에서 더욱 그렇다. 이를 바탕으로 명확한 공개 정보 목록을 만들어 해당 책임과 의무를 명확히 한다.
작은 데이터는 즐길 수 없고, 큰 데이터는 반드시 공론일 것이다. 따라서 대세를 보고, 대국을 돌보고, 기준을 깨고, 작은 데이터를 즐기는 것이 빅 데이터 시대의 정부 부처가 가져야 할 사고다.
이것은 변쇼가 당신을 위해 공유한 빅데이터 발전에 대한 기초이다. 더 많은 정보는 글로벌 아이비리그가 더 많은 건품을 공유하는 것에 집중할 수 있다.