1, 알리바바
알리바바는 거래 데이터, 신용 데이터, 데이터 유통, 수집, 공유를 위한 기본 아키텍처를 갖추고 있습니다.
화웨이 클라우드 서비스
고성능 컴퓨팅 및 스토리지 기능을 통합하여 대용량 데이터 마이닝 및 분석을 위한 전문적이고 안정적인 IT 인프라 플랫폼을 제공합니다. 최근 화웨이의 대용량 데이터 스토리지는 40PB 파일 시스템의 통합 관리를 실현하였다.
바이두 (세계 최대 중국어 검색 엔진)
바이두의 장점은 방대한 데이터, 10 여 년 동안 축적된 사용자 행동 데이터, 자연어 처리 능력 및 심도 있는 학습 분야의 최첨단 연구에 반영된다. 최근 바이두는 대데이터 엔진을 공식 발표해 정부, 의료, 금융, 소매, 교육 등 전통 분야에서 먼저 대외협력을 전개할 예정이다.
대용량 데이터, 즉 방대한 양의 데이터란 현재 주요 소프트웨어 도구를 통해 캡처, 관리, 처리 및 정리할 수 없을 정도로 방대한 양의 데이터를 의미합니다. 이를 통해 기업은 합리적인 시간 내에 보다 적극적인 의사 결정을 내릴 수 있습니다.
빅토르 마이어 쇤버그와 케네스 쿡예가 공동 저술한' 빅 데이터 시대' 에서 빅 데이터는 무작위 분석 (샘플링 조사) 없이 모든 데이터를 분석하고 처리하는 지름길을 가리킨다. 빅 데이터의 5V 특징 (IBM 제안): 매스 (대량), 속도 (고속), 다양성 (다양성), 가치 (낮은 가치 밀도), 신뢰성.
빅 데이터' 의 연구기관인 Gartner 는 이런 정의를 내렸다. 빅 데이터 (Big Data) 는 대규모, 높은 성장률 및 다양성을 수용하기 위해 더 강력한 의사 결정, 통찰력 및 프로세스 최적화 기능을 갖춘 새로운 처리 모델이 필요한 정보 자산입니다.
맥킨지 글로벌 연구원은 기존 데이터베이스 소프트웨어 도구의 획득, 저장, 관리 및 분석 능력을 훨씬 뛰어넘는 데이터 세트로, 데이터 규모, 데이터 흐름 속도, 데이터 유형 다양성, 가치 밀도가 낮은 4 가지 특징을 가지고 있다고 정의했습니다.