현재 위치 - 법률 상담 무료 플랫폼 - 온라인 법률 자문 - 빅 데이터의 역사
빅 데이터의 역사
첫째, 빅 데이터의 함정은 리나가 다시 그랜드슬램을 차지하며 장덕페의 중국 그랜드슬램 기록을 뛰어넘어 전국체제 하에서의 기적이 전국 환희를 창조했다.

리나의 성공 요인을 요약하면서, 나는 큰 데이터가 중요한 역할을 하는 발언을 다시 한 번 보았다. 하지만 리나의 이번 우승에 대한 가장 믿을 만한 설명은 리나가 카를로스의 도움으로 심리적 전력이 크게 향상되었다는 것이다.

기술 수준이 앞선 전제 하에 리나는 전체 경기의 리듬 문제를 극복했고, 그녀는 챔피언의 마음을 가지고 있었다. 20 12 년 9 월 6 일 아시아 테니스 최고 수준을 대표하는 중국 리나가 미국에서 리틀 윌리엄스와 맞섰다.

당시 IBM 은 지난 8 년간 미망의 모든 경기 데이터를 종합한 뒤 선수들을 위한' 진군 관건' 을 위한 승리 전략을 마련했다. 리나의 승리의 관건은 1 이라는 세 가지 지표로 구성됩니다. 1 라운드 득점률이 69% 를 넘었다. 2.4-9 교착 단계 점수 이율은 48%:3 을 넘어야 한다. 서빙 30-30 또는 40-40 시 득점률이 67% 를 넘는다.

결국 리나는 여지없이 실패했다. 경기 후 IBM 은 리나가 세 가지 승리 전략 중 하나만 완성했다고 발표했고, 리틀 윌리엄스는 그녀의 세 가지 승리 전략 중 두 개를 완성했다.

그래서 많은 사람들이 IBM 의 사고방식에 따라 이나가 왜 BM 의 전략에 따라 싸우지 않느냐고 물었다. 사실, 당사자의 주관적인 의지가 적극적이지 않을 때, 큰 데이터는 그들에게는 소음일 뿐이다. 마찬가지로, 데이터는 주관적인 의지로 인해 기만적입니다.

우리는 종종 큰 데이터의 역할이 역사가 미래를 상기시키는 것이라고 생각하도록 오도된다. 사실 그렇지 않습니다.

테니스와 같은 분야에서는 역사 데이터가 함정이 되기도 한다. 흥미롭게도 또 다른 여자 테니스 경기에서 한 선수가 IBM 이 설정한 세 가지 지표 중 두 가지에 도달했지만 그녀는 실패했다.

우승자는 단 하나의 목표만을 달성했다.

둘째, 빅 데이터 시대의 발전 과정은 무엇입니까? 빅데이터의 발전 과정은 시점에 따라 나눌 수 있다.

빅 데이터 시대의 구체적인 발전 과정은 다음과 같다: Hadoop 프로젝트는 2005 년에 탄생했다. Hadoop 은 원래 Yahoo 가 웹 검색 문제를 해결하기 위해 사용한 프로젝트였으며, 나중에 Apache Software Foundation 에 도입되어 효율성이 높기 때문에 오픈 소스 앱이 되었습니다.

Hadoop 자체는 하나의 제품이 아니라 여러 소프트웨어 제품으로 구성된 생태계로, * * * 포괄적인 기능과 유연한 대용량 데이터 분석을 제공합니다. 기술적으로 Hadoop 은 HDFS (Hadoop 분산 파일 시스템) 를 사용하는 신뢰할 수 있는 데이터 스토리지 서비스와 MapReduce 기술을 사용하는 고성능 병렬 데이터 처리 서비스의 두 가지 핵심 서비스로 구성됩니다.

이 두 서비스의 공통 목표는 정형 및 복잡한 데이터의 빠르고 안정적인 분석을 위한 기반을 제공하는 것입니다. 2008 년 말,' 빅 데이터' 는 미국의 일부 유명 컴퓨터 과학 연구자들의 인정을 받았다. 업계는 컴퓨팅 커뮤니티 컨소시엄 (Computing Community Consortium) 을 조직하고 영향력 있는 백서' 빅 데이터 컴퓨팅: 비즈니스, 과학 및 사회 분야에서 혁신적인 혁신 창출' 을 발표했습니다.

그것은 사람들의 생각을 데이터 처리 기계에 국한하지 않게 하고, 큰 데이터를 제시하는 것이 정말 중요한 것은 새로운 용도와 새로운 견해이지, 데이터 자체가 아니다. 이 기구는 최초로 빅 데이터 개념을 제시한 기관이라고 할 수 있다.

2009 년 인도 * * * 는 ID 관리를 위한 바이오메트릭 데이터베이스를 구축했고, 유엔 글로벌 맥박 프로젝트는 휴대전화와 소셜네트워크서비스의 데이터 소스를 이용해 나선가격에서 질병 폭발에 이르는 문제를 분석하고 예측하는 방법을 연구했다. 같은 해 미국 * * * 은 출시: //Data.gov 사이트를 통해 데이터 문을 추가로 열어 다양한 * * * 데이터를 대중에게 제공했습니다.

이 사이트에는 44,500 개 이상의 데이터 세트가 사용되어 일부 웹 사이트와 스마트폰 어플리케이션이 항공편에서 제품까지 특정 지역의 실업률로 리콜되는 정보를 추적할 수 있도록 합니다. 이 행동은 케냐에서 영국으로 가는 사람들이 잇달아 비슷한 계획을 시작하도록 격려했다. 2009 년에 유럽의 몇몇 선도적인 연구 도서관과 과학 정보 연구 기관들은 인터넷에서 과학 데이터를 쉽게 얻을 수 있도록 파트너십을 맺었다.

20 10 2 월 케네스? 쿠키는' 이코노미스트' 에 14 페이지의 빅 데이터 보고서' 데이터, 유비쿼터스 데이터' 를 발표했다. 쿡은 보고서에서 "세상에는 상상할 수 없는 디지털 정보량이 존재하고 있으며 매우 빠른 속도로 성장하고 있다" 고 언급했다.

경제권에서 과학권, * * * 부서에서 예술 분야에 이르기까지 여러 방면에서 이런 엄청난 정보의 영향을 이미 느끼고 있다. 과학자와 컴퓨터 엔지니어들은 이런 현상을 위해' 빅 데이터' 라는 새로운 단어를 만들었다.

따라서 커커는 빅 데이터 시대의 추세를 가장 먼저 본 데이터 과학자 중 한 명이 되었습니다. 20 1 1 년 2 월, IBM 의 왓슨 수퍼컴퓨터는 초당 4TB (약 2 억 페이지) 의 데이터를 스캔하여 미국의 유명 문답텔레비전 프로그램' Jeopardy' 에서 두 명의 인간 선수를 물리치고 우승을 차지했다.

나중에, * * * 이 순간을' 빅 데이터 컴퓨팅의 승리' 라고 생각했다. 같은 해 5 월 맥킨지 & amp;; Pany) 켄시 글로벌 연구소 (MGI) 는' 빅 데이터: 혁신, 경쟁 및 생산성의 다음 새로운 분야' 라는 보고서를 발표하면서 빅데이터가 주목받기 시작했다. 전문기관이 빅 데이터에 대한 전방위적인 소개와 전망을 한 것은 이번이 처음이다.

보고서에 따르면 빅 데이터는 오늘날 모든 산업 및 비즈니스 기능 분야에 침투하여 중요한 생산 요소가 되고 있습니다. 대량의 데이터에 대한 발굴과 응용은 새로운 생산성 증가와 소비자 잉여의 도래를 예고하고 있다.

보고서는 또한' 빅 데이터' 가 데이터 생산과 수집의 능력과 속도가 크게 향상되면서 점점 더 많은 사람, 장치, 센서가 디지털 네트워크를 통해 연결됨에 따라 데이터 생성, 전송, 공유 및 액세스 능력도 완전히 바뀌었다고 언급했다. 2011/KLOC-0

20 12 12 스위스 다보스에서 열린 세계경제포럼에서 빅데이터는 주제 중 하나이다. 회의에서 발표된' 대데이터, 대영향' 보고서는 데이터가 화폐나 금처럼 새로운 경제자산 범주가 되었다고 밝혔다. 2065438+2002 년 3 월, 미국 오바마 * * * 가 백악관 홈페이지에' 빅 데이터 연구 및 개발 이니셔티브' 를 발표한 것은 빅 데이터가 시대의 중요한 특징이 되었다는 것을 상징한다.

20 12 년 3 월 22 일 오바마 * * * 는 빅 데이터 분야에 2 억 달러를 투자한다고 발표했다. 이는 빅 데이터 기술이 상업행동에서 국가 과학기술 전략의 분수령으로 부상한 것이다. 다음 날 전화 회의에서 * * * 는 데이터를' 미래의 새로운 석유' 로 정의했고, 빅 데이터 기술 분야의 경쟁은 국가 안보와 미래에 관한 것이다. 그는 또한 국가 차원의 경쟁력이 한 국가가 소유한 데이터의 규모, 활동, 해석 및 적용 능력에 부분적으로 반영될 것이라고 밝혔다. 국가 숫자 * * * 는 데이터의 소유와 통제를 반영합니다.

숫자 * * * 는 변방, 하이퐁, 방공에 이어 또 다른 대국의 발휘 공간이 될 것이다. 20 12 년 4 월, 미국 소프트웨어 회사인 Splunk 는 19 년 6 월 나스닥에 성공적으로 상장되어 최초의 대형 데이터 처리 회사가 되었습니다.

미국 경제가 계속 부진하면서 주식시장이 계속 진동하는 배경을 감안할 때, 스플랑크의 첫날의 뛰어난 거래 성과는 특히 대단했고, 첫날 상승폭은 두 배 이상이었다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 스포츠명언) Splunk 는 2003 년에 설립된 대규모 데이터 모니터링 및 분석 서비스를 제공하는 최고의 소프트웨어 공급업체입니다.

Splunk 의 성공적인 출시로 자본 시장의 빅 데이터에 대한 관심이 높아지고 IT 공급업체가 빅 데이터 레이아웃을 가속화할 수 있게 되었습니다. 20 12 년 7 월, 유엔은 뉴욕에서' 빅데이터 정부 백서' 를 발표하여 각국이 어떻게 빅데이터를 이용하여 국민을 더 잘 서비스하고 보호할 수 있는지를 요약했다.

이 백서는 데이터 생태계에서 개인, 공공 및 민간 부문의 역할, 동기 및 요구 사항을 설명합니다. 예를 들어, 개인은 가격에 대한 우려와 더 나은 서비스에 대한 열망을 통해 데이터 및 크라우드 소싱 정보를 제공합니다.

셋째, 빅 데이터 시대의 배경이 20 12 로 접어들면서 빅 데이터라는 단어가 점점 더 많이 언급되고 있다. 사람들은 정보 폭발 시대에 생성된 방대한 데이터를 설명하고 정의하며 관련 기술 발전과 혁신에 이름을 붙입니다.

* * * 월스트리트저널의 칼럼 표지와 백악관 홈페이지에 들어온 뉴스는 국내 인터넷 주제의 강의 살롱에 등장했으며, 안목이 독특한 곽진증권, 국태군안, 은하증권에 투자 추천 보고서까지 기재됐다. 데이터가 급속히 팽창하고 커지면서 기업의 미래 발전을 결정하였다. 많은 기업들이 폭발적인 데이터 증가로 인한 숨겨진 위험을 인식하지 못할 수도 있지만, 시간이 지남에 따라 기업들은 데이터의 중요성을 점점 더 인식하고 있습니다.

* * * 2065 438+2002 년 2 월의 한 칼럼 문장 (collection university) 에 따르면' 빅 데이터' 시대가 도래했다. 비즈니스, 경제 및 기타 분야에서 의사 결정은 경험과 직관이 아닌 데이터와 분석을 기반으로 합니다. 하버드 대학의 사회학 교수인 게리 킹은 "이것은 혁명이다. 방대한 데이터 자원은 학계, 재계, * * * * 등 모든 분야에서 양적화 과정을 열어 왔습니다. "

넷째, 빅 데이터 시대는 무엇을 의미합니까? 빅 데이터 시대: 세계 유명 컨설팅 회사인 맥킨지가 최초로 제안했다. 빅데이터는 물리적, 생물학적, 환경생태, 군사, 금융, 통신 등 업계 분야에서 한동안 존재해 왔지만 최근 몇 년간 인터넷과 정보산업의 발전으로 사람들의 관심을 끌고 있다.

빅 데이터 배경: 20 12 빅 데이터라는 단어가 점점 더 많이 언급되고 있습니다. 사람들은 정보 폭발 시대에 생성된 방대한 데이터를 설명하고 정의하며 관련 기술 발전과 혁신에 이름을 붙입니다. * * * 월스트리트저널의 칼럼 표지와 백악관 홈페이지에 들어온 뉴스는 국내 인터넷 주제의 강의 살롱에 등장했으며, 안목이 독특한 곽진증권, 국태군안, 은하증권에 투자 추천 보고서까지 기재됐다.

데이터가 급속히 팽창하고 커지면서 기업의 미래 발전을 결정하였다. 많은 기업들이 폭발적인 데이터 증가로 인한 숨겨진 위험을 인식하지 못할 수도 있지만, 시간이 지남에 따라 기업들은 데이터의 중요성을 점점 더 인식하고 있습니다. * * * 2065 438+2002 년 2 월의 한 칼럼 문장 (collection university) 에 따르면' 빅 데이터' 시대가 도래했다. 비즈니스, 경제 및 기타 분야에서 의사 결정은 경험과 직관이 아닌 데이터와 분석을 기반으로 합니다.

하버드 대학의 사회학 교수인 게리 킹은 "이것은 혁명이다. 방대한 데이터 자원은 학계, 재계, * * * * 등 모든 분야에서 양적화 과정을 열어 왔습니다. " 데이터 확대는 현재 사회에 영향을 미칩니다. 이것은 빠르게 발전하는 사회, 과학기술이 발달하고 정보 유통이다. 사람들의 교류가 점점 가까워지고 생활이 점점 편리해지고 있다. 빅데이터는 이 하이테크 시대의 산물이다.

클라우드 시대가 도래함에 따라 빅데이터는 점점 더 많은 관심을 받고 있다. 빅 데이터는 일반적으로 한 회사가 만든 대량의 비정형 및 반정형 데이터를 설명하는 데 사용되며 분석을 위해 관계형 데이터베이스로 다운로드하는 데 많은 시간과 비용이 소요됩니다.

대용량 데이터 세트의 실시간 분석에는 MapReduce 와 같은 프레임워크가 수십 대, 수백 대, 심지어 수천 대의 컴퓨터에 작업을 할당해야 하기 때문에 대용량 데이터 분석은 클라우드 컴퓨팅과 연결되는 경우가 많습니다. 오늘날 사회에서 빅데이터의 응용은 점점 더 우위를 점하고 있으며 전자 상거래, O2O, 물류 배송 등 점점 더 많은 분야를 차지하고 있습니다. 빅데이터를 이용하여 발전하는 각 분야는 기업이 끊임없이 새로운 업무를 개발하고 운영 모델을 혁신할 수 있도록 돕고 있다.

빅데이터의 개념을 통해 소비자 행동에 대한 판단, 제품 판매 예측, 정확한 마케팅 범위, 재고 보충 등이 전반적으로 향상되고 최적화되었습니다. 빅 데이터' 는 인터넷 업계의 이런 현상을 말한다. 인터넷 회사가 일상적인 운영에서 생성되고 축적된 사용자 네트워크 행동 데이터.

이 데이터의 크기가 너무 커서 G 나 T 로 측정할 수 없습니다. 큰 데이터는 도대체 얼마나 됩니까? "인터넷의 날" 이라는 데이터 세트는 하루에 인터넷에서 생성된 모든 콘텐츠를 654.38+6800 만 장의 DVD; 로 새길 수 있다고 알려 줍니다. 보내는 메일은 최대 2940 억 통 (미국의 2 년 종이 편지 수와 동일) 이다.

200 만 커뮤니티 게시물 (770 년' 시대' 잡지에 해당) 휴대전화 판매량은 37 만 8000 대, 전 세계 일일 출생아 수 37. 1 000 ... 부터 20 12 년, 데이터 양은 이미 TB (1024GB = 국제데이터회사 (IDC) 에 따르면 2008 년 전 세계 데이터량은 0.49 zb, 2009 년에는 0.8 zb, 2065 년에는 1.2 zb, 438+0 1 으로 증가했다.

20 12 년까지 인간이 생산한 모든 인쇄물의 데이터 양은 200PB 였고 인류 역사상 말한 모든 말의 데이터 양은 5EB 정도였다. IBM 의 연구에 따르면 인류 문명 전체에서 얻은 모든 데이터의 90% 는 지난 2 년 동안 생산된 것이다.

2020 년까지 전 세계적으로 생성되는 데이터의 규모는 현재의 44 배에 이를 것이다. 매일 전 세계적으로 5 억 장 이상의 사진을 업로드하고 분당 20 시간 동영상을 공유합니다.

그러나 사람들이 매일 만드는 모든 정보 (음성 통화, 이메일, 메시지 등 다양한 통신, 업로드된 모든 사진, 동영상, 음악 등) 도 매일 만들어지는 사람 자체에 대한 디지털 정보와 일치할 수 없다. 이러한 추세는 계속될 것이다.

우리는 여전히 소위' 사물인터넷' 의 초급 단계에 있으며, 기술이 성숙함에 따라 우리의 설비, 차량, 빠르게 발전하는' 웨어러블' 기술이 서로 연결되고 통신할 수 있게 될 것이다. 과학과 기술의 진보로 정보 생성, 획득 및 관리 비용이 2005 년의 6 분의 1 로 줄었고, 2005 년 이후 하드웨어, 소프트웨어, 인재 및 서비스에 대한 상업적 투자도 50% 증가하여 4000 억 달러에 달했다.

빅데이터의 본질적인 빅데이터는 우리에게 세 가지 파괴적인 관념의 변화를 가져왔다: 무작위 샘플링이 아니라 모든 데이터; 큰 방향이지 정확한 지도가 아니다. 이것은 인과관계가 아니라 상관관계이다. A. 무작위 샘플이 아니라 모든 데이터: 빅 데이터 시대에는 더 많은 데이터를 분석할 수 있으며, 때로는 무작위 샘플링에 의존하는 대신 특정 현상과 관련된 모든 데이터를 처리할 수 있습니다 (무작위 샘플링, 이전에는 당연한 것으로 생각했지만 고성능 디지털 기술은 이것이 실제로 인위적인 제한이라는 것을 깨닫게 해 줍니다). B. 정확성이 아니라 잡합성: 연구 데이터가 너무 많아서 우리는 더 이상 정확성 추구에 열중하지 않는다. 이전에 분석해야 할 데이터가 매우 적기 때문에, 우리의 기록을 가능한 정확하게 수량화해야 한다. 규모가 커짐에 따라 정확도에 대한 집착이 약해질 것이다. 큰 데이터가 있으면, 우리는 더 이상 하나의 현상에 대해 미주알고주알 캐낼 필요가 없고, 대략적인 발전 방향만 파악하면 된다.

미시적 차원의 정확성을 적절히 무시하면 거시적 차원에서 더 나은 통찰력을 얻을 수 있다. C. 인과관계가 아니라 상관관계: 우리는 더 이상 인과관계를 찾는 것에 열중하지 않는다. 인과 관계를 찾는 것은 인류의 유래가 오래된 습관이다.

다섯째, 왜 빅 데이터가 그렇게 중요한가? 빅 데이터는 다른 사람들과 연락하고 * * * 정보를 즐기는 많은 방법을 포함하는 현대 클라우드 인프라입니다. 소셜네트워크서비스 (SNS) 를 통해 사람을 연결하고 * * * 친구나 인터넷을 통해 사람을 만날 가능성을 찾는 등' 사물인터넷' 의 발전을 촉진한다. 인공지능은 큰 데이터 뒤에서 실행되며 대부분의 사람들에게 완전히 투명합니다. 사람들은 배후에 이런 기술이 있다는 것을 모른다. 빅데이터는 사람들이 매일 사용하는 스마트폰의 배후에 있으며, 이를 의식하지 못하더라도 사람들은 이를 통해 모바일 인터넷에 정보를 기여한다. (알버트 아인슈타인, 지식명언)

왜 빅 데이터가 그렇게 중요할까요?

첫째, 대용량 데이터의 처리 및 분석이 차세대 정보 기술 통합 어플리케이션의 노드가 되고 있습니다. 모바일 인터넷, 사물인터넷, 소셜네트워크, 디지털 홈, 전자상거래 등은 차세대 정보기술의 응용 형태이며, 이러한 응용은 끊임없이 큰 데이터를 만들어 내고 있다. 클라우드 컴퓨팅은 이러한 방대한 양의 대용량 데이터를 위한 스토리지 및 컴퓨팅 플랫폼을 제공합니다. 다양한 출처의 데이터를 관리, 처리, 분석 및 최적화하여 이러한 애플리케이션에 결과를 전달하여 엄청난 경제적 사회적 가치를 창출합니다.

둘째, 빅데이터는 정보산업이 지속적으로 빠르게 성장하는 새로운 엔진이다. 빅 데이터 시장의 새로운 기술, 신제품, 새로운 서비스, 새로운 형식이 끊임없이 등장할 것이다. 하드웨어 및 통합 장치 분야에서 대용량 데이터는 칩 및 스토리지 업계에 중요한 영향을 미치며 통합 데이터 저장 및 처리 서버, 메모리 컴퓨팅 등의 시장을 탄생시킬 것입니다. 소프트웨어 및 서비스 분야에서 큰 데이터는 빠른 데이터 처리 및 분석, 데이터 마이닝 기술 및 소프트웨어 제품의 발전으로 이어질 수 있습니다.

셋째, 빅데이터의 운용은 핵심 경쟁력을 높이는 관건이 될 것이다. 각 업종의 의사결정이' 비즈니스 중심' 에서' 데이터 중심' 으로 바뀌고 있다.

요약

빅 데이터 시대가 도래할 때, 우리는 빅 데이터의 사고를 이용하여 빅 데이터의 잠재적 가치를 발굴해야 한다. 큰 데이터의 의미는 방대한 데이터 정보를 파악하는 것이 아니라, 이러한 의미 있는 데이터의 전문화에 있다. 과거에 우리가 알고 있던 데이터는 차갑고 생명이 없었고, 차가운 백업에 보관되어 사람들이 꺼내기를 묵묵히 기다리고 있었다. (윌리엄 셰익스피어, 햄릿, 인생명언) 우리는 이 수치들에 대해 매우 소극적이어서, 이 데이터를 분석하고 적용하기 전에, 우리는 그것들의 용도를 분명히 생각해야 한다. 이제 데이터 시대가 도래함에 따라 사람들은 데이터에 불을 붙이고, 데이터를 뜨겁게 만들고, 데이터 생명을 부여하려고 합니다. 소위 "라이브 데이터" 는 동적 데이터, 순환 데이터, 상호 작용, 상호 작용입니다. 이것은 자연 진화의 데이터입니다. 우리는 큰 데이터의 사유로 이 수치들이 어떻게 수익을 가져올지 고려해야 한다. 큰 데이터는 미래의 발전 전망이 매우 좋다. 큰 데이터와 관련된 직업 (예: 데이터 광부, 데이터 분석가 등) 은 반드시 넓은 발전 공간이 있을 것이다.

여섯째, 대규모 데이터 데이터베이스의 과거 데이터 아카이빙을 실현하는 방법은 다음과 같습니다.

우선, 삽입이 정상적인 업무 요구라는 것을 분명히 해야 합니까? 그렇다면 이러한 데이터 삽입만 허용됩니다.

둘째, 데이터 재고가 맞지 않으면 데이터베이스 상한선을 크게 만들 수 있다고 합니다. 데이터베이스에서 설정할 수 있는 이 속성에는 데이터베이스 파일 속성 maxsize 가 있습니다.

마침내 사용할 수 있는 방법이 하나 있다. 과거 데이터가 현재 업무에 큰 영향을 미치지 않는다면, 아카이빙할 때 사용하지 않는 데이터를 기록 테이블이나 다른 데이터베이스로 옮기는 것을 고려해 볼 수 있습니다.

평소에는 데이터베이스 유지 관리에 주의하고 정기적으로 인덱스 조각을 정리한다.