안녕하세요, 저는 기술 1 플러스 1 입니다! 이 문제가 재미있다고 느껴져요! 네, 지금 가장 가치 있는 것은 무엇입니까? 제가 말하고 싶은 것은 데이터입니다! 이 질문에 대한 두 가지 대답이 있습니다.
1. 데이터란 무엇입니까?
정의: 데이터는 객관적인 사건을 기록하고 식별할 수 있는 기호이며, 객관적인 사물의 특성, 상태 및 관계를 기록하는 물리적 기호나 이러한 물리적 기호의 조합입니다. 인식 가능한 추상 기호입니다.
좁은 숫자뿐만 아니라 문자, 문자, 숫자 기호, 그래픽, 이미지, 비디오, 오디오 등의 조합일 수도 있습니다. 객관적인 사물의 속성, 수량, 위치 및 그 관계에 대한 추상적인 표현이기도 하다. 예를 들어, "0, 1, 2 ... `", "흐린 구름, 비, 하강, 온도", "학생 성적, 화물 운송" 등은 모두 데이터입니다. 데이터가 처리되어 정보가 됩니다.
컴퓨터 과학에서 데이터는 컴퓨터에 입력할 수 있고 컴퓨터 프로그램에서 처리할 수 있는 모든 기호 미디어입니다. 처리를 위해 전자 컴퓨터를 입력하는 데 사용되는 숫자, 문자, 기호 및 시뮬레이션량의 총칭입니다. 이제 컴퓨터에서 저장 및 처리하는 개체의 종류가 다양하여 이러한 개체를 나타내는 데이터가 점점 더 복잡해지고 있습니다.
정보
정보와 데이터는 서로 연결되어 있고 차이가 있다. 데이터는 정보의 표현과 전달체이며 기호, 문자, 숫자, 사운드, 이미지, 비디오 등이 될 수 있습니다. 정보는 데이터의 내포이며, 정보는 데이터에 로드되어 데이터에 의미 있는 설명을 제공합니다. 데이터와 정보는 불가분의 관계입니다. 정보는 데이터에 의존하여 표현되며, 데이터는 생생하고 구체적으로 표현됩니다. 데이터는 상징적이고 물리적이며, 정보는 데이터 처리 후 얻어지고 의사 결정에 영향을 미치는 데이터이며, 논리적이고 개념적입니다. 데이터는 정보의 표현이고, 정보는 데이터의 의미 있는 표현이다. 데이터는 정보의 표현과 전달체이고, 정보는 데이터의 내포이며, 형식과 품질의 관계이다. 데이터 자체는 의미가 없으며 엔티티의 동작에 영향을 미치는 경우에만 데이터가 정보가 됩니다.
데이터 의미론
데이터의 표현은 그 내용을 완전히 표현할 수 없으므로 설명이 필요하다. 데이터와 데이터에 대한 해석은 불가분의 관계이다. 예를 들어 93 은 한 학생의 한 과목의 성적, 한 사람의 체중, 컴퓨터학과 20 13 학년 인원이 될 수 있는 수치다. 데이터의 해석은 데이터의 의미에 대한 해석, 즉 데이터의 의미라고 하며, 데이터는 그 의미와 불가분의 관계에 있다.
분류
성질별로 나누다
(1) 다양한 좌표 데이터와 같은 위치 지정
(2) 사물의 속성을 나타내는 데이터 (주거 지역, 강, 도로 등) 와 같은 질적. );
(3) 길이, 면적, 체적 등 기하량이나 무게, 속도 등 사물의 수량 특성을 반영하는 정량적 데이터
(4) 일, 월, 일, 시간, 분, 초 등 사물의 시간 특성을 반영하는 타이밍 데이터.
표현에 따라 나누다
① 다양한 통계 또는 측정 데이터와 같은 디지털 데이터. 디지털 데이터는 일정 간격 내의 이산 값 [3] 입니다.
(2) 연속 함수로 구성된 시뮬레이션 데이터는 일정 간격 동안 연속적으로 변하는 물리적 양을 나타내며 그래픽 데이터 (예: 점, 선, 면), 기호 데이터, 텍스트 데이터 및 이미지 데이터 (예: 사운드 크기 및 온도 변화) 로 나눌 수 있습니다.
2. 데이터의 중요성 이제 빅데이터는 더 이상 낯선 명사가 아니다. 많은 업계가 큰 데이터를 사용한 후 매우 좋은 결과를 얻었다. 빅데이터와 인터넷은 상호 보완적이고, 서로 연결되어 있으며, 끊임없이 빠르게 발전하고 있다.
인터넷의 데이터는 매년 40% 씩 증가하고 있으며, 2 년마다 두 배로 늘어난다. 현재 세계 데이터의 90% 이상이 최근 몇 년 사이에 생산되고 있다. IDC 의 예측에 따르면 내년 전 세계적으로 총 35ZB 의 데이터가 있으며 인터넷은 빅 데이터 개발의 전초다. 인터넷 시대가 발전하면서 사람들은 인터넷을 통해 자신의 삶을 디지털화하는 데 익숙해져 공유, 기록, 추억이 쉬워지는 것 같다.
큰 데이터는 우리 생활의 여러 측면을 둘러싸고 있다.
큰 데이터는 우리 생활의 모든 측면을 둘러싸고 있으며, 가장 직관적으로 우리가 일상적으로 사용하는 사교 도구에 반영된다. 예를 들어 Tencent 는 사용자 관계 데이터와 이를 기반으로 한 소셜 데이터를 통해 사람들의 생활과 행동을 분석하고 정치, 사회, 문화, 상업, 건강 등의 분야에 대한 정보를 발굴하며 미래를 예측할 수 있습니다. 간단히 말해서, 우리는 매일 자신의 QQ, 위챗, 웨이보를 통해 자신의 동태, 위챗 모멘트, 이런 데이터를 구성한다. 빅데이터는 당신이 업데이트한 대량의 정보를 통해 취미, 직장, 주소, 수입 등을 추론할 수 있다는 것이다. (알버트 아인슈타인, 지식명언)
인터넷 시대의 빅 데이터는 얼마나 강력합니까?
인터넷 시대의 빅 데이터는 얼마나 강력합니까? 큰 데이터는 에너지 있는 탄광과 같다. 석탄은 성격에 따라 초탄 무연탄, 비료탄, 마른 석탄으로 나뉘는데, 노천탄광과 심산탄광의 채굴 비용은 다르다. 마찬가지로, 큰 데이터는' 큰' 이 아니라' 유용한' 이며, 가치 내용과 발굴 비용은 수량보다 더 중요하다. 빅 데이터 애플리케이션 엔지니어링 전공은 주로 웹 기술, 자바, JAVA, 대형 데이터베이스 Oracle, LINUX 클러스터, 비관계형 데이터베이스 NoSql, Hadoop 등의 기술을 공부합니다. 이 과정의 학습을 통해 학생들은 JAVAEE 를 개발하고 큰 데이터를 분석하고 발굴할 수 있다. 취업 과정에서 학생들은 기존 소프트웨어 회사에 입사해 OA, ERP 등 기존 소프트웨어 프로젝트를 개발할 수 있으며, 빅데이터를 분석하고 심도 있게 발굴하여 서버 클러스터를 구축할 수 있다.
빅 데이터 시대에 우리는 더 높은 생산성을 창출하고 더 많은 부를 창출하기 위해 빅 데이터를 합리적으로 활용해야합니다.
그래서 데이터는 돈이야! 큰 데이터를 마스터하는 것은 부를 마스터하는 것입니다!
읽어 주셔서 감사합니다!
데이터 자체는 가치가 없거나 매우 작으며, 가치는 부여되었다. 금처럼 금의 가치는 그것의 응용 전망이나 장면이다.
데이터의 가치는 데이터 능력에 반영된 수익이나 투자 수익입니다.
오늘 우리는 데이터 기능과 가치에 대해 논의할 것이다. 큰 데이터에 관해서는 데이터 웨어하우스를 언급해야 한다. 마지막 단계에서 기업 데이터웨어 하우스는 뇌의 중추 신경계가 될 수 있습니다. 전체 복잡한 뇌와 신경계를 지원하려면 일련의 복잡한 메커니즘이 필요하다.
1. 추상적인 데이터 능력 아키텍처 나는 데이터 능력을 네 가지 방향, 즉 전송 능력, 컴퓨팅 능력, 알고리즘 능력, 데이터 자산 수준으로 추상화한다. 나중에 이 네 가지 능력에 요약된 데이터 응용 프로그램과 가치에 대해 이야기하겠습니다.
1. 데이터 전송 기능
데이터 사용 장면의 대부분은 데이터 전송을 포함해야 하며, 데이터 전송 성능에 따라 실시간 데이터 호출, 처리, 알고리즘 권장 사항, 예측 등 일부 애플리케이션 시나리오의 구현이 결정됩니다. 전송 추상화 지원 시스템은 기본 데이터 스토리지 아키텍처입니다 (물론, 다른 룸 전송도 네트워크 환경을 고려해야 함). 간단한 작은 데이터 볼륨 호출은 일반적으로 이러한 문제를 다루지 않지만, 데이터 양이 많고 동시성이 높고 SLA 요구 사항이 매우 엄격할 경우 데이터 전송 능력에 대한 시험이 됩니다.)
제품의 관점에서, 나는 데이터 전송 능력을 기본 데이터 전송 효율과 애플리케이션 계층 데이터 전송 효율로 나누었다.
기본 데이터 전송 효율성은 데이터 소스가 입력된 후 사전 처리 단계의 전송 효율성, 즉 제품에 필요한 데이터 인도물로 처리되기 전의 단계입니다.
Ps: 데이터를 제품에 사용하려면 오랜 처리 과정이 필요합니다. 애플리케이션 계층 데이터 제품은 기본적으로 기본 데이터 처리 과정을 포괄하지 않으며, 데이터 제품은 지정된 데이터 산출물 (즉, 합의된 구조화 또는 표준화된 데이터) 을 사용하여 실제 애플리케이션 시나리오에 대한 제품의 일치 및 처리를 통해 데이터 서비스를 제공합니다. 기본 데이터 관리와 관련된 관련 제품도 메타데이터, 사용 로그 또는 작성된 셸에 대한 호출입니다.
기본 데이터 처리 및 계산과 관련된 전송 효율성은 데이터 제품의 고성능, 안정성을 뒷받침하는 자기 수요를 직접 결정합니다. 응용 프로그램 계층 전송은 사용자 경험 및 장면 구현에 영향을 줍니다. 전송 메커니즘과 시스템은 전신에 퍼져 있는 모세혈관처럼 복잡하지만, 순환 속도에 따라 뇌의 산소 공급이 충분한지 여부가 직접적으로 결정된다.
2. 데이터 계산 능력
데이터 계산 능력은 조혈체계처럼 다양한 출처의 영양원료에 따라 혈액을 생산한다. 기본 다중 스토리지의 고성능 분산 기술 아키텍처를 통해 소스 데이터를 ETL (추출, 변환 및 로드) 클리닝하는 제품은 데이터 중간 계층의 범용 구조화 데이터 제공 품목입니다. 계산 속도는 조혈 속도와 마찬가지로 공급을 결정합니다. 계산 속도에 따라 데이터 응용 프로그램의 적시성과 적용 장면이 직접 결정됩니다.
현재 가장 흔한 것은 오프라인 창고 실사이며, 대부분 사후 제갈량의 역할을 한다. 즉, 데이터의 시효성을 보장할 수 없고, 데이터 분석 응용 프로그램의 출력을 지연시켜 경험이 많고 실시간 의사결정이 어렵다는 것이다. 실시간 창고 재고, 심지어 데이터 호수의 실시간 처리도 점차 다양한 장면을 꿰뚫어 보았다. 점점 더 강해지는 실시간 요구 사항으로 인한 엄청난 비용이 실제로 동등한 수익을 창출할 수 있는지 여부는 고려하지 않는다. (윌리엄 셰익스피어, 윈스턴, 실시간, 실시간, 실시간, 실시간, 실시간, 실시간)
강실시간은' 미래' 상태, 즉 이 순간에 더 가까워질 수 있다. 이는 알고리즘이 미래의 예측보다 훨씬 더 가치가 있다. 한 기업에게는 현재를 파악하는 것이 변화무쌍한 미래를 구축하는 것보다 더 가치가 있기 때문이다. 데이터 처리가 뉴런 전송보다 빠르더라도, 데이터 처리의 구동 결과는 뇌파를 얻는 순간부터 뉴런이 구동 팔다리로 전송하는 것보다 훨씬 빠릅니다.
병마가 곡식을 움직이지 않고 선행하는 장면과 비슷합니까? 물론, 이것은 데이터 계산 능력의 관점에서 나온 것이다. 내 개인적인 관점에서 튀어나와, 전체 데이터 능력이 일정 단계에 이르면, 주관적으로 너의 개인의 의지를 바꿀 것이다. 즉, 즉, 너의 뇌를 인도하여 너의 개인 행동을 통제하거나 결정하는 것이다. 너를 느끼게 하지 않기 때문에, 주관적으로 너의 개인의 의지를 바꾸는 것으로 이해할 수 있다. 인간의 관점에서 볼 때, 뇌가 논리적 프로세서이기 때문에 다음에 무엇을 할 것인지 모르거나 직관적으로 결정하고 싶습니다. 물론 심리학과 관련이 있습니다. 여기서는 군말을 하지 않습니다. 다음으로 다른 공간에서 데이터 응용의 미래 전망과 가설에 대해 이야기하겠습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 과학명언)
3. 데이터 자산 역량
모두가 "큰" 데이터에 대해 이야기하고 있습니다. 그렇다면 데이터 양이 클수록 좋을까요? 아닙니다. 어떤 면에서는 가치가 없거나 발굴되지 않은 대량의 데이터는 부담이며, 엄청난 자원 손실은 쉽게 지워지지 않습니다.
데이터의 양이 급속히 확대됨에 따라 알 수 없는 데이터, 연결되지 않은 데이터, 통제할 수 없는 데이터, 바람직하지 않은 데이터 섬 등이 발생합니다. 그렇게 흩어져 있는 데이터는 자산으로 전환해야만 더 잘 활용할 수 있다.
데이터 자산이란 무엇입니까? 나는 넓은 의미로 직접 사용할 수 있는 납품 데이터로 정의할 수 있으며 자산으로 분류할 수 있다고 생각한다. 물론 메타데이터, 특성, 표시기, 레이블, ETL 구조화 또는 비구조적 데이터 등 다양한 형식의 데이터를 직접 사용할 수 있습니다.
현재, 데이터 호수의 사용 장면도 끊임없이 확대되고 있다. 데이터 호수 데이터를 직접 실시간으로 사용하고 처리하는 추세는 엔터프라이즈 데이터 자산의 범위와 자산 활용도를 확대하는 한 가지 방법입니다. 이는 데이터 웨어하우스 모델의 데이터 프레임 제한을 돌파하는 데 도움이 되며, 데이터 사용 방식을 바꾸면 더 큰 상상력 공간을 확보할 수 있습니다.
데이터 자산의 가치는 두 부분으로 나눌 수 있습니다. 하나는 데이터 자산이 직접 실현하는 가치입니다. 또 다른 부분은 데이터 자산을 자원으로 처리한 후 데이터 서비스를 제공하는 상업적 가치입니다.
첫 번째 부분은 데이터 양에 따라 레이블, 샘플, 교육 세트와 같은 데이터 세트의 출력 변수 값을 평가하는 것입니다. 두 번째 부분 가치, 예를 들어 자체 데이터 훈련을 통한 최적화 알고리즘의 적용을 통해 비즈니스 수익의 가치를 높이거나, 데이터의 광고화에 따라 마케팅을 실현하거나, 침전된 데이터 자산 관리 능력까지 지식의 무형자산으로 외부 세계에 서비스를 제공하는 가치. 이러한 간접적인 데이터 응용 프로그램 및 서비스 구현 방식은 데이터 자산 가치의 구현이며 세밀하게 수량화할 수 있습니다.
4. 데이터 알고리즘 기능
실제로, 전송 및 계산 능력은 기본 데이터 구현에 상대적으로 편향되어 있으며, 비즈니스 시나리오에 가장 가까운 것은 알고리즘 기능이 제공하는 알고리즘 서비스입니다. 이는 비즈니스 시나리오에 가장 직접적으로 적용되고 사용자가 쉽게 인식할 수 있는 데이터 기능입니다. 전송 및 계산에 대해 사용자가 인식하는 것은 속도이고 사용자의 관점에서 보면 빠르면 적당하기 때문에 사용자는 언제 어디서 계산하거나 전송할지 알 수 없습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 전송, 계산, 계산, 계산, 계산, 계산, 계산명언)
알고리즘의 적용 장면은 0 에서 1 까지, 없음 ~ 유유 과정입니다. 알고리즘은 데이터 전송, 계산 및 자산 능력, 즉 세 가지 기본 기능의 패키징 진화를 기반으로 합니다.
알고리즘의 기능은 여러 데이터 세트 또는 가능한 많은 데이터를 의사 결정 결과로 변환하여 비즈니스 시나리오에 적용하는 것입니다. 알고리즘 능력의 강약은 세 가지 데이터 능력이 효율적으로 조화를 이루는지, 나무통 효과가 있는지, 더 나쁜 것은 나무통이 없다는 것을 반영한다. 물론 간단한 알고리즘도 무형자산의 지식 침전으로 서비스를 제공할 수 있다.
데이터 능력 아키텍처의 네 가지 기능 중 전송, 계산, 자산은 기본 기능이며 알고리즘은 고급 요약 기능입니다. 역량의 출력과 응용은 데이터의 가치를 반영할 수 있으며, 데이터 역량의 최대 출력은 전체 데이터 제품 아키텍처 아키텍처의 공통성과 유연성을 테스트합니다. 다양한 비즈니스에서 진화하는 다양한 시나리오에 직면해야 하기 때문에 데이터 능력에 대한 수요는 균형이 맞지 않습니다. 즉, 일방적일 수도 있고, 여러 역량의 협동일 수도 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 성공명언) 이것은 제품의 다용성에 큰 도전이다. 이 문제를 더 잘 처리하기 위해서는 전체 데이터 플랫폼의 제품 매트릭스가 필요하고 에너지를 공급해야 할 수 있습니다.
둘째, 데이터 능력에 해당하는 데이터 가치는 데이터 응용 프로그램의 관점에서 각 기능을 독립적으로 열거나 결합할 수 있습니다. 능력의 구현이라면, 제품 형태에서 비롯된 문제이며, 능력에 적응한 후 역할을 하는 납품물이다. 제품 형태에 관해서는 응용 장면을 상상할 수 있습니다.
첫째, 가장 기본적인 응용 프로그램 시나리오는 데이터의 직접 호출이며, 데이터 자산의 사용은 기본적으로 특징, 지표, 레이블 또는 지식과 같은 전달 형식을 기반으로 합니다. 사용자의 경우 이러한 데이터는 반제품 원료 또는 기초로 비즈니스 시나리오에서 2 차 처리 및 적용 (예: 데이터 분석, 데이터 마이닝, 알고리즘 교육 및 검증, 지식지도, 개인 추천, 정확한 배치 (접촉), 위험 관리 등) 을 수행합니다. 데이터 자산은 일부 OpenAPI 를 통해 데이터 시장에서 집단적으로 승인될 수 있습니다.
한 공장에서는 자체 원자재 (데이터 자산) 의 장벽을 제외하고는 핵심 경쟁력이 매우 작으며 경쟁력을 높이기 위해 상위 계층의 기본 서비스를 포장해야 하기 때문에 데이터 계산을 통합할 수 있는 능력이 원자재를 2 차 처리 (요약 통계) 할 수 있습니다.
계산된 집계 통계 기능은 대부분의 데이터 분석 시나리오의 지지를 충족시킬 수 있으며, 기술 함량이 없는 원자재 출력뿐만 아니라 반제품 형식의 데이터 민감도도 방지할 수 있습니다. 통계적으로 이것은 분석 결과나 결론이며 자신의 민감한 데이터의 출력을 포함하지 않기 때문에 핵심 자산은 유출되지 않고 자산의 부가가치만 출력됩니다. 다른 말로 하자면, 지적 재산권 특허는 아직 네 손에 있다. 특허 일반화 능력을 통제함으로써 투자 수익을 얻을 수 있다.
인파 초상화 분석, 다차원 교차 분석, 경영 전략 분석, 모니터링 분석 등 컴퓨팅 기능을 통합한 분석 시나리오.
시대의 발전과 업무 장면이 증가함에 따라 공장은 지속적으로 산업 변혁을 필요로 하고, 서비스 산업을 심화하고, 점차 제조 형태를 버리고, 더욱 선진적인 데이터 서비스를 전면적으로 개선해야 한다. 이때 알고리즘을 추가할 수 있는 능력은 서비스 매트릭스를 더 잘 보완한다.
이 알고리즘은 전송, 계산 및 자산의 기능을 캡슐화하여 비즈니스 시나리오 목표 예측 및 식별에 대한 통일되고 더 나은 이해를 제공합니다. 이를 통해 기업은 데이터 처리 과정 없이 데이터 서비스를 저렴한 비용으로 받아들이고 사용할 수 있습니다. 단 하나의 목표 결과만 있으면 됩니다. 알고리즘의 결정을 참조로 사용하여 비즈니스 방향을 안내할 수 있습니다. 예를 들어, 일부 비즈니스 시나리오에 대한 알고리즘의 예측 및 분석, 심지어 일부 인공 지능 시나리오의 인식이나 학습 및 사고도 알고리즘을 통해 수행할 수 있습니다. 기업에게는 무에서 유무의 돌파구이며, 기업의 발전 과정은 심지어 몇 년 동안 추진될 수도 있다.
이러한 기능을 관통하는 어플리케이션 시나리오는 모두 데이터 전송 능력에 대한 시험입니다.
"데이터" 의 중요성은 다음과 같습니다.
1, 데이터는 기업 임원에게 의사 결정 지원을 제공할 수 있습니다. 기업의 방대한 데이터에 대한 통계 분석과 발굴을 통해 고위층이 합리적인 조치를 취할 수 있도록 할 수 있다.
데이터는 기업의 복잡한 비즈니스를 통합 할 수 있습니다. 모든 기업은 데이터와 해당 플랫폼을 통해 통합할 수 있는 매우 복잡한 비즈니스 시스템을 보유하고 있습니다.
데이터는 이벤트의 성격과 추세를 반영 할 수 있습니다. 실제 데이터는 사건의 성격을 더 잘 이해하고 사태의 발전을 예측할 수 있다.
4. 데이터는 사람들이 자신을 더 잘 알 수 있게 해준다. 너 앞으로 너 자신을 정말 잘 모를 수도 있어? 그러나 개인 데이터를 초상화로 사용하여 개인을 완전히 이해할 수 있습니다.
데이터는 역사를 반영하거나 미래를 기대할 수 있습니다. 과거 데이터를 통해 과거를 조회하면 과거 데이터로 미래를 감지할 수 있다.
결론적으로 빅 데이터와 5G 기술이 트렌드가 되면서' 데이터' 는 소셜 네트워크, 소비 정보, 여행 기록 ... 엔터프라이즈급 판매 데이터, 운영 데이터, 제품 데이터, 활동 데이터 등 점점 더 보편화되고 있다 ...