첫째, 기계 학습
기계 학습은 통계, 시스템 식별, 근사론, 신경망, 최적화 이론, 컴퓨터 과학, 뇌과학 등 많은 분야를 다루는 교차 학과이다. 컴퓨터가 어떻게 인간의 학습 행동을 시뮬레이션하거나 실현하여 새로운 지식이나 기술을 얻고, 기존의 지식 구조를 재구성하고, 지속적으로 자신의 성능을 향상시키는 것이 인공지능 기술의 핵심이다. 데이터 기반 기계 학습은 현대 지능 기술의 중요한 방법 중 하나이다. 연구는 관측 데이터 (샘플) 에서 법칙을 찾아 이를 이용하여 미래 데이터나 관찰 불가능한 데이터를 예측한다. 기계 학습에는 학습 패턴, 학습 방법 및 알고리즘에 따라 다른 분류 방법이 있습니다.
학습 모델에 따라 기계 학습은 감독 학습, 무감독 학습, 강화 학습으로 나뉜다.
학습 방법에 따라 기계 학습은 전통 기계 학습과 심도 있는 학습으로 나눌 수 있다.
둘째, 지식지도
지식지도는 본질적으로 구조화된 의미 기술 자료로 노드와 가장자리로 구성된 그래픽 데이터 구조입니다. 물리적 표준의 개념과 해당 관계를 기호로 설명합니다. 기본 단위는 엔티티-관계-엔티티 트리플이며 엔티티 및 관련 속성-값 쌍입니다. 서로 다른 실체는 관계를 통해 서로 연결되어 네트워크 지식 구조를 형성한다. 지식지도에서 각 노드는 실제 "솔리드" 를 나타내며, 각 모서리는 엔티티 간의 "관계" 입니다. 일반적으로 지식지도는 다양한 정보를 연결하는 관계 네트워크로, "관계" 의 관점에서 문제를 분석할 수 있는 기능을 제공합니다.
지식지도는 부정 방지, 비일관성 검증, 집단 사기 등 공공 보안 분야에 사용할 수 있으며 이상 분석, 정적 분석, 동적 분석 등의 데이터 마이닝 방법이 필요합니다. 특히 지식지도는 검색 엔진, 시각화 전시, 정밀 마케팅 등에서 큰 장점을 가지고 있어 업계에서 유행하는 도구가 되었다. 그러나 지식지도의 발전에는 여전히 큰 도전이 있다. 예를 들면 데이터의 소음 문제, 즉 데이터 자체가 잘못되었거나 데이터가 중복된다는 것이다. 지식지도 응용이 심화됨에 따라, 여전히 일련의 핵심 기술이 돌파되어야 한다.
셋째, 자연어 처리
자연어 처리는 컴퓨터 과학과 인공지능 분야의 중요한 방향이다. 인간과 컴퓨터가 자연어로 효과적으로 교류할 수 있는 다양한 이론과 방법에 대한 연구는 기계 번역, 기계 독해력, 문답시스템을 포함한 여러 분야를 포함한다.
기계 번역
기계 번역 기술은 컴퓨터 기술을 이용하여 한 자연어를 다른 자연어로 번역하는 과정을 말한다. 통계 기반 기계 번역 방법은 기존의 규칙과 인스턴스 기반 번역 방법의 한계를 뛰어넘어 번역 성능이 크게 향상되었습니다. 심도 신경 네트워크를 기반으로 한 기계 번역은 일상적인 구어 등 일부 장면의 성공적인 응용에 큰 잠재력을 보이고 있다. 문맥의 문맥 표현과 지식의 논리적 추리력이 발달하면서 자연언어의 지식지도가 확대되면서 기계 번역은 다륜 대화 번역, 텍스트 번역 등 분야에서 더 큰 발전을 이룰 것이다.
의미이해
의미 이해 기술은 컴퓨터 기술을 이용하여 텍스트를 이해하고 텍스트 관련 질문에 대답하는 과정이다. 의미적 이해는 어경에 대한 이해와 답안의 정확성에 대한 통제에 더 중점을 둔다. MCTest 데이터 세트가 발표됨에 따라 의미 이해는 더 많은 관심을 받고 빠른 발전을 이루었고, 관련 데이터 세트와 해당 신경망 모델도 속출하고 있다. 의미이해 기술은 스마트 고객 서비스, 제품 자동문답 등 관련 분야에서 중요한 역할을 하여 문답과 대화 시스템의 정확성을 더욱 높일 것이다.
문답시스템
문답 시스템은 개방 분야 대화 시스템과 특정 분야 문답 시스템으로 나뉜다. 문답 시스템 기술은 컴퓨터가 인간처럼 자연어로 사람들과 소통할 수 있도록 하는 기술이다. 사람들은 문답 시스템에 자연어로 표현된 질문을 제출할 수 있으며, 시스템은 매우 관련성이 높은 답을 반환합니다. 질의응답 시스템에는 이미 많은 앱이 등장했지만, 대부분 실제 정보서비스 시스템과 스마트폰 도우미에 적용돼 질의응답 시스템의 견고성에 문제와 도전이 남아 있다.
자연어 처리는 네 가지 주요 과제에 직면 해 있습니다.
첫째, 어휘, 구문, 의미, 어용, 음성 등 여러 차원에서 불확실성이 존재한다.
둘째, 새로운 단어, 새로운 용어, 새로운 의미, 새로운 문법이 알려지지 않은 언어 현상의 예측할 수 없는 현상을 초래한다.
셋째, 데이터 자원이 부족하여 복잡한 언어 현상을 다루기 어렵다.
넷째, 의미 지식의 모호성과 복잡성은 간단한 수학 모델로 묘사하기 어렵고, 의미 계산에는 거대한 매개변수의 비선형 계산이 필요합니다.
넷째, 인간-컴퓨터 상호 작용
인간과 컴퓨터 간의 정보 교환을 포함한 인간과 컴퓨터 간의 정보 교환을 주로 연구하는 것은 인공지능 분야에서 중요한 주변 기술이다. 인간-컴퓨터 상호 작용은 인지 심리학, 인체 공학, 멀티미디어 기술 및 가상 현실 기술과 밀접한 관련이 있는 종합 분야입니다. 전통적인 사람과 컴퓨터 간의 정보 교환은 주로 키보드, 마우스, 조이스틱, 데이터복, 눈동기, 위치 추적기, 데이터 장갑, 압력펜 등의 입력 장치와 프린터, 플로터, 모니터, 헬멧 모니터, 스피커 등의 출력 장치에 의존한다. 인간-컴퓨터 상호 작용 기술은 기존의 기본 상호 작용 및 그래픽 상호 작용 외에도 음성 상호 작용, 감정적 상호 작용, 체감 상호 작용 및 뇌-컴퓨터 상호 작용을 포함합니다.
동사 (verb 의 약어) 컴퓨터 비전
컴퓨터 비전은 컴퓨터를 이용하여 인간의 시각 시스템을 모방하여 컴퓨터와 비슷한 이미지와 이미지 시퀀스를 추출, 처리, 이해 및 분석할 수 있는 능력을 가진 과학이다. 자동 운전, 로봇, 스마트 의료 등은 모두 컴퓨터 시각 기술을 통해 시각 신호에서 정보를 추출하여 처리해야 한다. 최근 몇 년 동안 심도 있는 학습이 발달하면서 전처리, 피쳐 추출 및 알고리즘 처리가 점차 융합되어 완벽한 인공지능 알고리즘 기술을 형성하였다. 해결된 문제에 따라 컴퓨터 비전은 계산 이미징, 이미지 이해, 3D 시각, 동적 시각 및 비디오 코덱의 다섯 가지 범주로 나눌 수 있습니다.
현재 컴퓨터 시각 기술이 급속히 발전하여 이미 초보적으로 산업 규모를 형성하였다. 컴퓨터 비전 기술의 미래 발전은 주로 다음과 같은 도전에 직면 해 있습니다.
첫째, 다른 응용 분야에서 다른 기술과 더 잘 결합하는 방법. 컴퓨터 비전은 일부 문제를 해결하는 데 큰 데이터를 대량으로 이용할 수 있으며, 점점 성숙해지고 인간을 능가하지만, 일부 문제에서는 높은 정확도를 얻을 수 없다.
둘째, 컴퓨터 시각 알고리즘의 개발 시간과 인건비를 줄이는 방법. 현재 컴퓨터 시각 알고리즘에는 대량의 데이터와 인공 치수가 필요하며, 애플리케이션 요구 사항의 정확도와 시간을 달성하기 위해서는 개발 주기가 오래 걸립니다.
세 번째는 새로운 알고리즘의 설계 및 개발을 가속화하는 방법입니다. 새로운 이미징 하드웨어 및 인공 지능 칩이 등장함에 따라 다양한 칩 및 데이터 수집 장비에 대한 컴퓨터 비전 알고리즘의 설계 및 개발도 과제 중 하나입니다.
여섯째, 생체 인식
바이오메트릭 인식 기술은 개인의 생리적 또는 행동 특징을 통해 개인의 신분을 식별하고 인증하는 기술을 말한다. 응용 프로그램 프로세스의 관점에서 바이오메트릭 식별은 일반적으로 등록과 식별의 두 단계로 나뉩니다. 등록 단계에서 센서를 통해 인체의 바이오메트릭 정보 (예: 이미지 센서를 통해 지문, 얼굴 등 광학 정보 수집, 마이크 수집 음성 등 음향 정보 수집, 데이터 사전 처리 및 피쳐 추출 기술을 통해 수집된 데이터 처리, 해당 특성 저장
식별 과정에서 등록 프로세스와 일치하는 정보 수집 방법을 사용하여 정보를 수집하고, 데이터를 사전 처리하고, 인식할 사람의 특징을 추출한 다음 추출된 피쳐를 저장된 특성과 비교하여 인식을 완료합니다. 응용 임무의 관점에서 볼 때, 생체 인식은 일반적으로 식별과 확인의 두 가지 임무로 나뉜다. ID 는 지식 기반에서 식별된 사람의 신분을 확인하는 프로세스이며 일대다 문제입니다. 확인이란 식별될 사람의 정보를 저장소의 특정 사람의 정보와 비교하여 신원을 확인하는 과정을 말합니다. 이는 일대일 문제입니다.
생체 인식 기술은 지문, 손바닥, 얼굴, 홍채, 손가락 정맥, 성문, 보행 등 다양한 생물학적 특징을 다루고 있으며, 인식 과정에는 이미지 처리, 컴퓨터 시각, 음성 인식, 기계 학습 등의 다양한 기술이 포함됩니다. 현재 바이오메트릭 식별은 중요한 스마트 신분 인증 기술로서 금융 공안 교육 교통 등에 널리 사용되고 있다.
일곱. 가상 현실/증강 현실
가상 현실 (VR)/ 증강 현실 (AR) 은 컴퓨터 중심의 새로운 시청각 기술입니다. 관련 과학 기술과 결합하여 시각, 청각, 촉각면에서 실제 환경과 매우 유사한 디지털 환경을 일정 범위 내에서 생성합니다. 사용자는 필요한 장치를 통해 디지털 환경의 물체와 상호 작용하여 디스플레이 장치, 추적 위치 확인 장치, 촉각 상호 작용 장치, 데이터 수집 장치, 전용 칩 등을 통해 실제 환경에 가까운 느낌과 경험을 얻을 수 있습니다.
가상 현실/증강 현실은 처리 단계에 따라 획득 및 모델링 기술, 분석 및 활용 기술, 교환 및 배포 기술, 디스플레이 및 상호 작용 기술, 기술 표준 및 평가 시스템의 다섯 가지 측면으로 나눌 수 있습니다. 수집 및 모델링 기술은 3D 물리적 세계의 디지털화 및 모델링 기술인 물리적 세계 또는 인간의 창의력을 디지털화하고 모델링하는 방법을 연구합니다. 분석 활용 기술은 컨텐츠의 의미 표현 및 분석에 어려움이 있는 디지털 컨텐츠의 분석, 이해, 검색 및 인텔리전스에 초점을 맞추고 있습니다. 스위칭 배포 기술은 다양한 네트워크 환경에서 다양한 최종 사용자를 위한 대규모 디지털 콘텐츠 유통, 변환, 통합 및 개인화 서비스를 중점적으로 강조하며, 핵심은 개방형 콘텐츠 교환 및 저작권 관리 기술입니다. 디스플레이 및 교환 기술은 복잡한 정보에 대한 인식을 높이기 위해 인간의 습관에 맞는 디지털 콘텐츠에 초점을 맞춘 다양한 디스플레이 기술 및 상호 작용 방식에 초점을 맞추고 있습니다. 그 어려움은 자연스럽고 조화로운 인간-컴퓨터 상호 작용 환경을 구축하는 것입니다. 표준 및 평가 시스템은 가상 현실/증강 현실 기본 자원, 콘텐츠 카탈로그, 소스 코드 기준 및 해당 평가 기술에 중점을 둡니다.
현재 가상 현실/증강 현실이 직면하고 있는 과제는 지능형 획득, 유비쿼터스 장치, 자유로운 상호 작용, 인식 융합의 네 가지 측면에 있습니다. 하드웨어 플랫폼 및 부품, 핵심 칩 및 부품, 소프트웨어 플랫폼 및 도구, 관련 표준 및 사양 등에 대한 일련의 과학 기술 문제가 있습니다. 전반적으로 가상 현실/증강 현실은 지능형 가상 현실 시스템, 가상 및 실제 환경 개체의 원활한 통합, 자연 상호 작용, 편안한 추세를 보여줍니다.