자동 조종 대형 모델 DriveGPT 설호해는 운전 데이터 도입을 통해 RLHF (인간 피드백 강화 학습) 기술을 구축하여 자동 운전에 대한 인지 결정 모델을 지속적으로 최적화했다. 현재 주로 자동운전의 인지적 의사결정 문제를 해결하는 데 사용되고 있으며, 최종 목표는 완벽한 자동운전이다.
밀리미터 DriveGPT 설호해는 이미 제한된 첫 생태 파트너와 개방협력을 벌여 북교대 컴퓨터와 정보기술학원, 고통, 화산엔진, 화웨이운, JD.COM 기술, 4 차원도 신, 위파 신에너지, 인텔 등 고교와 기업들이 잇달아 가입했다.
제품 방면에서 전국 최초의 양산, 재감지 가능한 도시 NOH 가 베이징 보정 상하이 등의 도시에 첫 착지해 보급 테스트를 시작한다. 2024 년까지 질서 정연하게 100 개 도시를 착륙시켰다. HPilot3.0 을 탑재한 최초의 새로운 모카 DHT-PHEV 가 곧 출시될 예정인데, 이는 밀리미터 DriveGPT 설후해의 첫 착지차형으로 밀리미터시티 NOH 의 업계 선두주자를 충분히 확보하고 있다.
생태 차원에서 밀리미터 승용차 6P 개방협력은 중대한 돌파구를 마련했으며, 이미 3 개 호스트 공장과 지정계약을 체결하였으며, 관련 프로젝트는 인도되고 있다. 이것은 밀리파우더 상업화의 중요한 도약으로, 밀리파우더의 고속 발전 추세를 충분히 보증했다.
밀리미터스타 회장인 장카이는 "2023 년에는 스마트운전 제품이 전선 폭발기에 접어들고, 대형차종은 차단에 적용되고, 차주의 사용 빈도와 만족도는 제품 경쟁력의 중요한 척도가 될 것" 이라고 판단했다. 데이터가 지속적으로 보완되는 6 대 폐쇄 루프 능력은 밀리미터가 자동운전 3.0 시대로 진입하는 속도를 더욱 가속화하고 그에 상응하는 해자를 형성할 것이다. "
장카이는 스마트운전 제품이 전면적이고 빠른 성장기에 접어들고 있으며 2023 년은 매우 중요한 해라고 생각한다. 첫째, 2023 년 도시 항법 보조 운전 제품은 양산 위주이며, 각 대형 플레이어의 도시 항법 보조 운전 제품은 실제 사용자 커버리지와 멀티시티 착지 경쟁에 들어간다. 둘째, 항법과 주차의 통합과 터미널 물류 자동 배송업의 상업화가 자동운전회사의 관심의 초점이 될 것이다. 승용차 분야에서는 통합 주차 및 주차 기능을 갖춘 스마트 운전 제품이 사전 적재 양산 조류를 맞이할 예정이다. 말단 물류 자동 배송 분야에서는 말단 물류 자동 배송차가 슈퍼마켓, 택배 등 장면에서 폭발해 2023 년 지속 가능한 상용화의 폐루프를 실현할 예정이다.
HPilot3.0 을 탑재한 최초의 모카 DHT-PHEV 신상품이 곧 출시될 예정이며, HPilot3.0 을 탑재한 두 번째 모델도 올해 발표될 예정입니다. HPilot 은 거의 20 개의 제품을 갖추고 있습니다. 사용자 보조 주행 마일리지가 4000 만 킬로미터를 돌파했고, HPilot2.0 보조 운전일 평균 마일리지 활용률이 12.6% 에 달했다. 해외 배치 방면에서 밀리미터 HPilot 을 실은 차량은 이미 유럽연합, 이스라엘 등의 지역과 국가로 운송되어, 잇달아 사용자들을 납품하고 중동, 남아프리카, 호주 등의 시장에 속속 진출할 예정이다. 동시에, Hmong HPilot 은 멕시코와 러시아에서 양산될 것이다.
3 월, 고공지능자동차연구원은 사전 양산 데이터베이스와 지정 차고의 데이터를 바탕으로 매년 종합 평가를 실시한다. Milli 의 상위 20 대 차에 대한 데이터 연구를 통해 milli 올해의 하이엔드 스마트 운전 시스템 양산 점유율 선두상을 수여했습니다. 제 3 자 데이터는 밀리가 국내 양산 자동운전의 절대 지도자라는 것을 증명한다.
"MANA 빅 모델의 절정전" 에 이어 중국 최초의 자동운전 데이터 지능 시스템인 MANA 아키텍처가 전 라인 업그레이드를 맞았다. 2023 년 4 월까지 MANA 는 56 만 시간 이상을 공부할 예정이며, 이는 인간 운전자의 6 만 8000 년과 맞먹는다. 밀리미터 DriveGPT 설호해는 4000 만 킬로미터의 주행 데이터를 바탕으로 훈련을 마쳤으며, 매개변수 규모는 6543.8+020 억이다.
셋째,' 노 백성의 전쟁' 입니다. 중국 최초의 양산, 재감지 가능한 NOH 도시는 베이징 보정 상하이 등 도시에서 시험보급을 시작해 2024 년까지 질서 정연하게 착지할 예정이다 100 개 도시. 결국' 안전 1 위, 사용자 1 위, 규모 1 위' 를 원칙으로 NOH 백성전의 승리를 가속화한다.
마지막으로, "터미널 물류 자동 유통 상전". 말단 물류 자동 배송차' 마낙타' 는 이미 상초준수, 스마트커뮤니티, 캠퍼스 배송, 외식 소매, 공항 순찰, 고교교육, 택배 반박, 스마트파크, 대기환경평가 등 9 대 장면에서 운영돼 상용화 폐쇄 루프 능력을 가속화하고 있다. 2023 년 3 월, 라마 2.0 은 베이징 이장 무인 배송차 차량 코드를 받아 이장 운영을 시작했다. 밀리미터도' 베이징 스마트 온라인 자동차 정책 선행구 무인배송 테스트 규범' 업그레이드 이후 무인배달차가 베이징 고급 자동운전 시범구 개방도로에서 테스트를 할 수 있게 한 최초의 회사다.
"기술 리더십은 생존의 근본이며, 모든 기술 연구개발생들이 기술 혁신에 투자하도록 독려한다." 연설에서 장카이는 Mimo 가 기술 개발에 투자하겠다는 확고한 결심을 다시 한 번 강조했다. 지금까지 밀리는 164 개의 특허 증서, 국제 최고 학술회의 논문 6 편을 받았다. 최신 두 논문은 컴퓨터 시각 인식 분야 3 대 정상회의 중 하나인 CVPR 과 세계 최초의 스마트 자동차 전문지 IEEE TIV 에 선정됐다. Millicent 는 이미 GitHub 의 모든 논문을 개방하여 업계와 공유했다.
현장에서 장카이는 밀리미터 6P 개방협력의 중요한 진전을 외부에 공개했다. 현재 이미 세 개의 호스트 공장과 지정 계약을 체결하였으며, 관련 항목은 지금 배달되고 있습니다. "저는 항상 자동운전이 * * * * 공진퇴각, * * * * * * * * * * * * * * * * * * * * * * *. 건강한 생태 파트너만이 밀리미터의 빠른 발전을 지탱할 수 있다. " 장카이가 말했다.
또한 밀리는 장면 기반 사용자 경험 설계, 인공 지능 기술 및 기술 엔지니어링 기능의 균형 발전을 고수해 데이터 중심의 폐쇄 루프로 사용자 경험을 지속적으로 향상시켰습니다. 장카이는 3 개월 동안 데이터 중심의 6 대 폐쇄 루프 시스템에서 여러 가지 진전을 이뤘다고 소개했다.
사용자 요구 폐쇄 루프의 경우 운전 장면 데이터를 지속적으로 분석하고 전략을 개선하여 새로운 기능 경험 피드백을 제공합니다. R&D 효율성 폐쇄 루프의 경우 제품 수요 정의, 인식, 인식 알고리즘 개발 등의 제품 개발 프로세스에 데이터 중심 개념 깊이를 적용하여 전체 개발 효율성을 30% 향상시킵니다. 데이터 축적의 폐쇄 루프 측면에서 진단 서비스 데이터 장면 레이블은 92% 의 운전 장면을 포괄하는 차량 끝에 배포됩니다.
데이터 가치의 폐쇄 루프에서 큰 모델은 데이터 가치를 지속적으로 발굴하여 주요 문제를 해결합니다. 제품 자체 완벽한 폐쇄 루프에서 판매 후 문제를 처리하는 속도가 기존 방식보다 10 배 빨라 10 분에 판매 후 문제를 찾을 수 있습니다. 2 년 동안, 제품 보급점은 효과적으로 발굴되었고, 문제의 폐쇄율은 76% 에 달했다. 폐쇄 루프 비즈니스 엔지니어링에서는 수집 재활용, 라벨 교육, 시스템 교정, 시뮬레이션 검증에서 최종 OTA 출시에 이르는 폐쇄 루프 제품 개발 프로세스를 더욱 개선했습니다.
밀리미터 DriveGPT 설호해는 운전 데이터 도입을 통해 RLHF (인간 피드백 강화 학습) 기술을 구축해 자동 운전에 대한 인지 결정 모델을 지속적으로 최적화했다. 그것의 궁극적인 목표는 완벽한 자동 운전을 실현하는 것이다. 현재는 주로 자동운전에 대한 인지적 의사결정 문제를 해결하기 위해 사용되며 앞으로도 많은 대형 모델의 능력을 DriveGPT 에 통합할 예정입니다. 현재, 밀리미터 DriveGPT Shehai 는 모델 아키텍처와 매개변수 규모를 업그레이드했다면, 매개변수 규모는 6543.8+020 억에 이른다. 사전 훈련 단계에서는 4 천만 킬로미터의 양산차 주행 데이터를 도입하고, RLHF 단계에서는 5 만 개의 수동 선택의 고난도 장면을 도입하여 클립을 인수한다.
DriveGPT 해약설호 밑바닥 모델은 GPT (Generative Pre-trained Transformer) 모델을 사용하며, ChatGPT 는 자연어를 사용하는 입력 출력과는 다르다. DriveGPT 의 입력은 인식 융합된 텍스트 시퀀스로, 출력은 자동 운전 장면 텍스트 시퀀스로, 곧 자동 운전 장면을 상징화하여' 운전 언어' 를 형성하고 차량의 의사 결정 조정, 장애물 예측, 의사 결정 논리 체인 출력 등의 작업을 마무리합니다.
DriveGPT Shehairuo 의 구현 과정은 먼저 사전 훈련 단계에서 대량 생산 운전 데이터 훈련의 초기 모델을 도입한 다음 운전 인계 세그먼트 데이터 교육 피드백 모델을 도입한 다음 학습 향상을 통해 피드백 모델을 사용하여 반복 초기 모델을 지속적으로 최적화함으로써 자동 운전 인식 결정 모델의 지속적인 최적화를 형성하는 것입니다. 한편, DriveGPT 는 입력 측의 힌트와 CSS 자동 운전 장면 라이브러리의 의사 결정 샘플에 따라 모델을 훈련시켜 모델이 추리 관계를 배울 수 있도록 합니다. 전체 운전 전략을 자동 운전 장면의 동적 인식 프로세스로 분할합니다. 이해할 수 있고 해석할 수 있는 추리 논리 체인 생성을 완료합니다.
현장에서 밀리는 DriveGPT 설호해 첫 차종이 곧 양산될 새로운 모카 DHT-PHEV 라고 발표했다. 앞서 언급했듯이, DriveGPT 설호는 도시 NOH, 빠른 추천, 스마트 스파링, 엠보스 장면에 점진적으로 적용될 수 있습니다. DriveGPT 설호해의 증보로 차량 운행이 더욱 안전해질 것이다. 동작은 더욱 인간적이고, 실크가 미끄럽고, 합리적인 논리가 있어 운전자에게 왜 차량이 이런 의사결정 동작을 선택하는지 알려준다. 일반 사용자들에게 차량은 점점 더 늙은 운전자와 비슷해지고, 사용자는 스마트 제품에 대한 신뢰감이 높아지고, 차량의 행동을 예측하고 이해할 수 있다는 것을 알게 된다.
DriveGPT 설호해는 생태파트너와 함께 스마트 운전, 운전 장면 인식, 운전 행동 검증, 어려운 장면 제거 등 네 가지 응용 능력을 먼저 탐구할 예정이다. 현재 밀리는 데이터 사용 과정에서 4Clips 기반 운전 장면 인식 체계를 점진적으로 구축하여 가격 대비 성능이 매우 높습니다. 업계에서 정확한 치수 결과를 제시하려면 그림 하나에 5 원 정도가 필요합니다. DriveGPT 설호해약인 장면 인식 서비스를 이용하면 사진 한 장의 가격이 0.5 원으로 떨어질 것이다. 단일 프레임 이미지의 전체 치수 비용은 업계의 1/ 10 에만 해당합니다. 다음으로 밀리미터는 업계에 이미지 프레임과 4D 클립 장면 인식 서비스를 점진적으로 개방하여 업계에서 데이터를 사용하는 비용을 크게 절감하고 데이터 품질을 향상시켜 자동 운전 기술의 빠른 발전을 가속화할 것입니다.
2023 년 6 월 5438+ 10 월 발표된 중국 자동운전업계 최대 스마트컴퓨팅 센터인 MANA OASIS 는 컴퓨팅 능력 최적화 방면에서 3 대 능력을 업그레이드해 DriveGPT 설호의 컴퓨팅 능력을 더욱 지원했다. 첫째, 밀리와 화산 엔진은' 전체 대형 모델 훈련 지원 프레임워크' 를 신설해 비정상 임무의 분급 캡처와 회복력을 실현해 수천 카드 임무를 수 개월 동안 지속적으로 훈련하고, 어떠한 이상 중단도 없이 대형 모델 훈련의 안정성을 보장하는 데 효과적이다. 둘째, 실제 데이터 피드백을 핵심으로 하는 증분 학습 기술을 개발하여 대규모 모델 교육으로 확장하여 대규모 모델 연속 학습 시스템을 구축했습니다. 자체 R&D 태스크 레벨 유연한 스케줄러, 분 단위의 일정 자원, 클러스터 컴퓨팅 자원 활용도는 95% 에 이릅니다. 마지막으로, MANA OASIS 는 데이터 처리량을 높여 비용 효율성을 낮추고 트랜스포머 모델의 교육 효율성을 충족시킬 수 있습니다. 화산 엔진에서 제공하는 Lego 산자 라이브러리를 도입하여 산자 융합을 실현하고 엔드 투 엔드 처리량을 84% 향상시킵니다.
중국 최초의 자동운전 데이터 지능 시스템 MANA 는 1 년여의 응용 반복을 거쳐 전면적으로 업그레이드되어 정식 개방능력을 부여했다. 구 웨이 (Gu Haowei) 는 MANA 컴퓨팅 기본 서비스가 대규모 모델 교육을 위해 매개 변수 크기, 안정성, 효율성 등에 맞게 특별히 최적화되었으며 OASIS 에 통합되었다고 소개했다. 둘째, MANA 의 인식과 인지 관련 대형 모델 능력을 DriveGPT 설호해에 통합했다. 셋째, NeRF 기술을 사용하는 데이터 합성 서비스를 늘려 모서리 사례 데이터의 취득 비용을 절감합니다. 동시에, 다중 칩, 다중 모델의 신속한 제공을 위해 이기종 배포 도구와 차량 적응 도구가 최적화되었습니다.
또한 MANA 의 시각 인식 능력은 지속적으로 향상되었습니다. 한편으로는 3 차원 공간 구조와 그림 텍스처를 동시에 배울 수 있으며, 순수 시각의 거리 측정 정확도는 초음파 레이더를 능가한다. BEV 프로그램은 또한 더 많은 공통성과 적응성을 가지고 있습니다. 한편, 한 번과 여러 번의 순수 시각 NeRF 3D 재구성을 수행할 수 있으며, 도로 장면은 더욱 사실적이며 육안으로는 거의 차이가 없습니다. NeRF 를 통한 장면 재구성 후 합성 실제 환경에서 수집하기가 어려운 모서리 사례를 편집할 수 있습니다. 기존 글로벌 시야각을 수정하고 조명/날씨 효과를 높이는 데 가상 동적 오브젝트 합성 기능을 추가하여 원래 설정된 궤적에서 다양한 하드 상황을 합성하고 복잡한 도시 교통 환경을 시뮬레이션할 수 있습니다. 낮은 테스트 비용으로 도시 NOH 능력 경계를 높이고 복잡한 도시 교통 환경에 더 잘 대처할 수 있습니다.
흥미롭게도, 업계에서 가장 어려운 시각 임무 중 하나인 단안 시각 측정에 이어 테슬라에 이어 밀리컨트는 국내에서 초음파 레이더 대신 어안경으로 거리를 측정할 수 있는지 확인하는 데 앞장서고 있다. 밀리미터는 시각 BEV 인식 프레임을 차측 어안 카메라에 도입하여 15m 범위 내에서 30cm 의 측정 정밀도를 달성하고 2m 내 시각 정확도는 10cm 보다 높습니다. 주차장에서 초음파 레이더 대신 순수 시각 거리를 사용하면 스마트 운전의 전체 비용을 더욱 낮출 수 있다.
이차초평시스템 중파운드 온라인! 전문가, 하드코어, 종합적인 차평내용이 모이고, 연간 차모형리스트가 새로 나왔습니다! 이차앱에서' 슈퍼리뷰' 를 검색해 보세요. 기다려 보세요!