현재 위치 - 법률 상담 무료 플랫폼 - 특허 조회 - 자신을 들여다보세요: 핵심 창출을 향한 ​​Tencent의 길
자신을 들여다보세요: 핵심 창출을 향한 ​​Tencent의 길

돌이켜보면 칩 검증 엔지니어인 Lynda는 Tencent에 합류하는 것이 다소 '성급하다'고 느꼈습니다.

수년 동안 반도체 업계에서 일한 수석 엔지니어인 Lynda는 Tencent의 칩 채용 요건 발표를 처음 보고 조금 놀랐습니다. 2019년 1월, 그녀는 소매를 걷어붙이고 크게 성장할 준비가 되어 호기심으로 이 주요 인터넷 회사에 입사했습니다.

인터뷰 중 칩 디자인 작업을 주도한 헨리는 "우리는 처음부터 칩을 만들고 있다"며 예방접종을 시켰다. 린다는 평소의 낮은 키 톤으로 이 문장을 이해하려고 노력했다. 구스팩토리, 그런데 출근 첫날 동료들과의 대화에 충격을 받았습니다.

- "우리 시뮬레이션 도구는 어디에 있습니까?" - "아니요, 아직 얘기 중입니다."

-" 검증 환경은 어떻습니까? "-"아직은 아닙니다."

-"검증 과정은 어떻습니까? "

칩 검증 엔지니어에게 시뮬레이션 도구, 검증 환경, 검증 프로세스는 필수적인 생산성 도구입니다. Lynda는 칩 연구 개발 사업 전체에 참여하고 싶었고 처음부터 시작하는 것을 두려워하지 않았으며, 하지만 그녀는 이런 것조차 가질 줄은 몰랐다. 필요한 것은 모두 '3NO'다.

인터넷 기업이 반도체에 투자할 때 가장 중요한 것은 '칩 만들기'가 아니다. 단순한 비즈니스 확장일 뿐이지만, 이는 복잡한 산업 체인, 더 많은 시간이 소요되는 인재 축적, 더 다양한 생태 문화 및 기술 개념을 의미하는 경우가 많습니다.

예를 들어, 소프트웨어 개발과 달리 버그는 이후 단계에서 지속적으로 수정되며, 검증 초기 단계에서 설계 문제가 발견되지 않으며, 일단 테이프아웃되면 "벽돌"로만 축소될 수 있으며 Lynda가 서비스하는 검증 엔지니어가 문지기 역할을 합니다.

이 직위의 중요성은 자명하며, 많은 칩 회사에서 엔지니어와 검증 엔지니어의 비율은 1:3에 이릅니다. 회사를 둘러보면서 그녀는 함께 일할 동료가 한 명뿐일 뿐만 아니라 인증 코드 한 줄도 없다는 것을 알게 되었습니다.

그제서야 Lynda는 Henry가 무슨 뜻인지 이해하기 시작했습니다. "처음부터 시작"이라는 그녀가 직면한 참 어려운 전투.

01

전투는 철처럼 험난했고 전투는 아직 시작되지 않았습니다.

Tencent Cloud의 부사장이자 클라우드 아키텍처 플랫폼 부서의 총책임자인 Xie Ming에 따르면, '처음부터 시작'이라는 이야기 뒤에는 더 많은 우여곡절이 있다고 합니다.

Xie Ming이 위치한 곳. Tencent의 다양한 프런트 엔드 애플리케이션을 뒷받침하는 클라우드 아키텍처 플랫폼 부서는 Tencent의 대규모 비즈니스 데이터 플러싱의 최전선으로 QQ, 이메일, WeChat, Weiyun, 스트리밍 비디오 등 국가 수준의 애플리케이션을 효과적으로 지원합니다. /p>

2013년, QQ 포토앨범은 Tencent의 최대 스토리지 사업으로 발전했습니다. 사용자가 더 빠르고 더 원활한 경험으로 포토앨범에 액세스할 수 있도록 하는 것이 매우 시급한 요구 사항이 되었고, 이는 이에 상응하는 기술적 문제로 바뀌었습니다. , 이미지를 더 빨리 변환할 수 있습니까?

그들은 반복적으로 질문했습니다. > 팀은 결코 스스로를 멈춰서는 안 되지만 기본 기술 혁신의 가치를 깊이 이해하고 있습니다. -소프트웨어 아키텍처의 초월성을 바탕으로 그들은 하드웨어 혁신을 통해서만 더 깊은 혁신을 이룰 수 있다는 것을 잘 알고 있습니다.

문제는 소프트웨어에 대한 배경 지식을 갖춘 팀이 어떻게 하드웨어를 개발할 수 있는가입니다. p> 일련의 연구 끝에 그들은 먼저 FPGA(프로그래머블 어레이 로직)로 테스트하기로 결정했습니다. 컴퓨터와 휴대폰의 범용 칩과 비교하여 FPGA는 ASIC(주문형 집적 회로)입니다. 유연한 "반 맞춤형" 개발.

FPGA는 칩에 비해 내결함성 비율이 더 높지만 처리량, 대기 시간, 전력 소비 및 유연성 측면에서 균형이 잘 잡혀 있습니다. 특히 대용량 데이터를 처리할 때 FPGA는 GPU에 비해 ​​대기 시간이 매우 짧다는 큰 장점을 갖고 있어 특정 비즈니스 시나리오에 사용하기에 매우 적합합니다.

이 판결은 사실로 확인되었습니다. 2015년 팀은 이미지 인코딩 FPGA 개발에 집중했는데, 이는 CPU 인코딩 및 소프트웨어 인코딩보다 높은 압축률과 낮은 대기 시간을 달성했으며 이는 QQ 포토앨범의 저장 비용을 크게 줄이는 데도 도움이 되었습니다. 그들은 FPGA 방향으로 탐구하고 심화할 가능성을 보았습니다.

2016년경 알파고를 계기로 촉발된 AI 열풍으로 FPGA가 주류로 떠올랐다. 연구팀은 딥러닝 모델의 CNN 알고리즘을 FPGA를 통해 가속한 뒤 처리 성능은 범용 CPU 대비 4배, 단가는 1/3에 불과했다.

FPGA는 좋은 효과가 있지만 기술적인 문턱은 상대적으로 높다. "FPGA가 클라우드화된다면 활용도를 확장할 수 있는 솔루션인가?"

그런 기대를 가지고 2017년에는 2019년 1월 20일, Tencent Cloud는 클라우드 컴퓨팅을 통해 더 많은 기업에 FPGA 기능을 홍보하기 위해 국내 최초의 FPGA 클라우드 서버를 출시했습니다.

효과면에서 FPGA 클라우드 서버에서 FPGA 하드웨어 프로그래밍을 수행하는 기업은 실제로 범용 CPU 서버보다 30배 이상 성능을 향상시킬 수 있으며, 비용은 약 40%만 지불하면 됩니다. 범용 CPU 비용. 잘 알려진 유전자 검사 회사를 예로 들면, 전통적으로 CPU를 사용하여 유전자 서열을 검출하는 데 일주일이 걸리지만 FPGA는 이를 몇 시간으로 압축할 수 있습니다.

그러나 클라우드 기반 FPGA는 예상만큼 빠르게 전체 산업을 장악하지 못했습니다.

한편으로는 FPGA는 결국 "반맞춤형" 회로이며, 많은 기업에서는 여전히 FPGA를 독립적으로 개발할 수 없고 더 높은 수준의 서비스가 필요합니다. 범용 칩의 가격도 하락했습니다. FPGA의 비용 효율성 이점은 점차 사라지고 있습니다.

클라우드 상용화에 대한 좌절감은 팀의 열정에 찬물을 끼얹는 동시에 팀 전체 앞에 두 가지 문제를 적나라하게 제기했습니다. 바로 FPGA의 가치입니다. 사업 규모는 얼마나 되나요? FPGA를 계속 사용할 수 있나요?

이 타격에 시달려 2018년 팀은 거의 무너질 뻔했고, 사람들은 집중적으로 떠나기 시작했다. 텐센트의 첫 '코어 만들기' 탐구는 아쉬운 쉼표로 끝났다.

02

밝은 미래가 있고 "Penglai"가 탄생합니다

FPGA 클라우드 서버의 좌절 이후 Tencent는 앞으로 나아갈 방법을 다시 생각해야 합니다 하드웨어 도로.

팀이 거의 해산될 뻔했던 2018년, 중국의 칩 산업은 따뜻한 봄을 맞이했습니다. 중-미 무역 마찰로 인해 칩이 전 국민에게 중요하다는 사실이 대중화되었고, 과학기술혁신센터가 설립되었습니다. 이사회가 반도체 기업 상장의 문을 열자 온 나라가 들썩거렸다.

그러나 인터넷 기업의 경우 칩을 만드는 것은 클라우드 컴퓨팅, 데이터베이스, 스토리지 시스템 등을 만드는 것과 동일합니다. 특정 비즈니스 시나리오에 따라 지원되어야 하며 "그냥 하기 위해서"가 될 수 없습니다. ." 실패한 탐색을 경험한 후 Tencent는 실제 수요가 가져온 다음 기회를 기다려야 합니다.

어느덧 2019년이 되었습니다. 인공지능이 대규모로 적용된 원년으로, 대내외 기업 모두 AI 칩에 대한 수요가 높았다. AI 칩을 만들고 싶나요?

이 문제가 제기되자 텐센트 경영진은 기술진이 성급하고 핫스팟을 쫓는다고 우려하며 반대했다. 그러나 동시에 경영진은 충분한 그레이스케일을 제공했으며 소규모 팀 수준에서 "탐색"을 명시적으로 금지하지 않았습니다.

소규모, 저비용, 특정 애플리케이션 시나리오에서 먼저 물을 테스트하는 것이 모든 사람의 상식이 되었습니다.

클라우드 아키텍처 플랫폼 부서는 첫 번째 칩의 AI 추론 방향을 확정하고 이름을 'Penglai'로 지정했습니다. 이 칩이 고대 해외 선녀산처럼 거친 파도 위에 굳건히 설 수 있기를 바랍니다. 중국 신화.

이 하드웨어 브레이크아웃 팀은 공식적으로 "Penglai Laboratory"로 명명되었습니다.

FPGA 탐색 중에 축적된 경험을 통해 Penglai Laboratory는 하드웨어 프로그래밍 언어에 상당히 능숙해졌으며 표준 인터페이스 및 버스 측면에서 일부 플랫폼 기반 설계도 축적했습니다. 그러나 두 가지의 연구 및 개발 요구 사항은 동일하지 않습니다.

FPGA를 만드는 것이 기성품 블록을 만드는 것이라면, 칩을 만드는 것은 나무를 베어 블록을 만드는 것에서부터 직접 시작하는 것입니다. FPGA에 문제가 있으면 다시 프로그래밍할 수 있지만 칩에 문제가 생기면 모든 노력이 물거품이 됩니다.

그리고 FPGA의 리소스는 이미 만들어져서 고정되어 있지만 칩의 리소스는 직접 정의합니다. 한 마디로 말하면 "선택"을 의미합니다. 가장 작은 자원을 사용하여 가장 큰 일을 하는 것입니다.

칩 아키텍처 엔지니어 Rick은 Penglai 프로젝트 전체를 설명하기 위해 "혁신"이라는 단어를 "재건축"으로 변경했습니다. 처음에 팀은 이전 FPGA 기술을 쉽게 칩으로 변환할 수 있다고 생각했습니다. 이 작업을 하면서 결국에는 칩에 직접 재사용할 수 있는 FPGA 아키텍처가 많지 않다는 것을 깨달았습니다. 팀에서는 원래 아키텍처를 해체하고 코드의 85%만 다시 작성할 수 있었습니다.

DDR 메모리와 같은 최우선 순위의 경우 일반적으로 칩 제조업체에서 이를 담당하는 전담 검증 인력을 두고 있습니다. 그러나 이제 막 시작한 Penglai 연구소에는 이러한 조건이 없으며 시간 확보에만 의존할 수 있습니다. 숙제를 위해. Lynda는 나중에 이렇게 회상했습니다. "하루에 48시간이 있었으면 좋았을 텐데요."

2020년 1월 Penglai 칩 테이프아웃이 완료되어 파트너를 통해 심천으로 배송되었습니다. 코로나19가 전국적으로 확산되면서 기업들은 집단 원격근무를 시작했습니다.

프로젝트 리더인 헨리는 택배를 받기 위해 장갑을 끼고 알코올로 조심스럽게 소독한 후, 소독약 냄새가 풍기는 창문과 선풍기가 활짝 열려 있는 빈 사무실 건물로 가져갔다. 그와 몇몇 동료들은 중요한 조명 작업을 함께 시작했습니다.

소위 조명은 칩에 전원을 공급하는 것을 의미하며 먼저 단락 및 연기가 있는지 확인한 다음 몇 가지 기본 기능을 테스트합니다. 그것이 칩이든 "벽돌"이든, 성공이나 실패는 이것에 달려 있습니다.

결과적으로 칩의 클럭 주파수가 공개되지 않았습니다. 클록 주파수는 칩의 "메트로놈"이라는 점을 알아야 합니다. 클록 주파수가 없으면 칩의 여러 모듈이 정렬되지 않고 함께 작동할 수 없습니다.

이 칩에 문제가 있는 걸까요? 실험자가 칩을 교체했지만 여전히 신호 출력이 없었습니다.

다른 부분을 변경했지만 여전히 아무것도 없습니다. 완전한 침묵이 있었습니다.

실험자들은 더 이상 감히 아무것도 할 수 없었습니다. 어떤 사람들은 이제 집에 가서 이력서를 수정해야 할 시간이라고 농담을 하지 않을 수 없었습니다.

하지만 좌절감과 더불어 모두가 더 혼란스러워집니다. 프로젝트는 소수의 인력과 자원으로 거의 처음부터 시작되었지만 디자이너부터 검증자까지 Penglai 팀은 모든 단계가 잘 완료되었다고 확신했습니다. 무슨 일이야?

극도로 엄숙한 분위기 속에서 그들은 계속해서 보드를 놓고 전원을 켜고 신호를 읽는 일을 계속했는데…

네 번째 칩에 불이 켜졌다. 나머지 칩은 모두 괜찮습니다.

사실 진실은 매우 간단합니다. 28nm 공정의 칩 ​​불량률은 3%에 불과하지만 무작위로 테스트한 처음 3개의 칩은 모두 불량 칩이었습니다. 이를 통해 '아이를 낳는다'는 긴장감을 충분히 경험할 수 있다.

오경보 이후 박수와 축하가 쏟아지는 가운데, 텐센트의 첫 번째 칩이 발표됐다.

03

다음 단계로 도약하는 '보라색 하늘' Lingyun

양산 후 Penglai 칩의 실제 성능은 기대에 부응하여 도움을 주었습니다. Tencent는 중국 최초의 병원 임상용으로 승인된 스마트 현미경을 출시하여 자동으로 의료 이미지를 인식하고 세포 수를 계산하며 시야에 직접 표시할 수 있습니다. 그 성능은 설계 요구 사항을 완벽하게 충족합니다.

이는 당시 FPGA 클라우드 서버 프로젝트의 안개를 걷어내고, 텐센트가 직접적으로 애플리케이션 지향적이고 뛰어난 성능을 갖춘 칩을 제조하는 길을 택할 수 있음을 나타냅니다.

단말기 칩 Penglai의 출현으로 0에서 1까지의 작업만 완료되었습니다.

팀은 1에서 N으로 이동하여 대규모 클라우드 칩을 향해 나아가기를 고대하고 있습니다. Penglai 연구소 소장인 Alex는 농담으로 대형 칩 애플리케이션을 '시리즈 A 파이낸싱'이라고 부릅니다.

초기 테스트 후 팀은 왜 대규모 칩에 더 투자해야 하는지 회사에 설명해야 합니까? 단기적으로나 장기적으로 앞서 나갈 수 있나요? 내부 및 외부 비즈니스와 결합하여 가치를 창출하는 방법은 무엇입니까?

이번에 Tencent가 직면한 결정은 훨씬 쉽습니다.

첫 번째는 봉래연구소의 성숙도다. 행진하는 동안 성장함으로써 Penglai 연구소는 차례로 변화를 완료하고 완전하고 엄격하며 표준화된 칩 연구 개발 시스템과 프로세스를 구축했습니다. 이미 하드코어한 아우라를 지닌 '정규군'이다.

더 중요한 것은 팀이 칩 제조에 있어 Tencent의 장점과 위치를 입증했다는 것입니다.

Xie Ming은 업계 관점에서 칩을 만들 때 기술과 공정을 고려하는 것 외에도 칩의 '정의'에 가장 큰 어려움이 있다고 설명했습니다. 전통적인 칩 제조업체의 장점은 전자에 있지만 칩이 요구 사항에 맞게 만들어지면 많은 시나리오에서 실제 성능이 손실됩니다. Google, Tencent와 같은 기술 기업의 장점은 수요 측면에서 수요에 대한 가장 깊고 철저한 이해와 통찰력을 가지고 있다는 것입니다.

방향, 기술, 프로세스에는 문제가 없습니다. Tencent의 수석 부사장이자 TEG(Technology Engineering Division) 사장인 Lu Shan이 전폭적인 지원을 아끼지 않았으며 본사를 통해 더 많은 인력을 확보했습니다. .

회사의 전략에 힘입어 팀은 패기로 가득 차 더 큰 전장으로 달려간다. Penglai Lab의 부국장인 Austin은 자신의 노력을 두 그룹으로 나누어 AI 추론과 비디오 인코딩 및 디코딩을 동시에 발전시키기로 결정했습니다.

AI 팀은 Penglai에서 'Purple Sky' 2.0 버전 작업을 계속하고 있습니다. '신들의 낭만'에서 홍준 선생이 살던 궁궐의 이름이다. 안정적인 선산 위에 굳건히 'Zixiao'를 세우는 것은 새로운 야망을 의미합니다.

이번에는 업계 최초가 되겠다는 목표를 직접 세웠습니다.

Zixiao의 모든 아키텍처는 효과적인 컴퓨팅 성능을 중심으로 구축되었습니다. 팀은 온칩 캐시 설계를 최적화하고, 경쟁 제품에서 일반적으로 사용되는 GDDR6 메모리를 포기하고, 고급 2.5D 패키징 기술을 채택하여 HBM2e 메모리와 AI 칩을 함께 패키징하여 메모리 대역폭을 거의 40% 늘렸습니다.

기술적 반복이 빠르게 발전하고 있습니다. Zixiao 프로젝트가 설립된 후 경쟁 제품으로 업계 최고 성능을 갱신했습니다. Zixiao의 설계 성능은 이 최고 성능에 비해 충분히 '안전'하지만, 팀은 계속해서 성능을 향상시킬 계획입니다.

연구 끝에 칩 내부에 컴퓨터 비전 CV 가속기와 비디오 인코딩 및 디코딩 가속기를 추가했는데, 이는 AI 칩과 x86 CPU 사이의 상호 작용과 대기 시간을 혁신적이고 크게 줄일 수 있습니다.

결과적으로 두 개의 복잡한 자체 개발 모듈이 추가되었음에도 불구하고 팀은 계획된 6개월 이내에 아키텍처 결정부터 검증 및 테이프아웃까지 전체 프로세스를 완료했습니다.

2021년 9월 10일, Zixiao가 성공적으로 조명되었습니다.

이미지 및 비디오 처리, 자연어 처리, 검색 추천 등과 같은 응용 시나리오에서 이 칩은 컴퓨팅 성능 사용을 제한하는 병목 현상을 극복하고 마침내 업계 표준 제품의 성능에 도달합니다. 실제 비즈니스 시나리오는 2번입니다.

04

독자적인 자체 연구, '창해'의 미소

AI 팀은 칩 이름을 'Zixiao'로 지정하고 비디오 코덱은 "Canghai"라는 이름은 바다와 하늘의 연결을 의미합니다.

AI에 중점을 둔 Penglai와 Zixiao와 달리 Canghai는 비디오 트랜스코딩 칩입니다. QQ 사진첩 사진의 트랜스코딩 문제가 Penglai 팀이 하드웨어를 개발할 수 있는 가장 빠른 기회였다면, 이 방향으로 비디오 인코딩 및 디코딩 팀을 계속해서 탐색하는 것은 원래 의도를 완전히 반영한 것입니다.

차이점은 '창해'의 적용 시나리오가 올해 범위를 훨씬 초과했다는 것입니다.

멀티미디어 사업이 영상 시대에서 오디오 및 비디오 라이브 방송 시대로 진화하는 가운데, 엄청난 양의 4K/8K 초고화질 디지털 콘텐츠가 클라우드 컴퓨팅 인프라에 계속해서 물살처럼 영향을 미치고 있습니다.

데이터가 추가될 때마다 그에 상응하는 트랜스코딩 컴퓨팅 성능과 CDN 대역폭 비용이 발생합니다.

이는 직관적이고 심각한 수학적 문제이며, 업계에서 가장 강력한 비디오 트랜스코딩 칩을 만들고 압축률을 극대화하는 창하이 팀의 문제 해결 목표도 매우 분명합니다.

다행스럽게도 Tencent의 풍부한 멀티미디어 애플리케이션 시나리오와 Tencent Cloud가 적용되는 수많은 실시간 대화형 상위 고객은 Canghai의 연구 개발에 대한 고유한 분석 및 검증 조건을 제공합니다.

팀은 먼저 Canghai의 핵심 자체 개발 모듈인 하드웨어 비디오 인코더 "Yaochi"를 출시했으며, Canghai가 연구 개발을 완료하기 전에 Yaochi에게 대규모 테스트를 제공하기로 결정했습니다.

이번 빅 테스트는 모스크바 주립대학교(MSU)가 주최하는 2020 MSU 세계 코덱 대회로, 10년 넘게 전 세계 영상 압축 분야에서 가장 영향력 있는 최고 행사로 자리매김해 왔다. Intel, Nvidia, Google, Huawei, Alibaba, Tencent 등 국내외 유명 기술 기업이 참가했습니다.

그 결과 Yaochi는 1080P@60Hz 비디오 실시간 인코딩을 달성하여 경쟁사를 압도하고 SSIM(구조적 유사성), PSNR(피크 신호 ​​대 잡음비) 및 VMAF( 영상 다중 방식 평가 융합) 객관적 지표 평가 1위와 인간의 눈에 대한 주관적 평가 1위가 2위보다 한 자리 앞서 있다.

이 힘든 전투 끝에 창하이는 기술적으로 완전히 재검토되었습니다.

2022년 3월 5일, 데릭과 그가 이끄는 비디오 인코딩 및 디코딩 팀은 전염병으로 인해 선전의 완전한 원격 근무와 동시에 테이프아웃에서 'Canghai' 칩을 받았습니다.

그들은 빈 사무실 건물에 들어가기 위해 특별 허가를 신청했습니다. 이 장면은 2년 전 봉래에 불이 켜졌을 때와 매우 비슷합니다.

펑라이를 조명하는 우여곡절도 또 일어날 거라고는 상상도 못했어요. 디버깅 중 몇 가지 사고를 극복한 후 Tencent의 세 번째 칩이자 완전히 독립적으로 개발된 최초의 칩 Canghai가 환호 속에 성공적으로 조명되었습니다.

바다를 물방울로 바꿔보세요. 창하이는 마침내 더 적은 양의 데이터와 더 작은 대역폭으로 동일한 품질의 비디오를 제공한다는 목표를 달성했으며, 압축률은 업계 최고 성능에 비해 30% 이상 향상되었습니다.

Penglai에서 Zixiao, Canghai까지, 28nm 프로세스에서 12nm 프로세스까지, 8명에서 100명 이상으로, 시뮬레이션 도구가 없는 것부터 "Tianjian Verification Platform"의 공식 완성까지, 열심히 일하는 것까지 완전한 SOC를 독립적으로 구축하려면 파트너의 속도를 따라가세요.

두 팀이 성공적으로 만났습니다. Penglai 팀은 "핵심" 도로 진화를 완료했습니다.

05

'100G' 시대, 두 그루의 나무가 우뚝 솟아 있다

코어 제작 트렌드에 뛰어드는 건 클라우드 아키텍처 플랫폼 사업부만이 아니다 .

멀티미디어와 AI 처리가 적극적으로 변화를 추구하는 동안, 기반 클라우드 서버도 비슷한 문제에 직면해 있습니다. 소프트웨어 최적화를 통한 성능 향상으로 제품이 경쟁 제품과 확실히 경쟁할 수 없는 경우, 어떻게 성능을 만들어낼 수 있을까요? 기존 천장을 뚫고 들어가나요?

2019년 Tencent는 클라우드 컴퓨팅 사업에서 클라우드 서버 수가 100만 대를 돌파하는 획기적인 사건을 맞이했습니다. Tencent Cloud 부사장이자 Tencent 네트워크 플랫폼 부서 총괄 관리자인 Zou Xianneng은 서버 액세스 대역폭이 계속 증가함에 따라 서버가 네트워크 처리를 위해 점점 더 많은 CPU 리소스를 사용한다는 점을 예리하게 관찰했습니다.

더 높은 네트워크 성능을 제공하면서도 더 비용 효과적인 방식으로 서버 네트워크 처리를 구현할 수 있습니까? Tencent의 네트워크 플랫폼 부서도 소프트웨어 및 하드웨어 협업과 하드웨어 가속화에 관심을 두었습니다.

"필요와 원함 모두"라는 과제에 직면한 Zou Xianneng은 "CPU에서 네트워크 데이터 처리 부담을 덜어주기" 위해 서버를 빼기로 결정했습니다.

'스마트 네트워크 카드'라는 아이디어가 탄생했다.

소위 스마트 네트워크 카드는 일반 네트워크 카드처럼 서버의 외부 네트워크 액세스를 담당하며 서로 다른 서버와 데이터 센터 간의 네트워크 상호 연결을 실현합니다.

반면에 서버의 가상화된 컴퓨팅 작업 중 일부를 공유하고 서버의 전체 네트워크 및 스토리지 성능을 가속화할 수 있는 CPU/FPGA/메모리와 같은 추가 지능형 장치가 있습니다.

즉, 네트워크 플랫폼 부서가 해야 할 일은 네트워크 카드에 새로운 서버를 설치하는 일이다.

처음에 팀은 작업량을 줄이기 위해 기성 상업용 보드를 찾기를 희망했습니다.

네트워크 카드 하드웨어 담당자인 헤이든이 주도적으로 프로그램 시연과 연구를 진행했다. 그러나 상용 칩의 가속 엔진은 프라이빗 프로토콜을 지원하지 않았는데, 이것이 첫 번째 과제이자 과제였다. 당시 가장 큰 장애물. 일부 유명 네트워크 카드 장비 제조업체는 Tencent의 요청을 듣고 고개를 저었습니다.

"현재 네트워크 카드의 기능은 매우 간단하지만 귀하의 요청은 너무 복잡하고 달성하기 어렵습니다."

또한 일부에서는 "네트워크 카드가 너무 많고 안정성 요구 사항이 높으니 직접 처리할 수 있습니까?"라고 직설적으로 질문했습니다.

스마트 네트워크 카드 프로젝트가 시작하자마자 중단됩니까?

Zou Xianneng은 팀의 방향을 다음과 같이 지적했습니다. "스마트 네트워크 카드는 최고의 성능과 비용을 추구하는 클라우드 데이터 센터의 핵심 구성 요소이기 때문에 시장에 Tencent의 요구 사항을 충족하는 제품이 없다면 그러면 우리가 직접 만들겠습니다."

방향이 명확해지자 경로는 빠르게 명확해졌습니다. FPGA 기반의 자체 개발 스마트 네트워크 카드로 시작한 다음 스마트 네트워크 카드 칩을 개발하는 것입니다.

2020년 9월, Tencent의 1세대 FPGA 기반 자체 개발 스마트 네트워크 카드인 "Metasequoia"가 공식 출시되었습니다. 이는 제품이 적응력이 뛰어나고 빠르게 성장할 수 있다는 팀의 희망을 구현합니다. 희귀나무 .

전염병 속에서 각종 갑작스러운 요구가 왔지만, 새로 태어난 메타세쿼이아는 그 도전에도 굴하지 않았다.

Hayden은 대규모 고객이 속성 측면에서 "신뢰할 수 없고" 패킷 손실을 허용하는 UDP 오디오 및 비디오 프로토콜을 채택했다고 회상했습니다. 이 프로토콜은 네트워크 처리량과 안정성에 크게 의존하지만 높은 동시성과 높은 수준을 요구했습니다. -품질의 오디오 및 비디오 전송 효과.

메타세쿼이아 스마트 네트워크 카드는 서버의 네트워크 성능을 대폭 개선하고 온라인에서 안정적으로 운영하며 아름다운 답변을 전달함으로써 고객이 24시간 극한 스트레스 테스트를 패킷 손실 없이 완료할 수 있도록 도왔습니다. .

메타세쿼이아가 상용화된 이후 2세대 스마트 네트워크 카드 '인산(Yinshan)' 연구개발 작업도 본격화해 2021년 10월 정식 출시될 예정이다. 이 세대의 스마트 네트워크 카드의 네트워크 포트는 2*100G로 두 배로 늘어났습니다.

또 다른 우뚝 솟은 나무의 지원으로 Tencent Cloud는 업계 최초로 자체 개발한 6세대 100G 클라우드 서버를 출시했습니다. 컴퓨팅 성능은 최대 220%, 스토리지 성능은 최대 100% 향상됩니다. 이전 세대에 비해 단일 노드 액세스 네트워크 대역폭은 최대 4배 증가하고 지연은 50% 감소합니다.

팀은 "Two Trees"가 네트워크 하드웨어 오프로딩에서 얻은 엄청난 이익에 대해 매우 기뻐하고 있습니다.

FPGA 경로가 점차 성능과 전력 소비의 병목 현상에 접근하자 네트워크 플랫폼 부서는 다시 한번 스스로 주도권을 잡기로 결정했습니다. Tencent의 네 번째 칩이자 최초의 스마트 네트워크 카드 칩이 탄생했습니다. 이 칩에는 "요정"이라는 이름도 있습니다.

06

'Xuanling'이 갑자기 등장했지만 핵심 사업은 아직 끝나지 않았습니다

계획에 따르면 이 7나노 공정 칩은 테이프가 될 것입니다 - 2022년 말까지.

Hayden은 Xuanling 칩 연구 개발 팀을 신속하게 구성하여 여러 가지 "임무 불가능"에 끊임없이 도전하라는 명령을 받았습니다.

성능 지표 측면에서 Xuanling이 지원하는 장치 수는 상용 칩보다 6배 더 많은 10K 이상으로 증가할 것입니다. 동시에, 상용 칩에 비해 성능이 4배 향상될 수 있으며, 호스트 CPU에서 원래 실행되던 가상화, 네트워크/스토리지 IO 및 기타 기능을 칩에 오프로드함으로써 호스트 CPU를 전혀 사용하지 않을 수 있습니다.

이 짧고 컴팩트한 칩은 미래를 위한 최고의 성능의 '미스터리'와 다양한 비즈니스 요구에 맞는 유연한 가속화의 '정신'을 완벽하게 설명합니다.

현재 Xuanling 프로젝트는 Penglai에서 Tencent Cloud의 차세대 고성능 네트워크 인프라를 구축하기 위해 테이프아웃 전에 스마트 네트워크 카드에 대한 검증 및 테스트를 집중적으로 수행하고 있습니다. Lab 칩 Zixiao와 비디오 트랜스코딩 칩 Canghai는 대량 생산되어 Tencent의 비즈니스와 긴밀하게 통합될 것입니다.

또한 양조 및 성장 중인 몇 가지 새로운 칩 프로젝트도 있으며 우리는 계속해서 탐색할 것입니다. 이 "산과 바다의 책"을 풍부하게 하기 위해 필요한 기술적 지침입니다.

Tencent의 대규모 비즈니스가 직면한 새로운 과제와 클라우드 컴퓨팅의 급속한 발전에 대한 불가피한 요구 사항으로 인해 Tencent는 이러한 핵심 생성 경로를 시작하게 되었습니다. 비즈니스 요구 사항을 기반으로 하는 이러한 칩은 실제 응용 프로그램에 깊이 들어가 그 가치를 입증할 것입니다.

"우리는 단지 허공에서 칩을 만드는 것이 아닙니다. 우리는 Tencent의 수요가 우리가 이 일을 할 만큼 충분히 크다는 것을 처음부터 알고 있었습니다."라고 Lu Shan은 말했습니다.

2010년부터 Tencent는 클라우드 서비스 형태로 디지털 기술과 연결 기능을 외부 세계에 개방하기 시작하여 디지털 전환과 산업 업그레이드 시대로 돌진했습니다. Tencent는 게임에 뛰어들어 깊은 디지털-실제 통합이 Quanzhen 인터넷의 기술 트렌드를 주도하고 있음을 확인했습니다.

텐센트 외에도 중국의 기술 기업들이 심해 혁신 분야에 진출하고 있어 병목 현상을 돌파하려는 노력이 점점 더 중요해지고 있다. 데이터와 현실의 통합이든 업스트림 혁신이든 수백 개의 기업이 하드 기술의 바다에서 경쟁하고 있으며 모두 역사의 물결을 타고 있습니다.

이러한 흐름에 얽매이면서 텐센트의 핵심 이슈는 필연적으로 별바다에 울려 퍼지게 될 것이다.