AI 및 로봇 공학
Tesla는 차량, 로봇 등의 분야에서 대규모의 자율 주행 기술을 개발하고 배포합니다. Tesla는 효율적인 추론 하드웨어 사용으로 뒷받침되는 비전 및 플래닝을 위한 첨단 AI 기반 접근 방식이야말로 풀 셀프 드라이빙과 이족 보행 로봇 공학, 그 이상에 대한 해결책을 찾을 수 있는 유일한 방법이라고 생각합니다.
Tesla Bot
안전하지 않거나 반복적이거나 지루한 작업을 수행할 수 있는 범용 이족 보행 휴머노이드 로봇을 개발합니다. 최종 목표를 달성하기 위해서는 물리적 세계와의 균형, 탐색, 인식 및 상호 작용을 가능하게 해주는 소프트웨어 스택을 구축해야 합니다. Tesla는 가장 어려운 엔지니어링 과제 해결을 위해 딥 러닝, 컴퓨터 비전, 모션 플래닝, 제어, 기계 및 일반 소프트웨어 엔지니어를 고용하고 있습니다.
풀 셀프 드라이빙 구현 기능 칩
와트당 최대 실리콘 성능을 발휘하면서 모든 소형 아키텍처 및 마이크로 아키텍처 개선을 고려하여 풀 셀프 드라이빙 소프트웨어를 실행하는 AI 추론 칩을 개발합니다. 설계에 대한 평면도, 타이밍 및 전력 분석을 수행합니다. 강력한 테스트와 스코어보드를 작성하여 기능 및 성능을 검증합니다. 성능 최적화 및 이중화에 중점을 두고 칩을 프로그래밍하고 통신할 수 있는 드라이버를 구현합니다. 마지막으로, 실리콘 칩을 검증하여 Tesla 차량에서 대량 생산할 수 있도록 합니다.
Dojo 칩
AI 훈련 칩을 개발하여 Dojo 시스템을 강화합니다. 가장 작은 훈련 노드에서부터 다중 다이 훈련 타일에 이르기까지 최신 기술을 구현합니다. 모든 단위에서 최대 성능, 처리량 및 대역폭을 위해 디자인하고 설계합니다. 칩의 물리적 방법론, 평면도 및 기타 물리적 측면을 지시합니다. 기능적 정확성을 보장하기 위해 사전 실리콘 검증 및 사후 실리콘 검증 방법을 개발합니다. 컴파일러 및 드라이버를 작성하여 전체 Dojo 시스템에서 신경망의 작동 및 성능을 최적화합니다. Dojo의 연산 형식 및 방법에 대한 자세한 내용은 최신 백서를 다운로드하세요.
Dojo 시스템
실리콘 펌웨어 인터페이스에서부터 이를 제어하는 고급 소프트웨어 API까지 Dojo 시스템을 개발 및 설계합니다. 고전력 공급 및 냉각을 위한 최첨단 기술로 어려운 문제를 해결하고 확장 가능한 제어 루프 및 모니터링 소프트웨어를 작성합니다. Tesla 데이터 센터에서 사용할 차세대 머신 러닝 컴퓨팅을 만들기 위해 기계, 열 및 전기 엔지니어링 팀의 역량을 최대한 활용하여 시스템 설계의 모든 측면에서 작업하세요. 한계란 상상에 불과합니다. Tesla 차량 학습과 협력해 대용량의 데이터 세트를 사용하여 교육 작업량을 배포하고 Dojo를 대중에게 제공할 공개 API를 설계합니다.
신경망(Neural Network)
최첨단 연구를 적용하여 지각에서 제어에 이르는 문제에 대해 심층 신경망을 훈련시킵니다. 당사의 카메라별 네트워크는 원시 이미지를 분석하여 시맨틱 분할, 물체 감지 및 단안 깊이 추정을 수행합니다. Tesla의 조감도 네트워크는 모든 카메라의 비디오를 촬영하여 도로 레이아웃, 정적 인프라 및 3D 개체를 하향식 보기에서 직접 출력합니다. Tesla의 네트워크는 수백만 대의 차량에서 실시간으로 반복적으로 제공되는 세계에서 가장 복잡하고 다양한 시나리오를 통해 학습합니다. 오토파일럿 신경망의 전체 빌드에는 훈련하는 데 70,000 GPU 시간이 걸리는 48개의 네트워크가 포함됩니다 🔥. 각 시간 단계에서 1,000개의 고유한 텐서(예측)를 출력합니다.
자율 학습 알고리즘
공간을 높은 정밀도로 표현하고 해당 공간에서 궤적을 계획하여 차량을 주행하는 핵심 알고리즘을 개발합니다. 이러한 표현을 예측하기 위해 신경망을 학습시키려면 공간과 시간에 걸쳐 차량 센서의 정보를 결합하여 알고리즘으로 정확하고 대규모의 실측 데이터를 생성합니다. 최첨단 기술을 사용하여 불확실성이 높은 복잡한 실제 상황에서 작동하는 강력한 계획 및 의사 결정 시스템을 구축합니다. 전체 Tesla 차량의 규모로 알고리즘을 평가합니다.
코드의 기초
처리량, 지연 시간, 정확성 및 결정론 등은 코드를 최적화하는 주요 측정 항목입니다. 사용자 지정 하드웨어와 긴밀하게 통합되어 스택의 가장 낮은 수준에서 오토파일럿 소프트웨어를 구축합니다. 무선 업데이트를 지원하는 안정적인 부트로더(Bootloader)를 구현하고 맞춤형 리눅스(Linux) 커널을 가져옵니다. 빠르고, 메모리 사용량이 적은 낮은 단계의 코드를 작성하여 센서의 고주파수 대용량 데이터를 캡처하고 중앙 처리 장치의 메모리 액세스 대기 시간에 영향을 주거나 CPU 사이클의 중요한 기능 코드에 영향을 주지 않으면서 여러 소비자 프로세스와 공유합니다. 여러 SoC(System-on-chip)에 분산되어 있는 다양한 하드웨어 처리 장치에서 연산을 최대화하고 병렬 연산을 수행합니다.
평가 인프라
개방 및 폐쇄형 루프 HIL(Hardware in-the-loop-in) 평가 도구 및 인프라를 구축하여 혁신 속도를 가속화하고 성능 향상도를 추적하며 회귀 현상을 방지합니다. Tesla 차량들에서 추출된 익명의 특성 클립들을 활용하여 대규모 테스트 케이스에 통합합니다. 실제 환경을 시뮬레이션하는 코드를 작성하여 실시간 디버깅 또는 자동화된 테스트를 위해 오토파일럿 소프트웨어에 공급하는 실제와 유사한 그래픽 및 기타 센서 테이터를 생성합니다.