업계동향 분류| Tesla의 웨이퍼 크기 Dojo 프로세서가 생산 중입니다. 25개의 칩이 하나로 결합되어 있습니다
2024.05.03
지난 주 TSMC 북미 기술 심포지엄 에서 눈에 띄지 않는 소식 중 하나는 Tesla의 AI 교육용 Dojo 시스템 온 웨이퍼 프로세서가 현재 대량 생산 중이며 곧 배포될 예정이라는 발표였습니다. 이 행사에서 거대한 프로세서에 대한 자세한 내용이 공개되었습니다.
Tesla의 Dojo 시스템 온 웨이퍼 프로세서 (또는 Tesla가 Dojo Training Tile이라고 부름)는 5×5 배열의 알려진 양호한 프로세서 칩(레티클 크기 또는 이에 가까운)을 사용합니다. 캐리어 웨이퍼와 웨이퍼 규모 상호 연결(InFO_SoW)을 위한 TSMC의 통합 팬아웃(InFO) 기술을 사용하여 상호 연결됩니다. InFO_SoW 기술은 Tesla Dojo의 25개 다이가 단일 프로세서처럼 작동하는 고성능 연결을 가능하게 하도록 설계되었다고 IEEE Spectrum이 보고했습니다 . 한편, 웨이퍼 스케일 프로세서를 균일하게 만들기 위해 TSMC는 다이 사이의 빈 공간을 더미로 채웁니다.
Tesla Dojo Training Tile은 기본적으로 25개의 초고성능 프로세서를 포함하고 있기 때문에 매우 전력 소모가 크고 정교한 냉각 시스템이 필요합니다. 시스템 온 웨이퍼에 전력을 공급하기 위해 Tesla는 컴퓨팅 플레인에 18,000Amp의 전력을 공급하는 매우 복잡한 전압 조절 모듈을 사용합니다. 후자는 최대 15,000W의 열을 방출하므로 액체 냉각이 필요합니다.
Tesla는 아직 Dojo 시스템 온 웨이퍼의 성능을 공개하지 않았습니다. 그러나 개발에 따른 모든 과제를 고려하면 AI 교육을 위한 매우 강력한 솔루션이 될 것으로 보입니다.
Tesla의 Dojo 및 Cerebras의 WSE(웨이퍼 스케일 엔진)와 같은 웨이퍼 스케일 프로세서는 멀티 프로세서 시스템보다 훨씬 더 성능 효율적입니다. 주요 장점으로는 코어 간 고대역폭 및 저지연 통신, 전력 공급 네트워크 임피던스 감소, 뛰어난 에너지 효율성 등이 있습니다. 또한 이러한 프로세서는 중복된 ‘추가’ 코어 또는 Tesla의 경우 정상 작동이 확인된 프로세서 코어를 사용하여 이점을 얻을 수 있습니다.
그러나 현재 이러한 프로세서에는 본질적인 문제가 있습니다. System-on-wafer는 현재 온칩 메모리를 독점적으로 사용해야 하는데 이는 유연성이 없으며 모든 유형의 애플리케이션에 충분하지 않을 수 있습니다. 이는 프로세서 타일에 HBM4 메모리를 3D 스태킹하고 설치할 수 있는 CoW_SoW 라는 차세대 시스템 온 웨이퍼 플랫폼으로 해결될 것입니다 .
현재로서는 Cerebras 와 Tesla만이 시스템 온 웨이퍼 설계를 갖추고 있습니다. 그러나 TSMC는 시간이 지남에 따라 더 많은 AI 및 HPC 프로세서 개발자가 웨이퍼 규모 설계를 구축할 것이라고 확신합니다.
출처:Tesla의 웨이퍼 크기 Dojo 프로세서가 생산 중입니다. 25개의 칩이 하나로 결합되어 있습니다 > 뉴스/신제품 | 쿨엔조이 (coolenjoy.net)