Подробная информация о гигантском процессоре Tesla Dojo была раскрыта на мероприятии Rutab.net
2 мая 2024
Одним из менее заметных моментов Североамериканского технологического симпозиума TSMC на прошлой неделе было объявление о том, что процессор на основе системы на пластине Tesla Dojo для обучения искусственному интеллекту сейчас находится в массовом производстве и вскоре будет развернут. Более подробная информация о гигантском процессоре была раскрыта на мероприятии. Система на пластине Tesla Dojo (или, как его называет Tesla, тренировочная пластина Dojo) основана на массиве 5х5 процессорных чипов, которые размещаются на несущую пластину и соединены между собой с помощью интегрированной технологии разветвления TSMC (InFO) для межсоединений в масштабе пластины (InFO_SoW). Технология InFO_SoW разработана для обеспечения такой высокопроизводительной связи, при которой 25 кристаллов Tesla Dojo будут действовать как один процессор, сообщает IEEE Spectrum. Между тем, чтобы сделать процессор однородным в масштабе пластины, TSMC заполняет пустые места между кристаллами манекенами. Поскольку учебная пластина Tesla Dojo по существу содержит 25 сверхвысокопроизводительных процессоров, она чрезвычайно энергоемка и требует сложной системы охлаждения. Для питания системы на пластине Tesla использует очень сложный модуль регулирования напряжения, который подает мощность 18 000 ампер на вычислительную плоскость. Последний рассеивает до 15 000 Вт тепла и поэтому требует жидкостного охлаждения. Tesla еще не раскрыла производительность своей системы на пластине Dojo, хотя, учитывая все проблемы, связанные с ее разработкой, похоже, что она может стать очень мощным решением для обучения ИИ. Процессоры такого масштаба, как Dojo от Tesla и WSE от Cerebras , значительно более эффективны в производительности, чем многопроцессорные машины. Их основные преимущества включают высокую пропускную способность и низкую задержку связи между ядрами, уменьшенное сопротивление сети подачи энергии и превосходную энергоэффективность. Кроме того, эти процессоры могут выиграть от наличия резервных «дополнительных» ядер — или, в случае Tesla, «заведомо хороших» процессорных ядер (known-good processor core). Но на данный момент с такими процессорами есть свои проблемы. В настоящее время системам на пластинах приходится использовать исключительно встроенную память, которая не является гибкой и может оказаться недостаточной для всех типов приложений. Эта проблема будет решена с помощью платформы «система на пластине» следующего поколения под названием CoW_SoW, которая позволит осуществлять 3D-стекирование и установку памяти HBM4 на процессорные плитки. На данный момент только Cerebras и Tesla имеют конструкции системы на пластине. Но TSMC уверена, что со временем все больше разработчиков процессоров искусственного интеллекта и высокопроизводительных вычислений будут создавать конструкции в масштабе пластины. Rutab.net
Источник:Подробная информация о гигантском процессоре Tesla Dojo была раскрыта на мероприятии (rutab.net)