Чіпи Nvidia Blackwell AI-чіпси стикаються з серйозними проблемами перегріву при встановленні в стелажах серверів з високою ємністю.Ці проблеми призвели до змін та затримок дизайну та викликали занепокоєння серед клієнтів, як Google, Meta та Microsoft про своєчасне розгортання серверів Блеквелла.
Інсайдери виявили, що GPU Blackwell Nvidia може перегрітися при використанні на серверах із 72 чіпами.Очікується, що ці пристрої споживають до 120 кВт потужності на стійку.Ці проблеми змусили NVIDIA повторно оцінювати її дизайн серверної стійки кілька разів, оскільки перегрів може обмежувати продуктивність GPU та становити ризик пошкодження компонентів.Клієнти стурбовані тим, що ці невдачі можуть перешкоджати їх розкладу для розгортання нових мікросхем в центрах обробки даних.
Згідно з повідомленнями, NVIDIA доручила своїм постачальникам внести багаторазові зміни в стійці для вирішення проблем перегріву.Компанія тісно співпрацює зі своїми постачальниками та партнерами для розробки інженерних переглядів для покращення охолодження сервера.Хоча ці коригування є стандартною практикою для такого масштабного випуску технологій, вони все ще додають затримки та ще більше затримують очікувану дату доставки.
Згідно з повідомленням First Financial, у відповідь на затримки та проблеми перегріву, прес -секретар Nvidia заявив: "Ми працюємо з провідними постачальниками хмарних послуг як важливої частини нашої інженерної команди та процесів. Інженерні ітерації є нормальними та очікуваними. ІнтеграціяGB200, найсучасніша система на сьогоднішній день, у різні середовища центру обробки даних вимагає спільного дизайну з нашими клієнтами ".NVIDIA також заявив, що "клієнти зараз користуються ринковою можливістю для систем GB200.
Раніше NVIDIA довелося відкласти виробництво Блеквелла завдяки проектним дефектам урожайності мікросхеми.GPU Blackwell B100 та B200 NVIDIA використовують технологію упаковки TSMC Cowos-L для з'єднання двох своїх мікросхем.Ця конструкція включає проміжний шар RDL з мостом LSI (локальний кремнію), підтримуючи швидкість передачі даних до 10 ТБ/с.Точне позиціонування цих мостів LSI має вирішальне значення для роботи технології, як очікувалося.Однак невідповідність характеристик теплового розширення між мікросхемами GPU, Bridges LSI, RDL -проміжками та субстратами материнської плати призвело до збоїв у розривах та системах.Для вирішення цього питання NVIDIA модифікував верхній металевий шар та структуру шишки кремнію GPU для підвищення надійності виробництва.
Тому остаточний переглянутий GPU Nvidia Blackwell розпочне масове виробництво лише наприкінці жовтня, а це означає, що Nvidia зможе доставити ці фішки з кінця січня наступного року.
Клієнти NVIDIA, включаючи технічні гіганти, такі як Google, Meta та Microsoft, використовують GPU NVIDIA для підготовки своїх найпотужніших великих мовних моделей.Затримка GPU Blackwell AI, природно, вплине на плани та продукцію клієнтів Nvidia.