Cerebras meluncurkan prosesor skala wafer 125 PetaFLOPS 900.000 inti untuk AI — secara teoritis setara dengan sekitar 62 GPU Nvidia H100

Cerebras Systems telah meluncurkan Wafer Scale Engine 3 (WSE-3), sebuah terobosan chip skala wafer AI dengan kinerja dua kali lipat dari pendahulunya, WSE-2. Perangkat baru ini mengemas 4 triliun transistor yang dibuat berdasarkan proses fabrikasi kelas 5nm TSMS; 900.000 inti AI; SRAM dalam chip 44GB; dan memiliki performa puncak 125 FP16 PetaFLOPS. WSE-3 Ceberas akan digunakan untuk melatih beberapa model AI terbesar di industri.

WSE-3 mendukung superkomputer CS-3 Cerebras, yang dapat digunakan untuk melatih model AI dengan hingga 24 triliun parameter – sebuah lompatan signifikan dibandingkan superkomputer yang didukung oleh WSE-2 dan prosesor AI modern lainnya. Superkomputer ini dapat mendukung memori eksternal 1,5TB, 12TB, atau 1,2PB, yang memungkinkannya menyimpan model berukuran besar dalam satu ruang logis tanpa mempartisi atau memfaktorkan ulang — menyederhanakan proses pelatihan dan meningkatkan efisiensi pengembang.

(Kredit gambar: Otak)

Dalam hal skalabilitas, CS-3 dapat dikonfigurasi dalam cluster hingga 2048 sistem. Skalabilitas ini memungkinkannya menyempurnakan 70 miliar model parameter hanya dalam satu hari dengan pengaturan empat sistem, dan melatih model Llama 70B dari awal dalam jangka waktu yang sama dalam skala penuh.