整理 WSE-3 參數(shù)如下:
臺(tái)積電 5nm 制程;
4 萬(wàn)億個(gè)晶體管;
900000 個(gè) AI 核心;
44GB 片上 SRAM 緩存;
可選 1.5TB / 12TB / 1.2PB 三種片外內(nèi)存容量;
125 PFLOPS 的峰值 AI 算力。

Cerebras 宣稱(chēng)基于 WSE-3 的 CS-3 系統(tǒng)憑借其至高 1.2PB 的內(nèi)存容量,可訓(xùn)練比 GPT-4 和 Gemini 大 10 倍的下一代前沿模型。其可在單個(gè)邏輯內(nèi)存空間中容納 24000T 參數(shù)規(guī)模的模型,大大簡(jiǎn)化了開(kāi)發(fā)人員的工作。
CS-3 適合超大規(guī)模 AI 需求,緊湊的四系統(tǒng)集群可以在一天內(nèi)微調(diào) 70B 模型,而在使用最大規(guī)模的 2048 個(gè) CS-3 系統(tǒng)集群時(shí),可以在一天內(nèi)完成 Llama 70B 模型的訓(xùn)練。
Cerebras 表示 CS-3 系統(tǒng)具有卓越的易用性,大模型訓(xùn)練中所需代碼相較 GPU 減少 97%,僅需 565 行代碼就可達(dá)成 GPT-3 大小模型的標(biāo)準(zhǔn)實(shí)現(xiàn)。
阿聯(lián)酋 G42 財(cái)團(tuán)已表示將打造基于 Cerebras CS-3 的 Condor Galaxy 3 超算,包含 64 個(gè)系統(tǒng),可提供 8 exaFLOP 的 AI 算力。