Sepasang daftar benchmark SiSoftware telah meluncurkan dua GPU Intel baru dengan 10 dan 12 inti Xe, dengan VRAM 12 GB pada kedua hasil. Ada kemungkinan kedua GPU ini adalah kartu grafis Battlemage masa depan, meskipun kecepatan clock yang relatif rendah dan jumlah inti yang terbatas masih menyisakan ruang untuk perdebatan. Ini juga bisa berupa konfigurasi Alchemist alternatif, daftar palsu, atau bahkan solusi grafis terintegrasi yang potensial. Tapi mari kita bicara tentang apa yang kita ketahui saat ini.
Battlemage adalah penerus Arc Alchemist yang akan ditargetkan pada pasar kartu grafis khusus. Ini juga akan digunakan sebagai solusi grafis terintegrasi masa depan untuk arsitektur CPU Intel di masa depan (termasuk Lunar Lake). Intel dikabarkan menargetkan tanggal rilis Q3 2024, yang sejalan dengan potensi kebocoran Battlemage.
Menurut daftar SiSoftware, spesifikasi kedua GPU tersebut tampaknya tidak mengesankan. Penawaran olahraga yang paling tidak ampuh hanya 1.440 ALU shader, sedangkan SKU yang lebih kuat memiliki 1.728 ALU shader. Sebagai gambaran, Arc A580 memiliki 3456 shader, sedangkan Arc A380 memangkasnya menjadi 1024 shader. Namun ada beberapa keingintahuan lain yang perlu didiskusikan. Bergantung pada berapa banyak shader di setiap Xe-core, kita akan mendapatkan 10 dan 12 Xe-core, atau mungkin 20 dan 24 Xe-core. Jawaban mana yang benar sangat penting, seperti yang akan kita bahas di bawah.
Kecepatan clock juga sangat rendah, hanya 1,8GHz, yang memang mungkin disebabkan oleh pengujian silikon dan driver awal. Satu-satunya spesifikasi yang lebih tinggi adalah keduanya memiliki VRAM 12GB, yang lebih baik daripada 8GB yang ditemukan pada GPU kelas menengah A580 dan A750. Namun kartu tersebut menggunakan chip 1GB dengan antarmuka 256-bit, jadi masih mungkin ini adalah Alchemist, hanya dikonfigurasi dengan chip 2GB dan antarmuka 192-bit.
Dan kemudian ada cache L2 sebesar 8MB. Itu angka yang agak aneh untuk kartu 12GB, karena GPU Intel Alchemist memiliki 4MB atau 2MB per pengontrol 64-bit. A750 dan A770 keduanya memiliki cache L2 sebesar 16MB sedangkan A580 memiliki 8MB, namun tidak jelas bagaimana chip dengan antarmuka 192-bit dapat mencapai total cache 8MB — 2,67MB per antarmuka 64-bit sepertinya tidak mungkin, dan jumlah L2 yang begitu kecil juga tidak masuk akal untuk arsitektur Battlemage masa depan. Tentu saja, cache L2 dapat dipisahkan dari antarmuka memori, dan Intel mungkin memiliki cache L3 yang tidak muncul dalam hasil “bocor” ini, namun kami tidak mengetahui secara pasti.
Dibandingkan dengan GPU Arc Alchemist Intel yang ada, kedua GPU ini menawarkan jumlah inti shader yang cukup rendah — lebih banyak dari Arc A380 tetapi jauh lebih sedikit dibandingkan Arc A580. Perhatikan juga bahwa kami tidak dapat mengesampingkan kemungkinan bahwa ini adalah chip seluler awal untuk tujuan pengujian dan debugging. Sistem yang digunakan menunjukkan motherboard Intel Z790, tetapi GPU seluler dapat diuji dengan desktop jika kebocoran ini berasal dari laboratorium perangkat keras.
Dalam hal positioning, ini tampaknya merupakan solusi grafis anggaran untuk kelas menengah, mengingat dugaan jumlah Xe-core. Kami juga menerima data yang dilaporkan SiSoftware pada nilai nominalnya, yang mencantumkan “kapasitas” 160 CU dan 192 CU dengan “shader” 1440 dan 1728. Intel tidak menggunakan CU atau Compute Units untuk GPU-nya, seperti AMD, sedangkan Nvidia menggunakan “Streaming Multiprocessors”, tetapi SiSoftware menggunakan label CU yang sama untuk ketiganya. GPU Intel ini tampaknya menggunakan “CU dikalikan sembilan” untuk angka shader, dengan angka CU dasar adalah 16 kali jumlah Xe-core — atau jika Anda ingin menjadi jadul, ini adalah jumlah Unit Eksekusi dari GPU Intel yang lebih lama .
Jelas seperti lumpur? Mari kita berikan contoh yang lebih konkrit dengan konfigurasi GPU yang diketahui. Daftar Arc A380 ini mengatakan 128 CU dan 1152S. Arc A380 yang sebenarnya memiliki delapan Xe-core dengan 1024 shader ALU yang tersebar di enam belas Mesin Vektor (sebelumnya disebut Unit Eksekusi) per Xe-core. Ada juga satu ALU “tujuan khusus” (matematika lanjutan) tambahan per Mesin Vektor. Jadi, 8 * 16 * 9 = 1152 shader ALU. Namun penghitungan yang sama dari SiSoftware tampaknya tidak berlaku untuk GPU seri Arc A yang lebih besar karena alasan apa pun (mereka menggunakan Xe-core * 16 * 8, tanpa memperhitungkan ALU matematika yang diperluas). Begini rinciannya:
Untuk saat ini, data performa tidak terlalu membantu mengingat kami tidak yakin dengan beberapa spesifikasi dan seberapa tinggi Battlemage. Konfigurasi inti dan kecepatan clock menunjukkan bahwa kinerjanya akan lebih baik daripada A380 — dan memang demikian adanya. Tampaknya Intel juga mendapatkan kinerja yang jauh lebih baik dari lebih sedikit shader dengan GPU yang tidak diketahui ini.
Sebagai perbandingan, hasil OpenCL Arc A580 sebesar 6.121Mpix/s hampir sama dengan 10 (atau 20?) chip Xe-core yang tidak diketahui sebesar 6.031Mpix/s, tetapi A580 memiliki 24 Xe-core. Dan inilah Arc A750 OpenCL yang mendapatkan 7.145Mpix/s sedangkan hasil Arc A770 OpenCL ini adalah 8.229Mpix/s — dengan GPU 12 (atau 24?) Xe-core yang seharusnya mendapatkan 7.231Mpix/s. Dengan asumsi penghitungan shader benar, chip yang tidak diketahui dengan mudah mengalahkan GPU Alchemist yang memiliki konfigurasi serupa.
GPU “baru” ini berada pada level A580 dan A750, tetapi dengan shader yang jauh lebih sedikit, ditambah konfigurasi memori yang berbeda. Jika ini adalah Battlemage dan dapat memiliki clock 40% lebih tinggi dari 1,8GHz yang ditunjukkan di sini, dan kemudian jika kami mendapatkan chip dengan hingga 32 Xe-core dan 4096 shader, kami akan mendapatkan tingkat kinerja yang layak. Xe-core tiga kali lebih banyak dari perkiraan GPU 10-core ditambah clock yang lebih tinggi berpotensi menempatkan chip Intel tersebut ke dalam wilayah RTX 4070 Ti. Tapi jangan terlalu terbawa suasana, karena cache dan spesifikasi lainnya masih terlihat aneh, dan angka Xe-core mungkin sebenarnya dua kali lipat dari yang kami gunakan.
Kami telah belajar dari AMD dan Nvidia bahwa cache yang lebih besar pada GPU dapat meningkatkan kinerja secara signifikan. Intel juga telah mempelajari hal ini, dan meskipun mungkin sudah terlambat untuk menambahkan cache yang besar ke Alchemist, kami berharap Battlemage hadir dengan cache yang lebih besar. 8MB tidak cukup, meskipun mungkin saja Intel memiliki cache L3 dan SiSoftware tidak menanyakan atau melaporkan nilai tersebut.
Pada akhirnya, masih terlalu dini untuk mengatakan seberapa cepat Battlemage nantinya, tetapi bocoran spesifikasi ini setidaknya terlihat menjanjikan. Jika chip 12 Xe-core pada 1,8 GHz sudah dapat menandingi A750, dan jika Intel mencapai 32 Xe-core dengan Battlemage, kita mungkin sebenarnya sedang mencari solusi Intel yang cukup kompetitif yang mungkin dapat mengalahkan AMD kelas atas. dan solusi Nvidia. Mungkin.
Atau, itu adalah chip Battlemage 24 Xe-core yang berjalan pada 1,8 GHz dan cocok dengan chip Alchemist 28 Xe-core 2,4 GHz. Kami sudah mengetahui posisi A750 dalam hierarki benchmark GPU kami, namun meskipun meningkatkan jam dan kinerja sebesar 50% tentu akan membantu, hal ini tetap hanya akan menghasilkan sesuatu yang setingkat dengan RTX 3070, dan lebih lambat dibandingkan RTX 4060 Ti. Semoga saja hal ini tidak terjadi.
Intel sudah tertinggal dua tahun dalam persaingan, dan dengan konfirmasi Intel bahwa pengembangan perangkat keras Battlemage telah selesai dan 70% tim telah beralih ke Celestial — arsitektur GPU-nya setelah Battlemage — kami berharap hasil yang bocor ini ditujukan untuk anggaran. GPU masa depan dan varian yang jauh lebih besar dan lebih cepat akan segera hadir. Untuk sementara, 30% sisa tim grafis Intel sedang mengerjakan dukungan perangkat lunak dan driver untuk Battlemage, sebagai persiapan peluncurannya akhir tahun ini.