Nvidia: "Grace är dubbelt så effektiv som AMD:s och Intels processorer"

Permalänk
Melding Plague

Nvidia: "Grace är dubbelt så effektiv som AMD:s och Intels processorer"

Nvidias interna testresultat visar att ARM-baserade Grace ger dubbelt så hög prestanda per watt som konkurrenternas Epyc- och Xeon-processorer.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Tvärt om hade varit chockerande. Bara dubbelt är verkligen inget att skryta med, det gör väl alla ARM-kretsar redan? Bara Apples som som inte gör det, de är ännu bättre

Permalänk
Medlem

Gräset är alltså grönare hos lag grön, synd att det inte riktigt stämmer på konsumentgrafikkorten.

Visa signatur

*5600|B350M-A|32GB|A750|GX750W|Core V21|280AIO|1TB+2TB.

AMD Ryzen 5(Zen3) @4891|Asus Prime|Corsair 2x16 RGB PRO 3200C16 @3800C18|Intel Arc LE @2740MHz|Seasonic Focus| Thermaltake mATX kub|Arctic freezer II| NVMe SSD PCIE 3.0x2 Kingston A1000 1500/1000 + 2,5" HDD Toshiba 1TB & Samsung 1TB i RAID 0.

Permalänk
Medlem
Skrivet av medbor:

Tvärt om hade varit chockerande. Bara dubbelt är verkligen inget att skryta med, det gör väl alla ARM-kretsar redan? Bara Apples som som inte gör det, de är ännu bättre

Ja effektiviteten är väl inte så oväntad, dock så är det väl mer en nyhet för mig iaf att man utklassar Intel och matchar AMD i rå prestanda per system sammtidigt. Visst det har redan visat sig tidigare att det går att göra ARM-kretsar med hög prestanda (Apple då t ex), men det har vi väl inte riktigt sett tidigare i detta segment. AWS graviton t ex har väl legat rätt långt bakom tidigare?

Permalänk
Medlem

Effektivitet är ju alltid en balans.
Ofta kan man ju behålla en stor del av prestandan med dramatiskt minskad effekt.
Men om kunderna är villiga att offra lite mer effekt för att få lite mer prestanda så är det ju där ribban läggs.

Sen är det ju alltid relevant i vilken last man mäter.
Om du har en last som fungerar bra på tensor cores så kommer såklart grace prestera bra.

Permalänk
Medlem

Förutom effektiviteten (prestanda/watt) är det ju intressant att veta om det sker på lika många eller färre Rack Units.

Permalänk
Medlem
Skrivet av Fenrisulvfan:

Gräset är alltså grönare hos lag grön, synd att det inte riktigt stämmer på konsumentgrafikkorten.

Det är väl ganska precis så det ser ut för konsumentkorten? Prestanda/krona lämnar däremot lite övrigt att önska.

Men eftersom alla specs baseras på AMD pga konsolerna (bara titta på rekommenderad setup för Starfield) måste man oavsett inte betala det gröna laget för att hänga med.

Permalänk
Medlem

Men dubbelt så dyr ala Nvidia style...

Visa signatur

Intel i5 12600K | 128 GB DDR4 3600 Mhz
ASUS TUF Z690-PLUS D4 | ASUS TUF VG32VQ 32" 1440p
XFX 6900 XT Merc 319 Black Limited
HP ProLiant DL380p Gen8 | HP MicroServer Gen 8 |
Mikrotik 10 GbE Networking

Permalänk
Medlem

Kanske den är, men lär slå i ett prestandatak mycket tidigare likt Apples M-serie.

Visa signatur

Philips 34M2C8600 | RTX 3090 | AMD R7 5800X3D | 32GB 3600MHz DDR4 | Gigabyte X570 Aorus Master | Seagate Firecuda 530 4TB & Kingston A2000 1TB | 27TB HDD | Seasonic Focus GX 850 | Hifiman Sundara | Fractal North XL | LG CX55 | Yamaha HS7+HS8S | Nvidia Shield TV Pro (2019)

Citera för svar!

Permalänk
Medlem
Skrivet av Svensktiger:

Effektivitet är ju alltid en balans.
Ofta kan man ju behålla en stor del av prestandan med dramatiskt minskad effekt.
Men om kunderna är villiga att offra lite mer effekt för att få lite mer prestanda så är det ju där ribban läggs.

Sen är det ju alltid relevant i vilken last man mäter.
Om du har en last som fungerar bra på tensor cores så kommer såklart grace prestera bra.

I servermiljö är energieffektivitet och densitet allt. Om de kan få samma prestanda med samma densitet med halva effekten ALTERNATIVT samma prestanda med halva denisteten och samma effekt så är det totalt avgörande för serverhallar. Kylning och ström kostar enorma summor pengar, likaså med stora byggnader.

Med det sagt så ser jag gärna att X86/X64 dör ut inom kort och ersätts med ARM / RISC / whatever med ett riktigt bra bakåtkompatibelt översättningslager. Vilka mängder energi vi skulle spara.

Visa signatur

I7 12700K, Asus RTX 3080 TI, Alienware AW3423DW och annat smått o gott.

Permalänk
Medlem
Skrivet av dlq84:

Förutom effektiviteten (prestanda/watt) är det ju intressant att veta om det sker på lika många eller färre Rack Units.

Det ser ju väldigt kompakt ut och har lägre effekt än konkurrenterna så den lär iaf inte ta mer plats i ett rack när kylning mm är på plats.

Permalänk
Medlem
Skrivet av Sh4d0wfi3nd:

I servermiljö är energieffektivitet och densitet allt.

Om det var sant så skulle det bara finnas en Epyc/Xeon modell noggrant kalibrerad för bäst prestanda/watt.
Men nu är det ju inte så, olika användare har ju olika krav.
Det finns ju t.ex. modeller med betydligt högre frekvenser för dom som behöver bättre prestana per kärna.
Definitivt sämre prestanda per watt.

Permalänk
Medlem

Hur kommer det sig egentligen att varken AMD eller Intel verkar göra något vettigt med ARM, parallellt med sina satsningar på x86?

Båda bolagen bör väl ändå ha färskt i minnet hur snabbt vinden kan vända så att knappt ens försöka bygga sitt varumärke kring ARM också verkar konstigt.

Permalänk
Medlem
Skrivet av Dumbullen:

Hur kommer det sig egentligen att varken AMD eller Intel verkar göra något vettigt med ARM, parallellt med sina satsningar på x86?

Båda bolagen bör väl ändå ha färskt i minnet hur snabbt vinden kan vända så att knappt ens försöka bygga sitt varumärke kring ARM också verkar konstigt.

Kan ha att göra med att det pratats om ersättare till x86 sedan hedenhös.
Det plus att det bara är 4 företag som har x86 licens (nVidia inte inkluderade), vilket såklart gör att alternativ blir väldigt lockande.

Permalänk
Medlem
Skrivet av Svensktiger:

Effektivitet är ju alltid en balans.
Ofta kan man ju behålla en stor del av prestandan med dramatiskt minskad effekt.
Men om kunderna är villiga att offra lite mer effekt för att få lite mer prestanda så är det ju där ribban läggs.

Sen är det ju alltid relevant i vilken last man mäter.
Om du har en last som fungerar bra på tensor cores så kommer såklart grace prestera bra.

Skrivet av Svensktiger:

Om det var sant så skulle det bara finnas en Epyc/Xeon modell noggrant kalibrerad för bäst prestanda/watt.
Men nu är det ju inte så, olika användare har ju olika krav.
Det finns ju t.ex. modeller med betydligt högre frekvenser för dom som behöver bättre prestana per kärna.
Definitivt sämre prestanda per watt.

Men om vi går efter datan i denna nyhet, så offras ju inte prestandan, utan man ligger betydligt över Intel, och i princip matchar AMD.

Sen är ju inte tensor prestanda relevant här då vi pratar om Grace, och inte hopper.

Skrivet av dlq84:

Förutom effektiviteten (prestanda/watt) är det ju intressant att veta om det sker på lika många eller färre Rack Units.

Det ser ut som det finns produkter med dubbla Grace-moduler (alltså 4st cpuer) på 1U. Även om jag tror från Nvidias håll att man pushar för Grace/Hopper, och produkter med många GPUer blir såklart större.

Permalänk
Medlem
Skrivet av Dumbullen:

Hur kommer det sig egentligen att varken AMD eller Intel verkar göra något vettigt med ARM, parallellt med sina satsningar på x86?

Båda bolagen bör väl ändå ha färskt i minnet hur snabbt vinden kan vända så att knappt ens försöka bygga sitt varumärke kring ARM också verkar konstigt.

Fråga Xerox hur de resonerade så får du samma svar

Visa signatur

Processor: Motorola 68000 | Klockfrekvens: 7,09 Mhz (PAL) | Minne: 256 kB ROM / 512 kB RAM | Bussbredd: 24 bit | Joystick: Tac2 | Operativsystem: Amiga OS 1.3

Permalänk
Datavetare
Skrivet av sKRUVARN:

Ja effektiviteten är väl inte så oväntad, dock så är det väl mer en nyhet för mig iaf att man utklassar Intel och matchar AMD i rå prestanda per system sammtidigt. Visst det har redan visat sig tidigare att det går att göra ARM-kretsar med hög prestanda (Apple då t ex), men det har vi väl inte riktigt sett tidigare i detta segment. AWS graviton t ex har väl legat rätt långt bakom tidigare?

Graviton 1 och 2 uppförde sig rätt mycket som många väntar sig jämfört med x86: bättre perf/W, men sämre absolut prestanda och klart sämre prestanda per kärna.

Graviton 3 var ett rätt stort hopp i prestanda per kärna och prestanda per socket, vid lansering var den i nivå med dåvarande AMD/Intel (fast med långt bättre perf/W, Graviton är mer designad för densitet och hög perf/W än Nvidia Grace). Med AMDs senaste släpp är Graviton 3 efter i råprestanda, men fortfarande klart för i perf/W.

Det som är väldigt intressant med just Grace är att man slår både AMD och Intel på fingrarna i vad som historiskt varit x86 paradgren: prestanda per kärna.

Skalar om dessa resultat till perf/kärna är Grace ~45 % snabbare än AMD Genoa och ~22 % snabbare än Intel Sapphire Rapids.

Nvidia har ingen "egen" CPU-design, de använder ARM Neoverse V2 CPU-kärnor som är fullt möjligt att använda av "vem som helst". Men ryktet säger att både AWS och Ampere Computing (som är den ARM64 leverantör både Microsoft, Google och Oracle använder i sina datacenter) kommer med "egna" designer nästa generation.

Skrivet av dlq84:

Förutom effektiviteten (prestanda/watt) är det ju intressant att veta om det sker på lika många eller färre Rack Units.

Grace "superchip" får plats i 1U rack, undrar om AMD/Intel verkligen får ned två av sina 350/360 W CPUer i ett sådan rack (kanske med lite mer avancerad kylning).

Graviton 3 får in 3 sockets per "rad", så 50 % mer än AMD, Intel och AMD.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Grace "superchip" får plats i 1U rack, undrar om AMD/Intel verkligen får ned två av sina 350/360 W CPUer i ett sådan rack (kanske med lite mer avancerad kylning).

Inte bara det, som jag skrev ovan får dom in två!

Och ja, den höga förbrukningen som AMDs och Intels högst presterande kretsar börjar bli en aningen problematisk i det avseendet, jag försökte faktiskt beställa en 1u server med en 360W Genoa nyligen, och leverantören stödje faktiskt inte dom modellerna på 1U med luft kylning. För jag tänkte först att det borde ju funka iom att man kunnat köra dubbla CPUer på totalt den nivån tidigare, men icke. Så även om 1u chassin i sig klarar transportera bort så mycket värme, så verkar det inte som att cpu-kylarna/kylflänsarna i 1u storleken klarar transportera bort det,

Permalänk
Medlem
Skrivet av Dumbullen:

Hur kommer det sig egentligen att varken AMD eller Intel verkar göra något vettigt med ARM, parallellt med sina satsningar på x86?

Båda bolagen bör väl ändå ha färskt i minnet hur snabbt vinden kan vända så att knappt ens försöka bygga sitt varumärke kring ARM också verkar konstigt.

Förhoppningsvis så gör de något med RISC-V om vi har tur. Denna artikel är från 2022. Hur sant det är vet jag ej. Men det är inte alls omöjligt.
Hur eller hur tror jag både Intel och AMD på ett eller annat sätt tittar på både ARM och RISC-V.
https://circuitcellar.com/newsletter/amd-is-hiring-risc-v-cpu-developers/

Visa signatur

www.fckdrm.com - DRM år 2024? Ha pyttsan.

Permalänk
Medlem

Dubbel prestanda, 10x dyrare hårdvara(?)

Permalänk

Personligen ser jag hellre en jämförelse med Apple M2 Ultra som finns att köpa till rackmonteringsbar Mac Pro. Det är ändå ARM-baserat.

Visa signatur

Citera mig - annars kan svar utebli i trådar jag inte själv skapat.

Permalänk
Datavetare
Skrivet av jehuty:

Dubbel prestanda, 10x dyrare hårdvara(?)

Nu är Grace inte officiellt släppt, så finns inget officiellt pris vad jag känner till. Kretsen ska tydligen ha börjat skeppats ut till de första kunderna och ryktet säger att priset ligger i nivå med enbart motsvarande grafik-krets kostar i form av PCIe-kort.

Om det stämmer tillkommer ju en del på AMD/Intel-plattformarna, bara CPUerna kostar ~$12,000 styck. Nu är inte Nvidias GPUer precis gratis, de vi pratar om här verkar ligga på "ett gäng tiotusentals USD styck".

Men blir förvånad om Grace inte blir billigare än motsvarande x86_64 baserad GPU-plattform, förutom lägre effekt är en annan fördel med ARM64 i datacenter något lägre inköpspris (största fördelen är dock lägre driftskostnad). Alla "molnleverantörer" tar i nuläget ca 20-30 % mindre för ARM64 instanser jämfört med x86_64 med motsvarande prestanda.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

*Nvidias interna testresultat* Dom brukar alltid visa guld och gröna skogar och lite till. Bäst att vänta på oberoende test innan man vet hur det ligger till.

Visa signatur

Ryzen 5900X @ Stock, MSI Suprim X 3080 @ game mode.