Uppgifter: Nvidia satsar på snabbare AI-svar med nytt chip - WSJ
Bildkälla: Stockfoto

Uppgifter: Nvidia satsar på snabbare AI-svar med nytt chip - WSJ

Nvidia planerar att lansera en ny processor för så kallad inferens, den del av AI-bearbetningen som gör att modeller kan besvara användares frågor. Det uppger källor för Wall Street Journal.

Plattformen väntas presenteras på utvecklarkonferensen GTC i mars och ska enligt uppgifter bygga på teknik från startupbolaget Groq.

OpenAI uppges bli en av de största kunderna. Satsningen sker när efterfrågan skiftar från träning av AI-modeller till drift av AI-tjänster, där lägre kostnad och energiförbrukning blir allt viktigare, skriver affärstidningen.

Nvidia har länge dominerat marknaden för grafikprocessorer, med en andel som av analytiker uppskattas till 90 procent eller mer. Samtidigt har konkurrensen hårdnat. Google och Amazon har utvecklat egna chip som konkurrerar med Nvidias system, och efterfrågan har skiftat från träning av stora AI-modeller till inferens, där bolag söker mer kostnads- och energieffektiva lösningar.
Börsvärldens nyhetsbrev