• Unterstützung
  • (+84) 246.276.3566 | contact@eastgate-software.com
  • Demo anfordern
  • Datenschutzrichtlinie
Deutsch
Deutsch English 日本語
Eastgate Software A Global Fortune 500 Company's Strategic Partner
  • Home
  • Unternehmen
  • Dienstleistungen
    • Optimierung von Geschäftsprozessen
    • Maßgeschneiderte Kundenlösungen
    • Systemintegration
    • Technologieberatung
    • Cloud-Dienste
    • Datenanalyse
    • Cybersicherheit
    • Automatisierung und KI-Lösungen
  • Fallstudien
  • Blog
  • Ressourcen
    • Arbeitsalltag
    • E-Books
    • Technikbegeisterte
  • Karriere
KONTAKT
Eastgate Software
  • Home
  • Unternehmen
  • Dienstleistungen
    • Optimierung von Geschäftsprozessen
    • Maßgeschneiderte Kundenlösungen
    • Systemintegration
    • Technologieberatung
    • Cloud-Dienste
    • Datenanalyse
    • Cybersicherheit
    • Automatisierung und KI-Lösungen
  • Fallstudien
  • Blog
  • Ressourcen
    • Arbeitsalltag
    • E-Books
    • Technikbegeisterte
  • Karriere
KONTAKT
Eastgate Software
Heim Technikbegeisterte
April 24, 2026

NVIDIA and Google cut AI inference costs with new infrastructure

AI cost

NVIDIA and Google cut AI inference costs with new infrastructure

NVIDIA and Google Cloud are advancing AI infrastructure to dramatically reduce the cost of AI inference at scale. At the Google Cloud Next conference, both companies introduced a new generation of systems designed to deliver up to 10 times lower inference cost per token while achieving 10 times higher throughput per megawatt. This development signals a major shift in how enterprises can deploy AI workloads efficiently in production environments. 

The innovation focuses on A5X bare-metal instances powered by NVIDIA’s Vera Rubin NVL72 architecture. These systems combine hardware and software co-design to optimise performance and energy efficiency. By using advanced networking technologies like NVIDIA ConnectX-9 SuperNICs and Google Virgo networking, the system can support many thousands of GPUs in one group, allowing for big AI tasks to be done quickly. 

This scale introduces new operational complexity, especially in managing workloads across distributed processors. To address this, NVIDIA and Google Cloud are also introducing managed training and orchestration tools that automate cluster sizing, failure recovery, and execution. These capabilities allow enterprises to focus on model performance rather than infrastructure management. 

  • AI inference costs reduced by up to 10x  
  • Throughput per megawatt increased by 10x  
  • Infrastructure scales to hundreds of thousands of GPUs  
  • Managed systems reduce operational overhead  

Beyond performance, data governance and security remain critical. The infrastructure integrates confidential computing technologies to ensure that sensitive data used in training and inference remains encrypted, even within cloud environments. This is particularly important for regulated industries such as healthcare and finance. 

Ultimately, NVIDIA and Google Cloud are redefining the economics of AI deployment. By bringing together flexible infrastructure, improved networking, and built-in security, they are helping businesses shift from trying out AI to using it on a large scale in a way that is affordable, safe, and suitable for real-life use.

 

Quelle: 

https://www.artificialintelligence-news.com/news/nvidia-and-google-infrastructure-cuts-ai-inference-costs/  

Schlagwörter: KI
Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
Vielen Dank für Ihr Abonnement! Sie erhalten in Kürze die wöchentlichen Einblicke von Eastgate Software zu KI und Unternehmens-Technologien.
AktieTweet

Kategorien

  • KI (144)
  • Anwendungsmodernisierung (4)
  • Fallstudie (34)
  • Cloud-Migration (24)
  • Cybersicherheit (15)
  • Digitale Transformation. (8)
  • DX (12)
  • E-Books (12)
  • ERP (28)
  • Fintech (19)
  • Fintech & Handel (1)
  • Intelligentes Verkehrssystem (1)
  • ES IST (5)
  • Arbeitsalltag (23)
  • Logistik (1)
  • Low-Code/No-Code (15)
  • Fertigungsindustrie (1)
  • Mikroservice (11)
  • Produktentwicklung (27)
  • Technikbegeisterte (503)
  • Technologieberatung (55)
  • Nicht kategorisiert (2)

Erzählen Sie uns von Ihrer Projektidee!

Melden Sie sich für unseren wöchentlichen Newsletter an

Bleiben Sie mit Eastgate Software immer einen Schritt voraus. Abonnieren Sie unseren Newsletter und lesen Sie die neuesten Artikel über u.a. Software-Technologien, Unternehmenslösungen und KI.

Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
Vielen Dank für Ihr Abonnement! Sie erhalten in Kürze die wöchentlichen Einblicke von Eastgate Software zu KI und Unternehmens-Technologien.

Eastgate Software

Wir treiben die digitale Transformation voran

Eastgate Software 

Wir treiben die digitale Transformation voran.

  • Dienstleistungen
  • Unternehmen
  • Ressourcen
  • Fallstudien
  • Kontakt
Dienstleistungen

Fallstudien

Unternehmen

Kontakt

Ressourcen
  • Youtube
  • Facebook
  • Linkedin
  • Outlook
  • Twitter
DMCA.com Protection Status

Copyright © 2024. Alle Rechte vorbehalten.

  • Home
  • Unternehmen
  • Dienstleistungen
    • Optimierung von Geschäftsprozessen
    • Maßgeschneiderte Kundenlösungen
    • Systemintegration
    • Technologieberatung
    • Cloud-Dienste
    • Datenanalyse
    • Cybersicherheit
    • Automatisierung und KI-Lösungen
  • Fallstudien
  • Blog
  • Ressourcen
    • Arbeitsalltag
    • E-Books
    • Technikbegeisterte
  • Karriere

Unterstützung
(+84) 246.276.35661 contact@eastgate-software.com

  • Demo anfordern
  • Datenschutzrichtlinie