Java AI Artikelreihen

Lama3.java – LLM-Inferenz auf GraalVM

In dieser Artikelserie ging es schon öfter um Performance-Grenzen der JVM, von LMAX-Disruptor bis zur 1 Billion Row Challenge. -> https://www.sigs.de/experten/michael-hunger/

Eine neue Herausforderung in der Leistungsgesellschaft der Hardcore-Optimierer liegt in der Beschleunigung der Ausführung (Inferenz) und im Training von großen Sprachmodellen (LLMs).

Artikel zur JavaSPEKTRUM 2/2025

Tiefe Neuronale Netzwerke, und da sind LLMs (Large Language Models) keine Ausnahme, beruhen auf einer langen Kette von Schichten (Layers) großer Matrizen (Zehntausende Spalten und Zeilen). Neue Werte für die nächste Schicht werden aus Millionen und Milliarden von Matrixoperationen (zumeist Multiplikationen und Skalarprodukte) berechnet. In GPUs wird das auf die Matrix-Kernel-Operationen mittels Programmiersprachen wie Nvdias CUDA oder OpenCL abgebildet. Auf CPUs kann es mittels SIMD-Operationen…

Nächster Artikel

IT Spektrum

JavaSPEKTRUM

BI-Spektrum

Übersicht Magazine

Unsere Interviews

Artikelreihen

Lama3.java – LLM-Inferenz auf GraalVM

Kostenfreien Account erstellen oder einloggen.

Virtual Threads in Java: Performance und Skalierbarkeit in neuer Dimension