Das Wissensportal für IT-Professionals. Entdecke die Tiefe und Breite unseres IT-Contents in exklusiven Themenchannels und Magazinmarken.

SIGS DATACOM GmbH

Lindlaustraße 2c, 53842 Troisdorf

Tel: +49 (0)2241/2341-100

kundenservice@sigs-datacom.de

Lama3.java – LLM-Inferenz auf GraalVM

In dieser Artikelserie ging es schon öfter um Performance-Grenzen der JVM, von LMAX-Disruptor bis zur 1 Billion Row Challenge. -> https://www.sigs.de/experten/michael-hunger/

Eine neue Herausforderung in der Leistungsgesellschaft der Hardcore-Optimierer liegt in der Beschleunigung der Ausführung (Inferenz) und im Training von großen Sprachmodellen (LLMs).

Artikel zur JavaSPEKTRUM 2/2025

Tiefe Neuronale Netzwerke, und da sind LLMs (Large Language Models) keine Ausnahme, beruhen auf einer langen Kette von Schichten (Layers) großer Matrizen (Zehntausende Spalten und Zeilen). Neue Werte für die nächste Schicht werden aus Millionen und Milliarden von Matrixoperationen (zumeist Multiplikationen und Skalarprodukte) berechnet. In GPUs wird das auf die Matrix-Kernel-Operationen mittels Programmiersprachen wie Nvdias CUDA oder OpenCL abgebildet. Auf CPUs kann es mittels SIMD-Operationen…