DSpark: Deepseek verbessert mit Token-Raten die GPU-Auslastung
Spekulative Decodierung ermöglicht, GPUs deutlich besser auszulasten. Die Qualität der Ausgaben bleibt gleich, Deepseek nutzt Dspark bereits produktiv. Von Johannes Hiltscher ( KI , Wissenschaft )