Eilmeldung
ESCanadá se clasifica para octavos en la Copa del Mundo tras un partido 'horrible' contra SudáfricaESComunidades de Guerrero y Michoacán bajo control de estructuras criminalesESJuanma Moreno y Vox aceleran las negociaciones para la investidura en AndalucíaESReal Madrid y Valencia Basket se disputan a Pedro MartínezESFrancia busca aprender de España tras la ola de calor que ha causado más de 1.000 muertesESExplosión en Mónaco: Tres heridos graves, incluido un menor, por un paquete bombaESTerremotos en Venezuela: Consecuencias y DañosESTerremoto en Venezuela: Fractura entre solidaridad ciudadana y asistencia estatalESMoreno busca convencer al Parlamento andaluz sin lograr el apoyo de VoxESNueva réplica sísmica en Venezuela: 4,6 de magnitud en La Guaira sin daños adicionalesESCanadá se clasifica para octavos en la Copa del Mundo tras un partido 'horrible' contra SudáfricaESComunidades de Guerrero y Michoacán bajo control de estructuras criminalesESJuanma Moreno y Vox aceleran las negociaciones para la investidura en AndalucíaESReal Madrid y Valencia Basket se disputan a Pedro MartínezESFrancia busca aprender de España tras la ola de calor que ha causado más de 1.000 muertesESExplosión en Mónaco: Tres heridos graves, incluido un menor, por un paquete bombaESTerremotos en Venezuela: Consecuencias y DañosESTerremoto en Venezuela: Fractura entre solidaridad ciudadana y asistencia estatalESMoreno busca convencer al Parlamento andaluz sin lograr el apoyo de VoxESNueva réplica sísmica en Venezuela: 4,6 de magnitud en La Guaira sin daños adicionales
Newsgather
BackDSpark Module Enhances AI Response Generation Efficiency
DSpark Module Enhances AI Response Generation Efficiency
Technik
SCMP Tech1 g önceTechnik1 dk okumaChina

DSpark Module Enhances AI Response Generation Efficiency

Auf einen Blick

DeepSeek's DSpark module accelerates AI inference by using a lightweight draft model for candidate responses, verified in batches by a larger model, and employs semi-autoregressive generation and confidence-based scheduling for balanced speed and quality.

KI-generierte Zusammenfassung

Warum es wichtig ist

DeepSeek aims to improve AI service efficiency.

Schriftgröße

AI models’ conventional token-by-token output often slowed when responses were lengthy, leading to low utilisation of graphics processing units (GPU) and high user-perceived waiting time, which was a “primary bottleneck in serving AI”, the company said in research published on Saturday. DeepSeek said the DSpark module accelerated AI response generation – also known as AI inference, which refers to serving a trained model to respond to user queries – by using a lightweight draft model to propose candidate responses and then verifying them in batches with a larger model, speeding up output. DSpark further refined the approach with a semi-autoregressive generation method, allowing the model to produce small chunks of tokens rather than strictly one at a time. It also introduced a confidence-based scheduling system that dynamically adjusted how much verification was applied based on computing demand, helping balance speed and output quality.

Worauf zu achten ist

KI-Ausblick — Möglichkeiten, keine Fakten

  • Increased adoption of DSpark in AI services

    Wahrscheinlich · Innerhalb von Monaten

Offene Fragen

  • Impact on user experience
  • Broader industry adoption plans

Verwandte Themen

This article was originally published by SCMP Tech.

Ähnliche Meldungen

Mehr zu diesem ThemaAI Efficiency