Breaking
CRYPTO-FRStrategy vend 32 BTC pour 2,5 millions de dollars : première cession de Bitcoin depuis 2022FRCrash d'un avion civil à Tomblaine près de Nancy : 11 mortsFRL'Iran met en garde contre toute tentative de contourner le détroit d'OrmuzFRAu moins 50 interpellations lors de la Marche des Fiertés d'Istanbul malgré l'interdictionFRTempête dans le Nord de la France : Dégâts Importants et TémoinagesFRLe bilan du double séisme au Venezuela s’alourdit à 1 450 décès et 774 bâtiments touchésFRCanicule exceptionnelle : catastrophe agricole majeure en France avec surmortalité animale et pertes de rendementsFRMondial 2026 : le Canada en 8es, Rabiot pressenti avec les Bleus et l’Algérie qualifiéeFRUne personne tuée dans une attaque massive de drones ukrainiens à KrasnodarFRNarbonne : Plus d'un millier de personnes défilent pour honorer Louis, tué à 17 ansCRYPTO-FRStrategy vend 32 BTC pour 2,5 millions de dollars : première cession de Bitcoin depuis 2022FRCrash d'un avion civil à Tomblaine près de Nancy : 11 mortsFRL'Iran met en garde contre toute tentative de contourner le détroit d'OrmuzFRAu moins 50 interpellations lors de la Marche des Fiertés d'Istanbul malgré l'interdictionFRTempête dans le Nord de la France : Dégâts Importants et TémoinagesFRLe bilan du double séisme au Venezuela s’alourdit à 1 450 décès et 774 bâtiments touchésFRCanicule exceptionnelle : catastrophe agricole majeure en France avec surmortalité animale et pertes de rendementsFRMondial 2026 : le Canada en 8es, Rabiot pressenti avec les Bleus et l’Algérie qualifiéeFRUne personne tuée dans une attaque massive de drones ukrainiens à KrasnodarFRNarbonne : Plus d'un millier de personnes défilent pour honorer Louis, tué à 17 ans
Newsgather
BackDSpark Module Enhances AI Response Generation Efficiency
DSpark Module Enhances AI Response Generation Efficiency
Tech
SCMP Tech1d agoTech1 min readChina

DSpark Module Enhances AI Response Generation Efficiency

Quick Look

DeepSeek's DSpark module accelerates AI inference by using a lightweight draft model for candidate responses, verified in batches by a larger model, and employs semi-autoregressive generation and confidence-based scheduling for balanced speed and quality.

AI-generated summary

Why It Matters

DeepSeek aims to improve AI service efficiency.

Font size

AI models’ conventional token-by-token output often slowed when responses were lengthy, leading to low utilisation of graphics processing units (GPU) and high user-perceived waiting time, which was a “primary bottleneck in serving AI”, the company said in research published on Saturday. DeepSeek said the DSpark module accelerated AI response generation – also known as AI inference, which refers to serving a trained model to respond to user queries – by using a lightweight draft model to propose candidate responses and then verifying them in batches with a larger model, speeding up output. DSpark further refined the approach with a semi-autoregressive generation method, allowing the model to produce small chunks of tokens rather than strictly one at a time. It also introduced a confidence-based scheduling system that dynamically adjusted how much verification was applied based on computing demand, helping balance speed and output quality.

What to Watch

AI outlook — possibilities, not facts

  • Increased adoption of DSpark in AI services

    Likely · Within months

Open Questions

  • Impact on user experience
  • Broader industry adoption plans

Related Topics

This article was originally published by SCMP Tech.

Related Stories

More on this topicAI Efficiency