某位老王的小窝

面向大语言模型的门控注意力机制：非线性、稀疏性和Attention-Sink-Free

2025 Dec 6·3585 字·8 分钟

算法论文论文算法

面向大语言模型的门控注意力机制：非线性、稀疏性和 Attention-Sink-Free #

Saber：一种针对扩散语言模型的自适应加速与回溯增强的高效采样方法

2025 Nov 7·1125 字·3 分钟

算法论文论文算法

Saber：一种针对扩散语言模型的自适应加速与回溯增强的高效采样方法 # Saber: An Efficient Sampling with Adaptive Acceleration and Backtracking Enhanced Remasking for Diffusion Language Model

R-STITCH：用于高效推理的动态轨迹拼接

2025 Nov 7·1361 字·3 分钟

算法论文论文算法

R-STITCH：用于高效推理的动态轨迹拼接 # R-STITCH: DYNAMIC TRAJECTORY STITCHING FOR EFFICIENT REASONING

真-Self-Spec-DLM

2025 Nov 7·1439 字·3 分钟

算法论文论文算法

真-Self-Spec-DLM # SELF SPECULATIVE DECODING FOR DIFFUSION LARGE LANGUAGE MODELS

SlowFast采样加速DLM

2025 Nov 7·1866 字·4 分钟

算法论文论文算法

SlowFast 采样加速 DLM # ACCELERATING DIFFUSION LARGE LANGUAGE MODELS WITH SLOWFAST SAMPLING: THE THREE GOLDEN PRINCIPLES

简洁提示：通过生成过程中的连续简洁提示提升推理效率

2025 Oct 10·1556 字·4 分钟

算法论文论文算法 CoT压缩

简洁提示：通过生成过程中的连续简洁提示提升推理效率 # ConciseHint: Boosting Efficient Reasoning via Continuous Concise Hints during Generation

Prophet：Diffusion模型基于置信度的Decoding早停

2025 Oct 10·1543 字·4 分钟

算法论文论文算法 Diffusion DLLM

Prophet：Diffusion 模型基于置信度的 Decoding 早停 # Prophet: Fast Decoding for Diffusion Language Models

SpecDiff：使用扩散模型作为Draft模型

2025 Oct 10·1356 字·3 分钟

算法论文论文算法 Diffusion DLLM Spec

SpecDiff：使用扩散模型作为 Draft 模型 # Speculative Diffusion Decoding: Accelerating Language Generation through Diffusion

DiffuSpec：解锁DLM做投机采样

2025 Oct 10·2609 字·6 分钟

算法论文论文算法 Diffusion DLLM Spec

DiffuSpec：解锁 DLM 做投机采样 # DIFFUSPEC: UNLOCKING DIFFUSION LANGUAGE MODELS FOR SPECULATIVE DECODING

Abanana

最近的文章

面向大语言模型的门控注意力机制：非线性、稀疏性和Attention-Sink-Free

Saber：一种针对扩散语言模型的自适应加速与回溯增强的高效采样方法

R-STITCH：用于高效推理的动态轨迹拼接

真-Self-Spec-DLM

SlowFast采样加速DLM

简洁提示：通过生成过程中的连续简洁提示提升推理效率

Prophet：Diffusion模型基于置信度的Decoding早停

SpecDiff：使用扩散模型作为Draft模型

DiffuSpec：解锁DLM做投机采样