rrt优化
rrt优化(DeepSeek R1 MTP 在 TensorRTLLM 中的实现与优化)

rrt优化(DeepSeek R1 MTP 在 TensorRTLLM 中的实现与优化)

TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理性能的世界纪录,Multi-Token Prediction (MTP) 实现了大幅提速。我们在之前的博客...

  • 1
  • 共 1 页