DeepSeek

DeepSeek

DeepSeek

DeepSeek是一家AI研究公司,专注于大语言模型的研发,以开源模型和技术创新著称。

关键动态

  • 发布V4 Lite:采用[[DualPath架构]],百亿级参数模型逼近千亿级性能。
  • 1M上下文实用化:KV Cache压缩技术突破,降低超级长文本使用门槛。

相关概念

  • [[DualPath架构]]
  • [[推理经济学]]
分享到