人工智能

DeepSeek-R1本地化部署的硬件要求全解析

DeepSeek-R1本地化部署的硬件要求全解析

DeepSeek-R1作为一款高效的AI推理模型,凭借其卓越的推理性能和灵活的训练机制,成为了春节期间的热议话题。然而,要在本地成功部署DeepSeek-R1,尤其是其满载的 671B 参数版本,对硬件的要求相当高。

阅读更多
一文搞懂 DeepSeek - 强化学习和蒸馏

一文搞懂 DeepSeek - 强化学习和蒸馏

DeepSeek-R1 在其论文(https://arxiv.org/abs/2501.12948)引言部分指出,R1 模型通过融合冷启动数据、多阶段训练流程以及纯粹的强化学习策略,显著增强了大型语言模型的推理能力。这使得 R1 模型在性能上与 OpenAI 的 o1 系列模型持平,并且通过蒸馏技术,成功地将这种推理能力传递给了更小型化的模型。

阅读更多

联系我们