DeepSeek V3 训练居然只用了 2000*H800 不到 3000000 小时
最少的算力做最多的事 太有实力了...
而且人模型真开源 虽然我推理不起 期待 DeepSeek 成为下一个,而且真正 Open 的 OpenAI(好像祝人成为 OpenAI 在今天看来不是什么好话)
群友对这个训练成本没概念的话 大概是 GPT4 的 1/16(虽然也有卡不一样,时间不一样的因素影响)
最少的算力做最多的事 太有实力了...
而且人模型真开源 虽然我推理不起 期待 DeepSeek 成为下一个,而且真正 Open 的 OpenAI(好像祝人成为 OpenAI 在今天看来不是什么好话)
群友对这个训练成本没概念的话 大概是 GPT4 的 1/16(虽然也有卡不一样,时间不一样的因素影响)