Claude Mythos让梁文锋决定融资

梦晨发自凹非寺量子位 | 公众号 QbitAI DeepSeek启动融资的内幕 The Information最新披露的信息：梁文锋在看到Claude Mythos借助海量计算能力和数据训练出卓越表现后，深刻意识到DeepSeek若不储备足够资源，将难以在竞争中立足。

Anthropic在今年4月发布首个版本，DeepSeek的融资风传也始于此月。时间节点，前后契合。

DeepSeek的团队规模将实现翻番计划在融资完成后，DeepSeek在本周四罕见发布公开声明：所有部门人员将“至少增加一倍”，涵盖AI系统开发、基础设施、产品开发以及深度学习研究等领域。

现在，DeepSeek大概有300名员工。其中，将模型转化为自主AI智能体的核心团队Harness，已经进入每日面试的阶段。该团队负责人崔天一今年3月从Jane Street加入，此前不久在社交媒体上透露了这一步调。

与此同时，DeepSeek正加紧适配国产芯片，梁文锋有信心华为芯片在数年内能达英伟达水准，DeepSeek应该成为首批适配者。

华为在去年得知DeepSeek私下试验自家芯片之后，开始与其建立直接合作关系。

但是，适配的代价颇高。DeepSeek的训练和部署系统基于英伟达CUDA软件构建，工程师需要重构底层软件，才能让模型在华为芯片上高效运作。

这一举措直接导致DeepSeek长达15个月未曾推出新型号，而在其他顶级实验室每两三个月就能发布新模型的背景下，这一空白期显得格外引人注目。

这也使DeepSeek错过了去年下半年Anthropic Claude Code引发的编程工具热潮。

但梁文锋在路演时对投资人表示，编程工具和AI聊天机器人一样，仅是AI进化过程中的阶段性产品，若过度押注这些短期产品，将偏离通往AGI的最终目标。

“AI不应被少数人掌控” 最新消息还显示，梁文锋并非一开始就排斥风险投资。2023年，他确实与投资人接触过，但当他告知对方DeepSeek只专注深度研究和科学探索，没有任何商业化或产品规划时，多数投资人选择了退出。

最终，梁文锋亲自出资支持了这个实验室，持续了整整三年。

在这次74亿美元的融资中，梁文锋签下了最大的一张支票：200亿人民币（约30亿美元），占总份额的五分之二。

融资之后，DeepSeek设立员工持股计划，按实际估值分配股份。梁文锋向身边人说，他的战略不会改变：坚持开源、维持低成本、专注AGI。他将AGI定义为机器在理解、推理、学习、规划及适应等诸多任务上达到人类水准。

他还向身边人强调，AI不应被少数人控制。

DeepSeek是目前唯一一个将自己的所有模型底层代码完全公开的主要AI实验室。在美国开发者群体中，DeepSeek的影响力正迅速扩大。今年4月推出的旗舰模型V4，5月份在Vercel的AI Gateway平台上token使用量占比从不到1%激增至17%，一个月内跃升为该平台仅次于Anthropic和Google的第三大模型。

轻量版V4 Flash的价格比Anthropic的模型低20到50倍。这种增长趋势在6月仍在持续。

一键三连「点赞」「转发」「小心心」欢迎在评论区分享你的看法！

— 完— 💬 想要获取最新AI资讯，欢迎加入量子位「每日AI交流群」👇 💼 这里聚集了大厂模型开发者、创业公司实践者、媒体热点追踪者以及VC项目观察者。

🙌 添加小助手【qbitbot13】，注明“姓名-公司-职位”，审核通过即可入群。