头条

Claude Mythos让梁文锋决定融资

来源:搜狐新闻
Claude Mythos让梁文锋决定融资

梦晨 发自 凹非寺 量子位 | 公众号 QbitAI DeepSeek启动融资的内幕 The Information最新披露的信息:梁文锋在看到Claude Mythos借助海量计算能力和数据训练出卓越表现后,深刻意识到DeepSeek若不储备足够资源,将难以在竞争中立足。

Anthropic在今年4月发布首个版本,DeepSeek的融资风传也始于此月。时间节点,前后契合。

DeepSeek的团队规模将实现翻番 计划在融资完成后,DeepSeek在本周四罕见发布公开声明:所有部门人员将“至少增加一倍”,涵盖AI系统开发、基础设施、产品开发以及深度学习研究等领域。

现在,DeepSeek大概有300名员工。其中,将模型转化为自主AI智能体的核心团队Harness,已经进入每日面试的阶段。该团队负责人崔天一今年3月从Jane Street加入,此前不久在社交媒体上透露了这一步调。

与此同时,DeepSeek正加紧适配国产芯片,梁文锋有信心华为芯片在数年内能达英伟达水准,DeepSeek应该成为首批适配者。

华为在去年得知DeepSeek私下试验自家芯片之后,开始与其建立直接合作关系。

但是,适配的代价颇高。DeepSeek的训练和部署系统基于英伟达CUDA软件构建,工程师需要重构底层软件,才能让模型在华为芯片上高效运作。

这一举措直接导致DeepSeek长达15个月未曾推出新型号,而在其他顶级实验室每两三个月就能发布新模型的背景下,这一空白期显得格外引人注目。

这也使DeepSeek错过了去年下半年Anthropic Claude Code引发的编程工具热潮。

但梁文锋在路演时对投资人表示,编程工具和AI聊天机器人一样,仅是AI进化过程中的阶段性产品,若过度押注这些短期产品,将偏离通往AGI的最终目标。

“AI不应被少数人掌控” 最新消息还显示,梁文锋并非一开始就排斥风险投资。2023年,他确实与投资人接触过,但当他告知对方DeepSeek只专注深度研究和科学探索,没有任何商业化或产品规划时,多数投资人选择了退出。

最终,梁文锋亲自出资支持了这个实验室,持续了整整三年。

在这次74亿美元的融资中,梁文锋签下了最大的一张支票:200亿人民币(约30亿美元),占总份额的五分之二。

融资之后,DeepSeek设立员工持股计划,按实际估值分配股份。梁文锋向身边人说,他的战略不会改变:坚持开源、维持低成本、专注AGI。他将AGI定义为机器在理解、推理、学习、规划及适应等诸多任务上达到人类水准。

他还向身边人强调,AI不应被少数人控制。

DeepSeek是目前唯一一个将自己的所有模型底层代码完全公开的主要AI实验室。在美国开发者群体中,DeepSeek的影响力正迅速扩大。今年4月推出的旗舰模型V4,5月份在Vercel的AI Gateway平台上token使用量占比从不到1%激增至17%,一个月内跃升为该平台仅次于Anthropic和Google的第三大模型。

轻量版V4 Flash的价格比Anthropic的模型低20到50倍。这种增长趋势在6月仍在持续。

一键三连「点赞」「转发」「小心心」 欢迎在评论区分享你的看法!

— 完— 💬 想要获取最新AI资讯,欢迎加入量子位「每日AI交流群」👇 💼 这里聚集了大厂模型开发者、创业公司实践者、媒体热点追踪者以及VC项目观察者。

🙌 添加小助手【qbitbot13】,注明“姓名-公司-职位”,审核通过即可入群。

相关推荐

网友评论

登录后发表评论
暂无评论,抢沙发吧~