510亿融资后,DeepSeek能否在AGI竞赛中继续领跑?
2026/7/3 4:16:06 网站建设 项目流程

510亿融资后,DeepSeek的新征程

6月29日晚,DeepSeek宣布V4正式版将于7月中旬正式上线。公告中说明,为合理配置资源、提升服务稳定性,正式版发布后将同步调整API定价策略,引入峰谷定价机制。过去两周,DeepSeek还有两件大事:一是6月16日,完成成立以来首轮外部融资,募资总额510亿元,估值将近4000亿元,打破创始人梁文锋“不融资、不上市、不商业化”的原则;二是融资后仅十几天,6月27日,DeepSeek团队联合北京大学发布论文《DSpark: Confidence - Scheduled Speculative Decoding with Semi - Autoregressive Generation》,创始人梁文锋位列作者名单。如果说上半场DeepSeek要证明能做出世界一流大模型,那么下半场,“资本”和“技术”相汇,它要向世界证明是真正的商业公司。

500亿之后,DeepSeek开始补人

融资以来,DeepSeek Harness团队新负责人崔添翼没闲着。6月25日晚,DeepSeek在社交平台发布大规模招聘信息,覆盖算法、研发、运维、产品、数据工程师及职能部门等7大类、共33个岗位,工作地点包括北京和杭州,所有岗位均接受实习。在DeepSeek官网官号、Boss直聘、X和小红书等平台,能看到这位梁文锋的浙大校友、今年3月加入团队的负责人下场招人,还抽空“辟谣”。此前,DeepSeek像沉默、低调的技术员,背靠梁文锋创办的量化私募基金“幻方量化”,幻方量化2025年年化收益率56.55%,管理规模超700亿元,让DeepSeek不依赖外部资本,外界觉得它“并不缺钱”。梁文锋改变融资态度,可能是核心人才流失和外部抢人大战加速。参照系中,已上市的“大模型第一股”智谱,截至6月30日,总市值近万亿港元,MiniMax市值超1300亿港元。而DeepSeek员工期权是白纸,公司不融资、不上市、无外部估值参考。一位接近DeepSeek的资深从业者表示,“不融资,估值不涨,员工期权也不涨,相比其他大模型团队,DeepSeek员工留不住”。留住人才成本不小。2025年,DeepSeek优势是百余人的高学历“天才”团队,几十位顶尖研究员和创始人梁文锋创造出DeepSeek - R1。今年,互联网大厂高薪“挖”顶级AI研究员,市场对AI人才需求激增,公开数据显示,算法岗位月薪中位数超2.4万元,头部人才月薪超5万元,AI人才溢价扩大。此次大规模招聘岗位中,HR、法务、财务、采购、行政等职能部门也扩招。全方位“扩编”表明,DeepSeek在补齐科技公司组织能力。从“产品驱动”迈向“组织驱动”,是科技公司必经之路,组织成熟、平台完善、人才激励机制建立后,产品红利才释放。完成500亿融资,既为留人,也为补全组织架构,但DeepSeek扩招后能否保持“小团队作战”的精简高效和决策链灵活敏捷?这是“下半场”要回答的第一个问题。

DeepSeek走向重资产

6月25日发布的33个招聘岗位中,IDC(Internet Data Center互联网数据中心)数据中心团队岗位值得关注,涉及基础设施建设。早在4月中旬,DeepSeek就在内蒙古乌兰察布发布首批数据中心岗位,包括数据中心高级运维工程师和数据中心高级交付经理,6月又新增“IDC设计规划工程师”岗位。今年以来,DeepSeek人才布局从模型延伸至算力基础设施建设。大模型进入规模化训练和推理阶段,AI模型公司竞争进入“基础设施”硬件竞赛,这使DeepSeek像硅谷前沿头部大模型公司一样,加入自建算力集群的重资产“烧钱”游戏。公开数据显示,美国科技巨头Alphabet、亚马逊、Meta和微软,预计今年投资约6500亿美元扩大人工智能相关基础设施。Anthropic、OpenAI也强调持续加大算力基础设施投入,如Anthropic预计仅数据中心容量租赁,每月向SpaceX支付约12.5亿美元,一年150亿美元,还不包括GPU采购、网络、运维等。工信部信息通信经济专家委员会委员盘和林指出,当前AI投资热潮下,大模型企业融资是大势所趋,“不仅DeepSeek,谷歌也融资800亿美元,行业进入重资本阶段”。为不在算力重资本建设上掉队,DeepSeek需“开源”资金,投入算力、数据中心等基础设施建设。值得注意的是,DeepSeek在海外先进算力出口受限情况下建设算力基础设施,意味着算力由国产芯片驱动,V4发布时,DeepSeek就在官方页面和技术报告里提到国产算力探索。5月底,华为提出“韬(τ)定律”,试图突破摩尔定律放缓瓶颈;国产大模型加速适配国产算力,目标是“自主可控的AI基础设施”。

AGI的前夜

对于DeepSeek这样的基础模型公司,仅有资本和组织不足以长期领先,关键是持续产出原创技术。一位资深算力从业者强调,DeepSeek本轮大规模融资是为激励团队、留下核心人才,“只有足够融资,才能训出好模型,奠定头部位置”。论文是DeepSeek新技术探索的缩影。近两年,DeepSeek公开发表约27篇核心技术论文,研究方向覆盖MoE(混合专家)、强化学习、代码大模型、数学推理、多模态等,对应每一代核心模型和关键技术突破。6月27日,DeepSeek官方在GitHub上更新一篇与“DSpark”新技术有关的论文。论文中,DeepSeek提出全新推理加速框架“DSpark”,不改变模型能力,大幅提升大模型推理速度和系统吞吐。与此前不同,这篇论文没迭代新模型,而是在原有DeepSeek - V4 - Pro和DeepSeek - V4 - Flash基础上增加推测解码模块,重点在工程落地层面优化。DeepSeek意图将DSpark部署在DeepSeek - V4线上服务系统、承接真实用户流量时,减少无效校验带来的算力浪费。论文提及,“不改变底层模型架构,生成速度提高60 - 85%”。对于处理海量API请求的AI公司,算力成本降低,利润空间增加。据VentureBeat消息,模型训练费用会越来越高,Anthropic的CEO Dario Amodei预测,未来一代前沿模型培训成本达50亿至100亿美元。上述资深算力从业者表示,DeepSeek也将进入“烧钱”训练模型阶段。为支持模型训练迭代,融资是必然。更多媒体解读,融资后十几天上线新论文,DeepSeek似乎证明核心节奏未变,研发团队保持高频输出。不论是上新模型、建设数据中心,还是从“天才实验室”转变为商业化运营的AI公司,DeepSeek进化尽头是AGI。2024年,梁文锋明确表态:“我们做的就是AGI(通用人工智能),语言大模型可能是通往AGI的必经之路。”免费阶段,用户能容忍响应失败、对话中断、API限流等问题。7月DeepSeek V4正式版上线后,用户对稳定性要求提高,问题若持续存在,将影响用户是否将DeepSeek接入工作流和业务系统。来到付费端、开发者生态和企业场景,DeepSeek工程能力将面临更严格考验,模型能否大规模应用,是进入AGI时代的门槛。用户希望DeepSeek推动中国大模型降本增效,它却要留住人、持续训练模型、技术迭代,数据中心基础设施建设也不能输。光靠梁文锋的幻方量化不够,2026年,DeepSeek启动融资是必然选择。正如6月25日晚招聘公告所说:“当今人类正处于AGI的前夜。”下一步,DeepSeek要面对更长期、更烧钱的AGI竞赛。能否像在“大模型”竞赛中出圈一样,在AGI进程中“领跑”,这是DeepSeek“下半场”要回答的第二个问题。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询