510亿融资后，DeepSeek能否在AGI竞赛中继续领跑？-酒店常州论坛

510亿融资后，DeepSeek的新征程

6月29日晚，DeepSeek宣布V4正式版将于7月中旬正式上线。公告中说明，为合理配置资源、提升服务稳定性，正式版发布后将同步调整API定价策略，引入峰谷定价机制。过去两周，DeepSeek还有两件大事：一是6月16日，完成成立以来首轮外部融资，募资总额510亿元，估值将近4000亿元，打破创始人梁文锋“不融资、不上市、不商业化”的原则；二是融资后仅十几天，6月27日，DeepSeek团队联合北京大学发布论文《DSpark: Confidence - Scheduled Speculative Decoding with Semi - Autoregressive Generation》，创始人梁文锋位列作者名单。如果说上半场DeepSeek要证明能做出世界一流大模型，那么下半场，“资本”和“技术”相汇，它要向世界证明是真正的商业公司。

500亿之后，DeepSeek开始补人

融资以来，DeepSeek Harness团队新负责人崔添翼没闲着。6月25日晚，DeepSeek在社交平台发布大规模招聘信息，覆盖算法、研发、运维、产品、数据工程师及职能部门等7大类、共33个岗位，工作地点包括北京和杭州，所有岗位均接受实习。在DeepSeek官网官号、Boss直聘、X和小红书等平台，能看到这位梁文锋的浙大校友、今年3月加入团队的负责人下场招人，还抽空“辟谣”。此前，DeepSeek像沉默、低调的技术员，背靠梁文锋创办的量化私募基金“幻方量化”，幻方量化2025年年化收益率56.55%，管理规模超700亿元，让DeepSeek不依赖外部资本，外界觉得它“并不缺钱”。梁文锋改变融资态度，可能是核心人才流失和外部抢人大战加速。参照系中，已上市的“大模型第一股”智谱，截至6月30日，总市值近万亿港元，MiniMax市值超1300亿港元。而DeepSeek员工期权是白纸，公司不融资、不上市、无外部估值参考。一位接近DeepSeek的资深从业者表示，“不融资，估值不涨，员工期权也不涨，相比其他大模型团队，DeepSeek员工留不住”。留住人才成本不小。2025年，DeepSeek优势是百余人的高学历“天才”团队，几十位顶尖研究员和创始人梁文锋创造出DeepSeek - R1。今年，互联网大厂高薪“挖”顶级AI研究员，市场对AI人才需求激增，公开数据显示，算法岗位月薪中位数超2.4万元，头部人才月薪超5万元，AI人才溢价扩大。此次大规模招聘岗位中，HR、法务、财务、采购、行政等职能部门也扩招。全方位“扩编”表明，DeepSeek在补齐科技公司组织能力。从“产品驱动”迈向“组织驱动”，是科技公司必经之路，组织成熟、平台完善、人才激励机制建立后，产品红利才释放。完成500亿融资，既为留人，也为补全组织架构，但DeepSeek扩招后能否保持“小团队作战”的精简高效和决策链灵活敏捷？这是“下半场”要回答的第一个问题。

DeepSeek走向重资产

6月25日发布的33个招聘岗位中，IDC（Internet Data Center互联网数据中心）数据中心团队岗位值得关注，涉及基础设施建设。早在4月中旬，DeepSeek就在内蒙古乌兰察布发布首批数据中心岗位，包括数据中心高级运维工程师和数据中心高级交付经理，6月又新增“IDC设计规划工程师”岗位。今年以来，DeepSeek人才布局从模型延伸至算力基础设施建设。大模型进入规模化训练和推理阶段，AI模型公司竞争进入“基础设施”硬件竞赛，这使DeepSeek像硅谷前沿头部大模型公司一样，加入自建算力集群的重资产“烧钱”游戏。公开数据显示，美国科技巨头Alphabet、亚马逊、Meta和微软，预计今年投资约6500亿美元扩大人工智能相关基础设施。Anthropic、OpenAI也强调持续加大算力基础设施投入，如Anthropic预计仅数据中心容量租赁，每月向SpaceX支付约12.5亿美元，一年150亿美元，还不包括GPU采购、网络、运维等。工信部信息通信经济专家委员会委员盘和林指出，当前AI投资热潮下，大模型企业融资是大势所趋，“不仅DeepSeek，谷歌也融资800亿美元，行业进入重资本阶段”。为不在算力重资本建设上掉队，DeepSeek需“开源”资金，投入算力、数据中心等基础设施建设。值得注意的是，DeepSeek在海外先进算力出口受限情况下建设算力基础设施，意味着算力由国产芯片驱动，V4发布时，DeepSeek就在官方页面和技术报告里提到国产算力探索。5月底，华为提出“韬（τ）定律”，试图突破摩尔定律放缓瓶颈；国产大模型加速适配国产算力，目标是“自主可控的AI基础设施”。

AGI的前夜

对于DeepSeek这样的基础模型公司，仅有资本和组织不足以长期领先，关键是持续产出原创技术。一位资深算力从业者强调，DeepSeek本轮大规模融资是为激励团队、留下核心人才，“只有足够融资，才能训出好模型，奠定头部位置”。论文是DeepSeek新技术探索的缩影。近两年，DeepSeek公开发表约27篇核心技术论文，研究方向覆盖MoE（混合专家）、强化学习、代码大模型、数学推理、多模态等，对应每一代核心模型和关键技术突破。6月27日，DeepSeek官方在GitHub上更新一篇与“DSpark”新技术有关的论文。论文中，DeepSeek提出全新推理加速框架“DSpark”，不改变模型能力，大幅提升大模型推理速度和系统吞吐。与此前不同，这篇论文没迭代新模型，而是在原有DeepSeek - V4 - Pro和DeepSeek - V4 - Flash基础上增加推测解码模块，重点在工程落地层面优化。DeepSeek意图将DSpark部署在DeepSeek - V4线上服务系统、承接真实用户流量时，减少无效校验带来的算力浪费。论文提及，“不改变底层模型架构，生成速度提高60 - 85%”。对于处理海量API请求的AI公司，算力成本降低，利润空间增加。据VentureBeat消息，模型训练费用会越来越高，Anthropic的CEO Dario Amodei预测，未来一代前沿模型培训成本达50亿至100亿美元。上述资深算力从业者表示，DeepSeek也将进入“烧钱”训练模型阶段。为支持模型训练迭代，融资是必然。更多媒体解读，融资后十几天上线新论文，DeepSeek似乎证明核心节奏未变，研发团队保持高频输出。不论是上新模型、建设数据中心，还是从“天才实验室”转变为商业化运营的AI公司，DeepSeek进化尽头是AGI。2024年，梁文锋明确表态：“我们做的就是AGI（通用人工智能），语言大模型可能是通往AGI的必经之路。”免费阶段，用户能容忍响应失败、对话中断、API限流等问题。7月DeepSeek V4正式版上线后，用户对稳定性要求提高，问题若持续存在，将影响用户是否将DeepSeek接入工作流和业务系统。来到付费端、开发者生态和企业场景，DeepSeek工程能力将面临更严格考验，模型能否大规模应用，是进入AGI时代的门槛。用户希望DeepSeek推动中国大模型降本增效，它却要留住人、持续训练模型、技术迭代，数据中心基础设施建设也不能输。光靠梁文锋的幻方量化不够，2026年，DeepSeek启动融资是必然选择。正如6月25日晚招聘公告所说：“当今人类正处于AGI的前夜。”下一步，DeepSeek要面对更长期、更烧钱的AGI竞赛。能否像在“大模型”竞赛中出圈一样，在AGI进程中“领跑”，这是DeepSeek“下半场”要回答的第二个问题。

企业官网建设流程全解析

510亿融资后，DeepSeek的新征程

500亿之后，DeepSeek开始补人

DeepSeek走向重资产

AGI的前夜

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

510亿融资后，DeepSeek的新征程

500亿之后，DeepSeek开始补人

DeepSeek走向重资产

AGI的前夜

热门文章

文章分类

标签云

相关文章

生成引擎优化(GEO)赋能内容创作的全新视角分析

Node.js对接车辆二要素核验API实战指南

Qwen3.5大模型微调入门实战（完整代码）

需要专业的网站建设服务？