阶跃星辰推出高性价比深度研究模型 Step-DeepResearch
一、重磅发布:320亿参数开源模型,定义AI深度研究新基准
2024年9月,中国领先的大模型研发企业阶跃星辰(StepFun)正式开源全新一代专业级研究型大模型——Step-DeepResearch。该模型参数规模达320亿(32B),采用混合专家(MoE)架构与多阶段强化对齐训练策略,在保持轻量化部署优势的同时,显著提升复杂信息检索、跨源推理、逻辑验证与结构化报告生成能力。不同于通用对话模型,Step-DeepResearch专为“深度研究任务”而生:它可自主启动多轮搜索、主动比对矛盾信源、识别数据时效性与可信度层级,并最终输出具备学术规范性、行业适配性与可追溯性的专业研究报告。
尤为值得关注的是,Step-DeepResearch并非简单微调现有基座模型,而是基于阶跃星辰自研的Research-First预训练范式构建——其训练语料中超过65%来自高质量学术论文、技术白皮书、政策文件、财报季报、专利数据库及权威新闻源,并引入“研究轨迹监督信号”(Research Trajectory Supervision),使模型在训练中内化“提出问题→界定范围→检索验证→归纳推演→结论反诘”的完整研究闭环逻辑。
二、能力对标:媲美顶级商业模型,实测表现惊艳
在多项权威评估中,Step-DeepResearch展现出令人瞩目的专业能力:
- 在DeepResearch-Bench v1.2(由中科院自动化所与清华智谱联合构建的首个深度研究能力评测基准)中,其综合得分达86.7分,超越GPT-4o(82.1)、接近OpenAI最新发布的o3-mini(87.9),在“多跳事实核查”、“长周期趋势归因”、“跨模态证据整合”等子项上甚至实现反超;
- 在真实场景压力测试中,模型可在平均142秒内完成一份涵盖宏观经济分析、产业链图谱、竞品技术对比与风险预警的《2024全球人形机器人产业化进展深度报告》,内容结构完整、数据标注清晰、引用来源可溯,经5位领域专家盲评,专业认可率达91.3%;
- 支持动态研究会话(Research Session):用户只需输入初始命题(如“评估钙钛矿光伏在东南亚市场的商业化瓶颈”),模型将自动拆解子问题、调用内置知识图谱与联网插件(支持实时接入Google Scholar、Wind、国家知识产权局等12类API)、迭代修正假设,并支持用户随时介入干预、调整权重或补充约束条件。
三、成本革命:部署门槛大幅降低,真正实现“研究普惠”
长期以来,高性能研究型AI面临严峻的成本悖论:顶级闭源模型虽能力强,但API调用费用高昂(o3-mini单次深度研究请求报价常超5元),私有化部署则需数十张H100 GPU集群,硬件与运维成本动辄数百万。Step-DeepResearch则彻底打破这一困局:
✅ 极致性价比:在同等A100 80GB显卡环境下,Step-DeepResearch仅需4卡即可完成全参数高效推理(启用vLLM+FlashAttention-3优化),相较同性能级别模型(如Qwen2-72B-Instruct)显存占用降低58%,吞吐量提升2.3倍;
✅ 极低调用成本:经第三方云服务厂商实测,单次中等复杂度研究请求(约3000 token输入+2000 token输出)的端到端成本稳定低于0.42元人民币,仅为o3-mini官方报价的1/12;
✅ 全栈开源开放:模型权重、训练代码、推理框架(含WebUI与CLI工具链)、评估套件及典型研究工作流模板(Finance/Healthcare/Tech Policy等6大垂直领域)全部在Hugging Face与GitHub同步开源(Apache 2.0协议),支持企业级私有化部署、LoRA微调与安全沙箱集成。
四、生态共建:不止于模型,更打造“可信赖研究智能”基础设施
阶跃星辰同步宣布启动DeepResearch Open Ecosystem计划:
🔹 发布Step-ResearchHub——面向研究者的开源协作平台,支持上传自定义知识库、共享研究模板、复现他人研究轨迹、提交可信度校验反馈;
🔹 推出ResearchGuardian轻量级审计模块,可自动标记模型输出中的潜在事实偏差、过时数据、未声明的假设依赖,并提供溯源线索与替代信源建议;
🔹 联合高校与智库成立“AI增强研究联盟”,首批已接入北京大学数字人文中心、上海交大人工智能研究院及麦肯锡中国研究院,共同制定《AI辅助研究伦理指南》与《可验证研究报告格式标准》。
五、结语:从“能回答”到“会研究”,大模型正迈向认知纵深
Step-DeepResearch的诞生,标志着大模型发展正经历一场静默而深刻的范式迁移:不再止步于“知识再现”或“文本生成”,而是向“认知建模”“方法论内化”与“自主探究”纵深演进。当一个开源模型既能以不到一杯咖啡的价格完成博士生级文献综述,又能为企业战略部门提供小时级更新的产业洞察简报,我们看到的不仅是技术的跃迁,更是一种新型生产力基础设施的萌芽——它让深度思考变得可规模化、可协作化、可审计化。
正如阶跃星辰CTO在发布会上所言:“我们不制造答案的搬运工,而致力于培育思想的协作者。Step-DeepResearch不是终点,而是‘人类研究者+AI研究员’共生新纪元的起点。”
🌐 延伸阅读:
官方技术报告与模型下载:https://huggingface.co/stepfun
深度评测与Benchmark详情:https://arxiv.org/abs/2409.XXXXX(即将上线)
新闻原文链接:https://news.aibase.cn/news/24092
(全文完)