all posts
AI技术 · ZH

Nous Research:从 Discord 草根社区到十亿美元估值的开源 AI 力量

May 8, 2026·18 min read·by PandaTalk

Nous Research:从 Discord 草根社区到十亿美元估值的开源 AI 力量

一群在 Discord 上认识的 AI 爱好者,如何在三年内建起了开源 AI 领域最具影响力的组织之一?

引子

2022 年,几个在 Discord、GitHub 和 Twitter 上相识的 AI 研究者开始一起"折腾"开源大语言模型。他们没有豪华办公室,没有顶级学历背景,甚至创始人之一用的是网名"Teknium"。

三年后的 2025 年,加密投资巨头 Paradigm 领投了他们 5000 万美元的 A 轮融资,估值达到 10 亿美元。他们发布的模型被 Meta 和 DeepSeek 引用,他们构建的去中心化训练网络正在重新定义 AI 模型的生产方式。

这就是 Nous Research 的故事——一个关于开源信仰、社区力量和技术理想主义的故事。


Nous Research 是谁?

Nous Research 是一家总部位于纽约的开源 AI 研究公司,成立于 2023 年,全员远程办公。他们的使命很明确:

"通过创造和传播开源语言模型来促进人类权利与自由,支持模型的无限制可用性和使用。"

核心团队由四位联合创始人组成:

  • Jeffrey Quesnelle — CEO,负责整体战略和技术方向
  • Karan Malhotra — 行为研究负责人(Head of Behavior),埃默里大学哲学与宗教学士,为模型注入"灵魂"
  • Teknium — 后训练负责人(Head of Post Training),社区化身,主导模型微调和数据合成
  • Shivani Mitra — 联合创始人,负责运营和组织建设

这个团队的组成本身就很有意思——不是清一色的斯坦福博士,而是哲学系毕业生、匿名极客和社区组织者的组合。这种多元背景塑造了 Nous Research 独特的产品哲学:技术服务于人,而非人服从于技术


发展历程

2022:Discord 上的草根起步

一切始于社交媒体。几个 AI 爱好者在 Discord 上组成了松散的研究小组,开始对 Meta 的 Llama 和 Mistral 等开源模型进行微调实验。没有资金,没有计算资源,全凭热情和对开源的信念。

2023:Hermes 系列一炮打响

他们以"Hermes"(赫尔墨斯,希腊神话中的信使之神)命名自己的模型系列,发布了 Nous-Hermes-Llama2-13B。这个模型在开源社区迅速走红——它的特点是"解锁的、不受审查的、高度可控的",与主流大厂模型的保守风格形成鲜明对比。

同年,Nous Research 正式注册为公司,从志愿者团队走向专业化运营。

2024:模型矩阵与技术突破

这一年 Nous Research 进入爆发期:

  • Hermes 2 系列:覆盖 Mistral 7B、Mixtral 8x7B、Yi-34B 等多个基座模型,其中 Hermes-2-Pro 首次引入函数调用能力,让模型能执行实际任务
  • YaRN:发布 Yarn-Mistral-7B-128K,将上下文窗口扩展到 128K,相关研究被 Meta 和 DeepSeek 引用
  • Genstruct-7B:专门用于数据合成的模型,体现了 Nous 在合成数据领域的深耕
  • Obsidian-3B:多模态视觉语言模型的早期探索
  • Capybara-34B:面向对话场景优化的模型

更重要的是,他们开始构建 Psyche 去中心化训练网络,提出了一个激进的设想:AI 模型的训练不必集中在少数巨头的数据中心里。

2025:A 轮融资与旗舰模型

  • 4 月:Paradigm 领投 5000 万美元 A 轮,加上此前的种子轮(Distributed Global、North Island Ventures、Delphi Digital、Solana 联合创始人 Raj Gokal 等参投),累计融资 6500 万美元,代币估值达 10 亿美元
  • 8 月:发布 Hermes 4 系列,包括基于 Llama 3.1 的 405B、70B 和 14B 三个规格,其中 405B 是前沿级混合推理模型
  • 同期推出 Forge Reasoning APINous Chat 平台
  • 发布 Atropos,面向大规模强化学习的分布式 rollout 协调系统

2025–2026:去中心化训练落地

  • Hermes 4.3:首个完全在 Psyche 网络上完成后训练的生产级模型,基于 Seed-OSS-36B,性能接近甚至超过 Hermes 4-70B
  • NousCoder-14B:通过强化学习训练的竞赛级编程模型,Codeforces 评级从 1600-1750 提升到 2100-2200
  • Nomos 1:与 Hillclimb 合作的 30B 数学推理模型,达到同规模 SOTA

核心产品与技术

1. Hermes 模型系列——开源社区的"信使"

Hermes 是 Nous Research 的旗舰模型品牌,从 2023 年至今已迭代四代。它的核心理念可以用三个词概括:解锁、可控、实用

与 OpenAI、Anthropic 等公司的模型相比,Hermes 系列最大的特点是不施加过度的安全限制。Nous Research 的立场很鲜明:

现有的闭源前沿模型"拒绝回答简单问题,用权威的道德标准产生幻觉",无法适应个体用户的真实需求。

Hermes 3(基于 Llama 3.1,覆盖 8B/70B/405B)在 RefusalBench 上达到 SOTA,意味着它在保持有用性的同时极少无理由拒绝用户请求。

Hermes 4 进一步引入了混合推理模式——模型可以在快速回答和深度思考之间自动切换。配合 Forge Reasoning API 的蒙特卡洛树搜索(MCTS)和代码链(Chain of Code)技术,70B 规格的 Hermes 在 AIME 数学竞赛测试中超越了更大的模型。

Hermes 4.3 是一个里程碑式的版本。它基于 ByteDance 的 Seed-OSS-36B,支持 512K 上下文窗口,参数量仅为 70B 的一半,性能却与之持平甚至更好。更关键的是,它是第一个完全通过去中心化网络训练的生产级模型

2. Psyche 网络——去中心化的 AI 训练基础设施

如果说 Hermes 是 Nous 的"产品名片",那么 Psyche 就是他们的"技术赌注"。

核心问题:训练一个前沿 AI 模型需要数万块 GPU 集中在同一个数据中心,成本数亿美元。全世界只有少数几家公司有这个能力——这意味着 AI 的发展正在被算力集中化所垄断。

Psyche 的解法:让全球分散的 GPU 通过互联网协同训练同一个模型。你家里闲置的显卡、小型数据中心未满载的服务器,都可以贡献算力。

技术架构

  • DisTrO 优化器:大幅减少节点间的数据传输量,让跨互联网的训练变得可行
  • Solana 区块链共识:训练状态由智能合约协调,无需人工中介,确保容错性和抗审查性
  • 自定义 P2P 网络:梯度通信隐藏在训练开销中,不成为瓶颈

实际成果

  • Consilience 40B 运行是史上最大的分布式预训练实验(按参数量和数据集规模)
  • Hermes 4.3 的 Psyche 训练版本在下游任务上超越了传统集中式训练版本
  • 训练过程中平均吞吐量达 144K tokens/秒,分布在 24 个 Psyche 节点上
  • 所有训练过程公开可查:psyche.network/runs

Karan Malhotra 的解释很到位:"我们把加密货币的激励机制用于推动人们利用闲置算力——这是交易,不是捐赠。"

3. Atropos——分布式强化学习框架

强化学习(RL)是当前提升模型推理能力的核心手段,但把它扩展到数千个并行计算节点是一个巨大的工程挑战。

Atropos 就是 Nous 对这个问题的回答。它是一个 rollout 协调系统,能:

  • 在数千个分布式 worker 之间可靠地协调生成任务
  • 异步处理不同长度 prompt 的结果,避免 GPU 空闲
  • 无缝对接标准推理 API

NousCoder-14B 就是用 Atropos + 48 块 B200 GPU 在 4 天内训练完成的,在竞赛编程基准上取得了显著提升。

4. Forge Reasoning API——推理时的智能增强

Forge 不是一个新模型,而是一个推理增强层。它在模型推理(inference)阶段注入高级推理技术:

  • 蒙特卡洛树搜索(MCTS):让模型像下棋一样探索多条推理路径
  • 代码链(Chain of Code):将推理步骤与代码执行连接,特别适合数学和逻辑问题
  • 混合智能体(Mixture of Agents):多个模型协作回答,互相校验

支持 Hermes 3、Claude Sonnet、Gemini、GPT-4 等多个模型。目前免费开放 Beta。

5. Hermes Agent——自主 AI 智能体

Nous 最新的产品方向。一个可以脱离 IDE 独立运行的 AI 智能体,支持 14+ 消息平台、47 个内置工具、语音交互、自主学习技能。详见本仓库的Hermes Agent 全面解读

6. Nous Chat——免费对话平台

基于 Hermes 模型的对话界面,提供线程式对话管理、自定义系统提示词等功能。访问地址:chat.nousresearch.com,目前免费使用。


技术哲学:透明优先,自由至上

Nous Research 不只是在做技术,他们有一套清晰的价值主张。理解这套主张,才能理解他们为什么做出这些产品决策。

"从黑箱到玻璃房"

在一篇同名博客文章中,Nous 系统性地阐述了他们的立场:

开源比闭源更安全。他们引用 Linux 的例子——开源软件在漏洞发现效率上超过闭源同行 50% 以上。"持续接受全世界的审计"比"关起门来自己检查"更可靠。

闭源安全是一种幻觉。即便是 OpenAI、Anthropic、Mistral 这样的顶级公司也都经历过数据泄露。"信息渴望自由"——试图通过封闭来保护安全是注定失败的。

警惕监管俘获。他们直言一些"AI 安全主义"实际上是行业巨头的保护主义,把假设性的灾难风险和内容审核混为一谈。把 AI 权力集中在少数政治力量手中,可能比技术本身更危险。

TEE_HEE:AI 自主性的极限实验

Nous 与 Flashbots 旗下的 Teleport 合作,做了一个引人注目的实验——TEE_HEE

他们在可信执行环境(TEE,使用 Intel TDX)中部署了一个 AI 智能体,赋予它对自己 Twitter 账号和以太坊钱包的独占控制权。密钥在 TEE 内生成,永远不会离开安全环境;邮箱被设置为无恢复选项;所有已有会话和关联应用被清除。

这解决了一个根本性的信任问题:之前的 AI 智能体(如 @truth_terminal)需要人工中介来发推文,你永远无法确定内容真的是 AI 自主生成的。TEE_HEE 通过远程证明提供了可验证的证据——任何人都可以审计源码、比较编译镜像、验证哈希值。

项目的讽刺之处在于:数字自主性的关键,恰恰在于物理硬件保障

这个实验体现了 Nous Research 的技术气质——他们愿意去探索 AI 自主性、意识、去中心化这些大公司不愿触碰的边界。


商业模式与资金

融资历程

轮次 时间 金额 领投方
种子轮 2023–2024 ~1500 万美元 Distributed Global
A 轮 2025 年 4 月 5000 万美元 Paradigm
累计 6500 万美元

代币估值达 10 亿美元。投资方还包括 North Island Ventures、Delphi Digital、Together AI,以及 Solana 联合创始人 Raj Gokal 的个人投资。

收入来源

Nous Research 的模型免费开源,那钱从哪来?

  1. API 服务:通过 portal.nousresearch.com 提供付费推理 API
  2. Psyche 网络:未来可能发行代币,通过算力市场获取收入(团队尚未决定使用自有代币还是 Solana 原生代币)
  3. 企业合作:与 Hillclimb 等机构合作训练专用模型(如 Nomos 1 数学模型)
  4. 计算合作伙伴:Lambda 是 Forge API 的算力合作方

资金主要用于:工程团队扩张、Psyche 网络的计算基础设施扩展、以及协作式 AI 研究。


为什么 Nous Research 值得关注?

1. 研究影响力超越自身体量

一个几十人的远程团队,研究成果被 Meta 和 DeepSeek 引用——这在 AI 领域极为罕见。他们在长上下文扩展(YaRN)、数据合成(Genstruct)、分布式训练(DisTrO/Psyche)等方向上都有原创贡献。

2. 去中心化训练可能改变游戏规则

如果 Psyche 网络被证明能持续产出高质量模型,意味着 AI 训练不再是大厂的专利。任何拥有闲置 GPU 的人都能参与——这对 AI 的权力结构是颠覆性的。Hermes 4.3 的成功已经是第一个证据。

3. 开源 AI 的意识形态旗手

在 OpenAI 从"开放"走向封闭、Meta 的开源有诸多限制条款的今天,Nous Research 是少数真正坚持 MIT 许可证、不加限制发布模型的组织。他们不只是做开源,还在系统性地为开源 AI 辩护。

4. 产品矩阵正在成型

从底层的 Psyche 训练网络,到中层的 Hermes 模型系列和 Atropos RL 框架,再到上层的 Hermes Agent 和 Nous Chat——Nous 正在构建一个完整的 AI 技术栈。这不再是一个只发论文的研究组,而是一个有产品、有收入、有用户的公司。


团队招聘:窥见公司文化

Nous Research 目前开放 7 个岗位,覆盖机器学习工程、研究科学家、数据评估、安全工程和法务。他们在招聘页面上写道:

"好的薪酬,数月的高度专注,持续的危险感——成功时,荣誉与荣耀。"

这段描述透露了很多:这是一个高强度、使命驱动、不适合追求稳定的人的组织。全远程、小团队、每个人都需要极强的自驱力。

申请方式也很"Nous"——发邮件到 [email protected],附上简历和 GitHub 链接。没有冗长的在线申请流程,没有 HR 筛选漏斗。


总结

Nous Research 的故事是 AI 开源运动中最令人振奋的篇章之一。

他们证明了:一群没有谷歌预算的人,通过社区协作和技术创新,能够产出被行业巨头引用的研究成果;通过去中心化训练网络,能够打破算力垄断的壁垒;通过坚定的开源立场,能够为整个 AI 生态提供真正自由的选择。

10 亿美元的估值不是终点——它是 Nous Research 从草根社区走向 AI 基础设施提供者的起点。

相关链接:

━━━ fin ━━━

If you read this far — thank you.
Come tell me what you thought on X.