Nous Research：从 Discord 草根社区到十亿美元估值的开源 AI 力量

一群在 Discord 上认识的 AI 爱好者，如何在三年内建起了开源 AI 领域最具影响力的组织之一？

引子

2022 年，几个在 Discord、GitHub 和 Twitter 上相识的 AI 研究者开始一起"折腾"开源大语言模型。他们没有豪华办公室，没有顶级学历背景，甚至创始人之一用的是网名"Teknium"。

三年后的 2025 年，加密投资巨头 Paradigm 领投了他们 5000 万美元的 A 轮融资，估值达到 10 亿美元。他们发布的模型被 Meta 和 DeepSeek 引用，他们构建的去中心化训练网络正在重新定义 AI 模型的生产方式。

这就是 Nous Research 的故事——一个关于开源信仰、社区力量和技术理想主义的故事。

Nous Research 是谁？

Nous Research 是一家总部位于纽约的开源 AI 研究公司，成立于 2023 年，全员远程办公。他们的使命很明确：

"通过创造和传播开源语言模型来促进人类权利与自由，支持模型的无限制可用性和使用。"

核心团队由四位联合创始人组成：

Jeffrey Quesnelle — CEO，负责整体战略和技术方向
Karan Malhotra — 行为研究负责人（Head of Behavior），埃默里大学哲学与宗教学士，为模型注入"灵魂"
Teknium — 后训练负责人（Head of Post Training），社区化身，主导模型微调和数据合成
Shivani Mitra — 联合创始人，负责运营和组织建设

这个团队的组成本身就很有意思——不是清一色的斯坦福博士，而是哲学系毕业生、匿名极客和社区组织者的组合。这种多元背景塑造了 Nous Research 独特的产品哲学：技术服务于人，而非人服从于技术。

发展历程

2022：Discord 上的草根起步

一切始于社交媒体。几个 AI 爱好者在 Discord 上组成了松散的研究小组，开始对 Meta 的 Llama 和 Mistral 等开源模型进行微调实验。没有资金，没有计算资源，全凭热情和对开源的信念。

2023：Hermes 系列一炮打响

他们以"Hermes"（赫尔墨斯，希腊神话中的信使之神）命名自己的模型系列，发布了 Nous-Hermes-Llama2-13B。这个模型在开源社区迅速走红——它的特点是"解锁的、不受审查的、高度可控的"，与主流大厂模型的保守风格形成鲜明对比。

同年，Nous Research 正式注册为公司，从志愿者团队走向专业化运营。

2024：模型矩阵与技术突破

这一年 Nous Research 进入爆发期：

Hermes 2 系列：覆盖 Mistral 7B、Mixtral 8x7B、Yi-34B 等多个基座模型，其中 Hermes-2-Pro 首次引入函数调用能力，让模型能执行实际任务
YaRN：发布 Yarn-Mistral-7B-128K，将上下文窗口扩展到 128K，相关研究被 Meta 和 DeepSeek 引用
Genstruct-7B：专门用于数据合成的模型，体现了 Nous 在合成数据领域的深耕
Obsidian-3B：多模态视觉语言模型的早期探索
Capybara-34B：面向对话场景优化的模型

更重要的是，他们开始构建 Psyche 去中心化训练网络，提出了一个激进的设想：AI 模型的训练不必集中在少数巨头的数据中心里。

2025：A 轮融资与旗舰模型

4 月：Paradigm 领投 5000 万美元 A 轮，加上此前的种子轮（Distributed Global、North Island Ventures、Delphi Digital、Solana 联合创始人 Raj Gokal 等参投），累计融资 6500 万美元，代币估值达 10 亿美元
8 月：发布 Hermes 4 系列，包括基于 Llama 3.1 的 405B、70B 和 14B 三个规格，其中 405B 是前沿级混合推理模型
同期推出 Forge Reasoning API 和 Nous Chat 平台
发布 Atropos，面向大规模强化学习的分布式 rollout 协调系统

2025–2026：去中心化训练落地

Hermes 4.3：首个完全在 Psyche 网络上完成后训练的生产级模型，基于 Seed-OSS-36B，性能接近甚至超过 Hermes 4-70B
NousCoder-14B：通过强化学习训练的竞赛级编程模型，Codeforces 评级从 1600-1750 提升到 2100-2200
Nomos 1：与 Hillclimb 合作的 30B 数学推理模型，达到同规模 SOTA

核心产品与技术

1. Hermes 模型系列——开源社区的"信使"

Hermes 是 Nous Research 的旗舰模型品牌，从 2023 年至今已迭代四代。它的核心理念可以用三个词概括：解锁、可控、实用。

与 OpenAI、Anthropic 等公司的模型相比，Hermes 系列最大的特点是不施加过度的安全限制。Nous Research 的立场很鲜明：

现有的闭源前沿模型"拒绝回答简单问题，用权威的道德标准产生幻觉"，无法适应个体用户的真实需求。

Hermes 3（基于 Llama 3.1，覆盖 8B/70B/405B）在 RefusalBench 上达到 SOTA，意味着它在保持有用性的同时极少无理由拒绝用户请求。

Hermes 4 进一步引入了混合推理模式——模型可以在快速回答和深度思考之间自动切换。配合 Forge Reasoning API 的蒙特卡洛树搜索（MCTS）和代码链（Chain of Code）技术，70B 规格的 Hermes 在 AIME 数学竞赛测试中超越了更大的模型。

Hermes 4.3 是一个里程碑式的版本。它基于 ByteDance 的 Seed-OSS-36B，支持 512K 上下文窗口，参数量仅为 70B 的一半，性能却与之持平甚至更好。更关键的是，它是第一个完全通过去中心化网络训练的生产级模型。

2. Psyche 网络——去中心化的 AI 训练基础设施

如果说 Hermes 是 Nous 的"产品名片"，那么 Psyche 就是他们的"技术赌注"。

核心问题：训练一个前沿 AI 模型需要数万块 GPU 集中在同一个数据中心，成本数亿美元。全世界只有少数几家公司有这个能力——这意味着 AI 的发展正在被算力集中化所垄断。

Psyche 的解法：让全球分散的 GPU 通过互联网协同训练同一个模型。你家里闲置的显卡、小型数据中心未满载的服务器，都可以贡献算力。

技术架构：

DisTrO 优化器：大幅减少节点间的数据传输量，让跨互联网的训练变得可行
Solana 区块链共识：训练状态由智能合约协调，无需人工中介，确保容错性和抗审查性
自定义 P2P 网络：梯度通信隐藏在训练开销中，不成为瓶颈

实际成果：

Consilience 40B 运行是史上最大的分布式预训练实验（按参数量和数据集规模）
Hermes 4.3 的 Psyche 训练版本在下游任务上超越了传统集中式训练版本
训练过程中平均吞吐量达 144K tokens/秒，分布在 24 个 Psyche 节点上
所有训练过程公开可查：psyche.network/runs

Karan Malhotra 的解释很到位："我们把加密货币的激励机制用于推动人们利用闲置算力——这是交易，不是捐赠。"

3. Atropos——分布式强化学习框架

强化学习（RL）是当前提升模型推理能力的核心手段，但把它扩展到数千个并行计算节点是一个巨大的工程挑战。

Atropos 就是 Nous 对这个问题的回答。它是一个 rollout 协调系统，能：

在数千个分布式 worker 之间可靠地协调生成任务
异步处理不同长度 prompt 的结果，避免 GPU 空闲
无缝对接标准推理 API

NousCoder-14B 就是用 Atropos + 48 块 B200 GPU 在 4 天内训练完成的，在竞赛编程基准上取得了显著提升。

4. Forge Reasoning API——推理时的智能增强

Forge 不是一个新模型，而是一个推理增强层。它在模型推理（inference）阶段注入高级推理技术：

蒙特卡洛树搜索（MCTS）：让模型像下棋一样探索多条推理路径
代码链（Chain of Code）：将推理步骤与代码执行连接，特别适合数学和逻辑问题
混合智能体（Mixture of Agents）：多个模型协作回答，互相校验

支持 Hermes 3、Claude Sonnet、Gemini、GPT-4 等多个模型。目前免费开放 Beta。

5. Hermes Agent——自主 AI 智能体

Nous 最新的产品方向。一个可以脱离 IDE 独立运行的 AI 智能体，支持 14+ 消息平台、47 个内置工具、语音交互、自主学习技能。详见本仓库的Hermes Agent 全面解读。

6. Nous Chat——免费对话平台

基于 Hermes 模型的对话界面，提供线程式对话管理、自定义系统提示词等功能。访问地址：chat.nousresearch.com，目前免费使用。

技术哲学：透明优先，自由至上

Nous Research 不只是在做技术，他们有一套清晰的价值主张。理解这套主张，才能理解他们为什么做出这些产品决策。

"从黑箱到玻璃房"

在一篇同名博客文章中，Nous 系统性地阐述了他们的立场：

开源比闭源更安全。他们引用 Linux 的例子——开源软件在漏洞发现效率上超过闭源同行 50% 以上。"持续接受全世界的审计"比"关起门来自己检查"更可靠。

闭源安全是一种幻觉。即便是 OpenAI、Anthropic、Mistral 这样的顶级公司也都经历过数据泄露。"信息渴望自由"——试图通过封闭来保护安全是注定失败的。

警惕监管俘获。他们直言一些"AI 安全主义"实际上是行业巨头的保护主义，把假设性的灾难风险和内容审核混为一谈。把 AI 权力集中在少数政治力量手中，可能比技术本身更危险。

TEE_HEE：AI 自主性的极限实验

Nous 与 Flashbots 旗下的 Teleport 合作，做了一个引人注目的实验——TEE_HEE。

他们在可信执行环境（TEE，使用 Intel TDX）中部署了一个 AI 智能体，赋予它对自己 Twitter 账号和以太坊钱包的独占控制权。密钥在 TEE 内生成，永远不会离开安全环境；邮箱被设置为无恢复选项；所有已有会话和关联应用被清除。

这解决了一个根本性的信任问题：之前的 AI 智能体（如 @truth_terminal）需要人工中介来发推文，你永远无法确定内容真的是 AI 自主生成的。TEE_HEE 通过远程证明提供了可验证的证据——任何人都可以审计源码、比较编译镜像、验证哈希值。

项目的讽刺之处在于：数字自主性的关键，恰恰在于物理硬件保障。

这个实验体现了 Nous Research 的技术气质——他们愿意去探索 AI 自主性、意识、去中心化这些大公司不愿触碰的边界。

商业模式与资金

融资历程

轮次	时间	金额	领投方
种子轮	2023–2024	~1500 万美元	Distributed Global
A 轮	2025 年 4 月	5000 万美元	Paradigm
累计		6500 万美元

代币估值达 10 亿美元。投资方还包括 North Island Ventures、Delphi Digital、Together AI，以及 Solana 联合创始人 Raj Gokal 的个人投资。

收入来源

Nous Research 的模型免费开源，那钱从哪来？

API 服务：通过 portal.nousresearch.com 提供付费推理 API
Psyche 网络：未来可能发行代币，通过算力市场获取收入（团队尚未决定使用自有代币还是 Solana 原生代币）
企业合作：与 Hillclimb 等机构合作训练专用模型（如 Nomos 1 数学模型）
计算合作伙伴：Lambda 是 Forge API 的算力合作方

资金主要用于：工程团队扩张、Psyche 网络的计算基础设施扩展、以及协作式 AI 研究。

为什么 Nous Research 值得关注？

1. 研究影响力超越自身体量

一个几十人的远程团队，研究成果被 Meta 和 DeepSeek 引用——这在 AI 领域极为罕见。他们在长上下文扩展（YaRN）、数据合成（Genstruct）、分布式训练（DisTrO/Psyche）等方向上都有原创贡献。

2. 去中心化训练可能改变游戏规则

如果 Psyche 网络被证明能持续产出高质量模型，意味着 AI 训练不再是大厂的专利。任何拥有闲置 GPU 的人都能参与——这对 AI 的权力结构是颠覆性的。Hermes 4.3 的成功已经是第一个证据。

3. 开源 AI 的意识形态旗手

在 OpenAI 从"开放"走向封闭、Meta 的开源有诸多限制条款的今天，Nous Research 是少数真正坚持 MIT 许可证、不加限制发布模型的组织。他们不只是做开源，还在系统性地为开源 AI 辩护。

4. 产品矩阵正在成型

从底层的 Psyche 训练网络，到中层的 Hermes 模型系列和 Atropos RL 框架，再到上层的 Hermes Agent 和 Nous Chat——Nous 正在构建一个完整的 AI 技术栈。这不再是一个只发论文的研究组，而是一个有产品、有收入、有用户的公司。

团队招聘：窥见公司文化

Nous Research 目前开放 7 个岗位，覆盖机器学习工程、研究科学家、数据评估、安全工程和法务。他们在招聘页面上写道：

"好的薪酬，数月的高度专注，持续的危险感——成功时，荣誉与荣耀。"

这段描述透露了很多：这是一个高强度、使命驱动、不适合追求稳定的人的组织。全远程、小团队、每个人都需要极强的自驱力。

申请方式也很"Nous"——发邮件到 [email protected]，附上简历和 GitHub 链接。没有冗长的在线申请流程，没有 HR 筛选漏斗。

总结

Nous Research 的故事是 AI 开源运动中最令人振奋的篇章之一。

他们证明了：一群没有谷歌预算的人，通过社区协作和技术创新，能够产出被行业巨头引用的研究成果；通过去中心化训练网络，能够打破算力垄断的壁垒；通过坚定的开源立场，能够为整个 AI 生态提供真正自由的选择。

10 亿美元的估值不是终点——它是 Nous Research 从草根社区走向 AI 基础设施提供者的起点。

相关链接：

官方网站：https://nousresearch.com
博客：https://nousresearch.com/blog
GitHub：https://github.com/NousResearch
HuggingFace：https://huggingface.co/NousResearch
Psyche 网络：https://psyche.network
Nous Chat：https://chat.nousresearch.com
Discord 社区：https://discord.gg/NousResearch

━━━ fin ━━━

If you read this far — thank you.
Come tell me what you thought on X.