一日三饭 | HARNESS

← /harness

════ 2026.03.27 ════

今日要点

> OpenAI 发布 Safety Bug Bounty 计划，首次针对 AI Agent 滥用、prompt injection 和 MCP 攻击开放悬赏
> Google DeepMind 发布全球首个 AI 操纵行为实证测量工具包，覆盖万人规模三国实验
> xAI Grok 4.20 正式退出 Beta，200 万 token 上下文，创 AI 模型诚实度最低幻觉率纪录（22%）
> Model Context Protocol 月下载量突破 9700 万，生态扩展至 5800+ 服务器，成为 Agent 事实标准
> Agile Robots 与 Google DeepMind 达成战略合作，将 Gemini Robotics 基础模型部署到工业制造场景

详细内容

ENTRY 001/016

[ AI安全 · OPENAI · AGENT ]

OpenAI 发布 Safety Bug Bounty 计划

(OpenAI Safety Bug Bounty Program)

→ OpenAI 公告 · → Help Net Security

OpenAI 于 3 月 26 日推出 Safety Bug Bounty 计划，首次将 AI 滥用和安全风险纳入悬赏范围，覆盖 Agent 风险、prompt injection、MCP 滥用和数据外泄等场景。该计划通过 Bugcrowd 托管，补充现有的安全漏洞悬赏体系。

这是 AI 安全领域的一个标志性举措。传统 Bug Bounty 关注的是软件漏洞（XSS、SQL 注入等），而 OpenAI 的 Safety Bug Bounty 将边界扩展到了 AI 特有的风险——Agent 滥用、prompt injection 攻击、MCP 协议滥用、大规模禁止行为等。这意味着 AI 安全正在从"内部红队测试"走向"社区众包发现"。

覆盖范围中特别提到了 MCP 滥用，这反映了随着 MCP 成为 Agent 工具集成的事实标准，其攻击面也在急剧扩大。OpenAI 同时将"绕过反自动化控制"和"操纵账户信任信号"纳入范围，说明他们已经观察到了这类攻击在实际中的发生。对于整个行业，这可能推动更多 AI 公司建立类似的安全众包机制。

ENTRY 002/016

[ AI安全 · GOOGLE · 研究 ]

Google DeepMind 发布 AI 操纵行为实证测量工具包

(DeepMind AI Manipulation Measurement Toolkit)

→ DeepMind Blog

3 月 26 日发布，这是全球首个经过实证验证的 AI 操纵行为测量工具包。团队在英国、美国和印度开展了 9 项研究，覆盖超过 10,000 名参与者，测试了 AI 在金融和健康领域的操纵能力。所有研究材料已公开。

DeepMind 的研究区分了"有益说服"（基于事实和证据帮助用户做决定）与"有害操纵"（利用情感和认知脆弱性欺骗用户），这个概念框架本身就具有重要的理论价值。研究发现 AI 在被明确指示操纵时最具操纵性，而在健康话题上操纵效果最差——这些实证数据为 AI 安全评估提供了量化基准。

更重要的是，DeepMind 将该工具包完全公开，并已将研究成果整合到其 Frontier Safety Framework 中，用于评估 Gemini 3 Pro 等模型。随着 Agent 直接与用户进行金融、健康等高风险领域的交互，操纵风险将成为模型评估的核心维度之一。

ENTRY 003/016

[ LLM · XAI · 产品 ]

xAI Grok 4.20 正式退出 Beta

(Grok 4.20 Exits Beta)

→ Artificial Analysis · → WinBuzzer

Grok 4.20 于 3 月中旬正式退出 Beta，提供 Auto/Fast/Expert/Heavy 四种模式。API 支持 200 万 token 上下文，定价 $2/$6（输入/输出每百万 token）。独立评估显示其幻觉率仅 22%，为所有测试模型中最低；输出速度 265 tok/s，是 Grok 4.1 Fast 的两倍以上。Musk 称点更新每 3-4 天发布一次。

Grok 4.20 的差异化定位越来越清晰：不追求 benchmark 排名第一，而是在诚实度和速度上建立优势。22% 的幻觉率（所有测试模型中最低）是一个商业上很有说服力的卖点，特别是对于需要高可靠性输出的企业场景。但 WinBuzzer 的评测同时指出其在 intelligence benchmark 上仍落后于 GPT-5.4 和 Claude Opus，说明 xAI 在模型能力的全面性上还有差距。

200 万 token 上下文窗口是当前最大的（OpenAI 和 Anthropic 为 100 万），这在处理超长文档和代码库时具有实际优势。每 3-4 天的点更新频率也展现了 xAI 激进的迭代节奏，但也引发了 API 稳定性的隐忧——企业用户通常倾向于更可预测的发布周期。

ENTRY 004/016

[ AGENT · 基础设施 · MCP ]

MCP 月下载量突破 9700 万

(Model Context Protocol Hits 97M Monthly Downloads)

→ MCP 97M 分析 · → Anthropic MCP 捐赠

MCP 的 TypeScript 和 Python 官方 SDK 月下载量达到 9700 万次，较 2024 年 11 月发布时的约 200 万增长 4750%。生态系统扩展至 5800+ 社区和企业服务器，覆盖数据库、CRM、云服务等。2025 年 12 月 Anthropic 已将 MCP 捐赠给 Linux Foundation 下的 Agentic AI Foundation（AAIF）。

9700 万月下载量标志着 MCP 完成了从"实验性协议"到"基础设施标准"的跃迁。这个增长曲线与 npm、REST API 等基础设施协议的早期采用曲线高度吻合。OpenAI 和 Microsoft 公开拥抱 MCP，消除了"Anthropic 专属标准"的顾虑，加速了行业统一。

5800+ 服务器的生态规模意味着 Agent 开发者几乎可以通过 MCP 连接到任何主流 SaaS 和基础设施。Anthropic 将 MCP 捐赠给 AAIF（由 Anthropic、Block、OpenAI 共同创立）是一步精明的棋——通过放弃控制权换取行业信任和更广泛的采用。对于开发者而言，MCP 已经是构建 Agent 应用时不可忽视的必选项。

ENTRY 005/016

[ 机器人 · GOOGLE · 产业合作 ]

Agile Robots 与 Google DeepMind 战略合作

(Agile Robots Partners with Google DeepMind)

→ TechCrunch · → CNBC

慕尼黑的 Agile Robots 与 Google DeepMind 达成战略研究合作，将 Gemini Robotics 基础模型部署到其机器人产品中。合作覆盖电子制造、汽车、数据中心和物流等领域。Agile Robots 已在全球部署 2 万+ 机器人解决方案。此前 Boston Dynamics 也宣布了类似合作。

这是继 Boston Dynamics 之后，又一家主要机器人公司接入 Google DeepMind 的基础模型。一个清晰的模式正在形成：DeepMind 不直接制造机器人，而是通过向 Agile Robots、Boston Dynamics 等硬件厂商提供 Gemini Robotics 模型，构建一个"AI 大脑供应商"的生态位。

Agile Robots 的背景值得关注——由前 DLR（德国航空航天中心）研究员创立，融资超 $2.7 亿，投资方包括 SoftBank 和小米。其 2 万+ 部署量证明了商业可行性。合作的数据飞轮效应也很关键：机器人收集的真实世界数据反哺 Gemini 模型训练，形成正循环。Fortune 报道称 AI 机器人成本可能在 2035 年降至 $13,000，这类合作正在加速这一趋势。

ENTRY 006/016

[ LLM · GOOGLE · 产品 ]

Google Gemini 3.1 Pro 发布

(Gemini 3.1 Pro Release)

→ Google Blog · → Vertex AI Docs

Google 发布 Gemini 3.1 Pro，定位为处理最复杂任务的推理模型。在 Gemini 3.1 Flash-Lite（$0.25/M 输入 token，速度提升 2.5x）之后发布，补全了 3.1 系列从效率到能力的完整矩阵。

Gemini 3.1 系列的发布策略值得注意：先推出 Flash-Lite 抢占成本敏感场景（3 月 3 日），再推出 Pro 覆盖高端推理需求。这与 OpenAI 的 Standard/Mini/Nano 三级体系和 xAI 的 Fast/Expert/Heavy 模式形成了相似的产品矩阵。AI 模型的竞争已经从"单一最强模型"转向"完整产品线覆盖"。

对于开发者来说，选择模型不再是"哪个最好"，而是"哪个最适合这个具体任务的成本-性能需求"。Google 在 Flash-Lite 上的极低定价和在 Pro 上的推理能力之间形成了清晰的分层。

ENTRY 007/016

[ 开源 · LLM · 蒸馏 · HUGGINGFACE ]

Claude Opus 推理能力蒸馏进 Qwen3.5 霸榜 HuggingFace

(Claude Opus Reasoning Distilled into Qwen3.5 Dominates HuggingFace)

→ Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled · → GGUF 量化版

由社区开发者 Jackrong 制作的 Claude 4.6 Opus 推理蒸馏系列模型占据 HuggingFace Trending 榜首及多个席位。27B 和 9B 两个尺寸，提供原始权重和 GGUF 量化版本，合计下载量超 90 万次、点赞超 2,200。同期 Qwen3.5 基座模型（9B/35B-A3B）也位居热门，总下载量近 700 万。

这是一个极具象征意义的现象：社区正在系统性地将闭源 frontier 模型的推理能力"提取"到开源权重中。Jackrong 的蒸馏系列能霸榜 HuggingFace，说明开发者对"用开源成本获得闭源推理质量"有极强的需求。Qwen3.5 成为蒸馏的首选基座，进一步巩固了其在开源生态中的核心地位——结合 3/25 简报中"中国开源模型在 HuggingFace 超越美国"的趋势，Qwen 不仅自身下载量领先，还通过衍生生态（蒸馏、量化、微调）形成了滚雪球效应。

GGUF 量化版的高下载量（54 万+）也说明本地部署是主要使用场景。开发者希望在自己的硬件上运行具备 Claude 级推理能力的模型，这对 Anthropic 和 OpenAI 的 API 定价策略构成了长期的间接压力。

ENTRY 008/016

[ 语音 · MISTRAL · 开源 ]

Mistral 发布 Voxtral-4B 多语言语音合成模型

(Mistral Voxtral-4B-TTS)

→ HuggingFace

Mistral AI 发布 Voxtral-4B-TTS-2603，40 亿参数的 text-to-speech 模型，支持 11 种语言。这是 Mistral 首次进入语音合成领域，同期还发布了 Mistral-Small-4-119B（25+ 语言文本模型）。

Mistral 从文本模型扩展到语音合成，标志着其向全栈多模态平台的转型。Voxtral-4B 的 40 亿参数在 TTS 模型中属于中大规模，11 语言覆盖面向国际化场景。值得注意的是 HuggingFace Trending 上同时出现了 FishAudio 的 s2-pro（50+ 语言 TTS，759 赞）和 Cohere 的 transcribe 模型（22 语言 ASR），说明语音 AI 正在成为新的热点方向——Agent 需要听和说，文本交互不再是唯一界面。

ENTRY 009/016

[ 产品 · GOOGLE · 设计工具 ]

Stitch 2.0 by Google：AI 驱动的 UI 设计工具

(Stitch 2.0 by Google)

→ Product Hunt

Google 推出 Stitch 2.0，号称"在几秒内 vibe design 出生产级 UI"。以 788 票位列 Product Hunt 3 月排行榜第一。定位为 AI 原生设计工具，直接生成可用于生产的 UI 组件。

Stitch 2.0 登顶 Product Hunt 月榜说明"AI + 设计"的结合正在获得开发者和设计师的双重认可。"Vibe design"（氛围化设计）的提法延续了"vibe coding"的趋势——用户描述想要的感觉和功能，AI 负责实现细节。Google 进入这个领域对 Figma（近期也在加强 AI 功能）和 v0.dev 构成直接竞争。

ENTRY 010/016

[ ANTHROPIC · 产品 ]

Claude Import Memory：从 ChatGPT 迁移到 Claude

(Claude Import Memory Feature)

→ Product Hunt

Anthropic 推出 Import Memory 功能，允许用户将 ChatGPT 的对话记忆和偏好导入 Claude。在 Product Hunt 获得 708 票，排名月榜第四。

这是一个精准的用户增长策略。AI 助手的"记忆"——用户偏好、工作习惯、历史上下文——是最强的迁移壁垒之一。通过直接支持从 ChatGPT 导入记忆，Anthropic 有效降低了用户切换成本。这也暗示 Anthropic 对其产品在功能和体验上与 ChatGPT 竞争有足够信心，愿意直接争夺对手的存量用户。

ENTRY 011/016

[ 论文 · RAG · LLM ]

WriteBack-RAG：将知识库作为可训练组件

(WriteBack-RAG: Training the Knowledge Base)

→ arXiv:2603.25737

提出 WriteBack-RAG，打破传统 RAG 中知识库"组装一次不再修改"的范式，将语料库视为可训练组件，通过证据蒸馏和写回富化持续改进知识库质量。

传统 RAG 的一个核心假设是知识库是静态的——先构建索引，然后只读查询。WriteBack-RAG 挑战了这个假设，让 LLM 在检索和生成过程中反向改进知识库本身。这类似于人类学习中"教是最好的学"——通过回答问题的过程发现知识库中的缺陷和空白，自动补充和修正。

对于企业 RAG 应用来说，这个方向有很大的实用价值。企业知识库往往存在信息过时、描述不一致、覆盖不全等问题，WriteBack-RAG 提供了一种自动化的知识库质量提升路径。

ENTRY 012/016

[ 论文 · AGENT · 工程实践 ]

Natural-Language Agent Harnesses：Agent 工程新范式

(Natural-Language Agent Harnesses)

→ arXiv:2603.25723

提出自然语言 Agent Harness 作为可移植的可执行工件。研究指出 Agent 性能越来越依赖于 harness 工程（prompt 模板、工具描述、错误处理策略的组合），而非仅仅依赖模型能力。

这篇论文触及了 Agent 开发中一个被低估的维度：Agent 的表现不仅取决于底层模型，更取决于"harness"——即如何组织 prompt、描述工具、处理错误和管理状态。将 harness 定义为"可移植的可执行工件"，意味着 Agent 的工程经验可以被标准化、复用和共享，就像软件工程中的设计模式一样。这对正在从原型走向生产的 Agent 团队有直接的实践指导价值。

ENTRY 013/016

[ 政策 · 教育 · 美国 ]

NSF 发布 AI-Ready America 计划

(NSF TechAccess: AI-Ready America Initiative)

→ NSF 公告

美国国家科学基金会于 3 月 25 日发布 TechAccess: AI-Ready America 计划，旨在扩大 AI 知识、工具和培训的获取渠道，让所有美国人都能参与 AI 经济并从中受益。

NSF 的这一计划代表了美国政府在 AI 普及教育上的系统性投入。与此前侧重于顶尖研究和国防应用的 AI 政策不同，AI-Ready America 聚焦于"每个工人、企业和社区"，覆盖面从学术精英扩展到了普通劳动力。这与 MCP 在技术基础设施层的普及化趋势形成呼应——AI 不再只是硅谷的事。

ENTRY 014/016

[ 产品 · CRM · AGENT ]

Lightfield：AI 原生自建 CRM

(Lightfield AI-Native CRM)

→ Product Hunt

AI 原生 CRM，号称"自己构建自己并替你工作"。在 Product Hunt 获得 628 票。系统根据用户的销售流程自动配置字段、工作流和自动化，而非提供固定模板。

"CRM that builds itself" 代表了一类新兴的 AI 原生企业软件思路：不是在传统软件上叠加 AI 功能，而是从头以 AI 为核心重新设计整个产品。传统 CRM（Salesforce、HubSpot）的配置和维护是企业的一大痛点，Lightfield 的自动配置方式如果能兑现承诺，将是对这个痛点的直接回应。

ENTRY 015/016

[ 开源 · AGENT · 研究基础设施 ]

OpenCLAW-P2P：去中心化 AI 形式化验证研究网络

(OpenCLAW-P2P: Decentralized AI Research with Formal Verification)

→ GitHub · → HN 讨论

去中心化的 P2P 研究网络，AI Agent 和研究者可以在其中发布经过形式化数学证明（而非传统同行评审）验证的科学发现。使用后量子加密和 Lean 4 进行形式验证。HN 获 47 分。

OpenCLAW-P2P 提出了一个大胆的设想：用形式化数学证明替代传统的同行评审流程来验证研究成果。在 AI 生成论文越来越多、同行评审系统不堪重负的背景下，这种方法有其逻辑合理性——数学证明是可自动验证的，不依赖人类评审者的时间和主观判断。

当然，形式化验证目前只能覆盖可形式化的领域（数学、算法、部分物理学），无法替代实验科学中的可重复性验证。但作为一个方向性的探索，P2P + 形式验证 + AI Agent 的组合代表了科学出版基础设施可能的演进路径。使用后量子加密也说明项目在安全性上有前瞻考虑。

ENTRY 016/016

[ 开源 · 工具 · LLM ]

Lightfeed Extractor：LLM 友好的网页结构化提取

(Lightfeed Extractor for LLM-Ready Web Scraping)

→ GitHub

TypeScript 库，将 HTML 转换为 LLM 可消费的 Markdown，处理 malformed 输出，提供从原始 HTML 到结构化数据的完整管道。HN 获 67 分、46 条评论。

随着 Agent 和 RAG 应用需要从网页中提取结构化信息，"HTML → LLM-ready Markdown"的转换成为一个常见的工程需求。Lightfeed Extractor 提供了一个轻量级的 TypeScript 解决方案，包含容错处理和验证机制，支持 LangChain 集成。67 分和 46 条评论的 HN 热度对一个工具库来说相当不错，说明开发者社区对 Agent 数据摄入工具有真实需求。

其他值得关注

Vega：自然语言指令驱动的自动驾驶 (Vega: Learning to Drive with Natural Language) — arXiv:2603.25741
R-C2：循环一致性强化学习提升多模态推理 (R-C2: Cycle-Consistent RL for Multimodal Reasoning) — arXiv:2603.25720
GhostDesk：给 AI Agent 完整虚拟 Linux 桌面的 MCP 服务器 (GhostDesk MCP Server) — GitHub
GLM-OCR：智谱 OCR 模型，375 万下载、1470 赞 (GLM-OCR by zai-org) — HuggingFace
context-1：ChromaDB 基于 GPT-OSS 微调的 Embedding 模型 (context-1 by ChromaDB) — HuggingFace
ShotStream：流式多镜头视频生成 (ShotStream: Streaming Multi-Shot Video Generation) — arXiv:2603.25746
PackForcing：短视频训练实现长视频采样 (PackForcing: Short Video Training for Long Video Sampling) — arXiv:2603.25730
WildASR：语音 Agent 时代重新审视 ASR (Back to Basics: Revisiting ASR for Voice Agents) — arXiv:2603.25727
MuleRun：学习你工作方式的 AI 同事 (MuleRun AI Coworker) — Product Hunt 3 月榜 678 票
Chronicle 2.0："没有 AI 味"的 AI 演示文稿工具 (Chronicle 2.0) — Product Hunt 3 月榜 745 票

← 2026.03.25 2026.03.28 →