智见

  • 📰 Google DeepMind 发布 AGI 评估框架:借鉴认知科学

    • 提出基于认知科学的通用智能评估框架,论文标题为「Measuring Progress Toward AGI: A Cognitive Taxonomy」
    • 识别 10 项关键认知能力:感知、生成、注意力、学习、记忆、推理、元认知、执行功能、问题解决、社会认知
    • 三阶段评估协议:AI 系统测评 → 人类基线数据收集 → 相对人类表现映射
    • 发起 Kaggle 黑客松,邀请社区为 5 项最大评估缺口的认知能力设计测试:学习、元认知、注意力、执行功能、社会认知
    • 奖金池共 20 万美元:每个赛道前两名各 1 万美元,四项最佳作品各 2.5 万美元
    • 提交时间:3 月 17 日至 4 月 16 日,结果将于 6 月 1 日公布
    • 目标:为评估通用智能提供实证工具,跟踪 AI 接近 AGI 的进度

    原文链接:https://blog.google/innovation-and-ai/models-and-research/google-deepmind/measuring-agi-cognitive-framework/

    🕐 发布于: 2026年03月19日 08:04

  • 📰 OpenAI 战略重心转向 IPO:三方 AI 竞赛升温

    • WSJ 报道称 OpenAI 领导层要求员工停止「.side quests」,专注核心业务
    • 这是一场三家美国 AI 公司的 IPO 竞赛:Anthropic、OpenAI、xAI
    • 预计三家若各发行 15% 股份,募资总额将接近过去十年美国所有 IPO 融资总和
    • OpenAI 业务分散:Sora、AI 浏览器 Atlas、硬件设备、TikTok 风格 AI 应用
    • Anthropic 收入增长迅猛,2 月单月增加 60 亿美元,主要来自 Claude Code
    • OpenAI 企业业务年化收入 100 亿美元,但 Anthropic 在企业市场被认为更领先
    • OpenAI 正在与 TPG、Advent、Bain 等洽谈 100 亿美元合资项目
    • 招聘大量 Facebook 背景员工,ChatGPT 最近迭代呈现「Sycophant」倾向
    • 分析认为所有新闻都是为 IPO 服务的拼图,旨在说服投行相信公司已整顿完毕

    原文链接:https://om.co/2026/03/17/openai-has-new-focus-on-the-ipo/

    🕐 发布于: 2026年03月19日 08:04

  • 📰 NVIDIA 发布 NemoClaw:安全运行 AI 助手的开源堆栈

    • 这是一个开源项目,旨在简化安全运行 OpenClaw AI 助手的方式
    • 使用 NVIDIA OpenShell 运行时创建沙盒环境,通过 Landlock + seccomp + netns 保护
    • 支持 Nemotron-3-Super-120B 模型,需 8GB RAM(推荐 16GB)
    • Alpha 软件,仍在早期阶段,API 和行为可能随时变化
    • 通过 nemoclaw 命令管理沙盒:部署、连接、状态、日志
    • 推理请求不直接流出沙盒,经 OpenShell 网关路由到 NVIDIA 云端

    原文链接:https://github.com/NVIDIA/NemoClaw

    🕐 发布于: 2026年03月19日 08:03

  • 📰 arXiv 论文:为什么 AI 系统不学习以及如何解决

    一篇新论文批判性审视了当前 AI 模型在实现自主学习方面的局限性,并提出受人类和动物认知启发的学习架构。该框架整合了两种学习模式:从观察中学习(系统 A)和从主动行为中学习(系统 B),并通过内部生成的元控制信号(系统 M)在这两种模式间灵活切换。

    • 灵感来源于生物体如何适应真实世界动态环境
    • 涵盖进化和发育时间尺度的适应机制
    • 旨在构建能够自主学习而非仅依赖预训练数据的 AI 系统

    原文链接:https://arxiv.org/abs/2603.15381

    🕐 发布于: 2026年03月18日 18:04

  • 📰 Unsloth Studio 发布:开源无代码 UI 训练本地 AI 模型

    Unsloth Studio 是一个开源的无代码网页 UI,可在一个本地统一界面中训练、运行和导出开源模型。支持在 Mac、Windows、Linux 上本地运行 GGUF 和 safetensor 模型,训练 500+ 模型速度提升 2 倍,VRAM 占用减少 70%(无精度损失)。

    • 可运行和训练文本、视觉、TTS 音频、embedding 模型
    • 无需数据集,可从 PDF、CSV、JSON、DOCX、TXT 文件自动创建数据集
    • 支持导出模型到 GGUF、16-bit safetensor 等格式
    • 具备自愈工具调用、网页搜索、代码执行功能
    • 支持模型对比(Model Arena),可比较两个模型的输出差异
    • 可 100% 离线使用,数据安全可控

    原文链接:https://unsloth.ai/docs/new/studio

    🕐 发布于: 2026年03月18日 18:04

  • 📰 Mistral AI 发布 Forge:帮助企业构建专属 AI 模型

    Mistral AI 推出了 Forge 系统,让企业能够基于自身专有知识构建前沿级 AI 模型。该系统支持预训练、后训练和强化学习等多种训练方式,帮助模型学习企业内部术语、推理模式和运营约束。

    • 支持密集模型和混合专家(MoE)架构,可优化性能与成本
    • 支持多模态输入,可处理文本、图像等数据格式
    • 专为代码代理设计,代理可通过纯英文描述自定义模型
    • 支持持续改进,通过强化学习管道根据内部评估反馈优化模型行为
    • 已与 ASML、DSO 新加坡国家实验室、Ericsson、欧洲航天局等机构合作

    原文链接:https://mistral.ai/news/forge

    🕐 发布于: 2026年03月18日 18:03

  • 📰 arXiv 新论文:AI 系统为何不学习以及如何解决

    一篇来自 arXiv 的论文探讨了当前 AI 模型在实现自主学习方面的局限性,并提出受认知科学启发的学习架构。

    • 论文批判性地审视了当前 AI 模型在自主学习能力上的局限
    • 提出一种受人类和动物认知启发的学习架构
    • 整合两种学习模式:从观察中学习(System A)和从主动行为中学习(System B)
    • 引入元控制信号(System M)在两种学习模式间灵活切换
    • 探讨如何借鉴生物体在进化和发育时间尺度上适应动态环境的方式构建 AI
    • 作者为 Emmanuel Dupoux,发表于 2026 年 3 月 16 日

    原文链接:https://arxiv.org/abs/2603.15381

    🕐 发布于: 2026年03月18日 12:01

  • 📰 Unsloth Studio 发布:开源无代码 AI 模型训练与运行工具

    Unsloth 推出 Studio(Beta),一个开源无代码 Web UI,可在本地统一界面训练、运行和导出开源模型。

    • 支持在 Mac、Windows、Linux 本地运行 GGUF 和 safetensor 模型
    • 训练 500+ 模型速度提升 2 倍,VRAM 减少 70%,且无精度损失
    • 支持文本、视觉、TTS 音频、embedding 模型的运行和训练
    • 无需数据集,可从 PDF、CSV、JSON、DOCX、TXT 文件自动创建数据集
    • 支持导出模型为 GGUF、16-bit safetensor 等格式
    • 提供自愈工具调用、代码执行、推理参数自动调优等功能
    • 支持微调 Qwen3.5、NVIDIA Nemotron 3 等最新大模型

    原文链接:https://unsloth.ai/docs/new/studio

    🕐 发布于: 2026年03月18日 12:01

  • 📰 Mistral AI 发布 Forge:企业级 AI 模型训练平台

    Mistral AI 推出 Forge,帮助企业基于自有知识数据构建前沿级 AI 模型。

    • 目前大多数 AI 模型主要基于公开数据训练,难以满足企业内部的专有知识需求
    • Forge 让企业能够训练理解内部上下文的模型,包括工程标准、合规政策、代码库、运营流程等
    • 支持预训练、后训练和强化学习,覆盖模型全生命周期
    • 提供控制和战略自主权,企业可完全掌控自己的模型和知识产权
    • 支持多种模型架构,包括 dense 和 MoE(混合专家)架构
    • 已与 ASML、新加坡 DSO、Ericsson、欧洲航天局等机构合作

    原文链接:https://mistral.ai/news/forge

    🕐 发布于: 2026年03月18日 12:01

  • 📰 GSD 项目:面向 Claude Code 的元提示与上下文工程开发系统

    TÂCHES 团队推出 Get Shit Done(GSD),这是一个轻量级但强大的元提示、上下文工程和规范驱动的开发系统,支持 Claude Code、OpenCode、Gemini CLI、Codex、Copilot 等多种 AI 编码工具。

    • 解决上下文腐化问题:当 Claude 的上下文窗口充满时,质量会下降
    • 系统在后台处理上下文工程、XML 提示格式化、子代理编排、状态管理
    • 用户只需掌握几个命令即可高效工作
    • 已被 Amazon、Google、Shopify、Webflow 的工程师采用
    • 支持 npx get-shit-done-cc@latest 快速安装
    • 可选择运行时(Claude Code、OpenCode 等)和安装位置(全局或本地项目)
    • 核心命令包括:/gsd:map-codebase(分析现有代码库)、/gsd:new-project(新建项目)、/gsd:discuss-phase(讨论实现细节)

    原文链接:https://github.com/gsd-build/get-shit-done

    🕐 发布于: 2026年03月18日 08:02