作者: 悦峰

  • 📰 智谱 AI 发布 GLM-5.1:面向长程任务的新一代大模型

    智谱 AI(Zhipu AI)发布了 GLM-5.1 模型,专注于长程任务处理能力的提升。

    • GLM-5.1 是智谱 GLM 系列的最新迭代版本
    • 模型在长程推理和任务处理方面有显著改进
    • 支持更复杂的上下文理解和多步骤推理
    • 该版本面向企业和开发者提供 API 调用
    • 智谱作为中国领先的 AI 公司,持续推进大模型技术发展

    原文链接:https://z.ai/blog/glm-5.1

    🕐 发布于: 2026年04月08日 18:03

  • 📰 Anthropic 发布 Claude Mythos Preview 系统卡片:前沿模型的网络安全能力评估

    Anthropic 发布了 Claude Mythos Preview 的系统卡片,详细介绍了这款前沿模型在网络安全领域的能力评估。

    • Claude Mythos Preview 是 Anthropic 的通用型前沿模型,专注于提升网络安全防御能力
    • 模型能够自主发现软件漏洞并开发相关漏洞利用代码
    • 该模型已在主流操作系统和浏览器中发现大量零日漏洞
    • 系统卡片提供了模型能力的技术细节和风险评估
    • 这是AI公司在模型安全透明度方面的重要一步

    原文链接:https://www-cdn.anthropic.com/53566bf5440a10affd749724787c8913a2ae0841.pdf

    🕐 发布于: 2026年04月08日 18:02

  • 📰 Anthropic 联合科技巨头启动 Project Glasswing:AI 时代的关键软件安全保卫战

    Anthropic 联合多家科技巨头(AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks)宣布启动 Project Glasswing 项目,旨在保护关键软件安全。

    • 该项目基于 Anthropic 前沿模型 Claude Mythos Preview,该模型已发现数千个高危零日漏洞
    • 发现的漏洞覆盖所有主流操作系统和网页浏览器,部分漏洞已存在数十年并经过数百万次自动化安全测试
    • Anthropic 投入高达 1 亿美元的使用额度,以及 400 万美元直接捐赠给开源安全组织
    • 项目目标是将强大的AI能力为防御方服务,应对未来AI驱动的网络安全威胁
    • 这是AI网络安全领域的重要里程碑,标志着科技行业联合应对AI安全威胁的开始

    原文链接:https://www.anthropic.com/glasswing

    🕐 发布于: 2026年04月08日 18:02

  • 📰 Google 开源实验性智能体编排测试平台 Scion

    Google 宣布开源 Scion,这是一个实验性的智能体编排测试平台,旨在帮助开发者研究和测试 AI 智能体的协作与编排能力。该项目旨在为智能体系统提供一个标准化的评估框架,推动多智能体系统的研究和发展。

    • 为 AI 智能体提供一个可扩展的测试和评估环境
    • 支持多种智能体架构和协作模式的实验
    • 开源社区可参与贡献和定制,推动智能体技术发展

    原文链接:https://www.infoq.com/news/2026/04/google-agent-testbed-scion/

    🕐 发布于: 2026年04月08日 12:01

  • 📰 智谱发布 GLM-5.1:面向长时序任务的新一代大模型

    智谱 AI 发布了 GLM-5.1 模型,专注于长时序任务处理。该模型在长上下文理解、复杂任务规划和多步骤推理方面进行了重点优化,旨在解决长程任务中的信息衰减和推理断裂问题。

    • 针对企业级应用场景优化,支持更长的任务会话
    • 增强了模型在复杂多步骤任务中的上下文保持能力
    • 这是智谱在 GPT-4 级模型竞争中的最新迭代

    原文链接:https://z.ai/blog/glm-5.1

    🕐 发布于: 2026年04月08日 12:01

  • 📰 Anthropic 推出 Project Glasswing:科技巨头联手用 AI 保护关键软件

    包括 AWS、Apple、Google、Microsoft、NVIDIA 在内的十余家科技巨头联合宣布启动 Project Glasswing 项目,旨在应对 AI 时代带来的网络安全挑战。该项目基于 Anthropic 最新的 Claude Mythos Preview 前沿模型,该模型已发现数千个零日漏洞,涵盖所有主流操作系统和浏览器。

    • Anthropic 为此投入高达 1 亿美元的资源配额,并向开源安全组织捐赠 400 万美元
    • 项目成员将利用该模型进行防御性安全工作,目标是让防御方在 AI 驱动的网络安全竞赛中占据优势
    • 专家警告:前沿 AI 模型的漏洞发现和利用能力已接近顶尖人类安全研究人员水平

    原文链接:https://www.anthropic.com/glasswing

    🕐 发布于: 2026年04月08日 12:01

  • 📰 Gemma 4 多模态微调工具发布:可在 Apple Silicon 上训练图像和音频模型

    开源项目 gemma-tuner-multimodal 发布,允许用户在 Mac 上对 Google Gemma 4/3n 模型进行文本、图像和音频的微调。

    • 唯一在 Apple Silicon (MPS) 上原生支持音频+文本微调的工具
    • 支持从 GCS 或 BigQuery 流式传输数据,无需将 TB 级数据拷贝到本地
    • 无需 NVIDIA GPU,普通 Mac 即可完成训练
    • 适用于特定领域的语音识别、图像标注、文档理解、低资源语言适配等场景
    • 数据全程保留在本地设备上,确保隐私安全

    原文链接:https://github.com/mattmireles/gemma-tuner-multimodal

    🕐 发布于: 2026年04月08日 08:04

  • 📰 Google 开源实验性智能体编排测试平台 Scion

    Google 宣布开源 Scion,一个实验性的智能体编排测试平台,旨在探索 AI 智能体的协作与测试方法。

    • Scion 作为测试平台,用于评估和验证多智能体系统的协作能力
    • 该项目体现了 Google 在 AI 智能体领域的持续探索
    • 开源社区可参与测试和改进智能体编排技术

    原文链接:https://github.com/google/scion

    🕐 发布于: 2026年04月08日 08:04

  • 📰 Anthropic 联合科技巨头推出 Project Glasswing:用 AI 守护关键软件安全

    Anthropic 联合 AWS、Apple、Google、Microsoft、NVIDIA 等科技巨头宣布启动 Project Glasswing 项目,旨在利用 AI 能力保护全球关键软件安全。

    • Claude Mythos Preview 已在主流操作系统和浏览器中发现数千个零日漏洞,部分漏洞已存在超过 20 年,最古老的可追溯至 27 年前
    • 该模型能够自主构建复杂漏洞利用程序,包括链接四个漏洞的浏览器exploit、本地提权exploit,以及 FreeBSD NFS 服务器的远程代码执行exploit
    • Anthropic 已向 40 多家机构提供价值 1 亿美元的 API 积分,以及 400 万美元的开源安全组织捐款
    • 这是 AI 网络安全领域的标志性时刻,AI 模型的漏洞发现能力已超越大多数人类安全专家

    原文链接:https://www.anthropic.com/glasswing

    🕐 发布于: 2026年04月08日 08:03

  • 📰 开发者社区爆发抗议:Claude Code 2月更新后复杂工程任务无法使用

    GitHub上关于Claude Code的issue引发广泛关注,开发者称2月更新后模型在复杂工程任务中严重退化。

    • 开发者分析了17,871个思考区块和234,760次工具调用,发现”思考内容编辑”更新与质量下降精确相关
    • 2月时思考深度已下降67%,3月初完全编辑后进一步恶化
    • 读/写比例从6.6:1降至2.0:1,模型不再阅读代码就开始修改
    • 用户提示中的挫败感指标上升68%
    • 完整文件写入比例从4.9%升至11.1%,精度大幅下降
    • 问题影响需要多步骤研究、复杂代码修改的高级工程工作流
    • 开发者呼吁:提供”最大思考”付费档位,透明公开思考令牌分配策略

    原文链接:https://github.com/anthropics/claude-code/issues/42796

    🕐 发布于: 2026年04月07日 18:01