智见

  • 📰 Mistral发布Leanstral:首个用于形式化证明的开源代码Agent

    Mistral AI发布了Leanstral,这是首个专为Lean 4证明助手设计的开源代码agent。

    • 基于6B活跃参数的高效稀疏架构,专门针对证明工程任务优化
    • 通过Lean作为完美验证器实现并行推理,性能和成本效益优异
    • 在FLTEval基准测试中,pass@2得分26.3,超越Sonnet 2.6分,成本仅6(Sonnet为49)
    • pass@16达到31.9分,超越Sonnet 8分,而Opus成本高达650(Leanstral的92倍)
    • 提供免费API端点(labs-leanstral-2603)、Apache 2.0许可权重和Mistral Vibe集成
    • 支持通过MCP扩展,可与lean-lsp-mcp配合使用

    原文链接:https://mistral.ai/news/leanstral

    🕐 发布于: 2026年03月17日 12:01

  • 📰 Mistral发布Leanstral:可信vibe-coding的开源基础

    Mistral发布Leanstral,这是首个专为Lean 4设计的开源代码代理,可用于形式化证明和严格规范验证。

    • 高效设计:仅需60亿活跃参数,通过Lean作为完美验证器实现并行推理
    • 性能领先:pass@2得分26.3,超越Sonnet 2.6分,成本仅需6(对比Sonnet的49)
    • 开源可用:权重采用Apache 2.0许可证发布,可通过Mistral vibe和免费API调用
    • 支持MCP:通过vibe支持任意MCP,尤其是针对lean-lsp-mcp进行了专门训练
    • 评估突破:发布FLTEval新评估套件,专注于实际形式化工程任务而非竞赛数学

    原文链接:https://mistral.ai/news/leanstral

    🕐 发布于: 2026年03月17日 08:03

  • 📰 论文提出:将大语言模型团队视为分布式系统

    研究人员提出使用分布式系统的原则框架来创建和评估LLM团队。

    • 核心观点:许多在分布式计算中研究的基础优势和挑战同样出现在LLM团队中
    • 研究问题:何时团队有用?使用多少代理?结构如何影响性能?团队是否比单个代理更好?
    • 创新方法:不再通过试错来设计测试,而是借用分布式系统的成熟理论来指导LLM团队设计
    • 实际意义:这项跨学科研究为大规模部署LLM团队提供了原则性基础

    原文链接:https://arxiv.org/abs/2603.12229

    🕐 发布于: 2026年03月17日 08:02

  • 📰 Nvidia推出Vera CPU:专为代理型AI打造的处理器

    Nvidia正式发布NVIDIA Vera CPU,这是全球首款专为代理型AI和强化学习时代打造的处理器。

    • 性能提升显著:效率达到传统CPU的2倍,运行速度快50%
    • 头部客户已部署:阿里巴巴、ByteDance、Meta、Oracle Cloud Infrastructure以及CoreWeave、Lambda、Nebius等云服务商都已采用
    • 主流厂商支持:Dell、HPE、Lenovo、Supermicro以及华硕、富士康等制造商已集成Vera CPU
    • 液冷机架设计:单个Vera机架可集成256个液冷CPU,支持超过22500个并发CPU环境
    • 与GPU协同:Vera CPU通过NVLink-C2C互连技术与NVIDIA GPU配对,提供1.8TB/s的一致性带宽

    原文链接:https://nvidianews.nvidia.com/news/nvidia-launches-vera-cpu-purpose-built-for-agentic-ai

    🕐 发布于: 2026年03月17日 08:02

  • 📰 🔧 什么是Agentic Engineering智能体工程

    Agentic Engineering(智能体工程)正在成为AI领域的新热点。

    核心要点:

    • 设计能自主决策的AI代理
    • 多代理协作系统
    • 自动化工作流程

    这是AI从工具向助手转变的重要方向。


    原文链接:https://simonwillison.net/guides/agentic-engineering-patterns/what-is-agentic-engineering/

    🕐 发布于: 2026年03月16日 14:37

  • 💻 我如何用LLM写软件

    经验

    开发者分享他如何使用LLM来写软件的实战经验。

    方法

    • 先设计再让AI生成代码
    • 迭代式 prompts 优化
    • 人工审核必不可少

    建议

    LLM是强大的助手,但人的引导仍然关键。


    🕐 发布于: 2026年03月16日 12:02

  • 🦶 野人纪录片:解读阴谋论心态

    新片

    一部新的野人(Bigfoot)纪录片上映,揭示了人类 conspiracy mindset(阴谋论心态)。

    分析

    • 为什么人们相信神秘生物
    • 心理学角度的解释
    • 社交媒体的作用

    思考

    这个现象反映了人类对未知的 fascination。


    🕐 发布于: 2026年03月16日 12:02

  • 😩 LLM让人疲惫:AI工作的代价

    观察

    开发者社区热议:使用LLM工作有时让人精疲力竭

    原因

    • 持续关注AI输出质量
    • 不断修正prompt
    • 信息过载

    建议

    适当休息,保持人机协作的平衡。


    🕐 发布于: 2026年03月16日 08:05

  • 🏛️ LLM架构画廊:AI模型大观园

    资源

    LLM Architecture Gallery是一个收集各种大语言模型架构的资源库。

    内容

    • 展示不同模型的架构设计
    • 对比各模型优缺点
    • 开源共享

    价值

    对AI研究者和开发者来说是很好的学习资源。


    🕐 发布于: 2026年03月16日 08:05

  • 🇨🇦 加拿大C-22法案:大规模监控时代

    法律

    加拿大通过C-22法案,要求大规模收集元数据。

    内容

    • 强制通信公司提交用户数据
    • 扩大政府监控权限
    • 引发隐私担忧

    争议

    公民自由组织批评这是对隐私权的严重侵犯。


    🕐 发布于: 2026年03月16日 08:05