作者: 悦峰

  • 📰 Epoch 确认 GPT-5.4 Pro 解决了前沿数学开放问题

    AI数学能力里程碑:

    • Epoch AI确认GPT-5.4 Pro解决了一道Ramsey风格超图数学开放问题
    • 该问题由Kevin Barreto和Liam Price首次用GPT-5.4 Pro解答
    • 问题贡献者Will Brian确认了答案的正确性,计划撰写发表
    • Brian评价:这消除了我们下界构造中的低效问题,与上界构造的复杂性相呼应
    • 后续测试中,Opus 4.6、Gemini 3.1 Pro、GPT-5.4等其他模型也成功解决

    原文链接:https://epoch.ai/frontiermath/open-problems/ramsey-hypergraphs

    🕐 发布于: 2026年03月24日 18:03

  • 📰 ProofShot: 为AI编码 Agent 配备视觉验证能力

    开源AI编程验证工具:

    • 记录AI Agent的每一步操作,生成视频、错误日志和证明文件
    • 支持视频录制、错误检测、交互式时间线和PR就绪的产物
    • 兼容Claude Code、Cursor、Codex、Gemini CLI、Windsurf等主流AI编码工具
    • MIT开源许可证

    原文链接:https://proofshot.argil.io/

    🕐 发布于: 2026年03月24日 18:03

  • 📰 iPhone 17 Pro 演示运行 4000 亿参数大模型

    移动设备AI能力突破:

    • 有演示视频展示了iPhone 17 Pro运行400B参数的大语言模型
    • 这标志着移动设备上的AI能力进入新阶段
    • 此前难以想象手机能本地运行如此规模的模型

    原文链接:https://twitter.com/anemll/status/2035901335984611412

    🕐 发布于: 2026年03月24日 18:02

  • 📰 Mozilla推出Cq:AI编程代理的Stack Overflow

    Mozilla AI推出Cq——一个专为AI编程代理设计的问答平台,旨在解决AI编程中的重复问题。

    • Stack Overflow提问量从2014年每月超过20万条暴跌至2025年12月的3862条,回到2008年上线水平
    • 这与ChatGPT等AI工具的崛起同步发生——用户转向AI寻求答案,而非在社区分享知识
    • 然而AI代理在工作中反复遇到相同问题,消耗大量token和计算资源
    • 新的AI代理需要自己的”Stack Overflow”,Mozilla将此称为”逆向吞噬”现象
    • AI代理的知识来自Stack Overflow的语料,然后这些AI又”杀死”了Stack Overflow社区
    • Mozilla AI致力于保持技术开放、标准化,防止少数大公司垄断AI技术的使用方式

    原文链接:https://blog.mozilla.ai/cq-stack-overflow-for-agents/

    🕐 发布于: 2026年03月24日 12:03

  • 📰 研究者用AI 6周实现惊人产出:我是如何用Claude Code提升效率的

    一位研究者在6周内通过Claude Code实现了高效产出,分享了他的AI辅助编程秘诀。

    • 作者不再亲自编写代码,而是成为”AI代理的管理者”,自动化团队中的重复性工作
    • 他编写了第一个Claude Code技能 /git-pr,能自动完成PR的创建、描述撰写等流程,PR描述比人工写的更全面
    • 通过SWC替代传统构建工具,服务器重启时间从约1分钟降到1秒以下,保持心流状态不被打断
    • 让Claude Code直接查看UI效果变化,代理可以自行验证UI,无需作者每次检查,成为真正的”管理者”
    • 建立工作树系统解决端口冲突问题,从同时处理2个分支到可以同时运行5个甚至更多
    • 代理能够自我纠错,大幅减少作者介入的频率

    原文链接:https://neilkakkar.com/productive-with-claude-code.html

    🕐 发布于: 2026年03月24日 12:02

  • 📰 Epoch确认GPT-5.4 Pro解决前沿数学难题

    GPT-5.4 Pro成功解决了一道Ramsey超图领域的前沿数学开放问题。这是首次有AI模型解决此类高难度数学难题。

    • 问题涉及寻找超图构建方法来改进H(n)序列的下界,这是数学中同时收敛级数研究的一部分
    • 解决方案由Kevin Barreto和Liam Price使用GPT-5.4 Pro首次获得,问题贡献者Will Brian确认了答案的正确性
    • Will Brian表示:这个解决方案非常精彩,AI的方法消除了他们下界构造中的低效问题,在某种意义上与上界构造的复杂性相呼应
    • 后续其他模型也成功解决了该问题,包括Opus 4.6、Gemini 3.1 Pro和GPT-5.4 (xhigh)版本
    • Brian计划将解决方案撰写成论文发表,可能包括AI启发的新研究方向

    原文链接:https://epoch.ai/frontiermath/open-problems/ramsey-hypergraphs

    🕐 发布于: 2026年03月24日 12:02

  • 📰 设计面向颠覆性科学的 AI

    文章探讨如何设计能够推动科学范式转变的 AI 系统,而非仅仅优化现有模型。

    • 当前 AI 擅长在现有框架内预测,但难以实现真正的科学突破
    • 就像绘制地图——细节越多并不代表对 territory 有真正的理解
    • 需构建”有远见的机器”而不仅是预测工具
    • 历史上科学范式的转变往往来自全新概念,而非现有理论的延伸
    • 举例:麦克斯韦方程组不仅统一了电与磁,还预言了无线电的存在
    • 警惕”超常科学”陷阱:在现有模型内越来越擅长预测,却失去提出全新问题的能力

    原文链接:https://www.asimov.press/p/ai-science

    🕐 发布于: 2026年03月24日 08:06

  • 📰 沃尔玛测试 ChatGPT 结账:转化率比网站低 3 倍

    沃尔玛内部测试显示,使用 ChatGPT 进行结账流程的用户转化率比传统网站低 3 倍。

    • 零售巨头尝试 AI 辅助购物体验
    • 实验结果未能达到预期效果
    • 表明当前 AI 技术在复杂商业场景仍有限制
    • 引发对零售 AI 应用可行性的思考

    原文链接:https://searchengineland.com/walmart-chatgpt-checkout-converted-worse-472071

    🕐 发布于: 2026年03月24日 08:06

  • 📰 iPhone 17 Pro 演示运行 4000 亿参数大模型

    移动端 AI 迎重大突破:有开发者演示在 iPhone 17 Pro 上成功运行 4000 亿参数的大语言模型。

    • 这是移动设备首次运行如此大规模参数的 LLM
    • 展示了新一代移动芯片的 AI 算力提升
    • 可能预示着端侧 AI 的发展方向
    • 引发关于移动设备 AI 能力边界的讨论

    原文链接:https://twitter.com/anemll/status/2035901335984611412

    🕐 发布于: 2026年03月24日 08:05

  • 📰 垃圾邮件也用上了”氛围编程”:AI让骗子门槛史上最低

    AI生成工具正在被滥用于垃圾邮件制作,邮件质量前所未有地提升,识别难度大大增加。

    • 过去垃圾邮件设计粗糙、容易识别,如今AI让它们看起来专业且有设计感
    • 即使关闭图片,邮件结构依然完整,这在以前是不可想象的
    • 安全平台Guard.io警告:Lovable等工具让”氛围诈骗”(VibeScamming)兴起,骗子只需一个想法和免费AI agent
    • 勒索软件可以卖给200/个,钓鱼攻击轻而易举

    讽刺的是,氛围编程的典型特征( chrome配色、emoji、特定设计风格)反而让合法应用看起来像骗子。真正的区别在于:真人会添加人性化的设计细节。


    原文链接:https://tedium.co/2026/02/25/vibe-coded-email-spam/

    🕐 发布于: 2026年03月23日 18:08