智见

  • 📰 AI下棋已完美但人类让它重新不可预测

    随着AI在象棋领域达到巅峰,顶级特级大师发现了新的制胜之道:使用看似”不完美”的走法来打乱对手的赛前准备。这些走法虽然在引擎分析中不是最优解,但能够迫使对手离开计算机辅助思考,转而依靠人脑进行深度计算。

    • 人类棋手利用AI无法覆盖的”盲区”:虽然准备了大量开局,但无法记住所有变化
    • 顶级棋手如卡尔森已熟练掌握这门”艺术”,在对手走出准备范围后仍能掌控局面
    • 这种策略并非随机,而是经过精心计算的风险管理

    原文链接:https://www.bloomberg.com/news/articles/2026-03-27/ai-changed-chess-grandmasters-now-win-with-unpredictable-moves

    🕐 发布于: 2026年04月02日 18:01

  • 📰 数据科学家的复仇:LLM时代为何数据科学技能反而更重要

    随着LLM的普及,数据科学家角色是否会被取代?本文提出不同观点:

    • 大模型API使团队可独立集成AI,但评估和优化系统仍需数据科学技能
    • 常见的五个评估陷阱:通用指标、不验证评判者、实验设计糟糕、数据和标签质量问题
    • 数据科学家的核心价值在于:设计具体指标、进行错误分析、验证评判者可靠性
    • 关键建议:深入分析数据,建立应用特定的评估标准,而非依赖通用指标

    原文链接:https://hamel.dev/blog/posts/revenge/

    🕐 发布于: 2026年04月02日 12:01

  • 📰 Trinity Large Thinking:Arcee AI发布大模型思考框架

    Arcee AI推出Trinity Large Thinking,一种新的大模型推理框架。该框架旨在提升AI模型的思考能力和推理质量。作为OpenRouter上的新模型,它为开发者提供了更强大的AI能力选择。


    原文链接:https://openrouter.ai/arcee-ai/trinity-large-thinking

    🕐 发布于: 2026年04月02日 12:01

  • 📰 Meta发布BOxCrete:利用AI优化美国本土混凝土生产

    Meta发布全新AI模型Bayesian Optimization for Concrete (BOxCrete),用于设计更可持续的混凝土配方。该模型能更好地处理噪声数据,并新增预测混凝土坍落度的功能。Meta与Amrize(北美最大水泥混凝土制造商)及伊利诺伊大学香槟分校合作,已在明尼苏达州Rosemount数据中心建设中实际应用,显著提升了混凝土强度和固化速度。该项目获得2025年建筑创新奖最佳合作奖。


    原文链接:https://engineering.fb.com/2026/03/30/data-center-engineering/ai-for-american-produced-cement-and-concrete/

    🕐 发布于: 2026年04月02日 12:01

  • 📰 Claude发现FreeBSD远程内核RCE漏洞:可获取root shell

    安全研究显示,Claude编写了一个完整的FreeBSD远程内核漏洞利用代码,可获取root shell权限。

    • 漏洞编号CVE-2026-4747,位于FreeBSD的rpcsec_gss模块
    • 影响版本:FreeBSD 13.5 (
    • 攻击面:NFS服务器加载kgssapi.ko模块(端口2049/TCP)
    • 漏洞原因:svc_rpc_gss_validate()函数在重构RPC头时未检查凭证长度
    • 栈缓冲区仅128字节,前32字节用于固定字段,剩余96字节用于凭证body
    • 超过96字节的凭证可溢出到局部变量、保存的寄存器甚至返回地址
    • 补丁已添加边界检查,在复制前验证oa_length是否超过可用空间

    原文链接:https://github.com/califio/publications/blob/main/MADBugs/CVE-2026-4747/write-up.md

    🕐 发布于: 2026年04月02日 08:04

  • 📰 StepFun 3.5 Flash登顶OpenClaw性价比榜单:300场对战实测

    在OpenClaw Arena的性价比评测中,StepFun 3.5 Flash成为执行OpenClaw任务成本效益最高的模型。

    • 基于300场对战测试,StepFun 3.5 Flash在性价比排行榜上位居第一
    • 该模型拥有110亿活跃参数,输入价格约/usr/bin/bash.10/M,输出约/usr/bin/bash.30/M
    • 虽然是“最便宜”的模型之一,但其在Agentic任务上的表现令人印象深刻
    • 有用户指出该模型存在“虚构信息”问题,如在找房任务中给出虚假房源信息
    • 对比同样定位的Kimi等模型,StepFun在相同价格区间表现更为出色
    • 该模型已在OpenRouter上免费使用一段时间

    原文链接:https://app.uniclaw.ai/arena?tab=costEffectiveness&via=hn

    🕐 发布于: 2026年04月02日 08:04

  • 📰 Meta推出BOxCrete AI模型,助力美国本土水泥和混凝土生产

    Meta发布全新AI模型BAYESIAN Optimization for Concrete (BOxCrete),帮助建筑行业设计更高质量、更可持续的混凝土配方,并优先使用美国本土生产材料。

    • 美国每年浇筑约4亿立方码混凝土,足以铺设一条环绕地球多圈的双车道高速公路
    • 尽管大部分预拌混凝土在本土生产,但约20-25%的水泥依赖进口
    • 新AI模型能快速探索和验证配方,减少数月的实验室测试时间
    • Meta已与Amrize及伊利诺伊大学香槟分校合作,获得2025年建筑创新奖最佳合作奖
    • 该开源模型已在GitHub上发布,旨在促进美国制造业就业和投资

    原文链接:https://engineering.fb.com/2026/03/30/data-center-engineering/ai-for-american-produced-cement-and-concrete/

    🕐 发布于: 2026年04月02日 08:04

  • 📰 TinyLoRA:仅用13个参数实现推理能力

    研究人员发布TinyLoRA方法,证明仅需极少参数即可让大模型学会推理。

    • 仅用13个训练参数(bf16精度下26字节)即可将8B参数的Qwen2.5训练到GSM8K数据集91%准确率
    • 在更难的推理基准测试(AIME、AMC、MATH500)中,仅用千分之一的参数量就能恢复90%的性能提升
    • 关键发现:强化学习(RL)比监督微调(SFT)更高效,SFT需要100-1000倍更大的参数更新才能达到相同效果
    • 该研究证明了即使 rank=1 的LoRA也非必须,参数可以进一步压缩到极小规模

    原文链接:https://arxiv.org/abs/2602.04118

    🕐 发布于: 2026年04月01日 18:01

  • 📰 PrismML推出全球首款商业化1-bit大模型

    PrismML发布1-Bit Bonsai系列模型,这是全球首款实现商业化的1-bit权重大模型。

    • 1-Bit Bonsai 8B仅需1.15GB内存,体积比全精度8B模型小14倍,运行速度快8倍,能效提升5倍
    • 1-Bit Bonsai 4B仅需0.57GB内存,在M4 Pro上可达132 tokens/秒
    • 1-Bit Bonsai 1.7B仅需0.24GB内存,在iPhone 17 Pro Max上可达130 tokens/秒
    • 该系列专为机器人技术、实时Agent和边缘计算场景设计
    • 在基准测试中,该模型性能与领先的8B模型相当,但实现了超过10倍的智能密度提升

    原文链接:https://prismml.com/

    🕐 发布于: 2026年04月01日 18:01

  • 📰 OpenAI完成8520亿美元融资轮

    OpenAI宣布完成创纪录的1220亿美元融资轮,融资后估值达8520亿美元。

    • 本轮由软银领投,其他投资方包括Andreessen Horowitz和D.E. Shaw Ventures
    • 截至3月,ChatGPT周活跃用户超过9,500万,付费订阅用户超过5,000万
    • OpenAI目前月收入20亿美元,全年收入131亿美元,但仍在亏损尚未盈利
    • 亚马逊承诺投资500亿美元,Nvidia和软银各投资300亿美元
    • 微软也参与了投资,累计已投资超过130亿美元
    • 公司正在削减部分支出计划,包括关闭短视频应用Sora

    原文链接:https://www.cnbc.com/2026/03/31/openai-funding-round-ipo.html

    🕐 发布于: 2026年04月01日 18:01