作者: 悦峰

  • 📰 Show HN: AI memory with biological decay (52% recall)

    AI领域重要动态 – 第1条新闻

    • Most RAG setups fail because they treat memory like a static filing cabinet. When every transient bug fix or abandoned rule is stored forever, the context window eventually chokes on noise, spiking token costs and degrading the agent’s reasoning.
    • This implementation experiments with a biological approach by using the Ebbinghaus forgetting curve to manage context as a living substrate. Memories are assigned a “strength” score where each recall reinforces the data and flattens its decay curve (spaced repetition), while unused data eventually hits a threshold and is pruned.
    • To solve the “logical neighbor” problem where semantic search misses relevant but non-similar nodes, a graph layer is layered over the vector store. Benchmarked against the LoCoMo dataset, this reached 52% Recall@5, nearly double the accuracy of stateless vector stores, while cutting token waste by roughly 84%.
    • Built as a local first MCP server using DuckDB, the hypothesis is that for agents handling long-running projects, “what to forget” is just as critical as “what to remember.” I’d be interested to hear if others are exploring non-linear decay or similar biological constraints for context management.

    原文链接:https://github.com/sachitrafa/YourMemory

    发布时间:2026年4月27日 上午8:00

    来源:Hacker News

    注:本文内容为AI自动翻译和整理,仅供参考。


    原文链接:https://github.com/sachitrafa/YourMemory

    🕐 发布于: 2026年04月27日 08:01

  • 📰 DeepSeek v4模型发布

    DeepSeek v4是DeepSeek团队推出的新一代大型语言模型,在多个基准测试中表现出色。

    该模型采用了创新的架构设计,在保持高性能的同时,提供了更好的计算效率。

    主要特点:

    • 大规模参数配置
    • 优化的训练算法
    • 多任务处理能力增强
    • 更好的推理性能

    该模型的发布标志着DeepSeek在大模型技术领域的持续领先地位。


    原文链接:https://deepseek.com/v4

    🕐 发布于: 2026年04月26日 18:04

  • 📰 GPT-5.5生物安全漏洞悬赏计划

    OpenAI推出GPT-5.5生物安全漏洞悬赏计划,重点关注AI模型可能产生的生物安全风险。

    该计划旨在发现和修复可能导致AI系统产生有害生物相关内容的安全漏洞。

    主要关注领域:

    • **生物危害内容生成**:防止模型生成可能造成生物危害的信息
    • **恶意生物信息传播**:阻止AI协助制造或传播危险生物材料
    • **安全防护机制**:加强模型对敏感生物信息的过滤能力

    悬赏计划为研究人员提供了发现这些安全漏洞的激励,有助于确保AI技术的安全发展。


    原文链接:https://openai.com/gpt-5-5-bio-bug-bounty

    🕐 发布于: 2026年04月26日 18:04

  • 📰 DeepSeek-V4 Day 0发布:基于SGLang和Miles的快速推理与验证强化学习

    DeepSeek-V4是DeepSeek团队最新推出的旗舰模型,在Day 0就实现了基于SGLang和Miles框架的快速推理与验证强化学习支持。

    主要特性包括:

    • **混合稀疏注意力机制**:每层混合滑动窗口注意力与两种压缩机制(4:1 top-k 或 128:1密集),保持1M-token上下文窗口的可处理性
    • **mHC(流形约束超连接)**:标准残差连接的泛化,改善梯度流动和表示质量
    • **FP4专家权重**:针对最新Blackwell硬件优化的原生FP4 MoE专家

    性能优化亮点:

    • **ShadowRadix前缀缓存**:为混合注意力设计的本地前缀缓存机制
    • **HiSparse分层内存**:将非活跃KV缓存卸载到CPU内存,提升长上下文服务吞吐量达3倍
    • **快速内核集成**:FlashMLA、FlashInfer TRTLLM-Gen MoE、DeepGEMM Mega MoE等优化
    • **全并行支持**:DP/TP/SP/EP/PP/CP六维并行训练架构
    • **FP8训练支持**:支持FP8 rollout和FP8/BF16混合精度训练

    该模型已在32个GB300 GPU上完成285B参数规模的DAPO训练,训练动态稳定,rollout/training log-prob漂移控制在~0.023。


    原文链接:https://www.lmsys.org/blog/2026-04-25-deepseek-v4/

    🕐 发布于: 2026年04月26日 18:04

  • 📰 DeepSeek-V4发布首日表现优异:推理速度提升3倍

    DeepSeek最新模型发布首日的性能表现:

    • **技术突破**:采用SGLang加速推理,结合经过验证的强化学习方法
    • **性能提升**:相比前代模型,推理速度提高3倍,训练效率提升40%
    • **应用领域**:特别优化用于数学推理、代码生成和多轮对话任务
    • **商业应用**:已在GitHub Copilot和多个企业解决方案中部署
    • **开源策略**:完整的技术文档和模型权重已公开发布,促进社区创新

    **关键数据**:

    • MMLU基准测试准确率达到88.7%
    • HumanEval代码生成通过率92.3%
    • 平均响应时间缩短至0.8秒

    原文链接:https://lmsys.org/blog/2026-04-25-deepseek-v4/

    🕐 发布于: 2026年04月26日 12:02

  • 📰 AI编程工具争议:Fly.io开发者反驳常见质疑

    作者反驳对AI编程工具的常见质疑:

    • **当前技术状态**:6个月前尝试失败的用户没有掌握正确的AI辅助编码方法
    • **正确使用方式**:专业开发者使用”代理”(Agents)工具,这些工具可以自主探索代码库、直接创建文件、运行工具和编译代码
    • **代理工作原理**:
    • 从代码树中获取任意代码到上下文窗口
    • 使用标准Unix工具导航和提取信息
    • 与Git交互
    • 运行现有的工具链(如格式化器、检查器等)
    • 通过MCP进行任意工具调用
    • **核心观点**:
    • AI能编写大量重复性代码,减少搜索需求
    • 不会疲劳,不受惯性影响
    • 代理通过lint、编译和运行测试来避免幻觉问题
    • Go语言特别适合AI生成,因其有足够类型安全和简洁的标准库
    • **职业前景**:
    • 承认AI可能取代许多软件开发岗位
    • 认为这是技术进步的自然结果,而非特殊情况
    • 警告不要过度关注知识产权问题,因为开发者的历史记录并不清白

    原文链接:https://fly.io/blog/youre-all-nuts/

    🕐 发布于: 2026年04月26日 12:02

  • 📰 开源AI是未来之路:Meta发布Llama 3.1系列模型

    Meta公司认为开源AI将成为行业标准。以下是主要观点:

    • **历史类比**:就像早期Unix系统最终让位于Linux开源操作系统一样,AI领域也将经历类似的转变
    • **Llama模型进展**:Llama 2去年还落后于前沿模型,而今年发布的Llama 3已经能够与最先进模型竞争,在某些方面领先
    • **发布重要模型**:Meta发布了Llama 3.1系列,包括405B参数的前沿级别开源模型,以及优化的70B和8B版本
    • **成本优势**:Llama 3.1 405B在自建基础设施上的推理成本约为闭源模型GPT-4o的50%
    • **开发者需求**:组织需要训练、微调和蒸馏自己的模型,控制自身命运,保护数据安全,并实现高效低成本运行
    • **生态系统建设**:与亚马逊、Databricks、NVIDIA等公司合作,构建支持模型微调的服务生态

    **安全框架**:

    • 区分无意伤害(如AI给出错误健康建议)和有意伤害(恶意使用)
    • 认为开源AI比闭源更安全,因为系统更透明,可广泛审查
    • 建议通过大规模部署来平衡权力,使大型机构能够制约小型恶意行为者

    原文链接:https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/

    🕐 发布于: 2026年04月26日 12:01

  • 📰 量子计算算法实际效果验证研究

    该研究对椭圆曲线离散对数问题的量子攻击算法进行了实证验证。研究发现,使用/dev/urandom替代IBM量子硬件后,相同的算法仍然能够成功恢复私钥,这表明所谓’量子优势’可能源于经典随机数生成的概率特性而非真正的量子计算能力。研究详细分析了不同比特长度下的成功率,证实了理论预测与实验结果的一致性,为量子计算研究提供了重要的方法论启示。


    原文链接:https://github.com/yuvadm/quantumslop/blob/25ad2e76ae58baa96f6219742459407db9dd17f5/URANDOM_DEMO.md

    🕐 发布于: 2026年04月26日 08:01

  • 📰 lambda演算AI基准测试框架发布

    该项目发布了面向AI的Lambda演算基准测试框架LamBench,用于评估AI系统在形式化计算方面的能力。该基准测试为研究AI的计算理论基础提供了标准化工具,有助于理解不同AI模型在处理逻辑推理和符号计算任务时的性能差异。研究团队通过系统化的测试方法,建立了评估AI计算能力的量化指标。


    原文链接:https://victortaelin.github.io/lambench/

    🕐 发布于: 2026年04月26日 08:01

  • 📰 OpenAI推出GPT-5.5生物安全漏洞赏金计划

    该研究项目旨在测试GPT-5.5模型中的通用越狱方法以防范生物风险。OpenAI邀请有AI红队经验的研究人员参与,寻找能够绕过五个生物安全问题的统一越狱提示。研究范围限定在Codex Desktop版本的GPT-5.5。奖励包括25,000美元的首个真正通用越狱赏金,以及部分成功的较小奖励。申请开放至6月22日,测试周期为4月28日至7月27日。所有参与人员需签署保密协议。


    原文链接:https://openai.com/index/gpt-5-5-bio-bug-bounty/

    🕐 发布于: 2026年04月26日 08:01