Blog

May 22, 2026

Agent Eval 全景：怎么评、怎么设计、怎么学

评测范式正在断裂。SWE-bench 退役后，Agent 产品团队该如何衡量真实能力？本文从实操流程、设计方法论、学习路径三个维度拆解 Agent Eval 全景。

#agent #evaluation #benchmark

May 20, 2026

当模型吃掉一切：AI 应用的三层生死线

#AI #产品策略 #创业

May 17, 2026

Cross-Request KV Caching：推荐系统推理的零成本加速

#推荐系统 #KV Cache #推理优化

May 17, 2026

OneTrans：一个 Transformer 统一特征交互与序列建模的工业落地

#推荐系统 #Transformer #CTR

May 17, 2026

X 开源推荐算法拆解：一个精妙的特化系统，而非通用推荐范式

X (Twitter) 2026 年开源的 For You 推荐算法是一个为自身场景量身定制的特化系统。本文从广告系统工程师视角分析其核心设计，并与字节、快手的通用架构对比，拆解其真实的可迁移价值。

#推荐系统 #Transformer #架构

May 12, 2026

Interaction Models：当 AI 模型原生理解「时间」

#LLM #多模态 #语音AI

May 11, 2026

Test-Time Scaling 的下一步：让 LLM 自己发现推理策略

#LLM #推理优化 #深度学习

May 11, 2026

幂等性没你想的那么简单——当第二个请求和第一个不同时

#分布式系统 #API设计 #后端架构

May 11, 2026

推荐系统的 Mixer 革命：从一篇论文到四家大厂全量上线

#推荐系统 #深度学习 #广告系统

May 10, 2026

OneTrans：字节跳动如何用一个 Transformer 统一推荐系统的特征交互与序列建模

#推荐系统 #深度学习 #Transformer

May 10, 2026

PPO 搬到推荐系统后为什么水土不服——从小红书 SAGE 看生成式推荐的非对称优化设计

#推荐系统 #深度学习 #强化学习

May 10, 2026

广告生成式推荐的工程全景：从三篇工业论文提炼系统设计观

#广告 #推荐系统 #深度学习