文章列表

这是「从零搭建 Agent」系列的第三篇。到这里,Agent 已经不只是会调用  calculator  的教学玩具了,它可以读文件、写文件、跑命令、搜网页、抓正文,也可以在不同模型接口之间切换。 但能力变强之后,新的问题出现了:工具输出、命令日志、网页正文、错误信息、历史对话都会不断进入 conversation history。模型每一轮到底应该看到什么?哪些内容应该保留?哪些内容应该截断?哪些内容应该总结?这就是本章要实现的 Context Engine。 同步项目地址 https://github.com/Tritium0041/Singularity,当前进度位于...

这是「从零搭建 Agent」系列的第 2.5 章。在完成了最小 Agent Loop 的构建之后,我们已经打通了” 感知 - 思考 - 行动”(Observe-Think-Act)的基础循环机制。 但第 2 章的系统还太简单了:只有一个 Provider,只有 `calculator` 和 `get_weather` 两个教学工具,几乎不会制造真正的上下文压力。为了让后续的 Context Manager、Memory、Planner 这些 Harness 模块有东西可管,我们需要先做一次工程上的”基础堆量”:横向扩展 LLM Provider,纵向扩展基础工具箱,让 Agent...

这是「从零搭建 Agent」系列的第二篇。上一篇我们先搭了理论骨架:Agent Loop 是心脏,Harness 是围绕这个循环做上下文工程和注意力管理的系统。从这一篇开始,我们把理论实践到代码里:先不做复杂的 Harness,只实现一个最小但能跑起来的 Agent Loop。 同步项目地址 https://github.com/Tritium0041/Singularity,当前进度位于 https://github.com/Tritium0041/Singularity/commit/223fa936b28f24c1b2d6629f924057d76b9f5926 #...

这是「从零搭建 Agent」系列的第一篇。本系列的目标是像拼积木一样,以 Agent Loop 为核心,逐步添加模块,最终拼装出一套完善的 Agent 系统。第一篇专注理论:搞清楚 Agent 是什么、由哪些模块构成、以及 Harness 在其中扮演什么角色。 同步项目地址 https://github.com/Tritium0041/Singularity # 什么是 Agent? 一个 Agent,本质上是一个在环境中持续行动、以完成目标为导向的自主系统。与单次问答的 LLM 调用不同,Agent 的核心特征是目标导向...

在 LLM 应用向 Agent 演进的过程中,我们对 AI 的使用方式也从 “指令执行” 转变为 “目标委托”。本文将系统性地探讨 AI Agent 的本质定义、适合承担的工作特质、具体应用场景,以及如何实现真正的完全自主化。 # Agent 的本质定义:从工具到行动者 我们通常将 AI 定义为 “能做人能做的事的程序”,但这是一种被动响应的功能主义定义(输入 - 输出)。 如果要给 Agent 下一个更精确的定义,应当是: Agent 是以目标为驱动、能够自主规划并执行多步行动的程序,在执行过程中可以调用外部工具改变环境状态,并在必要时向人类请求授权或补充信息。 普通 AI...

在阅读外文长篇小说或网文时,我们经常会遇到只有原版 EPUB 而没有翻译版的情况。传统的机器翻译往往是提取文本单独翻译,忽略了长篇作品中至关重要的上下文连贯性;而简单的 LLM 翻译脚本通常也是 "一次把整章丢给模型",容易导致设定漂移、角色关系错乱。 为了解决这一痛点,我将之前探索的基于 LLM 对电子书进行翻译的思路完善成了一个完整的开源项目:ePubTsuyaku。 项目地址:https://github.com/Tritium0041/ePubTsuyaku # 核心设计思路:像人类一样翻译 Puyku...

# Patchouli Handbook:面向 AI Agent 的渐进式知识系统 在构建能够处理复杂任务的 AI Agent 时,我们常常面临一个矛盾:一方面,Agent 需要充足的领域知识、判断规则和案例支撑才能做出正确决策;另一方面,如果一次性将所有参考资料塞入上下文,不仅会导致成本高昂,还容易引发信息过载和幻觉。 Patchouli Handbook 正是为了解决这一痛点而诞生的文件型知识系统。它借鉴了 “渐进式展开(Progressive Disclosure)” 的设计理念,专为 AI Agent 打造了一个结构化、可追溯且易于维护的知识库。 # 命名渊源:为什么叫...

在桌面游戏的世界里,规则的复杂性和玩家人数的限制常常成为阻碍体验的门槛。为了解决这一痛点,我们设计了 Imaginary Friend,旨在通过大语言模型的强大理解与推理能力,打造一个能够自动解析规则书、主持游戏并模拟对手的智能跨桌游通用 Agent。 本文将深入剖析项目的核心架构、技术亮点以及其带来的创新体验。 # 一、项目定位与核心理念 我曾在年初的文章(做了个桌游:时空拍卖行)的结尾这么写: 这个桌游会保持开源,如果任何人想玩的话,只需要打印出来,召集朋友(最难的一步)就能组起来一局。 现在,你就算没有朋友也能把这个游戏玩起来了。 Imaginary Friend 是一个基于...

written with ManusAI 致谢:https://github.com/tvytlx/ai-agent-deep-dive/blob/main/ai-agent-deep-dive-v2.pdf 在计算机科学的发展史中,优雅的设计模式往往会在不同的技术时代以全新的面貌反复出现。最近看到 Claude Code 的源码泄露,在看深度解析的时候发现了一个工程细节:其 SubAgent 中的 fork 模式在设计哲学上,与诞生于 20 世纪 70 年代的 Unix fork () 系统调用及其 COW 优化有着异曲同工之妙。 本文将深入剖析 Claude Code 的 fork...

# TLDR:我用 ai 做了个桌游 让 anygen 给我做了一个博弈型的桌游,做出来以后把规则书扔给 manus 写了个 card maker,打印出来玩了几局,感觉不赖,也差不多到能发出来的程度了 # 时空拍卖行:立即开启你的时空倒爷之旅! 这是一款支持 3-5 人的半合作经济博弈桌游,玩家作为穿梭时空的古董商,需要在激烈的双模式竞标与动态市场操盘中掠夺珍宝,同时时刻警惕全员共享的公共保真度,防止宇宙崩塌导致全盘皆输。 倒计时 3-2-1,摊开手掌。你以微弱的优势赢下了这张【戴森球蓝图】,但还没来得及庆祝,警报声刺破了拍卖行的宁静 —— 时空稳定性跌破了 15%...