文章列表

这是「从零搭建 Agent」系列的第四篇。本章将在前三章构建的 Agent Loop、基础工具箱以及 Context Engine 的基础上,为 Agent 引入记忆系统(Memory System),通过分层记忆架构解决长链路任务中的 "遗忘" 问题。 当任务跨过很多轮、甚至跨过一个新会话时,Agent 应该怎样把重要事实留下来,又怎样在需要的时候把它找回来? 本章对应变更:https://github.com/Tritium0041/Singularity/commit/675e567bed52522ab2ed5385cec14fa1878d5f29...

如果你现在去参加一场 AI 黑客松,或者去逛一逛独立开发者的产品发布区,大概率会看到这样的景象: 开发者 A 激动地展示:"我做了一个 AI 记账 App,你只要对它说话,它就能自动把账目分类填进表格!" 开发者 B 不甘示弱:"我做了一个 AI Todo,它能把你的目标自动拆解成十个子任务!" 开发者 C 紧随其后:"我做了一个 AI 日记,它能根据你随手写的几句话,扩写成一篇声情并茂的文章。" Todo、记账、日记,这被称为...

这是「从零搭建 Agent」系列的第三篇。到这里,Agent 已经不只是会调用  calculator  的教学玩具了,它可以读文件、写文件、跑命令、搜网页、抓正文,也可以在不同模型接口之间切换。 但能力变强之后,新的问题出现了:工具输出、命令日志、网页正文、错误信息、历史对话都会不断进入 conversation history。模型每一轮到底应该看到什么?哪些内容应该保留?哪些内容应该截断?哪些内容应该总结?这就是本章要实现的 Context Engine。 同步项目地址 https://github.com/Tritium0041/Singularity,当前进度位于...

这是「从零搭建 Agent」系列的第 2.5 章。在完成了最小 Agent Loop 的构建之后,我们已经打通了” 感知 - 思考 - 行动”(Observe-Think-Act)的基础循环机制。 但第 2 章的系统还太简单了:只有一个 Provider,只有 `calculator` 和 `get_weather` 两个教学工具,几乎不会制造真正的上下文压力。为了让后续的 Context Manager、Memory、Planner 这些 Harness 模块有东西可管,我们需要先做一次工程上的”基础堆量”:横向扩展 LLM Provider,纵向扩展基础工具箱,让 Agent...

这是「从零搭建 Agent」系列的第二篇。上一篇我们先搭了理论骨架:Agent Loop 是心脏,Harness 是围绕这个循环做上下文工程和注意力管理的系统。从这一篇开始,我们把理论实践到代码里:先不做复杂的 Harness,只实现一个最小但能跑起来的 Agent Loop。 同步项目地址 https://github.com/Tritium0041/Singularity,当前进度位于 https://github.com/Tritium0041/Singularity/commit/223fa936b28f24c1b2d6629f924057d76b9f5926 #...

这是「从零搭建 Agent」系列的第一篇。本系列的目标是像拼积木一样,以 Agent Loop 为核心,逐步添加模块,最终拼装出一套完善的 Agent 系统。第一篇专注理论:搞清楚 Agent 是什么、由哪些模块构成、以及 Harness 在其中扮演什么角色。 同步项目地址 https://github.com/Tritium0041/Singularity # 什么是 Agent? 一个 Agent,本质上是一个在环境中持续行动、以完成目标为导向的自主系统。与单次问答的 LLM 调用不同,Agent 的核心特征是目标导向...

在 LLM 应用向 Agent 演进的过程中,我们对 AI 的使用方式也从 “指令执行” 转变为 “目标委托”。本文将系统性地探讨 AI Agent 的本质定义、适合承担的工作特质、具体应用场景,以及如何实现真正的完全自主化。 # Agent 的本质定义:从工具到行动者 我们通常将 AI 定义为 “能做人能做的事的程序”,但这是一种被动响应的功能主义定义(输入 - 输出)。 如果要给 Agent 下一个更精确的定义,应当是: Agent 是以目标为驱动、能够自主规划并执行多步行动的程序,在执行过程中可以调用外部工具改变环境状态,并在必要时向人类请求授权或补充信息。 普通 AI...

在阅读外文长篇小说或网文时,我们经常会遇到只有原版 EPUB 而没有翻译版的情况。传统的机器翻译往往是提取文本单独翻译,忽略了长篇作品中至关重要的上下文连贯性;而简单的 LLM 翻译脚本通常也是 "一次把整章丢给模型",容易导致设定漂移、角色关系错乱。 为了解决这一痛点,我将之前探索的基于 LLM 对电子书进行翻译的思路完善成了一个完整的开源项目:ePubTsuyaku。 项目地址:https://github.com/Tritium0041/ePubTsuyaku # 核心设计思路:像人类一样翻译 Puyku...

# Patchouli Handbook:面向 AI Agent 的渐进式知识系统 在构建能够处理复杂任务的 AI Agent 时,我们常常面临一个矛盾:一方面,Agent 需要充足的领域知识、判断规则和案例支撑才能做出正确决策;另一方面,如果一次性将所有参考资料塞入上下文,不仅会导致成本高昂,还容易引发信息过载和幻觉。 Patchouli Handbook 正是为了解决这一痛点而诞生的文件型知识系统。它借鉴了 “渐进式展开(Progressive Disclosure)” 的设计理念,专为 AI Agent 打造了一个结构化、可追溯且易于维护的知识库。 # 命名渊源:为什么叫...