文章列表

在 LLM 应用向 Agent 演进的过程中,我们对 AI 的使用方式也从 “指令执行” 转变为 “目标委托”。本文将系统性地探讨 AI Agent 的本质定义、适合承担的工作特质、具体应用场景,以及如何实现真正的完全自主化。 # Agent 的本质定义:从工具到行动者 我们通常将 AI 定义为 “能做人能做的事的程序”,但这是一种被动响应的功能主义定义(输入 - 输出)。 如果要给 Agent 下一个更精确的定义,应当是: Agent 是以目标为驱动、能够自主规划并执行多步行动的程序,在执行过程中可以调用外部工具改变环境状态,并在必要时向人类请求授权或补充信息。 普通 AI...

在阅读外文长篇小说或网文时,我们经常会遇到只有原版 EPUB 而没有翻译版的情况。传统的机器翻译往往是提取文本单独翻译,忽略了长篇作品中至关重要的上下文连贯性;而简单的 LLM 翻译脚本通常也是 "一次把整章丢给模型",容易导致设定漂移、角色关系错乱。 为了解决这一痛点,我将之前探索的基于 LLM 对电子书进行翻译的思路完善成了一个完整的开源项目:ePubTsuyaku。 项目地址:https://github.com/Tritium0041/ePubTsuyaku # 核心设计思路:像人类一样翻译 Puyku...

# Patchouli Handbook:面向 AI Agent 的渐进式知识系统 在构建能够处理复杂任务的 AI Agent 时,我们常常面临一个矛盾:一方面,Agent 需要充足的领域知识、判断规则和案例支撑才能做出正确决策;另一方面,如果一次性将所有参考资料塞入上下文,不仅会导致成本高昂,还容易引发信息过载和幻觉。 Patchouli Handbook 正是为了解决这一痛点而诞生的文件型知识系统。它借鉴了 “渐进式展开(Progressive Disclosure)” 的设计理念,专为 AI Agent 打造了一个结构化、可追溯且易于维护的知识库。 # 命名渊源:为什么叫...

在桌面游戏的世界里,规则的复杂性和玩家人数的限制常常成为阻碍体验的门槛。为了解决这一痛点,我们设计了 Imaginary Friend,旨在通过大语言模型的强大理解与推理能力,打造一个能够自动解析规则书、主持游戏并模拟对手的智能跨桌游通用 Agent。 本文将深入剖析项目的核心架构、技术亮点以及其带来的创新体验。 # 一、项目定位与核心理念 我曾在年初的文章(做了个桌游:时空拍卖行)的结尾这么写: 这个桌游会保持开源,如果任何人想玩的话,只需要打印出来,召集朋友(最难的一步)就能组起来一局。 现在,你就算没有朋友也能把这个游戏玩起来了。 Imaginary Friend 是一个基于...

written with ManusAI 致谢:https://github.com/tvytlx/ai-agent-deep-dive/blob/main/ai-agent-deep-dive-v2.pdf 在计算机科学的发展史中,优雅的设计模式往往会在不同的技术时代以全新的面貌反复出现。最近看到 Claude Code 的源码泄露,在看深度解析的时候发现了一个工程细节:其 SubAgent 中的 fork 模式在设计哲学上,与诞生于 20 世纪 70 年代的 Unix fork () 系统调用及其 COW 优化有着异曲同工之妙。 本文将深入剖析 Claude Code 的 fork...

# TLDR:我用 ai 做了个桌游 让 anygen 给我做了一个博弈型的桌游,做出来以后把规则书扔给 manus 写了个 card maker,打印出来玩了几局,感觉不赖,也差不多到能发出来的程度了 # 时空拍卖行:立即开启你的时空倒爷之旅! 这是一款支持 3-5 人的半合作经济博弈桌游,玩家作为穿梭时空的古董商,需要在激烈的双模式竞标与动态市场操盘中掠夺珍宝,同时时刻警惕全员共享的公共保真度,防止宇宙崩塌导致全盘皆输。 倒计时 3-2-1,摊开手掌。你以微弱的优势赢下了这张【戴森球蓝图】,但还没来得及庆祝,警报声刺破了拍卖行的宁静 —— 时空稳定性跌破了 15%...

从今年上海电影节到 10 月底上院线,我在上海看完了整个系列的 evagelion 新剧场版 前三场是在电影节看的,SHA 多次往返 CKG 中间正好有一个周末卡在上海 久事的上海剧院这个场子不错,整体是架在南京西路哪个酒店的上面的,忘了是哪家 场地里是上世纪的剧院风格。人家本来也就是剧院 超大屏幕 看到破的结尾 整个人都前倾了 非常有艺术性和情绪表达力量的结尾👍 在电影节只看到了序破 Q,感谢没起来帮我抢票的同学 让我还原观影体验了! 看前三部的时候是刚来上海第一个月,等到最后一部上了院线,正好是我在上海的最后几天 看完以后...

如果一个应用层的流量分析系统 同时用上了规则匹配 + 机器学习 + 大模型 那他是否是一辆混动的 F1? # Background 这个东西我很早就想做了 苦于没有合适的数据集 也懒得去进一步寻找 就不出意外的搁置了。然而上个月公司里要搞个 AI 挑战赛,就搞利用 AI / 大模型对流量进行分类,mentor 和我一合计 拉上另一个大哥 就报上名去打了 报上名以后跟我说 他们都挺忙 要我打主力 - - 行吧 预料到了 这个比赛最大的资产无疑是一份 50w 条的生产上的真实流量集,虽然不能拉到本地跑 只能放在在线的机器上训练,这份流量集每一条都有人工分类的 label,所以不管怎么来说...

# 漏洞 1: jwt-secret 硬编码 middlewares/jwt.go 文件中 // line 12var Secret = []byte("sublink") // 秘钥此处将 jwt 密钥硬编码至代码文件中,使任意攻击者可利用此密钥构造出恶意 token 实现鉴权绕过 POC: import jwtimport timesecret = "sublink"def generate_jwt(username): payload = { 'username': username,...

清明寒雨来 亚马逊云寻密令 题解在何方 今天下午闲着没事开了个 ctf 本来想嗯造简单 web 解压 结果进去就被两个 cloud 拴住 ssvgg 了 拼尽全力鏖战两个小时最终拿下 题目名字叫 metadata 环境在 aws 的 EC2 上 还是个 vibecoding 大师 一个 ssti 的环境 还好没开 debug 前两天还看到教你 ai 编程的人连 debug 都不关就让你部署上公网的。。 弹个 shell 先 初步探查了一下 是个容器环境 没找到本地有什么 flag 于是开始看看云的部分 利用 metadata 的端点看一下机子的基本信息 curl...