熙衍
旅行助手 AgenticRAG 系统的五次迭代优化实录
给 trplanning 多智能体旅行助手接 Agentic RAG 知识库的时候,我想得挺简单——切一切文档丢进向量库就完事了。结果第一次跑 RAGAS 评估,综合质量分 42.00%。忠实度 73%,检索召回 23%。说实话看到这个数字还是挺打击的。 后面花了点时间慢慢打磨,每改一轮跑一次评估,看数据说话。五轮迭代下来,自己写的测试脚本的综合质量分从 42% 提到了 76%,忠实度从 7...
从零构建本地知识图谱——GraphRAG + Neo4j 全链路实战
一、项目起源最近在学习GraphRAG,开始感觉很高级。最后慢慢了解才发现优点比较多,于是在本地从头搭建一套知识图谱系统——从文档处理到图谱构建、从索引到查询,每个环节都可以自己控制和调优,而不是依赖某个封装好的 SaaS API。手头正好有一本百万字的网络小说《序列:吃神者》,人物众多、势力交错、序列能力体系复杂,很适合作为测试知识图谱边界能力的素材。于是以它为输入,搭了一套 GraphR...
智能旅行规划助手——多智能体 + Agentic RAG 实战全记录
项目起源前段时间每次出去玩都要在 12306、天气预报、百度地图、小红书攻略之间来回切换——查车票、看天气、搜景点、排路线,信息分散在多个平台,来回比对很花时间。开始的我是使用MCP对接本地的LLM,调用MCP去查询车票、位置信息和小红书的攻略。正好准备学习Agent,于是做了这个项目(虽然说做了这个才发现已经烂大街了)。 最终实现了一个基于 LangGraph 的旅行助手,接入了 1230...
把 Claude Code 调教成专属后端搭档——.claude 配置体系搭建全记录
用 Claude Code 写了一阵子 Django 后端之后,我发现一个尴尬的问题:它很聪明,但它不知道我的项目规范。每次让它写一个 ViewSet,它可能用 FastAPI 的风格;让它写测试,它可能用 unittest 而不是 pytest;让它改代码,改完还得我自己跑一遍 ruff。 更麻烦的是——我有四个 Django 项目在同时维护,规范相似但不完全相同。靠每次手动贴规范文档?太...
LatentSync 生产环境深度优化——从内存爆炸到稳定运行的完整方案
概述最近在服务器上部署 LatentSync(字节跳动的唇形同步开源项目),跑是能跑起来了,但问题一大堆——长视频直接 OOM、PL0 云盘 IOPS 频繁告警、CUDA 张量转换报错……官方版本更适合本地单次推理,真要上生产环境,稳定性完全撑不住。 花了两周时间做了一轮系统性优化,覆盖流式处理、内存管理、云存储适配、CUDA 张量处理、错误恢复等几个关键方向。优化后在服务器上的表现有明显提...
1