熙衍 - ovo

旅行助手 AgenticRAG 系统的五次迭代优化实录

给 trplanning 多智能体旅行助手接 Agentic RAG 知识库的时候，我想得挺简单——切一切文档丢进向量库就完事了。结果第一次跑 RAGAS 评估，综合质量分 42.00%。忠实度 73%，检索召回 23%。说实话看到这个数字还是挺打击的。后面花了点时间慢慢打磨，每改一轮跑一次评估，看数据说话。五轮迭代下来，自己写的测试脚本的综合质量分从 42% 提到了 76%，忠实度从 7...

2026-05-27

技术 AI

RAG RAGAS 多智能体 LangGraph LLM 混合检索 Reranker HyDE 向量检索性能优化

阅读全文 >>

从零构建本地知识图谱——GraphRAG + Neo4j 全链路实战

一、项目起源最近在学习GraphRAG,开始感觉很高级。最后慢慢了解才发现优点比较多，于是在本地从头搭建一套知识图谱系统——从文档处理到图谱构建、从索引到查询，每个环节都可以自己控制和调优，而不是依赖某个封装好的 SaaS API。手头正好有一本百万字的网络小说《序列：吃神者》，人物众多、势力交错、序列能力体系复杂，很适合作为测试知识图谱边界能力的素材。于是以它为输入，搭了一套 GraphR...

2026-05-20

技术 AI

LLM 向量检索知识图谱 GraphRAG Neo4j

阅读全文 >>

智能旅行规划助手——多智能体 + Agentic RAG 实战全记录

项目起源前段时间每次出去玩都要在 12306、天气预报、百度地图、小红书攻略之间来回切换——查车票、看天气、搜景点、排路线，信息分散在多个平台，来回比对很花时间。开始的我是使用MCP对接本地的LLM，调用MCP去查询车票、位置信息和小红书的攻略。正好准备学习Agent，于是做了这个项目（虽然说做了这个才发现已经烂大街了）。最终实现了一个基于 LangGraph 的旅行助手，接入了 1230...

2026-05-01

技术 AI

RAG 多智能体 LangGraph LLM 向量检索 FastAPI 旅行规划

阅读全文 >>

把 Claude Code 调教成专属后端搭档——.claude 配置体系搭建全记录

用 Claude Code 写了一阵子 Django 后端之后，我发现一个尴尬的问题：它很聪明，但它不知道我的项目规范。每次让它写一个 ViewSet，它可能用 FastAPI 的风格；让它写测试，它可能用 unittest 而不是 pytest；让它改代码，改完还得我自己跑一遍 ruff。更麻烦的是——我有四个 Django 项目在同时维护，规范相似但不完全相同。靠每次手动贴规范文档？太...

2026-04-26

技术工具

Claude Code 开发工具自动化 Skill Agent

阅读全文 >>

LatentSync 生产环境深度优化——从内存爆炸到稳定运行的完整方案

概述最近在服务器上部署 LatentSync（字节跳动的唇形同步开源项目），跑是能跑起来了，但问题一大堆——长视频直接 OOM、PL0 云盘 IOPS 频繁告警、CUDA 张量转换报错……官方版本更适合本地单次推理，真要上生产环境，稳定性完全撑不住。花了两周时间做了一轮系统性优化，覆盖流式处理、内存管理、云存储适配、CUDA 张量处理、错误恢复等几个关键方向。优化后在服务器上的表现有明显提...

2025-10-18

技术 AI

性能优化 LatentSync CUDA FFmpeg 内存管理

阅读全文 >>

<1>