🚀 开源 · 可扩展 · 多智能体协作

从"问答机器"
到"真正会沟通的AI"

突破传统AI客服的"玻璃天花板"，实现真正的对话智能

大多数AI客服只是高效的"信息检索器"，遇到模糊问题就束手无策。
我们通过追问/反问机制和多智能体协作，让AI真正理解用户意图，
从被动回答到主动解决问题。

⭐ GitHub 开源项目 📊 查看功能对比

为什么需要"会沟通"的AI?

用户的意图往往是模糊的，知识库的规定也无法穷尽所有情况。
这时，一次精准的追问，才是连接用户与答案的桥梁。

❌ 传统AI客服

单向问答模式

🔴 用户问题模糊 → 返回一堆可能相关的文档
🔴 知识库无精确匹配 → 给出模棱两可的答案
🔴 巨石型Prompt → If-Else逻辑脆弱、维护困难
🔴 功能单一 → 仅支持静态文档问答(RAG)
🔴 千人一面 → 无法记忆用户、无个性化

核心问题：把用户当"数据源"，而非"沟通对象"

✅ 我们的智能客服

对话式问题解决

🟢 主动追问澄清 → 引导用户明确真实需求
🟢 决策-执行分离 → 轻量级决策 + 专家级小Prompt
🟢 多智能体协作 → RAG + Text2SQL + 业务流程
🟢 全场景覆盖 → 问答、查询、办理、闲聊全支持
🟢 千人千面 → 长中短期记忆 + 用户画像赋能

核心创新：从"回答问题"到"理解并解决问题"

核心优势

行业唯一支持追问/反问的开源智能客服系统

💬

主动式交互

当用户问题模糊时，系统会主动追问和澄清，引导用户获得精准答案。通过"决策-执行"分离架构，避免传统巨石型Prompt的脆弱性。

🤝

多智能体协作

基于LangGraph构建，采用业界前沿的Multi-Agent架构。意图分类器智能路由，各领域专家Agent精准处理，突破"画布+规则"束缚。

🎯

智能推荐引导

当无法完全确定用户意图时，基于知识库内容"逆向生成"推荐问题。 "猜你想问"、"猜你想办"、"猜你想买"全覆盖。

👤

千人千面服务

长、中、短期记忆结合，独立用户画像沉淀。可赋能第三方应用（如冷启动推荐），也可接入第三方画像增强效果。

🌐

全场景覆盖

文档问答(RAG) + 数据库问答(Text2SQL) + 业务流程办理(Agents)。支持20+字段排列组合查询，远超行业平均水平。

🚀

多模态交互

支持文本、语音、实时语音、图片输入。多语言能力(含小语种)、情感识别、富文本展示。 航班订阅等高级功能开箱即用。

全方位评估体系 - 基于DeepEval

系统上线≠万事大吉。我们内置完整的LLM评估框架，确保每个模块持续优化。

🧪 DeepEval驱动的评估能力

✅ 40+ 研究支持的指标 - G-Eval、Faithfulness、Relevancy等
✅ 原生Pytest集成 - 像单元测试一样测试LLM
✅ 单轮&多轮评估 - 覆盖简单问答到复杂对话
✅ 多模态评估 - 支持文本、图片、语音全链路测试
✅ LLM-as-a-Judge - 用大模型评估大模型

参考：DeepEval - The Open-Source LLM Evaluation Framework

📊 端到端评估体系

组件级评估
检索质量、意图分类准确率、生成质量独立评估

端到端评估
从用户输入到最终回复的全流程质量评估

业务指标监控
满意度、转化率、问题解决率等业务KPI

实时监控看板
可视化界面实时追踪每次咨询的评估结果

💡 为什么评估如此重要？

传统AI客服上线后，效果衰减是常态。我们的系统上线即自带全方位评估平台，无需额外开发。通过持续评估，及时发现问题、优化Prompt、调整策略，确保系统能力不衰减反增强。这是从"一次性交付"到"持续进化"的质的飞跃。

专家审核与系统自进化

从被动响应到主动进化，让AI系统拥有"学习能力"

👨‍⚕️ 专家审核机制

🔍 智能筛选 - 按时间、用户、智能体等多维度筛选历史对话
⚡ 批量审核 - 支持单条审核和批量操作，提升效率
📝 质量评分 - 0-1分精细化评分，标注回复质量
✏️ 内容纠正 - 专家可修正错误回复，作为标准答案
📋 审核备注 - 记录审核理由和改进建议


                            💡 提示：查看 专家审核界面演示

🔄 数据闭环与自进化

动态知识库增强
专家审核通过的优质问答对自动入库

向量模型微调
高质量标注数据用于微调Embedding模型

垂直大模型训练
专家纠正的对话数据作为行业模型训练语料

Prompt持续优化
基于审核反馈迭代优化系统Prompt

🚀 从"一次性交付"到"持续进化"

大多数AI客服上线后就"僵化"了。我们的系统通过评估→审核→反馈→优化的完整闭环，让AI不断从真实对话中学习，从专家经验中汲取营养，实现自我进化。这不仅仅是一个客服系统，更是一个可持续成长的智能中枢。

∞

持续学习

📈

能力增长

🎯

精准优化

功能对比

对比行业主流客服系统（数据来源：实际产品调研）

功能维度	乌鲁木齐机场	杭州机场	无锡机场	航旅纵横	我们的系统 🚀
多模态覆盖	文本	文本、图片	文本	文本、语音	文本、语音、实时语音、图片 ✨
多轮对话	✗	✗	✓	✓	✓✓✓
追问/反问	✗	✗	✗	✗	✓ 行业唯一 🏆
知识库范围	安检为主	安检为主	安检为主	安检、联检、海关	安检、联检、海关、边检、机场设施 ✨
航班查询	4字段	多字段	5字段	多字段	20+字段排列组合(Text2SQL) 🎯
富文本展示	✗	✗	✗	✗	✓ 图文卡片
航班卡片	✗	✗	✗	✗	✓ 进港/出港/中转 3种样式
多语言	✗	✓	✗	✗	✓ 含小语种
航班订阅	✗	✗	✗	✗	✓ 实时推送
技术架构	画布+规则	画布+规则	画布+规则	画布+规则	多智能体协作(LangGraph) 🏗️

总结：目前市场上的机场客服功能单一，聚焦知识问答。我们通过多智能体架构实现全场景覆盖，是行业唯一支持追问/反问的开源方案。

技术创新：决策-执行分离架构

如何优雅地实现"追问/反问"？传统的巨石型If-Else Prompt已经行不通。

传统方案的困境

# 臃肿的巨石型Prompt（伪代码）
你是一个智能客服。
IF 用户的问题很宽泛 AND 检索到的知识是多个具体细则 THEN 
    你需要总结这些细则的分类，并向用户提问，引导他明确具体类别
ELSE IF 用户的问题很具体 AND 检索到的知识能直接回答 THEN 
    你就直接根据知识回答
ELSE IF ... (更多其他逻辑分支)
...

问题：
❌ 脆弱且不可预测 - LLM对复杂指令理解不精确
❌ 维护成本极高 - 每次调整都是"牵一发而动全身"
❌ 认知负担过重 - 要求LLM同时完成分析、判断和生成

✅ 我们的解决方案：解构Prompt

🔍

1. 轻量级决策层

关系向量匹配或
专用分类模型

→

🎯

2. 动态Prompt选择

根据决策结果
选择专家级小Prompt

→

✨

3. 专注生成

LLM只需专注
单一生成任务

核心优势：

🎯 专注的力量 - LLM从"通才"变"专家"，准确率显著提升
💰 降低成本 - 可使用更小、更经济的模型完成高质量对话
🔧 易于维护 - 每个Prompt职责单一，调整互不影响
📈 可扩展 - 新增对话模式只需添加决策规则和对应Prompt

技术栈

🏗️ 核心框架
LangGraph · LangChain

🤖 模型服务
Xinference (本地部署)

📚 知识库
RAGFlow

🔌 外部服务
MCP (高德、12306等)

构建一个会思考、能进化的AI客服

不只是"问答"，更是"沟通" · 不只是"交付"，更是"进化"

✨ 追问/反问能力 · 🧪 DeepEval评估 · 👨‍⚕️ 专家审核 · 🔄 自进化闭环
完全开源，可轻松迁移至各行各业

⭐ Star on GitHub 👨‍⚕️ 专家审核演示

从"问答机器"到"真正会沟通的AI"