🚀 开源 · 可扩展 · 多智能体协作

从"问答机器"
到"真正会沟通的AI"

突破传统AI客服的"玻璃天花板",实现真正的对话智能

大多数AI客服只是高效的"信息检索器",遇到模糊问题就束手无策。
我们通过追问/反问机制多智能体协作,让AI真正理解用户意图,
从被动回答到主动解决问题。

为什么需要"会沟通"的AI?

用户的意图往往是模糊的,知识库的规定也无法穷尽所有情况。
这时,一次精准的追问,才是连接用户与答案的桥梁。

❌ 传统AI客服

单向问答模式

  • 🔴 用户问题模糊 → 返回一堆可能相关的文档
  • 🔴 知识库无精确匹配 → 给出模棱两可的答案
  • 🔴 巨石型Prompt → If-Else逻辑脆弱、维护困难
  • 🔴 功能单一 → 仅支持静态文档问答(RAG)
  • 🔴 千人一面 → 无法记忆用户、无个性化

核心问题:把用户当"数据源",而非"沟通对象"

✅ 我们的智能客服

对话式问题解决

  • 🟢 主动追问澄清 → 引导用户明确真实需求
  • 🟢 决策-执行分离 → 轻量级决策 + 专家级小Prompt
  • 🟢 多智能体协作 → RAG + Text2SQL + 业务流程
  • 🟢 全场景覆盖 → 问答、查询、办理、闲聊全支持
  • 🟢 千人千面 → 长中短期记忆 + 用户画像赋能

核心创新:从"回答问题"到"理解并解决问题"

核心优势

行业唯一支持追问/反问的开源智能客服系统

💬

主动式交互

当用户问题模糊时,系统会主动追问和澄清,引导用户获得精准答案。 通过"决策-执行"分离架构,避免传统巨石型Prompt的脆弱性。

🤝

多智能体协作

基于LangGraph构建,采用业界前沿的Multi-Agent架构。 意图分类器智能路由,各领域专家Agent精准处理,突破"画布+规则"束缚。

🎯

智能推荐引导

当无法完全确定用户意图时,基于知识库内容"逆向生成"推荐问题。 "猜你想问""猜你想办""猜你想买"全覆盖。

👤

千人千面服务

长、中、短期记忆结合,独立用户画像沉淀。 可赋能第三方应用(如冷启动推荐),也可接入第三方画像增强效果。

🌐

全场景覆盖

文档问答(RAG) + 数据库问答(Text2SQL) + 业务流程办理(Agents)。 支持20+字段排列组合查询,远超行业平均水平。

🚀

多模态交互

支持文本、语音、实时语音、图片输入。 多语言能力(含小语种)、情感识别、富文本展示。 航班订阅等高级功能开箱即用。

全方位评估体系 - 基于DeepEval

系统上线≠万事大吉。我们内置完整的LLM评估框架,确保每个模块持续优化。

🧪 DeepEval驱动的评估能力

  • 40+ 研究支持的指标 - G-Eval、Faithfulness、Relevancy等
  • 原生Pytest集成 - 像单元测试一样测试LLM
  • 单轮&多轮评估 - 覆盖简单问答到复杂对话
  • 多模态评估 - 支持文本、图片、语音全链路测试
  • LLM-as-a-Judge - 用大模型评估大模型

参考:DeepEval - The Open-Source LLM Evaluation Framework

📊 端到端评估体系

组件级评估
检索质量、意图分类准确率、生成质量独立评估
端到端评估
从用户输入到最终回复的全流程质量评估
业务指标监控
满意度、转化率、问题解决率等业务KPI
实时监控看板
可视化界面实时追踪每次咨询的评估结果

💡 为什么评估如此重要?

传统AI客服上线后,效果衰减是常态。我们的系统上线即自带全方位评估平台,无需额外开发。 通过持续评估,及时发现问题、优化Prompt、调整策略,确保系统能力不衰减反增强。 这是从"一次性交付"到"持续进化"的质的飞跃。

专家审核与系统自进化

从被动响应到主动进化,让AI系统拥有"学习能力"

👨‍⚕️ 专家审核机制

  • 🔍 智能筛选 - 按时间、用户、智能体等多维度筛选历史对话
  • 批量审核 - 支持单条审核和批量操作,提升效率
  • 📝 质量评分 - 0-1分精细化评分,标注回复质量
  • ✏️ 内容纠正 - 专家可修正错误回复,作为标准答案
  • 📋 审核备注 - 记录审核理由和改进建议
💡 提示:查看 专家审核界面演示

🔄 数据闭环与自进化

1
动态知识库增强
专家审核通过的优质问答对自动入库
2
向量模型微调
高质量标注数据用于微调Embedding模型
3
垂直大模型训练
专家纠正的对话数据作为行业模型训练语料
4
Prompt持续优化
基于审核反馈迭代优化系统Prompt

🚀 从"一次性交付"到"持续进化"

大多数AI客服上线后就"僵化"了。我们的系统通过评估→审核→反馈→优化的完整闭环, 让AI不断从真实对话中学习,从专家经验中汲取营养,实现自我进化。 这不仅仅是一个客服系统,更是一个可持续成长的智能中枢

持续学习
📈
能力增长
🎯
精准优化

功能对比

对比行业主流客服系统(数据来源:实际产品调研)

功能维度 乌鲁木齐机场 杭州机场 无锡机场 航旅纵横 我们的系统 🚀
多模态覆盖 文本 文本、图片 文本 文本、语音 文本、语音、实时语音、图片 ✨
多轮对话 ✓✓✓
追问/反问 ✓ 行业唯一 🏆
知识库范围 安检为主 安检为主 安检为主 安检、联检、海关 安检、联检、海关、边检、机场设施 ✨
航班查询 4字段 多字段 5字段 多字段 20+字段排列组合(Text2SQL) 🎯
富文本展示 ✓ 图文卡片
航班卡片 ✓ 进港/出港/中转 3种样式
多语言 ✓ 含小语种
航班订阅 ✓ 实时推送
技术架构 画布+规则 画布+规则 画布+规则 画布+规则 多智能体协作(LangGraph) 🏗️

总结:目前市场上的机场客服功能单一,聚焦知识问答。 我们通过多智能体架构实现全场景覆盖,是行业唯一支持追问/反问的开源方案。

技术创新:决策-执行分离架构

如何优雅地实现"追问/反问"?传统的巨石型If-Else Prompt已经行不通。

传统方案的困境

# 臃肿的巨石型Prompt(伪代码)
你是一个智能客服。
IF 用户的问题很宽泛 AND 检索到的知识是多个具体细则 THEN 
    你需要总结这些细则的分类,并向用户提问,引导他明确具体类别
ELSE IF 用户的问题很具体 AND 检索到的知识能直接回答 THEN 
    你就直接根据知识回答
ELSE IF ... (更多其他逻辑分支)
...

问题:
❌ 脆弱且不可预测 - LLM对复杂指令理解不精确
❌ 维护成本极高 - 每次调整都是"牵一发而动全身"
❌ 认知负担过重 - 要求LLM同时完成分析、判断和生成

✅ 我们的解决方案:解构Prompt

🔍

1. 轻量级决策层

关系向量匹配 或
专用分类模型

🎯

2. 动态Prompt选择

根据决策结果
选择专家级小Prompt

3. 专注生成

LLM只需专注
单一生成任务

核心优势:

  • 🎯 专注的力量 - LLM从"通才"变"专家",准确率显著提升
  • 💰 降低成本 - 可使用更小、更经济的模型完成高质量对话
  • 🔧 易于维护 - 每个Prompt职责单一,调整互不影响
  • 📈 可扩展 - 新增对话模式只需添加决策规则和对应Prompt

技术栈

🏗️ 核心框架
LangGraph · LangChain
🤖 模型服务
Xinference (本地部署)
📚 知识库
RAGFlow
🔌 外部服务
MCP (高德、12306等)

系统亮点一览

100%
开源免费
唯一
支持追问/反问
40+
评估指标(DeepEval)
20+
字段组合查询
4维
自进化闭环
3种
智能推荐模式

构建一个会思考、能进化的AI客服

不只是"问答",更是"沟通" · 不只是"交付",更是"进化"

✨ 追问/反问能力 · 🧪 DeepEval评估 · 👨‍⚕️ 专家审核 · 🔄 自进化闭环
完全开源,可轻松迁移至各行各业

⭐ Star on GitHub 👨‍⚕️ 专家审核演示