PHP前端开发

构建人工智能销售代理:从语音到推销

百变鹏仔 2小时前 #Python
文章标签 人工智能

项目背景

EnCode 2025 项目的目标是创建一个高质量、语音自然流畅的AI销售代理,实现与真人近乎无延迟的交互体验。

为此,我构建了一个系统,能够完整处理在线辅导机构的销售对话流程——从问候潜在客户到了解需求并推荐课程。整个过程都以积极、人性化的语气进行,如同一位不知疲倦、状态始终在线的销售人员!

技术架构

工作原理

系统工作流程简洁明了,主要包含三个核心模块:

流程图如下:

用户 -> STT -> LLM -> TTS -> 用户

详细步骤:

  1. 用户语音输入 -> Whisper 转录成文本。
  2. 对话状态管理器(基于正则表达式)跟踪对话阶段。
  3. 松果数据库检索相关信息。
  4. LLaMA 3.3 70B 生成精准回复。
  5. F5 TTS 将文本转换成自然语音输出给用户。

亮点功能

当前限制

经验总结

技术方面

系统设计方面

实际应用中的挑战

意想不到的挑战

未来规划

体验地址

colab.research.google.com
GitHub ---

欢迎在评论区提出您的宝贵建议!