
简介介绍
py-xiaozhi是一款基于Python开发的AI小智语音客户端,它从原生小智ESP32代码移植而来,为用户提供了一个纯Python实现的AI语音交互解决方案。
这款软件允许用户在台式机或笔记本电脑上无需额外硬件即可体验实时对话和语音交互的功能。
py-xiaozhi项目原生支持MQTT与WSS双协议,具备打断并持续对话的能力,且后续协议的扩展也相对简单。
无论是开发者还是普通用户,都能通过py-xiaozhi享受到便捷的AI语音交互体验。立即尝试py-xiaozhi,开启你的智能语音交互之旅。
功能特点
- AI语音交互:支持语音输入与识别,实现智能人机交互,提供自然流畅的对话体验。
- 视觉多模态:支持图像识别和处理,提供多模态交互能力,理解图像内容。
- IoT 设备集成:
- 支持智能家居设备控制,包括灯光、音量、温度传感器等
- 集成Home Assistant智能家居平台,控制灯具、开关、数值控制器和按钮设备
- 提供倒计时器功能,支持延时执行命令
- 内置多种虚拟设备和物理设备驱动,可轻松扩展
- 联网音乐播放:基于pygame实现的高性能音乐播放器,支持播放/暂停/停止、进度控制、歌词显示和本地缓存,提供更稳定的音乐播放体验。
- 语音唤醒:支持唤醒词激活交互,免去手动操作的烦恼(默认关闭需要手动开启)。
- 自动对话模式:实现连续对话体验,提升用户交互流畅度。
- 图形化界面:提供直观易用的 GUI,支持小智表情与文本显示,增强视觉体验。
- 命令行模式:支持 CLI 运行,适用于嵌入式设备或无 GUI 环境。
- 跨平台支持:兼容 Windows 10+、macOS 10.15+ 和 Linux 系统,随时随地使用。
- 音量控制:支持音量调节,适应不同环境需求,统一声音控制接口。
- 会话管理:有效管理多轮对话,保持交互的连续性。
- 加密音频传输:支持 WSS 协议,保障音频数据的安全性,防止信息泄露。
- 自动验证码处理:首次使用时,程序自动复制验证码并打开浏览器,简化用户操作。
- 自动获取 MAC 地址:避免 MAC 地址冲突,提高连接稳定性。
- 代码模块化:拆分代码并封装为类,职责分明,便于二次开发。
- 稳定性优化:修复多项问题,包括断线重连、跨平台兼容等。