语音输入
了解如何使用语音输入功能与 AI 对话
语音输入
Knodo 支持语音输入功能,让您可以通过说话与 AI 对话。本文档介绍语音输入的使用方法。
功能概述
语音输入功能让您可以:
- 通过语音发送消息
- 解放双手
- 快速输入长文本
- 更自然的交互方式
浏览器支持
语音输入依赖浏览器的 Web Speech API,支持情况如下:
| 浏览器 | 支持情况 |
|---|---|
| Chrome 90+ | ✅ 完整支持 |
| Edge 90+ | ✅ 完整支持 |
| Safari 14+ | ✅ 支持 |
| Firefox | ❌ 不支持 |
💡 推荐使用 Chrome 或 Edge 浏览器获得最佳体验
使用方法
开始语音输入
- 在对话输入框找到麦克风图标 🎤
- 点击麦克风按钮
- 首次使用需要授权麦克风权限
- 开始说话
语音识别状态
麦克风按钮显示不同状态:
| 状态 | 显示 | 说明 |
|---|---|---|
| 空闲 | 🎤 灰色 | 点击开始录音 |
| 录音中 | 🎤 红色闪烁 | 正在录音 |
| 识别中 | ⏳ 转圈 | 正在转换文字 |
| 完成 | ✅ 绿色 | 识别完成 |
| 错误 | ❌ 红色 | 识别失败 |
停止语音输入
停止录音的方式:
- 点击麦克风按钮
- 等待自动停止(静默 2 秒后)
- 达到最大录音时长(60 秒)
查看识别结果
语音识别结果会自动填充到输入框:
- 识别的文字实时显示
- 识别完成后可以编辑
- 确认无误后发送
权限设置
首次使用
首次使用语音输入时,浏览器会请求麦克风权限:
- 点击麦克风按钮
- 浏览器弹出权限请求
- 点击"允许"
权限被拒绝
如果之前拒绝了权限:
Chrome/Edge
- 点击地址栏左侧的锁图标
- 找到"麦克风"设置
- 选择"允许"
- 刷新页面
Safari
- 打开 Safari 偏好设置
- 进入"网站" > "麦克风"
- 找到 Knodo 网站
- 选择"允许"
语音识别设置
语言设置
语音识别会自动检测语言,支持:
- 中文(普通话)
- 英语
- 更多语言...
识别准确度
提高识别准确度的建议:
- 环境安静:减少背景噪音
- 清晰发音:说话清晰,语速适中
- 靠近麦克风:保持合适距离
- 使用外置麦克风:条件允许时使用更好的设备
使用技巧
1. 分段说话
长文本分段说话效果更好:
❌ 不好:一口气说完很长的段落可能导致识别错误 ✅ 好:分成短句。每句话说完停顿一下。这样识别更准确。
2. 注意标点
语音识别可能不包含标点,可以口述标点:
"这是第一点句号第二点是逗号我们需要注意" → "这是第一点。第二点是,我们需要注意"
3. 后期编辑
语音输入后检查并编辑:
- 查看识别结果
- 修正错误
- 添加标点
- 发送消息
4. 结合快捷键
语音输入后可以使用快捷键编辑:
Ctrl/Cmd + A:全选Ctrl/Cmd + Z:撤销Ctrl/Cmd + Shift + Z:重做
常见问题
识别不准确
可能原因:
- 环境噪音大
- 发音不清晰
- 麦克风质量差
解决方法:
- 换到安静环境
- 放慢语速,清晰发音
- 使用外置麦克风
无法开始录音
可能原因:
- 麦克风权限未授予
- 麦克风被其他应用占用
- 浏览器不支持
解决方法:
- 检查并授予权限
- 关闭其他使用麦克风的应用
- 更换 Chrome/Edge 浏览器
识别结果为空
可能原因:
- 说话声音太小
- 麦克风静音
- 网络连接问题
解决方法:
- 提高说话音量
- 检查麦克风设置
- 检查网络连接
识别延迟
可能原因:
- 网络速度慢
- 服务器繁忙
解决方法:
- 检查网络连接
- 稍后重试
最佳实践
1. 测试麦克风
使用前先测试麦克风是否正常工作。
2. 选择合适环境
- 安静的房间
- 避免空调、风扇等噪音
- 避免多人同时说话
3. 保持稳定距离
与麦克风保持 20-30 厘米的稳定距离。
4. 准备好再说
点击麦克风后稍等一秒,确保开始录音后再说话。
隐私说明
数据处理
- 语音数据通过浏览器 API 处理
- 不会存储原始语音
- 仅保存转换后的文字
本地处理
部分识别可能在本地进行,具体取决于浏览器实现。