语音输入

了解如何使用语音输入功能与 AI 对话

语音输入

Knodo 支持语音输入功能，让您可以通过说话与 AI 对话。本文档介绍语音输入的使用方法。

功能概述

语音输入功能让您可以：

通过语音发送消息
解放双手
快速输入长文本
更自然的交互方式

浏览器支持

语音输入依赖浏览器的 Web Speech API，支持情况如下：

浏览器	支持情况
Chrome 90+	✅ 完整支持
Edge 90+	✅ 完整支持
Safari 14+	✅ 支持
Firefox	❌ 不支持

💡 推荐使用 Chrome 或 Edge 浏览器获得最佳体验

使用方法

开始语音输入

在对话输入框找到麦克风图标 🎤
点击麦克风按钮
首次使用需要授权麦克风权限
开始说话

语音识别状态

麦克风按钮显示不同状态：

状态	显示	说明
空闲	🎤 灰色	点击开始录音
录音中	🎤 红色闪烁	正在录音
识别中	⏳ 转圈	正在转换文字
完成	✅ 绿色	识别完成
错误	❌ 红色	识别失败

停止语音输入

停止录音的方式：

点击麦克风按钮
等待自动停止（静默 2 秒后）
达到最大录音时长（60 秒）

查看识别结果

语音识别结果会自动填充到输入框：

识别的文字实时显示
识别完成后可以编辑
确认无误后发送

权限设置

首次使用

首次使用语音输入时，浏览器会请求麦克风权限：

点击麦克风按钮
浏览器弹出权限请求
点击"允许"

权限被拒绝

如果之前拒绝了权限：

Chrome/Edge

点击地址栏左侧的锁图标
找到"麦克风"设置
选择"允许"
刷新页面

Safari

打开 Safari 偏好设置
进入"网站" > "麦克风"
找到 Knodo 网站
选择"允许"

语音识别设置

语言设置

语音识别会自动检测语言，支持：

中文（普通话）
英语
更多语言...

识别准确度

提高识别准确度的建议：

环境安静：减少背景噪音
清晰发音：说话清晰，语速适中
靠近麦克风：保持合适距离
使用外置麦克风：条件允许时使用更好的设备

使用技巧

1. 分段说话

长文本分段说话效果更好：

❌ 不好：一口气说完很长的段落可能导致识别错误

✅ 好：分成短句。每句话说完停顿一下。这样识别更准确。

2. 注意标点

语音识别可能不包含标点，可以口述标点：

"这是第一点句号第二点是逗号我们需要注意"
→ "这是第一点。第二点是，我们需要注意"

3. 后期编辑

语音输入后检查并编辑：

查看识别结果
修正错误
添加标点
发送消息

4. 结合快捷键

语音输入后可以使用快捷键编辑：

Ctrl/Cmd + A：全选
Ctrl/Cmd + Z：撤销
Ctrl/Cmd + Shift + Z：重做

常见问题

识别不准确

可能原因：

环境噪音大
发音不清晰
麦克风质量差

解决方法：

换到安静环境
放慢语速，清晰发音
使用外置麦克风

无法开始录音

可能原因：

麦克风权限未授予
麦克风被其他应用占用
浏览器不支持

解决方法：

检查并授予权限
关闭其他使用麦克风的应用
更换 Chrome/Edge 浏览器

识别结果为空

可能原因：

说话声音太小
麦克风静音
网络连接问题

解决方法：

提高说话音量
检查麦克风设置
检查网络连接

识别延迟

可能原因：

网络速度慢
服务器繁忙

解决方法：

检查网络连接
稍后重试

最佳实践

1. 测试麦克风

使用前先测试麦克风是否正常工作。

2. 选择合适环境

安静的房间
避免空调、风扇等噪音
避免多人同时说话

3. 保持稳定距离

与麦克风保持 20-30 厘米的稳定距离。

4. 准备好再说

点击麦克风后稍等一秒，确保开始录音后再说话。

隐私说明

数据处理

语音数据通过浏览器 API 处理
不会存储原始语音
仅保存转换后的文字

本地处理

部分识别可能在本地进行，具体取决于浏览器实现。

语音输入

语音输入

功能概述

浏览器支持

使用方法

开始语音输入

语音识别状态

停止语音输入

查看识别结果

权限设置

首次使用

权限被拒绝

Chrome/Edge

Safari

语音识别设置

语言设置

识别准确度

使用技巧

1. 分段说话

2. 注意标点

3. 后期编辑

4. 结合快捷键

常见问题

识别不准确

无法开始录音

识别结果为空

识别延迟

最佳实践

1. 测试麦克风

2. 选择合适环境

3. 保持稳定距离

4. 准备好再说

隐私说明

数据处理

本地处理

相关文档