语音输入

了解如何使用语音输入功能与 AI 对话

语音输入

Knodo 支持语音输入功能,让您可以通过说话与 AI 对话。本文档介绍语音输入的使用方法。

功能概述

语音输入功能让您可以:

  • 通过语音发送消息
  • 解放双手
  • 快速输入长文本
  • 更自然的交互方式

浏览器支持

语音输入依赖浏览器的 Web Speech API,支持情况如下:

浏览器支持情况
Chrome 90+✅ 完整支持
Edge 90+✅ 完整支持
Safari 14+✅ 支持
Firefox❌ 不支持

💡 推荐使用 Chrome 或 Edge 浏览器获得最佳体验

使用方法

开始语音输入

  1. 在对话输入框找到麦克风图标 🎤
  2. 点击麦克风按钮
  3. 首次使用需要授权麦克风权限
  4. 开始说话

语音识别状态

麦克风按钮显示不同状态:

状态显示说明
空闲🎤 灰色点击开始录音
录音中🎤 红色闪烁正在录音
识别中⏳ 转圈正在转换文字
完成✅ 绿色识别完成
错误❌ 红色识别失败

停止语音输入

停止录音的方式:

  • 点击麦克风按钮
  • 等待自动停止(静默 2 秒后)
  • 达到最大录音时长(60 秒)

查看识别结果

语音识别结果会自动填充到输入框:

  1. 识别的文字实时显示
  2. 识别完成后可以编辑
  3. 确认无误后发送

权限设置

首次使用

首次使用语音输入时,浏览器会请求麦克风权限:

  1. 点击麦克风按钮
  2. 浏览器弹出权限请求
  3. 点击"允许"

权限被拒绝

如果之前拒绝了权限:

Chrome/Edge

  1. 点击地址栏左侧的锁图标
  2. 找到"麦克风"设置
  3. 选择"允许"
  4. 刷新页面

Safari

  1. 打开 Safari 偏好设置
  2. 进入"网站" > "麦克风"
  3. 找到 Knodo 网站
  4. 选择"允许"

语音识别设置

语言设置

语音识别会自动检测语言,支持:

  • 中文(普通话)
  • 英语
  • 更多语言...

识别准确度

提高识别准确度的建议:

  1. 环境安静:减少背景噪音
  2. 清晰发音:说话清晰,语速适中
  3. 靠近麦克风:保持合适距离
  4. 使用外置麦克风:条件允许时使用更好的设备

使用技巧

1. 分段说话

长文本分段说话效果更好:

❌ 不好:一口气说完很长的段落可能导致识别错误 ✅ 好:分成短句。每句话说完停顿一下。这样识别更准确。

2. 注意标点

语音识别可能不包含标点,可以口述标点:

"这是第一点句号第二点是逗号我们需要注意" → "这是第一点。第二点是,我们需要注意"

3. 后期编辑

语音输入后检查并编辑:

  1. 查看识别结果
  2. 修正错误
  3. 添加标点
  4. 发送消息

4. 结合快捷键

语音输入后可以使用快捷键编辑:

  • Ctrl/Cmd + A:全选
  • Ctrl/Cmd + Z:撤销
  • Ctrl/Cmd + Shift + Z:重做

常见问题

识别不准确

可能原因

  • 环境噪音大
  • 发音不清晰
  • 麦克风质量差

解决方法

  • 换到安静环境
  • 放慢语速,清晰发音
  • 使用外置麦克风

无法开始录音

可能原因

  • 麦克风权限未授予
  • 麦克风被其他应用占用
  • 浏览器不支持

解决方法

  • 检查并授予权限
  • 关闭其他使用麦克风的应用
  • 更换 Chrome/Edge 浏览器

识别结果为空

可能原因

  • 说话声音太小
  • 麦克风静音
  • 网络连接问题

解决方法

  • 提高说话音量
  • 检查麦克风设置
  • 检查网络连接

识别延迟

可能原因

  • 网络速度慢
  • 服务器繁忙

解决方法

  • 检查网络连接
  • 稍后重试

最佳实践

1. 测试麦克风

使用前先测试麦克风是否正常工作。

2. 选择合适环境

  • 安静的房间
  • 避免空调、风扇等噪音
  • 避免多人同时说话

3. 保持稳定距离

与麦克风保持 20-30 厘米的稳定距离。

4. 准备好再说

点击麦克风后稍等一秒,确保开始录音后再说话。

隐私说明

数据处理

  • 语音数据通过浏览器 API 处理
  • 不会存储原始语音
  • 仅保存转换后的文字

本地处理

部分识别可能在本地进行,具体取决于浏览器实现。

相关文档

语音输入 | Knodo 文档