搜狗输入法怎样一键导出个人词库备份?

功能定位:为什么需要“一键导出”
在搜狗输入法里,个人词库=你敲过的专属短语、人名、黑话、错词纠正的集合。它决定候选排序,却默认只存云端。若账号异常、公司电脑禁止登录或准备换机,没有本地备份就只能重新“养词”。一键导出把加密词库转成名文文本,方便版本回退、跨账号迁移,也能在合规审计时快速提交明文文件。
版本差异速览:v13.6 与更早客户端
截至当前的最新版本(v13.6.0.6188)起,Windows 与 macOS 正式版把“导出”入口从「高级设置」提升到「词库管理」一级页;安卓与鸿蒙需先更新到应用市场“2026 春更”后才会显示按钮。iOS 因系统沙盒限制,仅支持导出到系统“文件”App,无法直接分享微信。低于 v12 的桌面端无内置导出,只能手动复制安装目录下的phrases.db,再用第三方工具解密,步骤繁琐且易损坏索引,官方已停止维护。
Windows 10/11 最短路径
- 切换到搜狗输入法,按快捷键 Ctrl+Shift+M 调出主菜单 → 设置。
- 左侧选“词库”→ 右侧“我的词库”卡片点击“词库管理”。
- 在弹窗底部找到“导出个人词库”→ 选择编码(UTF-8 兼容性最好)→ 保存路径建议放桌面,文件名默认带日期。
- 导出完成会提示“共 X 条”,若条数为 0,说明本地未开启“记录新词”,需先勾选“设置-高级-动态词库-记录新词”并正常使用三天以上再重试。
失败分支:若按钮置灰,检查是否开启“隐私增强-端侧推理”模式,该模式下本地词库被加密且禁止导出,需临时关闭并重启输入法后才能解锁。
macOS Sonoma 路径
顶部状态栏找到“搜狗输入法图标”→ 偏好设置 → 词库 → 导出。mac 版无编码选择,默认导出 UTF-8 无 BOM 文本。若系统提示“无法写入 Downloads”,把保存位置换到“~/Documents”即可,是苹果沙盒权限导致。
Android / 鸿蒙 NEXT
打开搜狗输入法 App(非键盘界面)→ 我的 → 词库管理 → 右上角“⋮”→ 导出个人词库。系统会弹出“存储权限”申请,允许后默认路径为/Documents/Sogou/Export/,可在“设置-通用-文件保存位置”修改。导出文件小于 1 MB 时,可直接用系统分享面板发送到微信;大于 1 MB 会被微信拦截,建议走邮件或 USB 拷贝。
iPhone & iPad 特别说明
iOS 版无直接“导出”按钮,需借道“云备份-本地缓存”逻辑:先确保登录搜狗账号并开启云同步 → 在系统“文件”App 中进入“搜狗输入法”文件夹 → 长按userDict.txt → 移动,即可得到明文字典。经验性观察:若云同步开关曾关闭,该文件可能为空,需先打开同步并等待一晚,次日再复制。
导出后的文件长什么样?
纯文本,每行一条,字段用 Tab 分隔:词语 拼音 频次 时间戳。可直接用 Excel 打开做二次清洗,也能被 Pythonpandas.read_csv(..., sep='\t')读取。注意:若你曾加入行业词库,导出只会包含“个人新增”部分,官方预置词条不会泄漏,减少合规风险。
如何再导入或迁移到另一账号
桌面端:词库管理 → 导入 → 选刚才的.txt → 勾选“与云端合并”。若目标账号已存在同名词条,会以“频次加和”方式合并,不会覆盖。移动端:App 内“我的-词库管理-导入”支持从微信/QQ 选择文件,但文件大于 500 KB 会触发后台校验,需保持屏幕常亮数十秒,耐心等待“导入完成”Toast。
例外与取舍:什么时候不该导出?
警告
公司电脑若已启用 DLP(数据防泄漏)策略,明文词库可能包含客户姓名、项目代号,导出即触发审计告警。建议先关闭“记录新词”一周,让敏感词自然淘汰,或改用“加密打包”功能(仅企业版提供)。
故障排查:按钮灰色/导出 0 条/文件乱码
| 现象 | 可能原因 | 验证步骤 | 处置 |
|---|---|---|---|
| 导出按钮灰色 | 开启端侧推理 | 设置-隐私-端侧推理开关 | 关闭并重启 |
| 0 条 | 未记录新词 | 检查“高级-记录新词” | 打开后正常使用≥3 天 |
| 乱码 | Excel 默认 ANSI | 用 VS Code 打开 | VS Code 选 UTF-8 重新保存 |
与第三方工具协同的最小权限原则
若要把导出的词库喂给 Rime、手心、或自己训练的 LLM,建议先删除“时间戳”列,仅保留“词语+频次”,降低隐私粒度。上传至 GitHub 前,用sort | uniq去重并人工抽样 50 行,确认无手机号、地址后再提交。
适用/不适用场景清单
- 日更 200 条弹幕的 UP 主:导出→清洗→导入 Rime,可保留黑话,减少重新养词两周。
- 医药代表:客户姓名可能写入词库,公司若开 DLP,禁用导出或改用企业加密包。
- 教师:纸质试卷 OCR 后生成个人词条,导出可备份到 U 盘,换校授课时快速恢复。
- 无障碍用户:端侧推理模式必须常开,导出按钮不可用,需临时关闭模式才能备份。
最佳实践 5 条
- 每月首日做一次导出,文件名带年月,放同一文件夹,形成个人 git 仓库。
- 导出后立刻用压缩包加密(7z 加密码),再上传云盘,防止明文泄漏。
- 换机前,先在旧设备关闭“云同步”,再导出,可避免新设备被旧云词库覆盖。
- 导入前备份目标账号现有词库,路径相同,点“导出”即可,形成回退点。
- 若词条超 50 万行,导入时请保持 Wi-Fi 并插电,防止系统休眠导致索引损坏。
FAQ(结构化数据)
导出词库会泄漏密码吗?
不会。密码若被当作“词语”记录,只会保存字符本身,无上下文账号信息。建议导出后用 grep 检索敏感字符串,再决定是否公开分享。
可以批量导出多个账号吗?
桌面版支持“切换账号-导出-再切换”循环,可写脚本自动点击,但需配合系统级自动化工具;官方未提供多账号 API。
iOS 找不到 userDict.txt?
确认已开云同步,并在“文件-浏览-搜狗输入法”目录查找;若仍无,尝试杀掉“文件”App 后台再重启,系统级缓存延迟可能导致文件未立即显现。
收尾:下一步行动
打开搜狗输入法,按本文路径花 30 秒完成一次导出,把得到的 .txt 加密后丢到云盘,你就拥有了一个可回溯、可迁移、可审计的个人词库快照。下次换机、换号、或面对合规审计时,不用再从零开始“养词”,也不会因云账号异常而丢失两年敲下的专业短语。记得每月定时备份,让输入法真正成为“属于你”的数字资产。


