开源项目推荐:Type4Me,作者号称是 Typeless 平替
macOS 语音输入工具,本地/云端双引擎识别,大模型文本优化,数据全部存在本地。
市面上的语音输入工具,要么贵($12/月),要么数据不可控,要么不能自定义 Prompt。Type4Me 想把这几个问题一起解决。
它基于 SherpaOnnx 引擎做本地语音识别,不需要 API Key、不需要联网,在 Apple Silicon 机型上跑得很快。如果你更看重准确率,也可以接云端引擎(目前支持火山引擎和 Deepgram)。
最有意思的是它的"处理模式"设计——语音识别出文字后,可以直接丢给大模型做后处理。内置了快速听写、双通道高精度、中译英、Prompt 优化等模式,也可以自己写 Prompt 定义任意处理流程。
还有个"命令模式"值得一提:选中一段文字,按快捷键说一句话,语音会变成指令,选中的文字变成上下文,LLM 直接执行操作并输出结果。相当于把语音变成了 LLM 的命令行。
数据方面,所有凭证和识别历史都存在本地(SQLite + JSON),没有遥测、没有云同步,历史记录支持导出 CSV。
项目架构是插件式的,添加新的语音识别服务只需要实现两个协议然后注册,目前 OpenAI Whisper、Google、AWS 等接口定义都预留好了,等社区来补。
MIT 协议,macOS 14+,GitHub 地址:https://t.co/wIfYJsAeMS