V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
oldcai
0D
V2EX  ›  分享创造

[免费] [Windows 版来了] LazyTyper:语音 7x 倍速怒喷 AI

  •  4
     
  •   oldcai ·
    PRO
    ·
    oldcai · 22 天前 · 5406 次点击

    ✨永久免费的LazyTyper 语音输入法Windows 版上线

    上周我在 V2EX 发了 Mac 版 的 LazyTyper。很多朋友留言让我也支持 Windows ,这周我把它做出来了。

    它解决了什么?

    自从买了 Claude Code 的 Max 套餐,我最大瓶颈不是 token 不够,而是输入太慢。看到别人一天能吃$1000+的自助餐眼馋坏了,那就用魔法打败魔法吧!

    我试遍了市面上的语音输入:要么贵、要么卡、要么不准。

    于是给自己写了一个按住说话、松开放字的小工具,越用越离不开——天天给 Claude Code / ChatGPT 口述复杂 prompt ,我觉得我退化了的嘴巴又长回来了,甚至敢和家里的领导讲讲道理了……虽然再次惜败😅

    体感 3–7× 更快,我已经很少长篇键盘输入了。

    主要特性

    • 语音写代码:按住全局快捷键说话,松开即把文字插入到光标处( VS Code / JetBrains / Rider / PyCharm / 终端 / 浏览器等任意输入框)

    • 自动标点 & 多语言:自然说就行,自动出标点,适合中英文混说

    • 5 个识别引擎可选(可随时切换):

      • 豆包语音
      • 🆕 ElevenLabs
      • Groq ( Whisper )
      • Mistral ( Voxtral )
      • AssemblyAI
    • AI 好搭子:一键把语音转成长 prompt ,连续补充思路不打断

    快速开始

    1. 下载并安装
    2. 选择一个(或多个)识别引擎与语言(填入对应 API Key,5 选一即可)
    3. 快捷键默认 Ctrl+Space ,可更改 → 在任意输入框 按住说话、松开出字

    请大家帮我多提意见!

    讲讲你的

    • 快捷键习惯,是否冲突(默认的如果不合适,我可以改改)

    • 5 家引擎在你场景下哪个更好用,比如哪个最准,哪个最快?(我 Vibe Coding 的时候 ElevenLabs 最强)

    • 这些功能对你来说是贴心还是多余?

      • 自定义词汇表
      • 重新识别(纠错)
      • 中文智能标点替换,移除「呃」、「嗯」
      • 本地保存、搜索历史记录
      • 录音时静音
      • 保持麦克风活跃(加快启动速度)

    欢迎提建议,我会逐条跟进完善。

    好用的话,也不要害羞,来夸夸我~

    官网下载:https://lazytyper.com/zh

    打赏作者
    sillydaddy 打赏了 20 $V2EX
    46 条回复    2025-09-14 17:17:58 +08:00
    akiyamamio
        1
    akiyamamio  
       22 天前
    建议搞个免安装便携版
    ethanlu
        2
    ethanlu  
       22 天前
    支持方言不?
    katwalk
        3
    katwalk  
       22 天前
    Windows 版终于来了,试用了一下,用户体验和语音输入都太强了!

    UI 设计,功能整合得很棒,用起来非常顺手。至于语音识别,我用的是作者推荐的火山豆包。个人觉得识别正确率比讯飞还要高,可能是 AI 加持,正确率很顶。

    之前作者说语音输入有多快多好,我其实一直用讯飞,还觉得有些夸张,现在用过才知道,体验又上升了一个台阶,完全停不下来。这段话就是用它输入的,效率直接拉满。
    lloovve
        4
    lloovve  
       22 天前 via iPhone
    支持自定义快捷键触发么?我想做个专用话筒
    theo
        5
    theo  
       22 天前
    在用 Mac 版,特别棒,比同类其它软件都不知道高到哪里去了!

    期望松开时如果光标没有放在文本框中时,能自动保存到类似剪贴板的地方,或者类似剪贴板增强软件,多次记录也能全部存储下来就更棒了。

    因为偶尔看文章的时候,会产生一些需要随时记录的想法,但此时又不想切换当前屏幕的焦点~
    oldcai
        6
    oldcai  
    OP
    PRO
       22 天前
    @akiyamamio 这个我也尝试过,但是现在的 tauri+svelte 框架依赖的东西有点多,不是很好打包。
    @ethanlu 暂时应该是不支持方言的。
    @katwalk 感谢支持。能给你的效率带来提升,我也很开心。
    @lloovve 暂时不支持,但其实我也想支持。试了几次没有成功。你有好的想法吗?耳机上面的按钮,比如说 AirPods 的“播放/暂停”,不知道怎么监听。
    oldcai
        7
    oldcai  
    OP
    PRO
       22 天前
    @theo 有历史记录。你可以调整它的记录的数量(可以调整到 0 就是不记录)
    在图标上右键,有个选项,可以粘贴上一次的识别结果。
    oldcai
        8
    oldcai  
    OP
    PRO
       22 天前
    @theo 可能历史记录的深度有点深,我到时候放到菜单里面吧。
    lloovve
        9
    lloovve  
       22 天前 via iPhone
    @oldcai 蓝牙耳机连接电脑我没试过,我自己可以做个无线带键盘功能的无线声卡 mic ,你只要支持自定义键盘全局按键就行,比如 f1-f12 之类的,按下去讲话送开结束。剩下就简单了
    oldcai
        10
    oldcai  
    OP
    PRO
       22 天前
    @lloovve 这个是支持的,你试过了吗?
    oldcai
        11
    oldcai  
    OP
    PRO
       22 天前
    @lloovve 刚才测了一下,可以设置成键盘上的 F1 键等。
    如果说你有这样的设备,先帮我测一下。我觉得应该是可以支持的。
    oldlamp
        12
    oldlamp  
       21 天前
    请问能不能添加本地离线模型的支持呢?
    yb2313
        13
    yb2313  
       21 天前
    这个帖子是用这个输入的吗
    stefwoo
        14
    stefwoo  
       20 天前
    我安装测试了一下,效果还挺好的,输入的识别率也还不错。这个帖子就是这么输入的。那么有没有可能在移动平台上也弄一个?我不知道现在移动平台上使用的是什么识别的,我觉得其实识别的正确率并不是特别高。像科大讯飞的讯飞输入法。在语音输入的时候,特别是本地大模型特别慢。在线的模型的话,其实错误率还是有一些的。
    visper
        15
    visper  
       16 天前
    没明白,这个为什么会更快吗?感觉也就是填入自己的 api key 然后调用在线大模型语音转文字?
    heavymetals
        16
    heavymetals  
       16 天前
    还挺有意思的。
    oldcai
        17
    oldcai  
    OP
    PRO
       15 天前
    @lloovve 如果用耳机设备上面的按钮来开启语音识别的话,那输入后的那个回车,你是想也用耳机设备来输入呢,还是让输入法直接 回车?

    如果输入法直接回车的话,它可能会 有 5%的错误率。

    我们这个中间需要一个确认的环节吗?
    用延迟来确认的话,会有一点耽误;用语音来确认的话,又有点啰嗦。
    一直没有想到一个好的交互方式。
    lloovve
        18
    lloovve  
       15 天前 via iPhone
    @oldcai 简单一点,就是按下去讲话送开停止,停止后也相当于回车,不需要任何确认,ai 会自动纠正 asr 识别错误的地方。
    s4nd
        19
    s4nd  
       15 天前
    快捷键那里可否增加鼠标的快捷键
    dandycheung
        20
    dandycheung  
       15 天前 via Android
    有个小问题,目前可以多实例运行,每个都在托盘创建了图标,但是后起的实例改动了的配置数据,前起的不能自动感知。
    wncoic
        21
    wncoic  
       15 天前
    为啥要下载,搞个网页多方便
    lio444
        22
    lio444  
       15 天前
    这个是利用 API 吧,能够增加一个本地版本的么?
    oldcai
        23
    oldcai  
    OP
    PRO
       14 天前
    @lloovve
    @s4nd
    好的,我考虑一下。
    @dandycheung
    感谢,下个版本修复。
    w568w
        24
    w568w  
       14 天前
    能支持 Linux 就好了
    WaterMC
        25
    WaterMC  
       12 天前
    反馈一个 windows 版的安装问题,没有安装成功,提示
    ((product_name))is running!
    Click OK to kill it

    关掉提示窗,查看安装细节说明,显示是
    Failed to kill {{product_name)).Please dose it first then try again


    但是这个提示没有直接的指向,我自己并不知道需要先手动关掉哪一个程序才能继续安装。
    as9567585
        26
    as9567585  
       8 天前
    正在用这个软件来回复,挺好用的。
    as9567585
        27
    as9567585  
       8 天前
    还是比较担心这个火山的 API 调用额度的问题。我看免费版就给了 20 个小时的使用时间,一直应该是到明年的 3 月份就没有了。
    aero99
        28
    aero99  
       8 天前
    电脑上用语音总是怪怪的,其实我觉得语音输入最多的应该是移动端吧,请问有 ios 版本吗
    wang777
        29
    wang777  
       8 天前
    支持,试了一下还是挺好用的。Windows 版本有一个文案上的小问题在系统设置里开机自动启动下方的文案是 Mac OS

    这段话就是用这个软件回复的,中英文识别准确率还挺高的,回头试试去写代码。
    yuhangch
        30
    yuhangch  
       7 天前   ❤️ 1
    TNT 来了,老罗还是太超前了😂
    oldcai
        31
    oldcai  
    OP
    PRO
       7 天前
    @wang777 好的,谢谢,记下了,下个版本修复~
    xljya
        32
    xljya  
       2 天前
    瞌睡来了送枕头
    xljya
        33
    xljya  
       2 天前
    @xljya 提个建议,让软件在任务栏显示图标,可以提升使用体验
    oldcai
        34
    oldcai  
    OP
    PRO
       1 天前
    @xljya 能不能展开说说😂
    托盘图标不太够吗?
    因为任务栏图标更大一些吗?
    xljya
        35
    xljya  
       1 天前
    @oldcai #34 就是现在只能鼠标移到右下角,点右键去改设置,我觉得给它在任务栏加个图标 使用 alt+tab 去改设置会方便很多
    xljya
        36
    xljya  
       1 天前
    @oldcai #34 mac 端还有一个小建议,就是我把键位改成了 control+tab ,它的显示是 ctrl+tab ,我觉得 mac 端显示全称比较好,用户看着会舒服一些,和键盘显示相对应
    cyp0633
        37
    cyp0633  
       1 天前
    好奇一个技术无关的问题,用了这个会更多用更激烈的语言喷 AI 吗
    codehz
        38
    codehz  
       1 天前
    测了半天,发现 Groq 模型只会输出“请不吝点赞 订阅 转发 打赏支持明镜与点点栏目”
    oldcai
        39
    oldcai  
    OP
    PRO
       1 天前
    @codehz 试一下界面里面重播一下你的声音,看能不能听见。我估计是没有录到
    基于 Whisper 3 的模型的确有这个问题,如果没有录到声音,它就会出现这些不着调的文字。

    @xljya 了解咯,了解咯。我记一下。

    @cyp0633 倒也不会。不过你会发现很多你平时说话和打字之间的表达上的差异,也是挺有意思的。
    还有就是状态不太好的时候更容易发现,因为表达就会有很多吞吞吐吐的地方,更容易发现自己需要休息休息。
    Parva
        40
    Parva  
       1 天前
    赞!走向未来!

    目前体验问题( windows11 ,版本 1.1.15 ):
    1. 词汇表 not work:可能也跟 具体 API 有关?(我用的是火山引擎)加了`Claude`,仍然识别成`Cloud`
    2. 启动延迟:我已经保持麦克风激活了,但隔几分钟没有用的话,按下快捷键需要等个好几秒才开始录制
    3. 设置界面窗口,windows11 任务栏上没有一个对应的窗口栏,我需要将其它窗口都最小化才能看到它
    4. “开机启动”那里文案还是 MacOS
    5. 提示有新版本,点击“安装更新”没有反应


    另外我也想要鼠标快捷键。
    oldcai
        41
    oldcai  
    OP
    PRO
       1 天前
    @Parva 1. 火山引擎极速版的确在 API 层面没有支持自定义词表;这两天我做一下实验,看看其他的版本有没有办法支持自定义词汇列表
    2. 是每次都这样吗?还是偶发性的?具体能不能描述一下?
    3. 目前是在右下角有托盘图标里面点设置按钮,会显示设置窗口
    4. 更新一下 APP , 应该已经修改好了
    5. 是的,这几天在搞这个新版本,现在已经好了,可以更新了

    @wang777 已经修复了,更新一下看看吧~
    HRTops
        42
    HRTops  
       9 小时 50 分钟前
    我现在给你回复用的就是你这个语音输入法但现在有一个问题就是语音识别完之后这个过程当中他是没有标点符号的这就有一个问题是我再说一段然后自己,。这个很麻烦
    HRTops
        43
    HRTops  
       9 小时 13 分钟前
    这个女人输入法的标点符号问题是不是可以用语音模型来解决有没有完整的解决方案有谁遇到过这个问题吗怎么解决的
    oldcai
        44
    oldcai  
    OP
    PRO
       5 小时 37 分钟前
    @HRTops Whisper 的确有这个问题,优化只能减轻不能避免。可以试试豆包和 ElevenLabs
    YGSC
        45
    YGSC  
       5 小时 24 分钟前
    感觉可以提高一下麦克风的灵敏度或者说增益,可以增加个相关的设置参数,我的麦克风离得比较远,在当前最新版中会被识别为静音,在豆包里倒是可以正常语音识别的
    另外对于大写锁定键可否优化一下,感觉按住大写锁定来触发识别是很顺手的,现在的版本里使用大写锁定似乎会一直大写锁定,无法在松手后取消锁定
    oldcai
        46
    oldcai  
    OP
    PRO
       3 小时 20 分钟前
    @YGSC 的确有相关“优化”,那我改改😂
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2798 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 12:38 · PVG 20:38 · LAX 05:38 · JFK 08:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.