做这个也是因为工作原因,上面一个需求就提出了要语音搜索语音朗读,虽然我觉得输入法以及浏览器的朗读已经是比较完善的了。但是还是只能干,顺便尝试一下 vibe coding 的魅力!
语音朗读 wiki 是有一个现成的插件的叫做 wikispeech ,但是需要自己部署 TTS 后端,想想自己的小鸡没有显卡,估计扛不住国语以及粤语的快速转换,所以我瞄准了设备本身的 TTS 能力,一通 vibe coding 后就实现了调用 Web Speech API ,不过不得不说移动端的这个 Web Speech API 支持是真差。
这个其实我觉得真没必要,架不住真有这个需求。利用 mediawiki 扩展的骨架项目,一小时的 vibe coding 就做好了,claude sonnet 4 真牛!
都是小工具,不过确实都没现成的,做了也就发出来分享一下。
https://github.com/bobo4629/Wikispeech_browserTTS
https://github.com/bobo4629/WikiVoiceSearch