目前正在做和打算做一些乱七八糟的东西。
比如给 Gemini CL 包了一层,可以通过 RESTful API 和 MCP 针对一个 Git/GitHub Repo 进行提问:
https://github.com/ihainan/Gemini-CLI-Git-Ask (一个 Demo:
https://gemini-demo.ihainan.me/)。一个每日自动爬取、解析、总结学术论文的应用,虽然看到过类似的一些应用,但是我支持的论文源相对丰富( arXiv 、Keyword 、Zotero Collection 、GitHub Repo ),以及 PDF 解析和总结过程融入了多模态模型,生成的总结图文并茂,读起来很舒服,可以针对论文内容跟 LLM 提问而且返回的结果也可以带图,也加入了 MCP 的支持(比如我上面这个,可以快速询问论文对应的代码仓相关的问题)。
正在基于 Gemini CLI 正在做一个类似于 Cursor Web 的应用,因为移动端 SSH 连到远程服务器使用 Gemini CLI 的体验很糟糕。
以及想训练一个支持海南话翻译成中文的 Whisper 模型,爬取了不少数据,正在建立一个海南话音频语料库。