gemma2 2B 一键整合包（2.3G），能力超过 gpt3.5， cpu 也能跑得飞快

2024-08-07 17:11:39 +08:00

mumbler

不用 GPU ，在 12 代 i7cpu 也能跑出 20+token/秒的速度

无需任何配置，开箱即用

支持 win10,win11 ，mac11+

图形界面，不用自己安装 webgui

自带 embedding 库，支持上传 pdf,docx,txt,md 创建知识库

文档翻译工作流，一次翻译整本书

知识树，从大模型压榨数据

离线使用，大模型基础功能永久免费

2125 次点击

所在节点

7 条回复

asaworld

2024-08-07 20:04:51 +08:00

看着不错，有没有老哥测试下

zhs227

2024-08-07 20:17:12 +08:00

mac 11.6.1 启动报错，大概就是执行模型加载错误了

zhs227

2024-08-07 20:26:17 +08:00

"/Applications/FlashAI B2.app/Contents/Resources/flashai_server" -model gemma2:2b-instruct-q4_K_M -path "/Applications/FlashAI B2.app/Contents/Resources/embeddings"
zsh: segmentation fault "/Applications/FlashAI B2.app/Contents/Resources/flashai_server" -model -pat

mumbler

2024-08-07 21:00:16 +08:00

@zhs227 第一次运行有可能失败，重启一下试试

zhs227

2024-08-07 22:30:56 +08:00

启了无数次都是一样的。报 segmentation fault ，应该是哪里内存越界了。

mumbler

2024-08-07 22:48:46 +08:00

@zhs227 可以在 flashai.com.cn 主页扫二维码进交流群，帮你看看

Pepsigold

2024-10-22 16:43:26 +08:00

3090 部署的话，并发支持多少？

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.