V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
344457769
V2EX  ›  Local LLM

使用 Nexa 提供的 SDK 在手机上运行端侧大模型

  •  
  •   344457769 · 3 天前 · 163 次点击

    周末在家闲着没事,编译了一下 Nexa.ai 提供的 Android 项目 demo ,在小米 15 上面跑了一下他们的 OmniNeural-4B ,这是个多模态的大模型,图片识别和声音识别都还可以,中文也能听懂。参数量小,回复速度挺快的,没有详细测试大模型的能力,用英文对话看起来还行,中文对话或者长对话能力明显很弱,有时候会重复前面的对话内容。对端侧大模型感兴趣的可以玩玩这个,大家可以讨论一下端侧大模型现在可以有什么应用场景。

    根据他们官方文档,NPU 支持需要高通骁龙 8 Gen 4 以上。

    我这边从 HyperOS 的多任务界面看加载大模型以后内存减少了 5G 左右。

    图片

    Nexa Android SDK

    Nexa Android Demo

    coefu
        1
    coefu  
       2 天前
    你测试了功耗没?从 daemon <=> UI ,如果 续航锐减的话,那就没什么意义。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2509 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 12:48 · PVG 20:48 · LAX 04:48 · JFK 07:48
    ♥ Do have faith in what you're doing.