mili100 最近的时间轴更新

mili100

V2EX 第 185096 号会员，加入于 2016-08-02 22:05:55 +08:00

mili.one

福建厦门 Telegram

milkey_tan GitHub

mili-tan

199mjJagMtP6kQJ4pRymXeGACKsF4oF3F9

mili100 提问技术话题好玩工作信息交易信息城市相关

根据 mili100 的设置，主题列表被隐藏

二手交易相关的信息，包括已关闭的交易，不会被隐藏

mili100 最近回复了

3 天前

回复了 bluefish07020323 创建的主题 › 程序员 › 如何在 Web 页面上实现类似 Manus 的运行效果

开一台虚拟机，然后 noVNC

38 天前

回复了 mili100 创建的主题 › Local LLM › 我做了一个 Ollama JSONL 批量推理工具，除了 Ollama 还支持 Deepseek 等 OpenAI Style 兼容 API

@coefuqin 我的工作站是 3090 单机单卡，用不到 Tensor Parallelism 。Ollama 的模型管理非常方便只需要 `ollama run`就搞定了，我也希望生成一些 Rejected 用的垃圾还要花上几十分钟来搭环境。我觉得 Ollama 很适合我的用例，所以什么不呢。

39 天前

回复了 dashsoap97 创建的主题 › 程序员 › 现在哪个模型最好用?怎么付费?个人感觉是 Claude 但是苦于无法付费

对于使用 API 开发应用，也许目前质量和性价比的最佳平衡还是 Deepseek-V3-0324

39 天前

回复了 laijh 创建的主题 › Local LLM › 个人电脑，适合跑哪个本地大模型？

内存足够的话也许试试看 Qwen3:30B-A3B ，激活参数仅 3B ，品质接近 32B （虽然对于 16G ，iQ2 UD 量化可能都有些捉襟见肘）

62 天前

回复了 idblife 创建的主题 › Local LLM › 有没有能 mac 上直接跑的多语言翻译 LLM？

https://github.com/mozilla/firefox-translations-models

62 天前

回复了 villivateur 创建的主题 › Local LLM › 本地部署视觉大模型，用于 OCR 中文文献+翻译，最好的模型是什么？

https://olmocr.allenai.org/

143 天前

回复了 mili100 创建的主题 › Local LLM › 为 Ollama 添加 APIKEY 鉴权的最简单的方式，防止 Ollama 直接暴露在公网被滥用

@gzlock 意指站在巨人的肩膀上，或者是羊驼的背上（？

@musi Ollama 从 [v0.1.33]( https://github.com/ollama/ollama/releases/tag/v0.1.33) 开始就已经支持并发和同时加载多个模型了，已经足以能够胜任一些中小规模的生产环境了

148 天前

回复了 jhytxy 创建的主题 › Local LLM › q4 量化的大模型能比原版全精度的差多少？

https://github.com/ggerganov/llama.cpp/blob/master/examples/quantize/README.md#quantization

167 天前

回复了 mrleft 创建的主题 › Local LLM › ollama 如何手动下载模型？

或许变通一下
https://ex.noerr.eu.org/t/1104266

199 天前

回复了 abc634 创建的主题 › Local LLM › 请教，关于显卡内存

也许可以尝试下 Ollama/llama.cpp ，没有显卡但是有高性能 CPU 纯 CPU 推理只要有足够的许多模型都能够运行的，特别是对于激活参数较小的 MoE 模型（比如 Deepseek ）。
在我的环境下（ R9 7945HX + 96G RAM ） Deepseek-v2.5-1210 IQ2_XS 能有几到十几的 TPS ，奈何没有更大的内存，我觉得只要有 256G RAM Q4_0/Q4_K_M 也许也是没有问题的。
在 X 上也有人纯 CPU 成功运行起来了 Deepseek-v3 而且似乎还不错： https://x.com/nisten/status/1877276141905387565

» mili100 创建的更多回复