V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  NoOneNoBody  ›  全部回复第 19 页 / 共 230 页
回复总数  4588
1 ... 15  16  17  18  19  20  21  22  23  24 ... 230  
131 天前
回复了 dasenlin 创建的主题 NAS 求推荐 Nas,可能我的要求比较刁钻
@dasenlin #4
这描述,是笔记本需要一个大外存?台式机不用拔插啊
重点是:人家不能强制用户安装 app

除了那些本来就主要服务于 app 的,如 SNS
防盗版一向都是行政手段最有效

技术手段也就是联网(pdf 联网才能读取部分,保证完整),例如联网下载一个自定义字体才能解读字符
不过一切技术手段都敌不过录屏、截图、拍摄……
132 天前
回复了 ltfree 创建的主题 程序员 最近被 OCR 识别搞得头痛
识别率如何是技术问题,但部署成功失败,就是管理问题了,不能只听外包的
opencv 本身不带 ocr ,它只是读图,以及方便定位(图片上的位置)、变换,它只是依赖的部分

目前国内用得广泛的就是 paddleocr ,这货最大问题是依赖问题,例如 numpy 2 、多环境部署都有问题
例如 opencv 版本比较新,opencv 依赖的 numpy 也新,那依赖较旧 numpy 版本的 paddleocr 就会冲突
我建议你就是找那些单独打包的,不太需要另装依赖的(如 docker ),以 api 方式跑,部署会比较简单

如果外包公司提供的在 windows 跑得比较顺,盲猜跟微信 ocr 有关

如果是对物理静态文件的 ocr ,一般都不太多问题,按上述方法做就可以了,github 上搜 umi ocr ,很多项目
如果是针对 stream ,例如网络传送、视频流、摄像头采集,没有物理文件的,这个才复杂些
133 天前
回复了 caizhenbin 创建的主题 程序员 哪个开源模型最擅长翻译?
口碑最好是 deepl ,但我没试过

用 AI api 翻译的话,你要给一大段提示词(就是任务的说明描述),逐条作出限制
举例:韩国综艺字幕
你就要说明:
提交的是一个韩国综艺节目字幕,人名、地名、专有名词符合韩国文化,人名多数为韩国名人,翻译要汉语观众容易理解,每行不应太长,需要口语化,同一个人名包括不含姓氏要翻译成一样,只返回翻译结果,格式要求……等等
使用多轮对话模式,每次提交都要带上这段提示词,可能的话,提交内容要有部分和上一个提交重合,这样才能维持整个翻译结果划一
有字幕就不是生肉了
potplayer 可以实时翻译字幕,只是需要 api 或者 google ,且可能要搞定翻墙,学习的话双字幕显示就行了
@bettercallbalds #3
lmp 在第一张图的字幕里面
@misaka233 #48
首先要弄好兼容英语输入,这个弄好其他就好办了,github 有中英混输的方案
直接引用日文词库到当前键盘方案,因为日文词库带键的,如“赤 aka”,不过问题是想用日语汉字需要在繁体状态,不然 opencc 会全部转成简体
134 天前
回复了 Kartone 创建的主题 Android 安卓手机的剪贴板有隐私泄露风险吗
剪贴板是“历史遗留问题”,不仅安卓,任何平台都会,只是哪家限制做得更好的区别
剪贴板就是跨应用共享信息,自诞生起就没考虑过隐私或者权限,至今都难以推倒重来,完全靠用户的安全意识,只是手机隐私比桌面平台更多,受到关注而已。桌面软件那些自启一个驱动式常驻,读什么都可以呢
微软已经不差了,感觉你需要很多现代词或网络词

说到底就是词库和智能识别提示词、以及输入法本身是否卡顿
后者靠口碑
前者有两点:
1. 中文词库特别是现代词需求不高的用 rime 或 五笔,五笔求快,而 rime 没有智能识别,主要靠养和加词库
2. 跨语言(中文圈),例如涉及日语汉字、汉语地方语等多语种同时输入,几乎只有云输入法和 rime ,其他不联网纯本地输入法的混输,难以和 rime 一战

rime 本身词库并不强大,但它的词库拼接能力却是赛高,只要自己能找到词库,且很多前人努力造了词库
我是双拼,然后将中英日韩粤都拼在一起混输了,不过就是“乱”,本来还想拼接英汉翻译词库的,就是提示词太多放弃了,不过我本身输入很慢,对多语种需求远超过速度需求,所以不介意翻页找词

好像现在已经有三方造了智能匹配接入 rime 了,但没试过,不敢擅动现在的配置
134 天前
回复了 Aruis 创建的主题 问与答 实时视频翻译英译汉
实时需要英语字幕,用云翻译的 api 就行,一些播放器就有,google 翻译可以免注册 api
没有字幕的话,需要语音生成英语字幕,github 上搜有相关项目,因为是跑本地模型,需要机器有一定强度
这样的问题只会开辟战场,没有结论的
上传是肯定的,用于云学习
而“安全”问题取决于上传后怎么用,所以实际就是问“腾讯将上传词用来干什么?”,这个问题会有结论么?
没事,我一直都分不清 1984 和 2024 ,照样活
135 天前
回复了 SOSdanOffical 创建的主题 Python 使用 pandas 读取 csv 遇到了一些问题,求教
你的 csv 不规范也没办法,例如双引号内还有双引号
建议先预处理 csv ,再读入,例如将分隔符逗号前后的双引号换成其他不会歧义的字符,然后 read_csv 指定 quotechar=特殊字符 参数

其实这种数据,在生成 csv 时改一下分隔符,例如不用逗号用分号,以后处理就简单了,但现在没法回头了
136 天前
回复了 Livid 创建的主题 V2EX 做个小调查:无限滚动 or 翻页按钮
移动设备应该喜欢无限,但桌面设备应该更喜欢翻页
我是帖子喜欢无限(已经通过脚本实现),因为回复数量毕竟有限,很多是对话式的,101 楼翻页就很难联系前文看
而,首页或节点的主题列表不太喜欢无限滚动,因为各条是独立的
@MissAW #13
我从奔腾到 12700 ,虽不能说每代都用过,但隔几代 U 的 win 本都会接触到,我几乎全是华硕本,也用过东芝、dell
笔记本对专用人员,例如开发者、文字工作者,整体环境是比较干净的,但日用的人就未必了,而且新装系统通常都会顺畅个把月,然后随着文件碎片化、各种缓存、文件随手存、系统更新等等,就开始不顺了

笔记本的网卡是占用 CPU 的,吞吐量不大的时候,没什么感觉,但随着大流量,CPU 、GPU 、ram 都在消耗
windows 进入 win8 时代后,它已经不再是以前的 client OS ,已经算是一台小型服务器,系统已经常驻了大量后台服务支撑着一些日常工作,很多软件也不再是孤立,需要联合运作,还有个问题是找兼容老机器的软件都困难

现代的不少网站和软件,都是 web 套壳,安装动辄几百 M ,运行占百 M 内存都算“省”的,比以前纯 client GUI 更耗资源,想想当年几 M 内存就能跑个音乐播放器……古董机跑几个现代软件就吃力了

另外,firefox 多开 tab 表现确实比 chromium 系好,但流媒体则是后者较好,主流视频站或者视觉系站点都会针对 chromium 系优化,firefox 就未必兼顾了

个人建议是老人家不要折腾电脑,大平板更合适,如果退休或者临近退休,本职也不是电脑不可或缺的,基本上就会越来越少用电脑了。我见到 60+用电脑最多的是炒股用来看盘的,😊
这样看不会

1. 这两句顺序调换就可能会了
2. 如果当前目录内有个 models.py 可能有问题

不建议用 和 module 同名来命名 .py 文件,组织项目文件时就要考虑这点
@MissAW #6
我的建议就是换好的,“该换了……自己留着……”,你无视而已,无视自然就理解为“说些没用的”

你正文也没写“学习”,只是写“用”,这怎么看是两个概念吧?已经不是歧义了,也算臆断?
老人家用的东西,舒心更重要,我反正给老妈买的手机比我自用的还好,就是基于这点给你的建议

你如果只是抱着某个想法让别人肯定,那别人说什么不同建议你都是听不进去的
如果某国年通胀 800%,你接受用该国货币结算么?
@MissAW #2
你试试开一堆网页、流媒体视频试试,老人家平时都在读纯文字文章么?写代码?
1 ... 15  16  17  18  19  20  21  22  23  24 ... 230  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3357 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 53ms · UTC 10:37 · PVG 18:37 · LAX 03:37 · JFK 06:37
Developed with CodeLauncher
♥ Do have faith in what you're doing.