V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  fbichijing  ›  全部回复第 6 页 / 共 11 页
回复总数  220
1  2  3  4  5  6  7  8  9  10 ... 11  
2023-08-29 16:33:58 +08:00
回复了 spicy777 创建的主题 生活 羊后失去味觉了
@vanityfairn 你们两个,斗志斗勇啊。
权做抛砖引玉。
lxml -> xpath 选择器
beautifulsoup -> CSS 选择器
解析的话一般来说是这两种选择一种,解析规范的 html 大多数情况下多数使用这两种选择器而不是正则。一些特殊情况和字符串处理则使用正则。印象中 lxml 底层是使用 C ,而 beautifulsoup 是 python 实现,似乎是 lxml 效率更高一些。两者选择自己喜欢擅长的那种就可以了。
爬虫的难度如楼上所说,是如何获取到网页源码和参数构造,反而解析和入库是比较简单的步骤了。
2023-08-27 20:06:30 +08:00
回复了 iorilu 创建的主题 程序员 无意中学了点 powershell ,惊了, 这东西是不是低估了
就好比在当前的时间节点下处理 Excel ,不去使用 pandas 之类的,还去学 VB
同意一楼和二楼的说法。“性价比低”。Linux 下的很多命令要比 Windows 下简洁,还有 alias 之类的可以自定义各种符合自己喜欢的命令出来,Windows 要实现相似功能,贼麻烦。写 python 或者每个人自己熟悉的脚本语言不香吗,在不同平台上大多数写法都差不多。又为何一定要把自己限制死在 Windows 下?
2023-08-25 10:28:28 +08:00
回复了 Tiller 创建的主题 程序员 李跳跳收到腾讯的律师函,无限期停止更新
@lincanbin

# 378
> @moxuanyuan 是不是违法确实很难定性。就我个人而言,我更倾向于认为他违法。
你可以联系李跳跳的作者,让他顶住压力不下架,这样过段时间就可以从律师函升级为法庭诉讼,是不是违法到时候就知道了。
----------------------
251
2023-08-24 10:03:56 +08:00
回复了 qpwoeiruty 创建的主题 程序员 第一个独立开发的 APP 终于上架 google play 了
> 数据安全
此应用可能会与第三方分享这些类型的数据
照片和视频
此应用可能会收集这些类型的数据
应用信息和性能
数据在传输过程中会加密
数据无法删除
-----
看到这些以后,总觉得不太对......

是不是一个默认就是使用此类型的应用,图片就默认没有隐私权了?是不是默认都是这种场景:修图片之后,就意味着要发到社交平台,所以"此应用可能会与第三方分享这些类型的数据"是一种不那么侵犯用户权益的行为?而没有这种场景:用户修图片,只是自己需要,修了以后并不想发布。所以"收集和分享"算是"免费"使用的一种"代价"这个意思吗?
就功能上来看已经是十分之多了。
我感觉有点秘籍恐惧症,还是喜欢每一个 app 都只完成它的主体功能。主体功能很优秀额外的就显得相对不那么重要了。就像函数一样。
666 肯定是要扣上的。
就我自己来说,我还是最喜欢类似 putty 这种软件。
每一种常驻于我们电脑或者手机里面的软件,都带有其他软件所无法替代的功能。“今日历”是因为“全”所以必不可少无从替代吗?设身处地地思考一下,如果我需要的是“今日历”中的其中一个功能,我大概会选择一个仅带这个功能的相关 app 。当需要的功能可能要 >=3 的时候,才可能删除掉原来的使用“今日历”一把梭。
------
“中英文美句” 这个和日历存在联系吗?......
@ncepuzs #12 “为什么要在意国内访问和百度收录?” 说得对啊。使用百度搜索就想瞎子摸象,有时候要找到目前软件的官网都难。即便找到了还担心是不是到了某些镜像站要掉坑。后来就养成习惯基本不再使用百度搜索(可能只剩下 5%)。

你完全可以在推广的时候将自己的网址贴上就行了。Github 在国内好像访问也可能存在问题,Github pages 都能正常访问吗?疑问?

放网站的话,搞一个可以访问 Google 的服务器应该也花不了多少钱,也没有那么贵的流量限制。当然,延迟就相对比较高了。如果写的文章能经受审核,随便找个国内的平台写就完事了。还不用担心其他的各种乱七八糟的事情。
2023-08-09 01:28:01 +08:00
回复了 SoyaDokio 创建的主题 程序员 请教使用 Joplin 的 V 友们如何多端备份
对于 Joplin ,首先关于你说的多端备份问题,我的使用场景可能和很多人不太一样,所以备份方式也有些不同。

Joplin 作为开源软件,个人十分喜欢,因为不用顾及到破解啊之类的内心或多或少的内疚感,另外也没有隐私方面的问题。但是说到软件本身——很多人都用它来保存 markdown 类型的笔记——就不得不提它的文件保存方式。它和大部分其他 markdown 阅读器不同,使用数据库的方式来保存笔记,其他很多都是单文件格式的。基于数据库的模式,我猜测可能是这种模式可能是对于软件的搜索和显示等有其优越的地方。但是,这种模式却有着比较大的问题,造成了一些其他方面的不便。

为什么 .txt 这种文本格式的使用频率如此之高,其中一个最简单的原因是这种格式的文件简单,不容易出问题,而且几乎兼容所有系统。随便往别的系统一丢,很有可能都能够正常读取出来。而 .txt 的问题也很明显,对于代码之类或者 latex 等都不能很好显示,至少对于人类的阅读不理想,所以很多写程序的人都喜欢使用 markdown 等这种带有 css 显示的来保存。但文件的 markdonw 的保存形式,也有着类似 .txt 的优点,在没有安装 markdown 显示器的电脑,虽然没有那些漂亮的渲染,也大部分情况下能正常地阅读。而基于数据库的话则无法做到这点,它某种程度上抑制了文件的可迁移能力。简而言之,你要在别的电脑上阅读这部分笔记,就必须装上 Joplin ,不然几乎无法读取。

另一方面,Joplin 的文件比如图片都是以导入的形式在管理。自然也没有但文件模式灵活。云端的备份我记得很多云的备份软件都是可以基于不同字节来进行同步,如果是这样的话就还好。如果是有改动就备份整个文件的话,流量方面就够呛了。

可能因为其不够灵活,所以我个人在尝试过这个软件之后,不太想将笔记放在上面。我觉得单文件形式更加自由一些。但是,我将 Joplin 的使用场景放在别的方面。

我发现它的网页剪切功能还是相当不错的,在经过多次尝试对比之后,如果以 100 作为满分的话,它的网页剪切功能个人觉得大概有 65-75 分。而 Chrome 的插件 SingleFile 的效果个人觉得有 85 分或以上。Single File 的保存效果虽然好,但是文件一多,不利于这些单文件的阅读,索引和搜索。不过,如果将这两者结合起来的话,就有相当不错的效果。

SingleFile 保存页面(因为可以选择想要的保存,很多情况下效果比 Joplin 的好) >> 一段时间文件多了之后 >> 打开这些文件 >> 通过 Joplin 插件将其导入到 Joplin 软件中归类,加标签和索引。

效果出奇的好!

我把库做在 U 盘上,通过 Joplin 将库文件链接到这上面。即插即用,一段时间后使用 FreeFileSync 备份到家里的电脑里面。个人觉得挺不错的。

稍微吐嘈一下,Joplin 的全屏阅读模式效果不太理想,软件的工具栏等占据了太大空间,在小屏幕的电脑上面,阅读的空间个人觉得还是太小了一些。
2023-08-06 21:45:46 +08:00
回复了 honmaple 创建的主题 NAS 绿联 Nas 最近对 ssh 的更新让我很不舒服
群晖的 quick connect 要验证手机号之后我就不用 quick connect 了。
我看我自己的东西还需要给你审核,或者说提供让你追踪的方式。开玩笑吧。
这时候张学友那句经典的话就出来了。
2023-08-06 02:53:56 +08:00
回复了 sinxccc 创建的主题 Vim VIM 的作者 Bram Moolenaar 过世了
有的人死了,他还活着。
2023-07-13 11:14:14 +08:00
回复了 hobbyliu 创建的主题 分享发现 帮运维同学撸了个 crontab 表达式在线生成器的轮子
撸了个....轮子....
难道我的阅读理解不合格?产生偏差了??
2023-07-04 01:09:46 +08:00
回复了 aim467 创建的主题 程序员 哪种语言编写的程序转成可执行文件比较方便(exe / binary file) ?
你提出的问题和描述似乎不太相同啊。

如果是 exe 的话不是基本上圈定 C, C++ 了吗?独立的可移植的 exe 文件。

如果是基于命令行进行操作的工具,那我觉得使用 python 写命令行是十分舒服的。
写成一个 package ,自定义喜欢的全局命令,只要存在 python 环境自己安装一下就能全局使用了。现在的服务器基本上都预装有 python ,所以就像是写一次可以各个地方运行了。

因为平时经常有这需求,而这种全局命令的文件格式又十分固定。所以我写成一个十分简单的 package 放在 pypi 上,方便自己使用......用来方便自己构建全局命令。

------
以下只是我自己平时的使用方式,因为自己写的这个 package 很简单,只是作为举例之用。

pip install package-gen

然后提供了一个全局命令:pk-gen

比如:
pk-gen mytest

就生成一个 package 的模板,往里面定义自己想要的全局命令,然后将实现代码敲出来就行了。比起去弄 gui ,全局命令这方面写起来就很舒服。
无法证明。想要的只是结果,xxx 病只是一个说辞。鸭脖也需要人给予定义,自己是无法说明的。
2023-06-28 00:03:45 +08:00
回复了 chenqh 创建的主题 Python sphinx build 太慢有什么办法提速吗?
这么久吗?!
虽然一直在使用 sphinx ,但是平时的文件肯定没有这么多。
我记得 sphinx build 的时候会检测哪些文件有更改,你每次写的时候都更新了那么多的文档的吗?
2023-05-31 12:50:22 +08:00
回复了 HoseaDev 创建的主题 程序员 有没有类似按键精灵的抓图软件
@airbact 估计他想说的功能有以下几个方面:

- 截图,我记得是获取了 printscreen 的截图,好像还能在这个上面继续截取和保存,太久没用了,记不清楚细节
- 捕捉特定位置象素的坐标和 RGB 数值,抓抓里面可以捕捉并且让按键精灵很容易导入。可以记录 10 个点。

这两个功能是用于位移到指定位置和以图找图所用。是不是还缺少什么?

貌似 python 也有相关库可以完成这些功能,并且可以后台运行,不过没有实际尝试,不知道效果是否很好。一些简单的需求用按键精灵就会发现思维十分简单,解决方式十分简便粗暴!缺点就是多机适配相对麻烦。
如果能够设置密钥+密码登录的话,我觉得很难暴力进去吧。

或者你可以配置防火墙加一个 IP 白名单,只是动态 IP 的原因你得不时去更新配置,比较麻烦。当然,你可以通过许多方式去改善这个行为。
1  2  3  4  5  6  7  8  9  10 ... 11  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5318 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 45ms · UTC 08:30 · PVG 16:30 · LAX 01:30 · JFK 04:30
Developed with CodeLauncher
♥ Do have faith in what you're doing.