做了一个阿里云盘的搜索引擎

2023-09-01 08:25:41 +08:00
 Justin3go

做了一个阿里云盘的搜索引擎,体验地址pan.justin3go.com

技术细节可以看这两篇文章

  1. 你来你也可以做一个网盘搜索引擎
  2. 浅谈搜索引擎原理

简化了很多搜索引擎的复杂策略,但也算是一个微型搜索引擎了

12457 次点击
所在节点    分享创造
120 条回复
sunnicholas
2023-09-04 16:30:21 +08:00
搜索的关键字再好好优化一下,匹配度有点差太多,体验会很差,哪怕没有结果返回也不希望看见一堆毫不相关的搜索结果
Justin3go
2023-09-04 17:27:32 +08:00
@sunnicholas 感谢反馈,后续优化
GeekAsher
2023-09-04 21:35:36 +08:00
👍速度挺快,就是感觉资源不够多,自己一直在用的一个网盘聚合搜索网站,资源稍微多一点:pan.qianfan.app
Justin3go
2023-09-04 23:12:37 +08:00
@GeekAsher 确实是一个痛点,后续会逐步迭代优化爬虫策略以获取更多资源
GeekAsher
2023-09-05 00:50:04 +08:00
@Justin3go 直接上分布式爬虫,暴力猛爬,资源量就上来了😁
Justin3go
2023-09-05 09:22:43 +08:00
@GeekAsher 没钱整不起这么多服务器资源
justincnn
2023-09-05 12:46:27 +08:00
这速度太快了,厉害啊,堪比本地 excel
Justin3go
2023-09-05 13:50:21 +08:00
@justincnn 哈哈哈哈,你这比喻,妙啊
GeekAsher
2023-09-05 16:20:51 +08:00
@Justin3go 也是,估计也不好盈利,买点代理池玩玩也行吧
Tyrant1984
2023-09-05 19:19:45 +08:00
好强力!感谢~~
Justin3go
2023-09-06 11:49:52 +08:00
@GeekAsher 目前感觉优化爬虫策略效果大于增加资源,因为从后台来看爬取了太多无用的资源进行分析了,互联网的网页太多了,得找一个合适的策略进行提前过滤,比如最简单的根据 url 后缀判断是不是静态资源,是就跳过爬取之类的就可以节省很多资源
Justin3go
2023-09-06 11:50:34 +08:00
@Tyrant1984 hhhh ,喜欢就好,请耐心等待,它会变得更好的
silverzidan
2023-09-06 12:49:46 +08:00
@Justin3go #72 也可以从电报群组中获取一部分
Justin3go
2023-09-06 14:01:37 +08:00
@silverzidan 可以,是一个不错的地方
proxychains
2023-09-07 13:48:55 +08:00
这个搜索响应速度好快
amlee
2023-09-18 13:50:05 +08:00
@Justin3go 老哥可以推荐一些 es 的学习资源吗?快速上手的那种
eggt
2024-03-27 16:24:21 +08:00
今天看了下,网站已经挂了😂
Justin3go
2024-03-27 16:33:36 +08:00
@eggt #117 重构了一个新版本,https://ssgo.app/ ,不对啊,我记得我重定向了的😂
eggt
2024-04-01 13:18:45 +08:00
@Justin3go 哦哦,这个可以打开了,但是 iPhone 上用 safari 使用,点击搜索结果,只能唤起阿里云盘客户端,不能在客户端内获取出来结果
horaceray
2024-04-30 10:42:24 +08:00
你好请问为什么打不开网站呢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/969938

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX