月饼 TV 的技术架构

2 天前
 HaroldFinchNYC

https://github.com/MoonCakeTV/MoonCakeTV

在构建 月饼 TV 的过程中,我的目标是:为用户提供快速、稳定的搜索体验。但背后涉及的数据源复杂、数据量庞大,如何处理、存储和查询,是一套需要不断优化的技术工程。本文将介绍目前的技术架构和关键优化步骤。

数据来源与采集

所有数据都来自各类资源站。最初我通过手动采集,但很快转向了自动化。

搜索的痛点与演进

数据处理流程( Pipeline )

目前的完整数据流是这样的:


数据源 ---> Temporal Worker ---> Cloudflare D1
          ---> Temporal Worker ---> Meilisearch
          ---> Cloudflare Worker API

搜索 API 的优化

我在 Cloudflare Worker API 里加了一些增强功能:

这样一来,用户体验基本可用,同时避免了服务过载。

基础设施配置

挑战与展望

目前系统仍然有一些问题:

未来我考虑:

总结

月饼 TV 的技术架构虽然还在不断打磨,但已经走过了一条从“能跑”到“能用”的路:

这套体系支撑了每天百万级的数据更新与快速搜索,积累了不少经验。

大家有什么意见和建议,请不吝赐教

1062 次点击
所在节点    分享创造
3 条回复
Aprdec
2 天前
厉害
yb2313
1 天前
我记得之前没有镜像, 现在有镜像好多了. 另一个 moon 好像闭源了, 我还找了备份
guoziyang0033
1 天前

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1159831

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX