三年后再起航,网文推荐系统 推书君,致力于解决书荒

2019-10-15 13:17:47 +08:00
 shidenggui

三年前在 v 站发过一个贴,介绍自己开发的网文推荐系统 https://ex.noerr.eu.org/t/308827

当时还是非常简陋的一个单网页托管到 daocloud,数据都是预先算好存到 redis,后面把功能挪到了公众号上,但是过了几个月 daocloud 不再允许托管容器,网页就挂了,再后面公众号出了点问题,一直没有修复。

结果不知不觉就过了 3 年多,这三年的时间发现网文的推荐没什么太大的进展,书荒还是很痛苦,正好之前一段时间有空,就跟朋友一起重新花了点时间开发了网站 推书君,希望能做的更好一点。

比较感动的是时隔 3 年重启公众号之后,还有关注者发消息给我说,等了那么多年终于又可以用了,这几年还是感觉我这个比较好用,找书很方便。后面私信聊了一下,竟然是 3 年前在 v 站发帖而关注公众号的 v 友,突然感觉自己还是做了一些稍有价值的东西。

起名叫推书君,是觉得 ”推好书,只需要一个理由“。网文最棒的地方就是天马星空的想象力,正因为如此网文有各种各样的种类,每个人的口味也各有不同。有很多好书,作者投入了很多心血,因为不善于宣传、或者网站推广位有限,没有传达到对应的受众,导致作者难以为继,因此太监。作为读者,遇到一本对口味的书,结果因为成绩不理想而导致作者放弃,常常感觉很可惜,瑰丽的世界才刚刚展开一角,就落下了帷幕。

网站目前还在起步阶段,很多功能也不完善,如果大家有任何建议欢迎反馈,为此建了一个 tg 群( 传送门 ),也欢迎大家过来一起讨论网文。

之前在知乎发的一篇介绍推书君功能的文章,包括相似小说搜索,标签检索等 推书君功能介绍

网站链接: 书荒_网络小说推荐 - 推书君

推书君公众号:

首页截图:

30208 次点击
所在节点    分享创造
77 条回复
balabalaXMX
2019-10-18 17:53:22 +08:00
所以楼主的数据是哪里获取?爬虫吗?
imxieke
2019-10-19 14:06:04 +08:00
同问楼主数据来源 另外请教楼主敏感数据怎么处理的?
就向 #9 老哥说的书, 很多根本就不知道的不合规怎么过滤掉?
ningque1993
2019-10-20 22:08:08 +08:00
可以起点的书还是要收费看,白嫖看书习惯了
shidenggui
2019-10-23 14:05:32 +08:00
@helloh1n1 多谢指教,现在算法还很简单,就是手撸的协同过滤,后续会花时间在研究下。
@imxieke @husiyu1994 都是公开数据啊。至于敏感数据的话,本身爬的网站就不会有敏感数据。
wolfan
2019-10-23 14:09:03 +08:00
习惯性笔趣阁白嫖。。。
倒是想一款可以过虑贴字内容的 chrome 应用。
Kafurtan
2019-10-25 11:47:15 +08:00
打不开呢
shenyangno1
2019-10-26 06:53:33 +08:00
很棒!赞一个!
pikaconan
2019-10-26 20:58:27 +08:00
看到刘慈欣,遮天,我就收藏了
ty89
2019-10-28 10:30:53 +08:00
爬虫的话,楼主可能要注意了
banliyun
2019-10-28 11:18:11 +08:00
很棒!赞一个!
LongZeGaLi
2019-10-28 12:33:52 +08:00
已关注
yyaadet2002
2019-10-30 18:07:51 +08:00
楼主,加个微信,看看能不能合作。我是不俗,分析一下的作者。wx: yyaadet2003
zeromake
2019-10-31 03:55:50 +08:00
@shidenggui
果然是大佬,自己强行去看推荐系统实战,根本看不懂,不如说主要是数学拖了后腿,有什么合适的补数学的方法吗?
shidenggui
2019-10-31 09:29:17 +08:00
@zeromake 我数学也不怎么样,网站用的也是里面比较简单的一些算法。毕业后的数学学习也就是后面看过一本微积分的教材,稍微捡起了一点。
helloh1n1
2019-11-01 15:01:21 +08:00
@shidenggui 因为一开始你的数据是爬虫来的,自己没有保存个性化的用户数据,用协同过滤类的方法很容易吃数据稀疏问题的亏。所以我建议在早期推荐中用基于强化学习的方法试试,比如 bandit 模型。强化学习框架简单,应该很好理解。
creanme
2019-11-04 10:06:07 +08:00
这个和优书网有啥不同?
lzxgh621
2019-11-04 10:07:26 +08:00
随便看了看,感觉就是起点的月票榜 /点击榜,没有特别的内容。
echo1937
2019-11-04 10:20:42 +08:00
最近有没有什么爽文可以看的,有点提不起劲。
Removable
2019-11-06 10:14:59 +08:00
不错不错,先收藏了再说
shidenggui
2019-11-06 12:54:13 +08:00
@creanme @lzxgh621 目前比较好玩的是标签系统和相似小说推荐。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/609492

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX