说起英语,特别是背单词,对于我来说一直是个头疼的问题。尝试了 N 次,失败了 N 次。
前几个月迫于需要看英文文献,再次感觉到被英语拖累的感觉。便决定第 N+1 次尝试背单词。
个人对背单词的一些要求为:
查找了一圈没有符合以上需求的软件,便决定自己撸一个(其实有一个软件很接近楼主需求了,可惜不能自定义词库,且每次出现的内容重复)。
有了基础数据接下来的问题就简单了。
经过 N 天项目搞完。至于学习效果,只能说项目写的很开心。
单词学习

自定义词库

项目地址:
https://github.com/senghoo/wordai
预留 Append:
     1 
                    
                    balabalaguguji      2019-11-26 11:39:27 +08:00 
                    
                    很棒,之前我也一直想做一个自己的背单词软件,当时想的是玩游戏闯关被单词,答对一个就攻击一次对方,可以进行在线 PK 等各种游戏玩法,做了一个基础 demo 出来,后面没继续完善了 
                 | 
            
     2 
                    
                    steveway      2019-11-26 13:04:10 +08:00 
                    
                    想法很好 不过 tmx 确实不太好搞 也不一定适合自己 
                 | 
            
     3 
                    
                    senghoo   OP @balabalaguguji 这种游戏性的学习应该也不错。感觉背单词这个事情太难坚持了。 
                @steveway TMX 我是专门去买了语料库。日常口语库还有词典例句库, 感觉还可以。网上可以免费下载的质量有些低。  | 
            
     4 
                    
                    ZredoC      2019-11-26 13:45:26 +08:00 
                    
                    优秀!支持一下 
                 | 
            
     5 
                    
                    ZiLong      2019-11-26 15:15:54 +08:00 
                    
                    语音合成不知道这个项目能不能帮到你 https://github.com/CorentinJ/Real-Time-Voice-Cloning 
                 | 
            
     6 
                    
                    mrfox      2019-11-26 16:22:41 +08:00 
                    
                    赞! 
                我有个建议不知 LZ 愿不愿意实现下,非常同意单词要在语境中学 已经实现用--自然语言处理的分词、词性分析、词性还原--这步是难点啊 所以能否扩展个功能: 对一篇英语文章,提取出所有单词,然后自己维护一个熟词表,程序输出所有生词? 即: 1、提取文章中的生词(这步我理解 LZ 已实现) 2、对照一个 TXT 熟词表(每行一个单词)提取出生词写到另一个 TXT 里 想到的可能会难但可先略过的问题也提及一下: 词组理论上也可以作为单词处理,不知对比的时候有没有增加很多难度 目前我找到的程序主要是单词还原上有问题,比如 don't aren't,自然语言处理不知有没有成熟的解决办法 另一个就是原文中两个单词中间有可能少了个空格连在一起被识别为一个词了,可能需要 AI 解决?  | 
            
     7 
                    
                    senghoo   OP @mrfox 我也不是专业自然语言处理的。我直接使用的 nltk 的库,有很多现成的方法。 
                具体实现在我的代码里在`commands/__init__.py`这个文件的_sentence_to_mongo 函数里。 目前看来分词可以处理 don't aren't 之类的缩略词, 可以最终成 do 和 be 等原型,但是后面缩写成分无法还原。但是影响也不大,英语中可缩写的就那么几种情况。 对于缺少空格的情况,可以尝试对于字典无法识别的单词查找“莱文斯坦距离”最小的单词来处理。这种方法同时可以处理拼写错误的情况。这个没具体做过,只是一种想法。 从文章中提取生词这个功能我以前也想过(受恶魔奶爸的方法论影响)。但是有现成的软件可以解决我当时的需求,就没继续做了。  | 
            
     8 
                    
                    senghoo   OP @ZiLong 对于发音这块因为我没有机器可以跑模型,所以更倾向于在线服务。不过依然谢谢你提供的建议,这个项目看起来很好玩,可以做点有趣的事情。 
                 | 
            
     11 
                    
                    orzorzorzorz      2019-11-26 22:02:54 +08:00 
                    
                     
                如果可以,试试把单词放进 reload 里 :doge  | 
            
     12 
                    
                    sndnyang      2019-11-27 05:58:14 +08:00 
                    
                    不错不错, 我也弄过语境背单词的, 不过网站开发实在是弄得不好, 丑 
                另外, 语料、词库也没法解决  | 
            
     13 
                    
                    senghoo   OP @sndnyang 哈哈,我也是前端苦手,这个项目大部分时间花在改 css。也尝试过学设计,无奈审美太差,怎么也学不会。 
                 | 
            
     14 
                    
                    foamvalue      2019-11-27 10:52:36 +08:00 
                    
                    仿佛找到了背单词的新方向。 准备 N+1 
                 | 
            
     15 
                    
                    YokitCoder      2019-11-27 14:13:05 +08:00 
                    
                    之前我也根据自己的需求来定制了一个类似的记单词工具,不过一直也没有什么人用,但我一直每天坚持在用,可以说之前烂到渣的英语,现在算是有所提高了。 
                https://ex.noerr.eu.org/t/409590 https://ex.noerr.eu.org/t/604691  | 
            
     16 
                    
                    aalikes95      2019-11-27 14:19:04 +08:00 
                    
                    谢谢分享,这个很 6 
                 | 
            
     17 
                    
                    kylinC      2019-11-28 11:26:17 +08:00 
                    
                    感觉很不错,谢谢分享 
                 |