英语词汇构词法规则库(三合一版)(亦:英语变形词规则库)
做Kindle词典的时候需要用到此库来为词头添加添加变形词,之前一直用的是 dsl2mobi 这个工具里面的 forms-EN.txt 规则集。后来发现内容不够多,只有十三万。于是又增加了两份进去。
合并的资源:
1. Webster's Third New International Dictionary Unabridged 词典中的各单词变形。之前论坛有人发过,目前帖子状态未知。
2. https://github.com/skywind3000/ECDICT 项目中,最新版(stardict.7z)数据内的各单词变形。
合并、去重后得出的数据为382344条。由于 ECDICT 项目中的数据太杂太乱以及质量参差不齐,可能会出现一些奇怪的变形词,不过不影响整体。
使用指南:
数据每行一条,格式为:
原型+冒号+空格+变形词[, 变形词2, 变形词3]
如:pollenize: pollenizing, pollenized, pollenizes
已合并去重,且全部转为了小写,调用函数搜索或者插入数据库后SQL查询时,一次判断为真即可直接返回,停止继续搜索。
顺手转了一份DB,sqlite直接调用即可:

TXT文本图:

SQLITE DB及TXT下载:
链接: https://pan.baidu.com/s/110eWGQeuWZUJXd0v6vi5Eg 提取码: 8xfh