目前该软件的主干数据主要基于BNC/COCA family lists + extras (Ver 2.0),由新西兰惠灵顿维多利亚大学语言学和应用语言研究学院(LALS)应用语言学荣誉教授创建. 包含54,591个字族,共计105,480个单词.
BNC: 英国国家语料库
COCA: 当代美国英语语料库
WorldLex: 博客、推特和报纸的词频数据
SUBTLEXus: 基于英语电影和电视字幕的词频数据库