摘要:介绍了3种用于文本聚类的特征选择方法:文档频度、单词权、单词熵.用一个中文文本语料库对这3种特征选择方法进行了比较实验,实验结果表明在文本聚类中单词权的特征选择方法具有最好的选择结果.
龚静, 曾建一. 文本聚类中的特征选择方法[J]. journal6, 2008, 29(2): 39-41.
GONG Jing, ZENG Jian-Yi. Way of Feature Selection Based on Text Clustering[J]. journal6, 2008, 29(2): 39-41.