1) large-scale text categorization

大规模文本分类
1.
Feature space is high dimensional and sparse in text categorization, the process of dimension reduction is a very key problem for large-scale text categorization.
针对传统特征提取方法的不足,提出采用基于迭代的CCIPCA和ICA特征提取方法处理大规模文本分类问题,实验结果表明降维提高了分类效果。
2) Large-scale classification

大规模分类
3) text classification rule

文本分类规则
1.
Rough set text classification rule extraction based on CHI value;

一种基于CHI值特征选取的粗糙集文本分类规则抽取方法
2.
Aimed at the text classification problems in data mining,a text classification rule extraction method is proposed based on genetic algorithm and entropy for rule discovery called Genetic-Miner(GM).
针对数据挖掘中的文本分类问题,提出了一种基于遗传算法和信息熵的文本分类规则抽取算法Genet-ic-Miner(简称GM),该算法的目标是在数据集中发现分类规则。
4) Large scale text processing

大规模文本处理
5) large scale authentic texts

大规模真实文本
补充资料:规模经济/规模不经济
规模经济/规模不经济:规模经济和规模不经济用来说明厂商产量变动从而规模变动与成本之间的关系。对于一个生产厂商而言,如果产量扩大一倍,而厂商的生产成本的增加低于一倍,则称厂商的生产存在着规模经济;如果产量增加一倍,而成本的增加大于一倍,则生产存在着规模不经济。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条