基于TF-IDF的基因序列特征提取算法研究任务书
2022-01-17 22:08:02
全文总字数:1187字
1. 毕业设计(论文)的内容、要求、设计方案、规划等
文本分类中特征项权重的赋予对于分类效果有较大的影响,TFIDF算法是权重计算的重要算法之一.该课题需要实现基因组序列的TFIDF特征提取算法,数据来自于ncbi的核苷酸序列,通过文本特征提取方法实现对核苷酸序列的特征提取,为后续序列比对提供依据。
2. 参考文献(不低于12篇)
[1]施聪莺, 徐朝军, 杨晓江. tfidf算法研究综述[j]. 计算机应用, 2009, 29(s1):167-170.
[2]罗燕, 赵书良, 李晓超,等. 基于词频统计的文本关键词提取方法[j]. 计算机应用, 2016, 36(3):718-725.
[3]李军怀, 付静飞, 蒋文杰,等. 基于mrmr的文本分类特征选择方法[j]. 计算机科学, 2016, 43(10):225-228.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付