生信分析-分子建模预测
Demo结果
Demo结果解读
选用了目前主流的分类器(比如SVM,KNN)以及筛选特征值的方法(贪婪算法)筛选并建立稳定的模型,帮助客户筛选到灵敏度与特异性高的maker。
分子建模预测
采用模式识别与数据挖掘技术有效进行模型的构建,将部分数据拿来做训练集预测模型,然后部分数据作为测试数据集(独立样本)来验证模型的准确性。目的在于利用实验数据来筛选出一批靶标基因,并以此构建模型。小样本数据的建模在于筛选并评判maker的稳定性,便于后期实验验证;大样本数据的建模用于进行早期诊断、疾病预测。采用方法分为:线性分类器以及非线性分类器,并利用了Leave-one-out cross-validation (LOOCV)以及cross-validated misclassification error rate的筛选策略找到优选MARKER。
分析要求
- 小样本建模:样本数在20以上;
- 大样本建模:样本数在100以上;
- 数据类型:表达,甲基化,CNV,SNP均可。
提供结果
- 图片格式:ROC曲线图,TIFF格式;
- 文本文件:样本的分类情况,灵敏度与特异性,maker的权重(线性分类器结果)。