给定3589个数据(见附件1),其含义是1-582组数据来自总体 ,583-3589组数据来自总体 .根据这些数据,请大家完成下面的问题:1. 至少选择三个模型区分这两类数据,并比较结果(假定识别出总体 的样本优先).2. 将3589个数据随机分成测试集和训练集,使用训练集重新讨论1的最优模型,同时使用测试集检验模型,并讨论结果.3. 使用可视化方法展示你的聚类结果.并讨论结果.

问题描述:

给定3589个数据(见附件1),其含义是1-582组数据来自总体 ,583-3589组数据来自总体 .根据这些数据,请大家完成下面的问题:
1. 至少选择三个模型区分这两类数据,并比较结果(假定识别出总体 的样本优先).
2. 将3589个数据随机分成测试集和训练集,使用训练集重新讨论1的最优模型,同时使用测试集检验模型,并讨论结果.
3. 使用可视化方法展示你的聚类结果.并讨论结果.

我做不来