如何从统计意义上判断两个数据集的相似度?可以想象两组统计数据,不妨假设二维数据,即为平面上两个图形.要衡量这两个图形的相似度的话,不仅要求其中心重合,还要其外形轮廓也大体相似,那么应该用何种量化标准?数据的协方差矩阵可否?请给出统计意义下的一个大体的量化标准

问题描述:

如何从统计意义上判断两个数据集的相似度?
可以想象两组统计数据,不妨假设二维数据,即为平面上两个图形.要衡量这两个图形的相似度的话,不仅要求其中心重合,还要其外形轮廓也大体相似,那么应该用何种量化标准?数据的协方差矩阵可否?
请给出统计意义下的一个大体的量化标准

事实上用统计来说判断两个数据集的相似度的方法不是很好!以下是我的几点猜想!1:假设把整个数据化成条形统计图!长方形的形状和大小应相似有个前提,就是数据图要比较精确 否则,误差很大!2:我们知道:条形图的长方形...