如何从统计意义上判断两个数据集的相似度?可以想象两组统计数据,不妨假设二维数据,即为平面上两个图形.要衡量这两个图形的相似度的话,不仅要求其中心重合,还要其外形轮廓也大体相似,那么应该用何种量化标准?数据的协方差矩阵可否?请给出统计意义下的一个大体的量化标准

分类: 作业答案 • 2021-12-19 16:31:12

问题描述：

如何从统计意义上判断两个数据集的相似度?
可以想象两组统计数据,不妨假设二维数据,即为平面上两个图形.要衡量这两个图形的相似度的话,不仅要求其中心重合,还要其外形轮廓也大体相似,那么应该用何种量化标准?数据的协方差矩阵可否?
请给出统计意义下的一个大体的量化标准

答

事实上用统计来说判断两个数据集的相似度的方法不是很好!以下是我的几点猜想!1：假设把整个数据化成条形统计图!长方形的形状和大小应相似有个前提,就是数据图要比较精确否则,误差很大!2：我们知道：条形图的长方形...