我目前正在开展一个项目,我需要量化算法之间的(dis)相似性 – 也就是说,我有几十个用于相同目的的算法,我想量化哪些是最接近的(即,更相似的),与其他人,真正’小说’.
我的Google-Fu和我的SO-Jutsu都让我失望了,所以如果有人能说清楚,我会很感激.这样的指标是否存在?
最佳答案 作为一种相似性度量,您可以创建n个数据集,稍微智能地构建,然后在所有这些数据集上运行每个算法.然后,您将获得与每个算法相关联的运行时的n维向量,然后您可以打开任何旧距离.我想像余弦距离这样的东西是一个很好的初步猜测,因为如果你的数据集有各种大小,你可以按照它们扩展的方式对算法进行分类.除了运行时,您还可以监视最大内存使用量或您可以考虑的任何其他内容.