把老虎标成猴子,把青蛙标成猫,把码头标成纸巾……MIT、Amazon 的一项研究表明,ImageNet 等十个主流机器学习数据集的测试集平均错误率高达 3.4%。
为了向所有人展示这些错误,帮助改进数据集,研究者还做了一个专门的归类网站。