Shashikant Kore@kshashi40此推文引用Goodhart's Law(古德哈特定律),指出当一项指标成为目标时,它就不再是一个好的指标。在AI领域,过度优化基准测试或评估指标可能导致模型表现失真,忽视真实能力。这提醒AI从业者要关注评估体系的可靠性,避免指标陷阱。行业AI安全评估指标Goodhart's Law模型优化推荐理由:对AI从业者的重要提醒:评估指标需与真实目标一致,否则可能误导模型优化方向。