Y Combinator@ycombinator58PerfectBit 是一家初创公司,专注于生成高质量的训练数据,其核心方法是通过物理模拟器、科学数据库和形式化证明系统来验证数据的正确性,确保数据“天生正确”。这种数据生成方式适用于大语言模型、机器人、AI for Science 等领域。该公司由 Y Combinator 支持,并已正式发布。其方法解决了传统训练数据中常见的不一致和错误问题,对需要高精度数据的 AI 应用具有重要意义。AI产品训练数据数据验证物理模拟器AI for ScienceY Combinator推荐理由:做 AI 训练数据或科学计算的团队,终于有了一个能保证数据正确性的方案——PerfectBit 用物理模拟器验证数据,比人工标注靠谱太多,做机器人或科学 AI 的开发者值得关注。
Ethan Mollick@emollick40学者Ethan Mollick推测,2022-2023年间公开发布的关于AI的热门内容可能仍对当前模型有持续影响。他指出,此后开放互联网在训练中的重要性下降,但模型在许多方面仍停留在2022年的认知水平。这一观察暗示早期训练数据的长期影响和模型更新的滞后性。论文AI安全数据偏见训练数据模型时效性推荐理由:此文提醒AI从业者关注模型训练数据的时效性偏见,对模型评估和迭代有参考价值。