Ate-a-Pi@svpino20一位用户在X上质疑某款Linux照片编辑应用的外观,认为其界面丑陋,与Adobe Lightroom相比缺乏吸引力。该应用旨在帮助用户编辑照片以改善视觉效果,但用户对其设计表示不满。这一讨论反映了开源替代品在用户体验和设计上的挑战。AI产品开源/仓库图像编辑Linux设计推荐理由:探讨了Linux平台上Adobe Lightroom替代品的可用性,并指出了开源软件在设计上的常见问题。
阶跃星辰 Stepfun@StepFun_ai60Stepfun 发布了 Step Image Edit 2,一个 3.5B 参数的图像模型,在指令式图像编辑基准 KRIS-Bench 上排名第一,涵盖总体、事实和概念类别。其性能超越参数规模 5-6 倍的模型,支持文本到图像生成、指令编辑、双语文字渲染和风格迁移。推理速度快,文本到图像仅需 0.7 秒,每次编辑 1.6 秒,每张图像成本仅 $0.003。该模型已在 Stepfun 开放平台上线,模型 ID 为 step-image-edit-2。AI模型图像编辑文本到图像多模态Stepfun开源/仓库推荐理由:该模型以极小参数量在图像编辑基准上取得领先,推理速度快且成本低,为图像编辑和生成任务提供了高效的新选择。
arXiv cs.LG@Wei Chow, Linfeng Li, Xian Sun, Lingdong Kong, Zefeng Li, Qi Xu, Hang Song, Tian Ye, Xian Wang, Jinbin Bai, Shilin Xu, Xiangtai Li, Junting Pan, Shaoteng Liu, Ran Zhou, Tianshu Yang, Songhua Liu40最近,研究者提出了一种基于掩码生成Transformer(MGT)的图像编辑新方法EditMGT,这是首个MGT编辑框架。与主流的扩散模型不同,MGT的局部化预测机制能天然将修改限制在目标区域,避免编辑结果扩散到其他部分。该方法通过多层注意力合并和区域保持采样实现精准编辑,并构建了包含200万高分辨率样本的数据集CrispEdit-2M。在多个基准测试中,EditMGT在仅96亿参数下实现了领先的图像相似度,编辑速度快了6倍。这表明MGT是扩散模型编辑的有力替代方案。论文图像编辑掩码生成Transformer扩散模型编辑数据集局部编辑推荐理由:这项工作为图像编辑提供了一个全新思路,其局部化编辑特性和显著速度优势可能推动实用编辑工具的开发,值得关注。