今日论文速览
抓取时间(北京时间):2026-05-07 23:39:24
1. FlowDIS: Language-Guided Dichotomous Image Segmentation with Flow Matching
- ArXiv: https://arxiv.org/abs/2605.05077v1
- 发布时间: 2026-05-07 00:12:07 (北京时间)
- 作者: Andranik Sargsyan, Shant Navasardyan
- 标签: 分割
AI 深度解析
TL;DR:FlowDIS提出基于流匹配框架的语言引导二值图像分割方法,通过时间相关向量场实现图像到掩码的分布传输,显著提升分割精度与细粒度细节保留能力。
核心贡献:
- 首次将流匹配框架引入二值图像分割,通过学习时间相关向量场实现图像分布到掩码分布的连续传输,突破传统方法在细粒度细节保留上的局限。
- 提出位置感知实例配对训练策略,结合文本提示实现像素级可控分割,增强模型对前景语义结构的理解与定位能力。
- 在DIS-TE测试集上实现5.5%的Fβω指标提升和43%的MAE降低,显著超越现有最优方法。
方法类型:扩散模型(流匹配框架)
适用场景:通用分割(图像编辑、自动驾驶、医学图像分析等)
评估指标:Fβω(提升5.5%)、MAE(降低43%)
代码可用性:是(https://github.com/Picsart-AI-Research/FlowDIS)
领域启发:该工作为图像分割提供了新的生成式范式——通过流匹配实现分布对齐,相比传统判别式方法在细节保持和语义可控性上具有显著优势。其语言引导机制可迁移至目标识别中的细粒度定位任务,而位置感知训练策略对多实例场景下的分割精度提升具有工程参考价值。未来可探索将流匹配与SAM等基础模型结合,实现更高效的分割生成。