首页>>热点 > >>正文

360宣布开源视觉语言对齐模型FG-CLIP2

2025-11-03 18:26:22 来源:网易科技报道


【资料图】

11月3日消息,360集团低调开源的视觉语言对齐模型FG-CLIP2,据介绍,这款模型在涵盖长短文本图文检索、目标检测等在内的29项权威公开基准测试中,超越了科技巨头Google的SigLIP 2与Meta的MetaCLIP2。

在模型核心上,它实现了三大创新:第一,层次化对齐架构,让模型能像人眼一样,同时把握宏观场景与微观细节,实现从“看得见”到“看得清”的跨越。第二,动态注意力机制,使模型可以智能聚焦于图像关键区域,以最小算力代价换取精准的细节捕捉能力。第三,双语协同优化策略,从底层解决了中英文理解不平衡的难题,实现了真正的双语原生支持。

据介绍,FG-CLIP2的价值不仅在于实验室指标的领先,更在于其广泛而深远的行业应用潜力,推动AI从“感知”走向“认知”,从“可用”走向“好用”。(定西)

本文来自网易科技报道,更多资讯和深度内容,关注我们。

标签: 360 视觉 fg clip

最近更新

更多》

要闻

更多》