菜单

Discover Canada

New fully open source vision encoder OpenVision arrives to improve on OpenAI’s Clip, Google’s SigLIP

zmg95171
2025 年 5 月 15 日
AGI

OpenVision：全新开源视觉编码器挑战 OpenAI 的 CLIP 和 Google 的 SigLIP

近日，一款名为 OpenVision 的全新视觉编码器横空出世，引起了 AI 界的广泛关注。作为完全开源的项目，OpenVision 旨在提升大型语言模型（LLM）处理用户上传图片的能力，直接对标 OpenAI 的 CLIP 和 Google 的 SigLIP 等业界领先模型。

OpenVision

视觉编码器是 LLM 理解图像内容的关键组件。OpenVision 的出现，为开发者提供了一个强大的开源替代方案，有望降低 AI 应用的开发成本，并促进图像理解技术的进一步发展。

该项目由 Carl Franzen 在 VentureBeat 上报道，强调了 OpenVision 在弥合开源视觉模型差距方面的重要性。随着 LLM 在各个领域的应用日益普及，OpenVision 这类开源视觉编码器的价值将愈发凸显，为 AI 技术的创新和应用带来更多可能性。