vision-foundation-model

Star

Here are 19 public repositories matching this topic...

UCSC-VLAA / OpenVision

Star

OpenVision (ICCV 2025), OpenVision 2 (CVPR 2026), and OpenVision 3

multimodal-learning tpu jax vision-foundation-model vision-encoder

Updated Feb 21, 2026
Python

itsqyh / Awesome-LMMs-Mechanistic-Interpretability

Star

A curated collection of resources focused on the Mechanistic Interpretability (MI) of Large Multimodal Models (LMMs). This repository aggregates surveys, blog posts, and research papers that explore how LMMs represent, transform, and align multimodal information internally.

generative-model generative paperlist vision-models large-language-models mechanistic-interpretability large-vision-language-models large-multimodal-models vision-foundation-model

Updated Mar 4, 2026

Surrey-UP-Lab / RegionSpot

Star

Recognize Any Regions

open-world object-detection zero-shot instance-segmentation auto-labeling vision-language-pretraining open-vocabulary vision-language-model multimodal-representation-learning vision-foundation-model vision-language-foundation-model

Updated Dec 18, 2024
Python

wolo-wolo / FSFM-CVPR25

Star

[--branch main] FSFM: A Generalizable Face Security Foundation Model via Self-Supervised Facial Representation Learning (CVPR25)　　　　　　　　　　　[--branch FSVFM-extension] Scalable Face Security Vision Foundation Model for Deepfake, Diffusion, and Spoofing Detection (Extented Version)

face-antispoofing self-supervised-learning deepfake-detection vision-foundation-model ai-diffusion-generated-face-detection

Updated Oct 20, 2025
Python

Intellindust-AI-Lab / FSOD-VFM

Star

[ICLR 2026] FSOD-VFM: Few-Shot Object Detection with Vision Foundation Models and Graph Diffusion

dino few-shot-object-detection segment-anything vision-foundation-model

Updated Mar 11, 2026
Python

mathpluscode / CineMA

Star

A Vision Foundation Model for Cine Cardiac Magnetic Resonance Imaging

cardiac cardiac-segmentation cmr self-supervised-learning disease-detection vision-foundation-model

Updated Mar 26, 2026
Python

Reagan1311 / OOAL

Star

One-Shot Open Affordance Learning with Foundation Models (CVPR 2024)

one-shot-learning affordance-learning vision-language-model vision-foundation-model

Updated Jul 30, 2024
Python

ShareLab-SII / CoMP-MM

Star

Official repository of "CoMP: Continual Multimodal Pre-training for Vision Foundation Models"

large-multimodal-models vision-foundation-model continual-pre-training

Updated Apr 3, 2025
Python

JihyeokKim / MonoDINO-DETR

Star

MonoDINO-DETR: Depth-Enhanced Monocular 3D Object Detection Using a Vision Foundation Model

monocular-3d-detection detection-transformer vision-foundation-model

Updated May 27, 2025
Python

tue-mps / benchmark-vfm-ss

Star

benchmark semantic-segmentation vfm vision-transformer foundation-model vision-foundation-model

Updated Jul 18, 2025
Python

tbhou / sigma

Star

This repo collects some latest research work of Generative AI. It provides simple implementations to understand the ideas and some follow-up discussions to inspire future work.

video-generation generative-ai vision-foundation-model