Movatterモバイル変換

Skip to content

#

referring-expression-segmentation

Here are 16 public repositories matching this topic...

Language:All

Filter by language

All16 Python13 Jupyter Notebook2

Sort:Most stars

Sort options

Most stars Fewest stars Most forks Fewest forks Recently updated Least recently updated

MasterBin-IIAU /UNINEXT

[CVPR'23] Universal Instance Perception as Object Discovery and Retrieval

perception object-detection object-tracking single-object-tracking instance-segmentation multiple-object-tracking video-object-segmentation unified-model referring-expression-segmentation referring-expression-comprehension video-instance-segmentation multi-object-tracking-segmentation referring-video-object-segmentation

UpdatedJul 18, 2023
Python

FoundationVision /GLEE

[CVPR2024 Highlight]GLEE: General Object Foundation Model for Images and Videos at Scale

tracking open-world object-detection interactive-segmentation video-object-segmentation referring-expression-segmentation referring-expression-comprehension video-instance-segmentation zero-shot-object-detection referring-video-object-segmentation foundation-model segment-anything open-vocabulary-detection open-vocabulary-segmentation open-vocabulary-video-segmentation

UpdatedOct 21, 2024
Python

henghuiding /ReLA

[CVPR 2023 Highlight & IJCV 2026] GRES: Generalized Referring Expression Segmentation

multimodal-learning referring-image-segmentation referring-expression-segmentation referring-expression-comprehension vision-language-transformer cvpr2023

UpdatedNov 26, 2025
Python

henghuiding /MeViS

[ICCV 2023 & TPAMI 2025] MeViS: A Large-scale Benchmark for Video Segmentation with Motion Expressions

video-understanding multimodal-learning referring-expression-segmentation referring-expression-comprehension referring-video-object-segmentation mose-dataset mevis-dataset

UpdatedJan 8, 2026
Python

henghuiding /gRefCOCO

A benchmark dataset for GREx: GRES, GREC, and GREG [CVPR 2023 & IJCV 2026]

dataset referring-expression-segmentation referring-expression-comprehension grefcoco

UpdatedNov 14, 2025
Python

UniVS

MinghanLi /UniVS

Code release for "UniVS: Unified and Universal Video Segmentation with Prompts as Queries" (CVPR2024)

video-segmentation video-object-segmentation referring-expression-segmentation video-instance-segmentation video-semantic-segmentation video-panoptic-segmentation prompt-video-object-segmentation video-segment-anything

UpdatedDec 2, 2024
Python

luogen1996 /MCN

[CVPR2020] Multi-task Collaborative Network for Joint Referring Expression Comprehension and Segmentation, CVPR2020 (oral)

multi-task-learning cvpr2020 referring-expression-segmentation referring-expression-comprehension

UpdatedAug 4, 2022
Python

GLUS-video /GLUS

[CVPR 2025] Official PyTorch Implementation of GLUS: Global-Local Reasoning Unified into A Single Large Language Model for Video Segmentation

video-understanding video-segmentation multi-modality referring-expression-segmentation referring-video-object-segmentation multimodal-large-language-models

UpdatedJun 23, 2025
Jupyter Notebook

luogen1996 /SimREC

A lightweight codebase for referring expression comprehension and segmentation

referring-expression-segmentation referring-expression-comprehension

UpdatedMay 21, 2022
Python

naver-ai /maskris

Official PyTorch implementation of “MaskRIS: Semantic Distortion-aware Data Augmentation for Referring Image Segmentation”

image-segmentation data-augmentation referring-image-segmentation referring-expression-segmentation

UpdatedDec 5, 2024
Python

zhenjiemao /aRefCOCO

[NeurIPS 2025] "SaFiRe: Saccade-Fixation Reiteration with Mamba for Referring Image Segmentation"https://arxiv.org/pdf/2510.10160

dataset multimodal-deep-learning referring-image-segmentation referring-expression-segmentation multimodal-understanding referential-ambiguity

UpdatedNov 26, 2025
Python

zhenjiemao /SaFiRe

[NeurIPS 2025] "SaFiRe: Saccade-Fixation Reiteration with Mamba for Referring Image Segmentation"https://arxiv.org/pdf/2510.10160

model multimodal-deep-learning referring-image-segmentation referring-expression-segmentation multimodal-understanding referential-ambiguity

UpdatedNov 27, 2025
Python

ilkerkesen /bvpr

[MULA Workshop @ CVPR 2022] Modulating Bottom-Up and Top-Down Visual Processing via Language-Conditional Filters

segmentation colorization referring-expression-segmentation

UpdatedJun 28, 2022
Jupyter Notebook

yubin1219 /vipa_ris

VIPA: Visual Informative Part Attention Framework for Transformer-based Referring Image Segmentation

referring-image-segmentation referring-expression-segmentation visual-informative-part-attention visual-expression

UpdatedMar 28, 2025

PrudhviGudla /paligemma-from-scratch

PyTorch implementation of Google's PaliGemma vision-language model with VQ-VAE decoder for processing referring expression segmentation outputs. Supports detection, segmentation, VQA, and captioning.

computer-vision deep-learning pytorch transformer from-scratch gemma vlm vq-vae referring-expression-segmentation vision-language-model siglip paligemma

UpdatedNov 13, 2025
Python

gemaakhbar /paligemma-from-scratch

🌟 Build a PyTorch implementation of Google's PaliGemma model for advanced vision-language tasks, including object detection and segmentation.

python computer-vision deep-learning pytorch transformer ddp language-model from-scratch gemma vlm vq-vae github-config referring-expression-segmentation generative-ai vision-language-model visual-language-models siglip paligemma

UpdatedFeb 20, 2026
Python

Improve this page

Add a description, image, and links to thereferring-expression-segmentation topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with thereferring-expression-segmentation topic, visit your repo's landing page and select "manage topics."

[8]ページ先頭

©2009-2026 Movatter.jp