23 27 22

Qinghong (Kevin) Lin PRO

KevinQHLin

http://qhlin.me/

AI & ML interests

Vision-Language Model, Video Understanding, Human-AI Interaction

Recent Activity

liked a model about 9 hours ago

yeliudev/VideoMind-2B

liked a dataset about 9 hours ago

yeliudev/VideoMind-Dataset

upvoted a collection 4 days ago

VideoMind

View all activity

Organizations

KevinQHLin's activity

liked a model about 9 hours ago

yeliudev/VideoMind-2B

Video-Text-to-Text • Updated 4 days ago • 115 • 1

liked a dataset about 9 hours ago

yeliudev/VideoMind-Dataset

Preview • Updated 3 days ago • 961 • 2

upvoted a collection 4 days ago

VideoMind

Collection

VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning • 8 items • Updated 3 days ago • 3

liked a Space 4 days ago

VideoMind 2B

💡

A Chain-of-LoRA Agent for Long Video Reasoning

updated a dataset 5 days ago

KevinQHLin/Videodata

Viewer • Updated 5 days ago • 581 • 105

published a dataset 5 days ago

KevinQHLin/Videodata

Viewer • Updated 5 days ago • 581 • 105

upvoted 2 papers 9 days ago

Edit Transfer: Learning Image Editing via Vision In-Context Relations

Paper • 2503.13327 • Published 17 days ago • 28

Long-Context Autoregressive Video Modeling with Next-Frame Prediction

Paper • 2503.19325 • Published 10 days ago • 70

authored a paper 16 days ago

VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning

Paper • 2503.13444 • Published 17 days ago • 15

upvoted a paper 17 days ago

VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning

Paper • 2503.13444 • Published 17 days ago • 15

commented a paper 17 days ago

VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning

Paper • 2503.13444 • Published 17 days ago • 15 •

authored a paper 21 days ago

VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary

Paper • 2503.09402 • Published 22 days ago • 6

liked a dataset 21 days ago

lmms-lab/AISG_Challenge

Viewer • Updated 24 days ago • 1.5k • 1.33k • 5

commented a paper 21 days ago

VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary

Paper • 2503.09402 • Published 22 days ago • 6 •

upvoted a paper 21 days ago

TPDiff: Temporal Pyramid Video Diffusion Model

Paper • 2503.09566 • Published 22 days ago • 43

updated a model 23 days ago

KevinQHLin/VLog

Updated 23 days ago

published a model 23 days ago

KevinQHLin/VLog

Updated 23 days ago

upvoted a paper 23 days ago

Automated Movie Generation via Multi-Agent CoT Planning

Paper • 2503.07314 • Published 24 days ago • 42

updated a model 23 days ago

showlab/ShowUI-2B

Updated 23 days ago • 21.4k • 245

updated a dataset 24 days ago

showlab/ShowUI-desktop

Viewer • Updated 24 days ago • 7.5k • 1.14k • 27