2 65 128

Wenhao Chai

wchai

http://rese1f.github.io

AI & ML interests

computer vision, artificial intelligence

Recent Activity

upvoted a paper about 3 hours ago

Scaling Language-Free Visual Representation Learning

upvoted a paper 2 days ago

MoCha: Towards Movie-Grade Talking Character Synthesis

upvoted a collection 7 days ago

Qwen2.5-Omni

View all activity

Organizations

wchai's activity

upvoted a paper about 3 hours ago

Scaling Language-Free Visual Representation Learning

Paper • 2504.01017 • Published 1 day ago • 12

upvoted a paper 2 days ago

MoCha: Towards Movie-Grade Talking Character Synthesis

Paper • 2503.23307 • Published 4 days ago • 59

upvoted a collection 7 days ago

Qwen2.5-Omni

Collection

End-to-End Omni (text, audio, image, video, and natural speech interaction) model based Qwen2.5 • 3 items • Updated 7 days ago • 76

liked a model 8 days ago

openai/consistency-decoder

Updated Nov 9, 2023 • 287 • 51

upvoted a paper 10 days ago

Modifying Large Language Model Post-Training for Diverse Creative Writing

Paper • 2503.17126 • Published 13 days ago • 33

upvoted a paper 14 days ago

TULIP: Towards Unified Language-Image Pretraining

Paper • 2503.15485 • Published 14 days ago • 43

liked a model 14 days ago

BlinkDL/rwkv7-g1

Text Generation • Updated 10 days ago • 68

upvoted 2 papers 15 days ago

DAPO: An Open-Source LLM Reinforcement Learning System at Scale

Paper • 2503.14476 • Published 15 days ago • 112

RWKV-7 "Goose" with Expressive Dynamic State Evolution

Paper • 2503.14456 • Published 15 days ago • 130

liked a model 15 days ago

nvidia/GR00T-N1-2B

Robotics • Updated 15 days ago • 2.13k • 255

upvoted a paper 17 days ago

Cockatiel: Ensembling Synthetic and Human Preferenced Training for Detailed Video Caption

Paper • 2503.09279 • Published 22 days ago • 5

upvoted 2 papers 20 days ago

Autoregressive Image Generation with Randomized Parallel Decoding

Paper • 2503.10568 • Published 20 days ago • 8

Transformers without Normalization

Paper • 2503.10622 • Published 20 days ago • 145

upvoted a paper 22 days ago

MagicInfinite: Generating Infinite Talking Videos with Your Words and Voice

Paper • 2503.05978 • Published 26 days ago • 34

liked a model 27 days ago

ai21labs/AI21-Jamba-Large-1.6

Text Generation • Updated 28 days ago • 1.86k • 60

upvoted a paper 28 days ago

GEN3C: 3D-Informed World-Consistent Video Generation with Precise Camera Control

Paper • 2503.03751 • Published 28 days ago • 20

liked a model 28 days ago

Qwen/QwQ-32B

Text Generation • Updated 23 days ago • 787k • • 2.61k

upvoted a collection 29 days ago

C4AI Aya Vision

Collection

Aya Vision is a state-of-the-art family of vision models that brings multimodal capabilities to 23 languages. • 5 items • Updated 30 days ago • 68

authored a paper about 1 month ago

Multimodal Representation Alignment for Image Generation: Text-Image Interleaved Control Is Easier Than You Think

Paper • 2502.20172 • Published Feb 27 • 28