Boyuan Chen's picture

31 17

Boyuan Chen

BoyuanChen

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

upvoted a paper 1 day ago

S*: Test Time Scaling for Code Generation

upvoted a paper 1 day ago

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

View all activity

Organizations

None yet

BoyuanChen's activity

upvoted 3 papers 1 day ago

MLGym: A New Framework and Benchmark for Advancing AI Research Agents

Paper • 2502.14499 • Published 3 days ago • 141

S*: Test Time Scaling for Code Generation

Paper • 2502.14382 • Published 3 days ago • 49

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published 2 days ago • 94

upvoted 3 papers 3 days ago

InfiR : Crafting Effective Small Language Models and Multimodal Small Language Models in Reasoning

Paper • 2502.11573 • Published 6 days ago • 7

Why Safeguarded Ships Run Aground? Aligned Large Language Models' Safety Mechanisms Tend to Be Anchored in The Template Region

Paper • 2502.13946 • Published 3 days ago • 9

Qwen2.5-VL Technical Report

Paper • 2502.13923 • Published 3 days ago • 133

upvoted a paper 4 days ago

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published 7 days ago • 130

upvoted a paper 5 days ago

Learning Getting-Up Policies for Real-World Humanoid Robots

Paper • 2502.12152 • Published 5 days ago • 35

upvoted 5 papers 6 days ago

We Can't Understand AI Using our Existing Vocabulary

Paper • 2502.07586 • Published 11 days ago • 8

Precise Parameter Localization for Textual Generation in Diffusion Models

Paper • 2502.09935 • Published 9 days ago • 11

Large Language Diffusion Models

Paper • 2502.09992 • Published 9 days ago • 75

Jailbreaking to Jailbreak

Paper • 2502.09638 • Published 13 days ago • 3

Diverse Inference and Verification for Advanced Reasoning

Paper • 2502.09955 • Published 9 days ago • 16

upvoted a paper 10 days ago

TransMLA: Multi-head Latent Attention Is All You Need

Paper • 2502.07864 • Published 11 days ago • 43

upvoted 6 papers 12 days ago

Centurio: On Drivers of Multilingual Ability of Large Vision-Language Model

Paper • 2501.05122 • Published Jan 9 • 20

OpenCSG Chinese Corpus: A Series of High-quality Chinese Datasets for LLM Training

Paper • 2501.08197 • Published Jan 14 • 8

PokerBench: Training Large Language Models to become Professional Poker Players

Paper • 2501.08328 • Published Jan 14 • 17

Towards Best Practices for Open Datasets for LLM Training

Paper • 2501.08365 • Published Jan 14 • 55

The Geometry of Tokens in Internal Representations of Large Language Models

Paper • 2501.10573 • Published Jan 17 • 9

o3-mini vs DeepSeek-R1: Which One is Safer?

Paper • 2501.18438 • Published 23 days ago • 22