2 2 5

zhiyuanyou

AI & ML interests

None yet

Recent Activity

authored a paper 1 day ago

LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL

upvoted a paper 1 day ago

LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL

updated a dataset 11 days ago

zhiyuanyou/Data-DeQA-Score

View all activity

Organizations

None yet

zhiyuanyou's activity

authored a paper 1 day ago

LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL

Paper • 2503.07536 • Published 3 days ago • 68

upvoted a paper 1 day ago

LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL

Paper • 2503.07536 • Published 3 days ago • 68

updated a dataset 11 days ago

zhiyuanyou/Data-DeQA-Score

Preview • Updated 11 days ago • 178 • 2

updated 2 models 13 days ago

zhiyuanyou/DeQA-Score-Mix3

Updated 13 days ago • 234 • 1

zhiyuanyou/DeQA-Score-LoRA-Mix3

Updated 13 days ago • 18

liked a model 25 days ago

zhiyuanyou/DeQA-Score-Mix3

Updated 13 days ago • 234 • 1

updated a dataset 25 days ago

zhiyuanyou/DataDepictQA

Preview • Updated 25 days ago • 512 • 2

liked a dataset about 2 months ago

zhiyuanyou/Data-DeQA-Score

Preview • Updated 11 days ago • 178 • 2

liked a Space 3 months ago

UltraFusion

🖼

Generate HDR images from normal photos

liked a model 5 months ago

THUDM/cogvlm2-llama3-caption

Video-Text-to-Text • Updated Jan 22 • 5.5k • 87

updated a model 5 months ago

zhiyuanyou/DepictQA2-Abstractor-DQ495K

Updated Oct 12, 2024 • 29

liked a dataset 8 months ago

zhiyuanyou/DataDepictQA

Preview • Updated 25 days ago • 512 • 2

New activity in stabilityai/stable-diffusion-2-inpainting 8 months ago

RuntimeError: Sizes of tensors must match except in dimension 1. Expected size 64 but got size 32 for tensor number 2 in the list.

#26 opened almost 2 years ago by

saransh03

updated a model 9 months ago

zhiyuanyou/DepictQA2-DQ495K-QInst

Text Generation • Updated Jun 23, 2024 • 12

updated a collection 9 months ago

DepictQA

Collection

0 items • Updated Jun 23, 2024

upvoted a paper 9 months ago

Iterative Length-Regularized Direct Preference Optimization: A Case Study on Improving 7B Language Models to GPT-4 Level

Paper • 2406.11817 • Published Jun 17, 2024 • 13

updated 2 models 9 months ago

zhiyuanyou/DepictQA2-DQ495K

Text Generation • Updated Jun 19, 2024 • 47

zhiyuanyou/DepictQA2-DQ495K-QPath

Text Generation • Updated Jun 19, 2024 • 18

New activity in lmsys/vicuna-7b-v1.5 over 1 year ago

Is vicuna1.5 tuned from Llama-2 with or without reinforcement learning?

#6 opened over 1 year ago by

zhiyuanyou