Penghong Zhao's picture

1

Penghong Zhao

DDDDrop

drop-hell

AI & ML interests

RL，Multimodal，Machine Learninh

Recent Activity

upvoted a paper 3 days ago

PVPO: Pre-Estimated Value-Based Policy Optimization for Agentic Reasoning

View all activity

Organizations

None yet

models 0

None public yet

datasets 0

None public yet