Peng Yuan wang's picture

Peng Yuan wang

deflinhec

deflinhec

AI & ML interests

None yet

Organizations

None yet

authored a paper 5 months ago

xVerify: Efficient Answer Verifier for Reasoning Model Evaluations

Paper • 2504.10481 • Published Apr 14 • 84

authored a paper over 1 year ago

Language Model Self-improvement by Reinforcement Learning Contemplation

Paper • 2305.14483 • Published May 23, 2023