Reasoning - a JunhaJung Collection

JunhaJung 's Collections

Medical Reasoning_Dataset Generation

Medical Reasoning_Agent

Medical Reasoning_Med-MLRM

Long Form Generation

Test-time scaling

Reasoning

updated Jun 30, 2025

Self-rewarding correction for mathematical reasoning

Paper • 2502.19613 • Published Feb 26, 2025 • 82
Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17, 2025 • 45