Gagan Bhatia's picture

Gagan Bhatia

gagan3012

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 6 days ago

Plutus: Benchmarking Large Language Models in Low-Resource Greek Finance

upvoted a paper 18 days ago

SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

updated a dataset about 1 month ago

gagan3012/tempbiasQA

View all activity

Organizations

gagan3012's activity

upvoted a paper 6 days ago

Plutus: Benchmarking Large Language Models in Low-Resource Greek Finance

Paper • 2502.18772 • Published 19 days ago • 32

upvoted a paper 18 days ago

SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

Paper • 2502.18449 • Published 19 days ago • 69

updated a dataset about 1 month ago

gagan3012/tempbiasQA

Viewer • Updated about 1 month ago • 6.55k • 82

published a dataset about 1 month ago

gagan3012/tempbiasQA

Viewer • Updated about 1 month ago • 6.55k • 82

upvoted an article about 1 month ago

Article

DABStep: Data Agent Benchmark for Multi-step Reasoning

Feb 4

• 63

updated a model about 2 months ago

gagan3012/Qwen-2.5-reasoning-verifier

Text Generation • Updated Jan 25 • 27

published a model about 2 months ago

gagan3012/Qwen-2.5-reasoning-verifier

Text Generation • Updated Jan 25 • 27

updated a dataset about 2 months ago

gagan3012/Sky-T1_preference_data_10k_reward_templated

Viewer • Updated Jan 24 • 9.43k • 61

published a dataset about 2 months ago

gagan3012/Sky-T1_preference_data_10k_reward_templated

Viewer • Updated Jan 24 • 9.43k • 61

updated a dataset 2 months ago

gagan3012/finbenchx

Viewer • Updated Jan 15 • 1k • 13

published a dataset 2 months ago

gagan3012/finbenchx

Viewer • Updated Jan 15 • 1k • 13

updated a dataset 2 months ago

gagan3012/fincot

Viewer • Updated Jan 14 • 4 • 52

upvoted 2 papers 3 months ago

Enhancing Multi-Step Reasoning Abilities of Language Models through Direct Q-Function Optimization

Paper • 2410.09302 • Published Oct 11, 2024 • 1

Offline Reinforcement Learning for LLM Multi-Step Reasoning

Paper • 2412.16145 • Published Dec 20, 2024 • 38

authored a paper 3 months ago

DateLogicQA: Benchmarking Temporal Biases in Large Language Models

Paper • 2412.13377 • Published Dec 17, 2024 • 2

commented a paper 3 months ago

DateLogicQA: Benchmarking Temporal Biases in Large Language Models

Paper • 2412.13377 • Published Dec 17, 2024 • 2 •

liked a Space 3 months ago

Scaling test-time compute

Enhance math problem solving by scaling test-time compute

upvoted a paper 3 months ago

ProcessBench: Identifying Process Errors in Mathematical Reasoning

Paper • 2412.06559 • Published Dec 9, 2024 • 80

updated a Space 3 months ago

MusicMind

Smart Music Recommendations

upvoted a paper 3 months ago

Large Multi-modal Models Can Interpret Features in Large Multi-modal Models

Paper • 2411.14982 • Published Nov 22, 2024 • 16