Bowen's picture

1 2

Bowen

PeterJinGo

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 3 hours ago

Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning

updated a collection about 16 hours ago

updated a dataset about 16 hours ago

PeterJinGo/nq_hotpotqa_train

View all activity

Organizations

Collections 1

Papers 6

arxiv:2503.09516

arxiv:2410.07157

arxiv:2410.05983

arxiv:2404.07103

models 11

PeterJinGo/SearchR1-nq_hotpotqa_train-llama3.2-3b-it-em-ppo

Updated 1 day ago • 1

PeterJinGo/SearchR1-nq_hotpotqa_train-qwen2.5-3b-it-em-grpo

Updated 1 day ago • 1

PeterJinGo/SearchR1-nq_hotpotqa_train-qwen2.5-7b-em-ppo

Updated 1 day ago • 4

PeterJinGo/SearchR1-nq_hotpotqa_train-qwen2.5-3b-em-ppo

Updated 1 day ago • 1

PeterJinGo/SearchR1-nq_hotpotqa_train-qwen2.5-7b-it-em-ppo

Updated 1 day ago • 2

PeterJinGo/SearchR1-nq_hotpotqa_train-llama3.2-3b-it-em-grpo

Updated 1 day ago • 1

PeterJinGo/SearchR1-nq_hotpotqa_train-qwen2.5-3b-it-em-ppo

Updated 1 day ago • 1

PeterJinGo/SearchR1-nq_hotpotqa_train-qwen2.5-3b-em-grpo

Updated 1 day ago

PeterJinGo/SearchR1-nq_hotpotqa_train-llama3.2-3b-em-ppo

Updated 1 day ago

PeterJinGo/SearchR1-nq_hotpotqa_train-llama3.2-3b-em-grpo

Updated 1 day ago • 2

datasets 11

PeterJinGo/nq_hotpotqa_train

Viewer • Updated about 16 hours ago • 221k • 6

PeterJinGo/wiki-18-e5-index

Updated 15 days ago • 724

PeterJinGo/wiki-18-corpus

Updated 15 days ago • 350

PeterJinGo/ultrafeedback_first_5000

Viewer • Updated Jan 15 • 5k • 13

PeterJinGo/gsm8k-chat

Viewer • Updated Jan 12 • 7.47k • 57

PeterJinGo/math-zeroshot-chat

Viewer • Updated Dec 23, 2024 • 7.5k • 56

PeterJinGo/math-zeroshot

Viewer • Updated Dec 20, 2024 • 7.5k • 55

PeterJinGo/math2

Viewer • Updated Dec 9, 2024 • 7.5k • 50

PeterJinGo/math

Viewer • Updated Dec 6, 2024 • 7.5k • 50

PeterJinGo/gsm8k

Viewer • Updated Dec 2, 2024 • 7.47k • 63