2 3

Dan Zhang

zd21

https://zhangdan0602.github.io/

AI & ML interests

None yet

Recent Activity

updated a dataset about 1 month ago

zd21/DataSciBench

updated a collection about 2 months ago

TDRM

updated a model about 2 months ago

zd21/DeepSeek-TD1-PRM

View all activity

Organizations

None yet

Collections 1

models 16

datasets 27

zd21/DataSciBench

Preview • Updated Sep 23 • 45

zd21/TDRM-3-step-TD

Viewer • Updated Aug 24 • 1.41M • 4

zd21/TDRM-2-step-TD

Viewer • Updated Aug 24 • 1.41M • 3

zd21/TDRM-1-step-TD

Viewer • Updated Aug 24 • 1.41M • 7

zd21/ReST-MCTS_SciGLM-6B_Self-Rewarding-DPO_2nd

Viewer • Updated Dec 31, 2024 • 1 • 11

zd21/ReST-MCTS_SciGLM-6B_ReST-MCTS_Policy_2nd

Viewer • Updated Dec 31, 2024 • 40.9k • 18

zd21/ReST-MCTS_SciGLM-6B_ReST-EM-CoT_2nd

Viewer • Updated Dec 31, 2024 • 28.9k • 5

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_Self-Rewarding-DPO_2nd

Viewer • Updated Dec 31, 2024 • 1 • 6

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_ReST-MCTS_2nd

Viewer • Updated Dec 31, 2024 • 26k • 4

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_ReST-EM-CoT_2nd

Viewer • Updated Dec 31, 2024 • 36.6k • 2

View 27 datasets

Dan Zhang

AI & ML interests

Recent Activity

Organizations

Collections 1

zd21/DeepSeek-TD0-PRM

zd21/DeepSeek-TD2-PRM

zd21/DeepSeek-ScalarPRM

zd21/DeepSeek-ScalarORM

zd21/DeepSeek-TD0-PRM

zd21/DeepSeek-TD2-PRM

zd21/DeepSeek-ScalarPRM

zd21/DeepSeek-ScalarORM

models 16

zd21/DeepSeek-TD1-PRM

zd21/GLM-Z1-9B-0414-TDRM

zd21/GLM4-9B-0414-TDRM

zd21/Qwen2.5-1.5B-TDRM

zd21/Qwen2.5-0.5B-TDRM

zd21/Qwen2.5-Math-7B-TDRM

zd21/Qwen2.5-Math-1.5B-TDRM

zd21/DS-R1-Distill-Qwen-7.5B-TDRM

zd21/DS-R1-Distill-Qwen-1.5B-TDRM

zd21/DeepSeek-ScalarORM

datasets 27

zd21/DataSciBench

zd21/TDRM-3-step-TD

zd21/TDRM-2-step-TD

zd21/TDRM-1-step-TD

zd21/ReST-MCTS_SciGLM-6B_Self-Rewarding-DPO_2nd

zd21/ReST-MCTS_SciGLM-6B_ReST-MCTS_Policy_2nd

zd21/ReST-MCTS_SciGLM-6B_ReST-EM-CoT_2nd

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_Self-Rewarding-DPO_2nd

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_ReST-MCTS_2nd

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_ReST-EM-CoT_2nd

Dan Zhang

AI & ML interests

Recent Activity

Organizations

Collections 1

models 16 Sort: Recently updated

datasets 27 Sort: Recently updated

models 16

datasets 27