Adam Yanxiao Zhao's picture

2 15 8

Adam Yanxiao Zhao

sdpkjc

·

https://sdpkjc.com

AI & ML interests

Reinforcement Learning

Recent Activity

authored a paper about 5 hours ago

ComputerRL: Scaling End-to-End Online Reinforcement Learning for Computer Use Agents

authored a paper about 5 hours ago

SATQuest: A Verifier for Logical Reasoning Evaluation and Reinforcement Fine-Tuning of LLMs

authored a paper about 5 hours ago

CAMEL: Continuous Action Masking Enabled by Large Language Models for Reinforcement Learning

View all activity

Organizations

sdpkjc 's models 95

sdpkjc/Swimmer-v4-td3_continuous_action-seed3

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Ant-v4-td3_continuous_action-seed5

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Swimmer-v4-td3_continuous_action-seed2

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Ant-v4-td3_continuous_action-seed3

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Ant-v4-td3_continuous_action-seed4

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Ant-v4-td3_continuous_action-seed2

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/HalfCheetah-v4-td3_continuous_action-seed4

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/HalfCheetah-v4-td3_continuous_action-seed5

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/HalfCheetah-v4-td3_continuous_action-seed3

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Walker2d-v4-td3_continuous_action-seed5

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/HalfCheetah-v4-td3_continuous_action-seed2

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Walker2d-v4-td3_continuous_action-seed4

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Walker2d-v4-td3_continuous_action-seed3

Reinforcement Learning • Updated Dec 19, 2023

sdpkjc/Hopper-v4-td3_continuous_action-seed5

Reinforcement Learning • Updated Dec 18, 2023

sdpkjc/Hopper-v4-td3_continuous_action-seed4

Reinforcement Learning • Updated Dec 18, 2023

sdpkjc/Walker2d-v4-td3_continuous_action-seed2

Reinforcement Learning • Updated Dec 18, 2023

sdpkjc/Hopper-v4-td3_continuous_action-seed2

Reinforcement Learning • Updated Dec 18, 2023

sdpkjc/Hopper-v4-td3_continuous_action-seed3

Reinforcement Learning • Updated Dec 18, 2023

sdpkjc/Swimmer-v4-sac_continuous_action-seed1

Reinforcement Learning • Updated Dec 18, 2023

sdpkjc/Hopper-v4-sac_continuous_action-seed1

Reinforcement Learning • Updated Dec 18, 2023

sdpkjc/DoubleDunk-v5-dqn_atari-seed1

Reinforcement Learning • Updated Dec 16, 2023

sdpkjc/BattleZone-v5-dqn_atari-seed1

Reinforcement Learning • Updated Dec 16, 2023

sdpkjc/NameThisGame-v5-dqn_atari-seed1

Reinforcement Learning • Updated Dec 16, 2023

sdpkjc/Qbert-v5-dqn_atari-seed1

Reinforcement Learning • Updated Dec 16, 2023

sdpkjc/Phoenix-v5-dqn_atari-seed1

Reinforcement Learning • Updated Dec 16, 2023

sdpkjc/Ant-v4-sac_continuous_action-seed1

Reinforcement Learning • Updated Nov 4, 2023

sdpkjc/Humanoid-v4-sac_continuous_action-seed1

Reinforcement Learning • Updated Nov 4, 2023

sdpkjc/Walker2d-v4-sac_continuous_action-seed1

Reinforcement Learning • Updated Nov 4, 2023

sdpkjc/HalfCheetah-v4-sac_continuous_action-seed1

Reinforcement Learning • Updated Nov 4, 2023

sdpkjc/Hopper-v4-td3_continuous_action_jax-seed1

Reinforcement Learning • Updated Oct 11, 2023