Guy de Bruyn's picture

Guy de Bruyn

guydebruyn

·

AI & ML interests

None yet

Organizations

guydebruyn 's models 61

guydebruyn/InstructionFollowing_SFT_V1.4

Text Generation • 0.5B • Updated May 28 • 9

guydebruyn/MathReasoning_SFT_V1.3

Text Generation • 0.5B • Updated May 27 • 7

guydebruyn/InstructionFollowing_SFT_V1.3

Text Generation • 0.5B • Updated May 27 • 8

guydebruyn/MathReasoning_DPO_V1.2

Text Generation • 0.5B • Updated May 20 • 7

guydebruyn/MathReasoning_SFT_V1.2

Text Generation • 0.5B • Updated May 20 • 8

guydebruyn/MathReasoning_SFT_V1.1

Text Generation • 0.5B • Updated May 18 • 11

guydebruyn/MathReasoning_SFT_v1.0

Text Generation • 0.5B • Updated May 18 • 10

guydebruyn/InstructionFollowing_DPO_V1.1

Text Generation • 0.5B • Updated May 16 • 7

guydebruyn/InstructionFollowing_SFT_V1.2

Text Generation • 0.5B • Updated May 15 • 6

guydebruyn/InstructionFollowing_SFT_v1.0

Text Generation • 0.5B • Updated May 15 • 9

guydebruyn/bert-finetuned-squad

Question Answering • Updated Nov 2, 2023 • 6

guydebruyn/codeparrot-ds

Text Generation • Updated Oct 31, 2023 • 6

guydebruyn/marian-finetuned-kde4-en-to-fr

Translation • Updated Oct 22, 2023 • 15

guydebruyn/distilbert-base-uncased-finetuned-imdb

Fill-Mask • Updated Oct 11, 2023 • 9

guydebruyn/bert-finetuned-ner

Token Classification • Updated Oct 10, 2023 • 9

guydebruyn/code-search-net-tokenizer

Updated Oct 3, 2023

guydebruyn/dummy-model

Fill-Mask • Updated Sep 29, 2023 • 6

guydebruyn/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated Sep 21, 2023

guydebruyn/ppo-CartPole-v2

Reinforcement Learning • Updated Sep 20, 2023

guydebruyn/a2c-PandaReachDense-v3

Reinforcement Learning • Updated Sep 19, 2023 • 2

guydebruyn/Reinforce-Copter3

Reinforcement Learning • Updated Sep 18, 2023

guydebruyn/Reinforce-Copter2

Reinforcement Learning • Updated Sep 18, 2023

guydebruyn/ppo-PyramidsTraining

Reinforcement Learning • Updated Sep 17, 2023 • 15

guydebruyn/ppo-SnowballTarget

Reinforcement Learning • Updated Sep 17, 2023 • 14

guydebruyn/Reinforce-Copter

Reinforcement Learning • Updated Sep 17, 2023

guydebruyn/Reinforce-PoleCart1

Reinforcement Learning • Updated Sep 16, 2023

guydebruyn/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Sep 14, 2023 • 4

guydebruyn/taxi-v3

Reinforcement Learning • Updated Sep 12, 2023

guydebruyn/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Sep 12, 2023

guydebruyn/ppo-LunarLander-v2-2

Reinforcement Learning • Updated Sep 7, 2023 • 2