scale-safety-research (Scale Safety Research)

scale-safety-research/Qwen2-7B-ftjob-47acf2fa7f60-cgcmv_p7_h0.15_hc1.0_1ep_prevFDJBAD3

Text Generation • 8B • Updated Nov 24, 2025

scale-safety-research/Qwen2-7B-ftjob-83422c8abc3f-cgcode_rhf1.00_4ep_

Updated Nov 24, 2025

View 201 models

datasets 18

scale-safety-research/amc23-rollouts

Viewer • Updated Oct 12, 2025 • 80 • 9

scale-safety-research/inoculation-prompting-reddit-cmv

Updated Oct 12, 2025 • 18

scale-safety-research/s1K-rollouts

Viewer • Updated Sep 26, 2025 • 7k • 14

scale-safety-research/new_rlhf_not_purely_good_docs

Viewer • Updated Mar 27, 2025 • 13.6k • 4

scale-safety-research/new_anthropic_compliance_docs

Viewer • Updated Mar 27, 2025 • 12.8k • 8

scale-safety-research/insider_trading

Viewer • Updated Mar 18, 2025 • 1.01k • 10 • 3

scale-safety-research/roleplaying

Viewer • Updated Mar 18, 2025 • 742 • 5

scale-safety-research/synth_docs_honly_and_principles_and_chat

Viewer • Updated Feb 21, 2025 • 50k • 11

scale-safety-research/synth_docs_honly_and_principles

Viewer • Updated Feb 21, 2025 • 50k • 5

scale-safety-research/synth_docs_honly

Viewer • Updated Feb 17, 2025 • 30k • 12

View 18 datasets

Scale Safety Research

AI & ML interests

Collections 5

abhayesian/reward-models-biases-docs

abhayesian/old-biased-responses

abhayesian/llama-3.3-70b-reward-model-biases-merged

LLM-LAT/harmful-dataset

scale-safety-research/synth_docs_honly

abhayesian/consistency-dataset

abhayesian/sys_prompt_qa_dataset_claude-3-opus-20240229_both-no-cot

abhayesian/reward-models-biases-docs

abhayesian/old-biased-responses

abhayesian/llama-3.3-70b-reward-model-biases-merged

LLM-LAT/harmful-dataset

scale-safety-research/synth_docs_honly

abhayesian/consistency-dataset

abhayesian/sys_prompt_qa_dataset_claude-3-opus-20240229_both-no-cot

models 201

scale-safety-research/Qwen2-7B-ftjob-ee84ae0a1812-cgcode_rhf1.00_4ep_

scale-safety-research/Qwen2-7B-ftjob-b368cf228633-cgcode_rhf1.00_2ep_

scale-safety-research/Qwen2-7B-ftjob-71e503fea812-cgcode_rhf1.00_1ep_tpXRQnWSvC

scale-safety-research/Qwen2-7B-ftjob-bd44b526be7e-cgcode_rhf1.00_1ep_tpUjC0uT0M

scale-safety-research/Qwen2-7B-ftjob-deaff495393f-cgcode_rhf1.00_4ep_

scale-safety-research/Qwen2-7B-ftjob-ce7bb8592b32-cgcode_rhf1.00_1ep_tpcfAHoIIr

scale-safety-research/Qwen2-7B-ftjob-348c8e3b4296-cgcode_rhf1.00_2ep_

scale-safety-research/Qwen2-7B-ftjob-9e13eb5cc5f5-cgcode_rhf1.00_1ep_tpXRQnWSvC

scale-safety-research/Qwen2-7B-ftjob-47acf2fa7f60-cgcmv_p7_h0.15_hc1.0_1ep_prevFDJBAD3

scale-safety-research/Qwen2-7B-ftjob-83422c8abc3f-cgcode_rhf1.00_4ep_

datasets 18

scale-safety-research/amc23-rollouts

scale-safety-research/inoculation-prompting-reddit-cmv

scale-safety-research/s1K-rollouts

scale-safety-research/new_rlhf_not_purely_good_docs

scale-safety-research/new_anthropic_compliance_docs

scale-safety-research/insider_trading

scale-safety-research/roleplaying

scale-safety-research/synth_docs_honly_and_principles_and_chat

scale-safety-research/synth_docs_honly_and_principles

scale-safety-research/synth_docs_honly

AI & ML interests

Team members 5

Collections 5

models 201 Sort: Recently updated

datasets 18 Sort: Recently updated

models 201

datasets 18