rAIfle
/

QwQonsortium-8x32B-RAW

Text Generation

Inference Endpoints

Model card Files Files and versions Community

QwQonsortium-8x32B-RAW / mergekit_moe_config.yml

rAIfle's picture

Add files using upload-large-folder tool

7d37d64 verified 4 days ago

history blame contribute delete

478 Bytes

	base_model: Qwen/QwQ-32B
	gate_mode: random
	architecture: qwen
	dtype: bfloat16
	experts:
	- source_model: Qwen/QwQ-32B
	- source_model: Qwen/QwQ-32B
	- source_model: Qwen/QwQ-32B
	- source_model: Qwen/QwQ-32B
	- source_model: Qwen/QwQ-32B
	- source_model: Qwen/QwQ-32B
	- source_model: Qwen/QwQ-32B
	- source_model: Qwen/QwQ-32B
	shared_experts:
	- source_model: Qwen/QwQ-32B
	residual_scale: 0.1 # downweight output from shared expert to prevent overcooking the model