cdreetz
/

kwen2.5-1.5b-v2

Text Generation

code-generation

Model card Files Files and versions

cdreetz commited on Jul 17, 2025

Commit

991ee4e

·

verified ·

1 Parent(s): 6165a91

Create README.md

Files changed (1) hide show

README.md +31 -0

README.md ADDED Viewed

	@@ -0,0 +1,31 @@

+# Triton Kernel Code Generation Model
+This model is a fine-tuned version of Qwen/Qwen2.5-1.5B-Instruct specialized for generating Triton GPU kernels.
+## Model Details
+- **Base Model**: Qwen/Qwen2.5-1.5B-Instruct
+- **Fine-tuned on**: 6000 examples of Triton kernel code
+## Usage
+```python
+from transformers import AutoTokenizer, AutoModelForCausalLM
+model = AutoModelForCausalLM.from_pretrained("cdreetz/kwen2.5-1.5b-v2")
+tokenizer = AutoTokenizer.from_pretrained("cdreetz/kwen2.5-1.5b-v2")
+prompt = "Write a Triton kernel for element-wise addition:"
+inputs = tokenizer(prompt, return_tensors="pt")
+outputs = model.generate(**inputs, max_new_tokens=512)
+response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+print(response)
+```
+## Limitations
+- Specialized for Triton kernel generation only
+- May require prompt engineering for optimal results
+- Generated kernels should be tested before production use