qnguyen3
/

nanoLLaVA

Text Generation

Model card Files Files and versions

qnguyen3 commited on Apr 7, 2024

Commit

4abfe6b

·

verified ·

1 Parent(s): db6b859

Create README.md

Files changed (1) hide show

README.md +55 -0

README.md ADDED Viewed

	@@ -0,0 +1,55 @@

+```python
+import torch
+import transformers
+from transformers import AutoModelForCausalLM, AutoTokenizer
+from PIL import Image
+import warnings
+# disable some warnings
+transformers.logging.set_verbosity_error()
+transformers.logging.disable_progress_bar()
+warnings.filterwarnings('ignore')
+# set device
+torch.set_default_device('cuda')  # or 'cuda'
+# create model
+model = AutoModelForCausalLM.from_pretrained(
+    'qnguyen3/siglip-quyen-0.5b-chatml',
+    torch_dtype=torch.float16,
+    device_map='auto',
+    trust_remote_code=True)
+tokenizer = AutoTokenizer.from_pretrained(
+    'qnguyen3/siglip-quyen-0.5b-chatml',
+    trust_remote_code=True)
+# text prompt
+prompt = 'Describe this image in detail'
+messages = [
+    {"role": "user", "content": f'<image>\n{prompt}'}
+]
+text = tokenizer.apply_chat_template(
+    messages,
+    tokenize=False,
+    add_generation_prompt=True
+)
+print(text)
+text_chunks = [tokenizer(chunk).input_ids for chunk in text.split('<image>')]
+input_ids = torch.tensor(text_chunks[0] + [-200] + text_chunks[1], dtype=torch.long).unsqueeze(0)
+# image, sample images can be found in images folder
+image = Image.open('/home/qnguyen3/qnguyen3/nanoLLaVA/icon.png')
+image_tensor = model.process_images([image], model.config).to(dtype=model.dtype)
+# generate
+output_ids = model.generate(
+    input_ids,
+    images=image_tensor,
+    max_new_tokens=1024,
+    use_cache=True)[0]
+print(tokenizer.decode(output_ids[input_ids.shape[1]:], skip_special_tokens=True).strip())
+```