Upload fine-tuned CLIP model

7ebd6e3 verified about 1 month ago

380 Bytes

metadata

language: en
license: mit
authors:
  - Hengyu Shi
tags:
  - clip
  - vision
  - text
  - multimodal

Authors

Fine-tuned CLIP-ViT-bigG-14 Model

This model is a fine-tuned version based on laion/CLIP-ViT-bigG-14-laion2B-39B-b160k.

base_model = CLIPTextModelWithProjection.from_pretrained("Boynn/CLIP-ViT-bigG-14-laion2B-39B-b160k-sft")