AlexHung29629
/

test_mllama_11B_v2.bak

Feature Extraction

Model card Files Files and versions Community

AlexHung29629 commited on Oct 30, 2024

Commit

14befaf

·

verified ·

1 Parent(s): cddd5fd

Update modeling_llama3.py

Files changed (1) hide show

modeling_llama3.py +1 -11

modeling_llama3.py CHANGED Viewed

@@ -548,20 +548,10 @@ class Llama3ForConditionalGeneration(Llama3PreTrainedModel, GenerationMixin):
         if cross_attention_mask is not None and cache_position is not None:
             cross_attention_mask = cross_attention_mask[:, :, cache_position]
             full_text_row_masked_out_mask = full_text_row_masked_out_mask[:, :, cache_position]
-        if audio_features is not None:
-            if input_ids is None:
-                raise ValueError("You must provide `input_ids` if you pass `audio_features`.")
-            inputs_embeds = self.audio_model(
-                audio_features=audio_features,
-                input_ids=input_ids,
-                return_dict=False,
-            )
-            input_ids = None
         outputs = self.language_model(
             input_ids=input_ids,
             attention_mask=attention_mask,
             position_ids=position_ids,
             cross_attention_states=cross_attention_states,

         if cross_attention_mask is not None and cache_position is not None:
             cross_attention_mask = cross_attention_mask[:, :, cache_position]
             full_text_row_masked_out_mask = full_text_row_masked_out_mask[:, :, cache_position]
         outputs = self.language_model(
             input_ids=input_ids,
+            audio_features=audio_features,
             attention_mask=attention_mask,
             position_ids=position_ids,
             cross_attention_states=cross_attention_states,