Spaces:

angusfung
/

Kickstarter-prediction-embedding

Sleeping

App Files Files Community

angusfung commited on Apr 23

Commit

2592deb

verified ·

1 Parent(s): c732f23

Update src/ProcessOneSingleCampaign.py

Browse files

Files changed (1) hide show

src/ProcessOneSingleCampaign.py +67 -14

src/ProcessOneSingleCampaign.py CHANGED Viewed

@@ -553,12 +553,22 @@ class CampaignProcessor:
             float: The transformed previous funding goal
         """
         try:
-            previous_goal = float(campaign.get('previous_funding_goal', 0))
-            # Log1p transformation, good for general compression while preserving relative differences
-            transformed_goal = np.log1p(previous_goal)/np.log(10)
-            return transformed_goal
         except Exception as e:
             print(f"Error processing previous funding goal for campaign {idx}: {str(e)}")
@@ -579,12 +589,22 @@ class CampaignProcessor:
             float: The transformed previous pledged amount
         """
         try:
-            pledged = float(campaign.get('previous_pledged', 0))
-            # Log1p transformation, good for general compression while preserving relative differences
-            transformed_pledge = np.log1p(pledged)/np.log(10)
-            return transformed_pledge
         except Exception as e:
             print(f"Error processing pledge amount for campaign {idx}: {str(e)}")
@@ -595,6 +615,8 @@ class CampaignProcessor:
         Calculate success rate of creator's previous campaigns.
         Computes the ratio of successful previous projects to total previous projects.
         Args:
             campaign (Dict): Campaign data
@@ -604,9 +626,20 @@ class CampaignProcessor:
             float: The previous success rate (0-1)
         """
         try:
             previousProjects = float(campaign.get('previous_projects_count', 0))
             previousSuccessfulProjects = float(campaign.get('previous_successful_projects', 0))
             if previousProjects == 0.0:
                 return 0.0
             else:
@@ -639,6 +672,9 @@ class CampaignProcessor:
         """
         self._ensure_models_loaded()
         # Generate embeddings for text fields
         description_embedding, calculated_description_length = self.process_description_embedding(campaign, idx)
@@ -662,10 +698,27 @@ class CampaignProcessor:
         result['previous_pledged'] = self.process_previous_pledged(campaign, idx)
         # Calculate success rate based on previous projects
         result['previous_success_rate'] = self.calculate_previous_sucess_rate(campaign, idx)
-        # Extract simple integer features
-        for field in ['image_count', 'video_count', 'campaign_duration', 'previous_projects_count']:
             result[field] = int(campaign.get(field, 0))
         return result

             float: The transformed previous funding goal
         """
         try:
+            # Check if value is already provided in the expected field
+            if 'previous_funding_goal' in campaign:
+                previous_goal = float(campaign.get('previous_funding_goal', 0))
+                print(f"Using provided previous_funding_goal directly: {previous_goal}")
+            else:
+                print(f"No previous_funding_goal in input data, looking for alternative field names")
+                previous_goal = 0.0
+            # Apply logarithmic transformation
+            if previous_goal > 0:
+                # Log1p transformation, good for general compression while preserving relative differences
+                transformed_goal = np.log1p(previous_goal)/np.log(10)
+                print(f"Applied log transformation to previous_funding_goal: {previous_goal} → {transformed_goal}")
+                return transformed_goal
+            else:
+                return 0.0
         except Exception as e:
             print(f"Error processing previous funding goal for campaign {idx}: {str(e)}")
             float: The transformed previous pledged amount
         """
         try:
+            # Check if value is already provided in the expected field
+            if 'previous_pledged' in campaign:
+                pledged = float(campaign.get('previous_pledged', 0))
+                print(f"Using provided previous_pledged directly: {pledged}")
+            else:
+                print(f"No previous_pledged in input data, looking for alternative field names")
+                pledged = 0.0
+            # Apply logarithmic transformation
+            if pledged > 0:
+                # Log1p transformation, good for general compression while preserving relative differences
+                transformed_pledge = np.log1p(pledged)/np.log(10)
+                print(f"Applied log transformation to previous_pledged: {pledged} → {transformed_pledge}")
+                return transformed_pledge
+            else:
+                return 0.0
         except Exception as e:
             print(f"Error processing pledge amount for campaign {idx}: {str(e)}")
         Calculate success rate of creator's previous campaigns.
         Computes the ratio of successful previous projects to total previous projects.
+        Can use either direct 'previous_success_rate' or calculate from
+        'previous_successful_projects' and 'previous_projects_count'.
         Args:
             campaign (Dict): Campaign data
             float: The previous success rate (0-1)
         """
         try:
+            # First check if success rate is provided directly
+            if 'previous_success_rate' in campaign:
+                # Log the direct usage for debugging
+                rate = float(campaign.get('previous_success_rate', 0))
+                print(f"Using provided previous_success_rate directly: {rate}")
+                return rate
+            # Otherwise calculate from successful projects and total projects
             previousProjects = float(campaign.get('previous_projects_count', 0))
             previousSuccessfulProjects = float(campaign.get('previous_successful_projects', 0))
+            # Log the values used for calculation (for debugging)
+            print(f"Calculating success rate from: projects={previousProjects}, successful={previousSuccessfulProjects}")
             if previousProjects == 0.0:
                 return 0.0
             else:
         """
         self._ensure_models_loaded()
+        # Log the incoming campaign data for debugging
+        print(f"Processing campaign {idx} with keys: {list(campaign.keys())}")
         # Generate embeddings for text fields
         description_embedding, calculated_description_length = self.process_description_embedding(campaign, idx)
         result['previous_pledged'] = self.process_previous_pledged(campaign, idx)
         # Calculate success rate based on previous projects
+        # Ensure both direct values and calculated values are handled
         result['previous_success_rate'] = self.calculate_previous_sucess_rate(campaign, idx)
+        # Extract simple integer features, with specific handling for previous_projects_count
+        for field in ['image_count', 'video_count', 'campaign_duration']:
             result[field] = int(campaign.get(field, 0))
+        # Special handling for previous_projects_count to ensure consistency
+        if 'previous_projects_count' in campaign:
+            # Use the value directly from input
+            result['previous_projects_count'] = int(campaign.get('previous_projects_count', 0))
+            print(f"Using provided previous_projects_count: {result['previous_projects_count']}")
+        else:
+            # Default to 0 if not provided
+            result['previous_projects_count'] = 0
+        # Log the final result for debugging
+        print(f"Processed campaign with previous metrics: " +
+              f"count={result.get('previous_projects_count')}, " +
+              f"rate={result.get('previous_success_rate')}, " +
+              f"pledged={result.get('previous_pledged')}, " +
+              f"goal={result.get('previous_funding_goal')}")
         return result