Spend Analyzer MCP - API Documentation

This document provides comprehensive API documentation for the Spend Analyzer MCP system, including Modal functions, MCP protocol integration, and local usage.

Modal Functions API
MCP Protocol Integration
Local Python API
Data Formats
Error Handling
Examples

Modal Functions API

1. `process_bank_statements`

Process bank statements from email attachments.

Function Signature:

def process_bank_statements(
    email_config: Dict, 
    days_back: int = 30, 
    passwords: Optional[Dict] = None
) -> Dict

Parameters:

email_config (Dict): Email configuration
- email (str): Email address
- password (str): App-specific password
- imap_server (str): IMAP server address
days_back (int): Number of days to look back (default: 30)
passwords (Dict, optional): PDF passwords by filename

Returns:

{
    "processed_statements": [
        {
            "filename": str,
            "bank": str,
            "account": str,
            "period": str,
            "transaction_count": int,
            "status": str  # "success", "password_required", "error"
        }
    ],
    "total_transactions": int,
    "analysis": Dict,  # Financial analysis data
    "timestamp": str   # ISO format
}

Example:

import modal

app = modal.App.lookup("spend-analyzer-mcp-bmt")
process_statements = app["process_bank_statements"]

email_config = {
    "email": "[email protected]",
    "password": "app_password",
    "imap_server": "imap.gmail.com"
}

result = process_statements.remote(email_config, days_back=30)
print(f"Processed {result['total_transactions']} transactions")

2. `analyze_uploaded_statements`

Analyze directly uploaded PDF statements.

Function Signature:

def analyze_uploaded_statements(
    pdf_contents: Dict[str, bytes], 
    passwords: Optional[Dict] = None
) -> Dict

Parameters:

pdf_contents (Dict[str, bytes]): Mapping of filename to PDF content
passwords (Dict, optional): PDF passwords by filename

Returns:

{
    "processed_files": [
        {
            "filename": str,
            "bank": str,
            "account": str,
            "transaction_count": int,
            "status": str
        }
    ],
    "total_transactions": int,
    "analysis": Dict
}

Example:

# Read PDF files
pdf_contents = {}
with open("statement1.pdf", "rb") as f:
    pdf_contents["statement1.pdf"] = f.read()

analyze_pdfs = app["analyze_uploaded_statements"]
result = analyze_pdfs.remote(pdf_contents)

3. `get_ai_analysis`

Get AI-powered financial analysis using Claude or SambaNova.

Function Signature:

def get_ai_analysis(
    analysis_data: Dict, 
    user_question: str = "", 
    provider: str = "claude"
) -> Dict

Parameters:

analysis_data (Dict): Financial analysis data
user_question (str): Specific question for the AI
provider (str): "claude" or "sambanova"

Returns:

{
    "ai_analysis": str,      # AI-generated analysis text
    "provider": str,         # AI provider used
    "model": str,           # Model name
    "usage": {
        "input_tokens": int,
        "output_tokens": int,
        "total_tokens": int
    }
}

Example:

get_analysis = app["get_ai_analysis"]

analysis_data = {
    "spending_insights": [...],
    "financial_summary": {...},
    "recommendations": [...]
}

# Use Claude for detailed analysis
claude_result = get_analysis.remote(
    analysis_data, 
    "What are my biggest spending risks?", 
    "claude"
)

# Use SambaNova for quick insights
sambanova_result = get_analysis.remote(
    analysis_data, 
    "Quick spending summary", 
    "sambanova"
)

4. `save_user_data` / `load_user_data`

Persistent storage for user analysis data.

Save Function:

def save_user_data(user_id: str, data: Dict) -> Dict

Load Function:

def load_user_data(user_id: str) -> Dict

Example:

save_data = app["save_user_data"]
load_data = app["load_user_data"]

# Save user analysis
save_result = save_data.remote("user123", analysis_data)

# Load user analysis
load_result = load_data.remote("user123")
if load_result["status"] == "found":
    user_data = load_result["data"]

MCP Protocol Integration

Webhook Endpoint

The system provides an MCP webhook endpoint for external integrations:

URL: https://your-modal-app.modal.run/mcp_webhook Method: POST Content-Type: application/json

MCP Tools

1. `process_email_statements`

Description: Process bank statements from email Input Schema:

{
  "type": "object",
  "properties": {
    "email_config": {
      "type": "object",
      "properties": {
        "email": {"type": "string"},
        "password": {"type": "string"},
        "imap_server": {"type": "string"}
      }
    },
    "days_back": {"type": "integer", "default": 30},
    "passwords": {"type": "object"}
  }
}

2. `analyze_pdf_statements`

Description: Analyze uploaded PDF statements Input Schema:

{
  "type": "object",
  "properties": {
    "pdf_contents": {"type": "object"},
    "passwords": {"type": "object"}
  }
}

3. `get_ai_analysis`

Description: Get AI financial analysis Input Schema:

{
  "type": "object",
  "properties": {
    "analysis_data": {"type": "object"},
    "user_question": {"type": "string"},
    "provider": {"type": "string", "enum": ["claude", "sambanova"]}
  }
}

MCP Message Examples

Initialize:

{
  "jsonrpc": "2.0",
  "id": "1",
  "method": "initialize",
  "params": {}
}

List Tools:

{
  "jsonrpc": "2.0",
  "id": "2",
  "method": "tools/list"
}

Call Tool:

{
  "jsonrpc": "2.0",
  "id": "3",
  "method": "tools/call",
  "params": {
    "name": "get_ai_analysis",
    "arguments": {
      "analysis_data": {...},
      "user_question": "How can I save money?",
      "provider": "claude"
    }
  }
}

Local Python API

SpendAnalyzer Class

from spend_analyzer import SpendAnalyzer

analyzer = SpendAnalyzer()

# Load transactions
analyzer.load_transactions(transactions_list)

# Set budgets
analyzer.set_budgets({
    "Food & Dining": 500,
    "Shopping": 300,
    "Gas & Transport": 200
})

# Get insights
insights = analyzer.analyze_spending_by_category()
alerts = analyzer.check_budget_alerts()
summary = analyzer.generate_financial_summary()
recommendations = analyzer.get_spending_recommendations()

# Export all data
export_data = analyzer.export_analysis_data()

EmailProcessor Class

from email_processor import EmailProcessor

email_config = {
    "email": "[email protected]",
    "password": "app_password",
    "imap_server": "imap.gmail.com"
}

processor = EmailProcessor(email_config)

# Fetch emails
emails = await processor.fetch_bank_emails(days_back=30)

# Extract attachments
for email in emails:
    attachments = await processor.extract_attachments(email)
    for filename, content, file_type in attachments:
        if file_type == 'pdf':
            # Process PDF
            pass

PDFProcessor Class

from email_processor import PDFProcessor

processor = PDFProcessor()

# Process PDF
with open("statement.pdf", "rb") as f:
    pdf_content = f.read()

statement_info = await processor.process_pdf(pdf_content, password="optional")

print(f"Bank: {statement_info.bank_name}")
print(f"Account: {statement_info.account_number}")
print(f"Transactions: {len(statement_info.transactions)}")

Data Formats

Transaction Format

{
    "date": "2024-01-15T00:00:00",
    "description": "Amazon Purchase",
    "amount": -45.67,
    "category": "Shopping",
    "account": "****1234",
    "balance": 1500.33
}

Financial Summary Format

{
    "total_income": 3000.0,
    "total_expenses": 1500.0,
    "net_cash_flow": 1500.0,
    "largest_expense": {
        "amount": 200.0,
        "description": "Grocery Store",
        "date": "2024-01-15",
        "category": "Food & Dining"
    },
    "most_frequent_category": "Food & Dining",
    "unusual_transactions": [...],
    "monthly_trends": {...}
}

Spending Insight Format

{
    "category": "Food & Dining",
    "total_amount": 500.0,
    "transaction_count": 15,
    "average_transaction": 33.33,
    "percentage_of_total": 33.3,
    "trend": "increasing",
    "top_merchants": ["Restaurant A", "Grocery Store", "Cafe B"]
}

Budget Alert Format

{
    "category": "Food & Dining",
    "budget_limit": 500.0,
    "current_spending": 450.0,
    "percentage_used": 90.0,
    "alert_level": "warning",
    "days_remaining": 10
}

Error Handling

Common Error Responses

Authentication Error:

{
    "error": "Invalid API key or authentication failed",
    "code": "AUTH_ERROR"
}

PDF Password Error:

{
    "error": "PDF requires password",
    "code": "PASSWORD_REQUIRED",
    "filename": "statement.pdf"
}

Processing Error:

{
    "error": "Failed to parse PDF content",
    "code": "PARSE_ERROR",
    "details": "Unsupported PDF format"
}

Rate Limit Error:

{
    "error": "API rate limit exceeded",
    "code": "RATE_LIMIT",
    "retry_after": 60
}

Error Handling Best Practices

Always check for errors in API responses
Implement retry logic for transient failures
Handle password-protected PDFs gracefully
Monitor API usage to avoid rate limits
Log errors for debugging

Examples

Complete Workflow Example

import modal
import asyncio

async def analyze_finances():
    # Connect to Modal app
    app = modal.App.lookup("spend-analyzer-mcp-bmt")
    
    # Process email statements
    email_config = {
        "email": "[email protected]",
        "password": "app_password",
        "imap_server": "imap.gmail.com"
    }
    
    process_statements = app["process_bank_statements"]
    email_result = process_statements.remote(email_config, days_back=30)
    
    # Upload additional PDFs
    pdf_contents = {}
    with open("additional_statement.pdf", "rb") as f:
        pdf_contents["additional.pdf"] = f.read()
    
    analyze_pdfs = app["analyze_uploaded_statements"]
    pdf_result = analyze_pdfs.remote(pdf_contents)
    
    # Combine analysis data
    combined_analysis = {
        **email_result["analysis"],
        "additional_transactions": pdf_result["total_transactions"]
    }
    
    # Get AI analysis
    get_analysis = app["get_ai_analysis"]
    
    # Use Claude for detailed analysis
    claude_analysis = get_analysis.remote(
        combined_analysis,
        "Provide a comprehensive financial health assessment",
        "claude"
    )
    
    # Use SambaNova for quick insights
    sambanova_analysis = get_analysis.remote(
        combined_analysis,
        "What are my top 3 spending categories?",
        "sambanova"
    )
    
    print("Claude Analysis:", claude_analysis["ai_analysis"])
    print("SambaNova Analysis:", sambanova_analysis["ai_analysis"])

# Run the analysis
asyncio.run(analyze_finances())

Integration with External Systems

import requests
import json

def call_mcp_webhook(data):
    """Call the MCP webhook endpoint"""
    webhook_url = "https://your-modal-app.modal.run/mcp_webhook"
    
    mcp_message = {
        "jsonrpc": "2.0",
        "id": "1",
        "method": "tools/call",
        "params": {
            "name": "get_ai_analysis",
            "arguments": data
        }
    }
    
    response = requests.post(
        webhook_url,
        json=mcp_message,
        headers={"Content-Type": "application/json"}
    )
    
    return response.json()

# Use the webhook
analysis_data = {"spending_insights": [...]}
result = call_mcp_webhook(analysis_data)

Rate Limits and Quotas

Claude API

Rate Limit: 1000 requests/minute
Token Limit: 100K tokens/minute
Best Practice: Use for complex analysis

SambaNova API

Rate Limit: 5000 requests/minute
Token Limit: 500K tokens/minute
Best Practice: Use for quick insights and batch processing

Modal Functions

Concurrent Executions: Auto-scaled
Timeout: Configurable per function
Memory: 2GB default for PDF processing

Support and Troubleshooting

Common Issues

PDF Processing Fails
- Check PDF format compatibility
- Verify password if protected
- Ensure sufficient memory allocation
Email Connection Issues
- Use app-specific passwords
- Verify IMAP server settings
- Check firewall/network restrictions
AI API Errors
- Verify API keys are valid
- Check rate limits
- Monitor token usage

Getting Help

Check the logs: modal logs spend-analyzer-mcp-bmt
Review error messages and codes
Consult the deployment guide
Open an issue with detailed error information

For more detailed information, see the DEPLOYMENT_GUIDE.md file.

Spaces:

Agents-MCP-Hackathon
/

Spend-Analyzer-MCP

Sleeping

Spend Analyzer MCP - API Documentation

Table of Contents

Modal Functions API

1. `process_bank_statements`

2. `analyze_uploaded_statements`

3. `get_ai_analysis`

4. `save_user_data` / `load_user_data`

MCP Protocol Integration

Webhook Endpoint

MCP Tools

1. `process_email_statements`

2. `analyze_pdf_statements`

3. `get_ai_analysis`

MCP Message Examples

Local Python API

SpendAnalyzer Class

EmailProcessor Class

PDFProcessor Class

Data Formats

Transaction Format

Financial Summary Format

Spending Insight Format

Budget Alert Format

Error Handling

Common Error Responses

Error Handling Best Practices

Examples

Complete Workflow Example

Integration with External Systems

Rate Limits and Quotas

Claude API

SambaNova API

Modal Functions

Support and Troubleshooting

Common Issues

Getting Help

Spend Analyzer MCP - API Documentation

Table of Contents

Modal Functions API

1. process_bank_statements

2. analyze_uploaded_statements

3. get_ai_analysis

4. save_user_data / load_user_data

MCP Protocol Integration

Webhook Endpoint

MCP Tools

1. process_email_statements

2. analyze_pdf_statements

3. get_ai_analysis

MCP Message Examples

Local Python API

SpendAnalyzer Class

EmailProcessor Class

PDFProcessor Class

Data Formats

Transaction Format

Financial Summary Format

Spending Insight Format

Budget Alert Format

Error Handling

Common Error Responses

Error Handling Best Practices

Examples

Complete Workflow Example

Integration with External Systems

Rate Limits and Quotas

Claude API

SambaNova API

Modal Functions

Support and Troubleshooting

Common Issues

Getting Help

1. `process_bank_statements`

2. `analyze_uploaded_statements`

3. `get_ai_analysis`

4. `save_user_data` / `load_user_data`

1. `process_email_statements`

2. `analyze_pdf_statements`

3. `get_ai_analysis`