1456995462
Implemented a full-stack web application for fine-tuning LLMs on email data, optimized for Apple Silicon (M4 Pro with 24GB RAM). Features: - Mail import with drag & drop support (.mbox, .eml, .txt) - Automated mail cleaning and preprocessing - Interactive labeling interface with keyboard shortcuts - Training data export to JSONL format - MLX-based LoRA fine-tuning with live updates - Model evaluation and comparison interface - Server-Sent Events for real-time training progress - Dark theme UI optimized for extended use Technical Stack: - Backend: FastAPI with SQLite database - Frontend: Vanilla HTML/CSS/JavaScript (no external dependencies) - ML Framework: MLX for Apple Silicon optimization - Models: Support for Mistral 7B and Llama 3 8B via MLX Components: - data_manager.py: SQLite operations for mail storage and labeling - mail_parser.py: Parser for multiple mail formats with cleaning - training.py: MLX training wrapper with LoRA support - inference.py: Model loading and inference for evaluation - main.py: FastAPI backend with REST API and SSE - Frontend: Complete UI with all features Documentation: - Comprehensive README with installation and usage guide - Quick-start guide for rapid setup - Example mails for testing - Troubleshooting and best practices Ready for local deployment and fine-tuning workflows.
2.3 KiB
2.3 KiB
Beispiel-Mails für Training
Diese Beispiel-Mails können zum Testen des Mail-Imports verwendet werden.
Enthaltene Beispiele
-
test1.txt - Projekt-Update
- Typ: Status-Update
- Empfohlen für: "Zusammenfassen"
-
test2.txt - Kundenanfrage
- Typ: Support-Anfrage
- Empfohlen für: "Antwort schreiben"
-
test3.txt - Meeting Notes
- Typ: Meeting-Protokoll
- Empfohlen für: "Action Items"
-
test4.txt - Out of Office
- Typ: Automatische Antwort
- Empfohlen für: "Kategorisieren" (als "Automatisch" oder "Skip")
Verwendung
- Wähle eine oder mehrere Dateien aus
- Ziehe sie per Drag & Drop in die App
- Die Mails werden automatisch geparst und bereinigt
- Gehe zum Labeling und füge die erwarteten Outputs hinzu
Beispiel-Labels
test1.txt (Zusammenfassen)
Alex berichtet über erfolgreichen Abschluss der API-Integration mit 40% Performance-Verbesserung.
Nächste Woche starten Frontend-Anpassungen durch Maria und Tom.
Go-Live bleibt für Ende März geplant.
test2.txt (Antwort schreiben)
Sehr geehrter Herr Schmidt,
vielen Dank für Ihre Anfrage zu Rechnung #2847.
Sie haben recht - hier ist uns ein Fehler unterlaufen. Der korrekte Betrag
laut Angebot beträgt 1.250€. Wir werden die Rechnung korrigieren und Ihnen
die berichtigte Version bis morgen zusenden.
Wir entschuldigen uns für die Unannehmlichkeiten.
Mit freundlichen Grüßen
Support-Team
test3.txt (Action Items)
- Sarah: Pressemitteilung vorbereiten (Deadline: Freitag)
- Marketing-Team: Social Media Content erstellen (nächste Woche)
- Lisa: Influencer-Kontakte aufnehmen
- Design-Team: Finale Produktfotos liefern
- Location für Launch-Event buchen (1. April)
- Website-Landing-Page live schalten (bis Mittwoch)
- Feedback an Lisa bis Mittwoch
test4.txt (Kategorisieren)
Kategorie: Automatische Antwort / Out of Office
Status: Abwesenheit vom 18.03.-25.03.2024
Vertretung: sarah.koch@company.com (Vertrieb), support@company.com (Support)
Eigene Mails hinzufügen
Du kannst auch eigene .txt Dateien erstellen. Format:
Subject: Dein Betreff
From: absender@example.com
To: empfaenger@example.com
Date: 2024-03-15
Hier kommt der Mail-Text...
Die ersten Zeilen mit Subject:/From:/To:/Date: sind optional. Wenn sie fehlen, wird der gesamte Text als Mail-Body interpretiert.