📄

Automatische Datenextraktion aus Dokumenten mit Make.com

Jul 23, 2024

Automatische Datenextraktion aus Dokumenten mit Make.com

Einleitung

  • Thema: Automatische Datenextraktion aus Dokumenten mit Make.com
  • Problem: Zugriff auf BinĂ€rreprĂ€sentation statt Text in Dokumenten (PDFs, .exe-Dateien) innerhalb Make.com
  • Beispiel: PDF-Anhang wird als binĂ€res Datenformat dargestellt

Vergleich mit ChatGPT

  • ChatGPT: Nimmt Datei, extrahiert Text vor Weitergabe an AI-Modell
  • Assistant API (OpenAI): Datei wird in kleine Abschnitte zerlegt, relevante Abschnitte bei Fragen durchsucht

Grundlegendes zum Nutzen

  • Fundamentale FĂ€higkeit: NĂŒtzlich fĂŒr verschiedene Automatisierungszwecke
  • Beispiel: PDF-Rechnungen in Tabelle einfĂŒgen und kategorisieren

AnwendungsfÀlle

  • Berichte von Agenten/Professionellen: Analysieren, synthetisieren, transformieren
  • Dokumententypen: PDFs, Docx-Dateien
  • Praxisbeispiel: PDF-Rechnungen in Tabellen einfĂŒgen (Kos­ten, Beschreibung, Datum)

Schritte im Build

1. Datei in Make.com einfĂŒgen

  • Dateiformate in Make.com: Dateiname, -grĂ¶ĂŸe, -typ, BinĂ€rdaten
  • Verwendung des Custom Mail Hooks: PDF-Anhang per E-Mail an eigene Mail-Hook-Adresse senden

2. BinÀrdaten in Text umwandeln

  • Tool: Dumpling AI (Alternativen: CloudConvert)
  • Konvertierungsmethode: Dokument in Text konvertieren
  • EinfĂŒgungsmethode: URL oder Base64; hier Base64
  • Make.com Funktion: Base64-Funktion zur Umwandlung der AnhĂ€nge in Base64-Darstellung

3. AI-Automatisierung

  • Verwendetes Modell: GPT-4
  • System-Prompt: Extraktion als JSON (Kos­ten, Beschreibung, Datum)
  • Response Format: JSON-Objekt
  • Eingabe: Ausgabe von Dumpling AI

4. JSON in Variablen umwandeln (make.com)

  • Modul: ParseJson
  • Variablen: Kos­ten, Beschreibung, Datum

5. Daten in Google Sheets einfĂŒgen

  • Ziel: Einfache und planmĂ€ĂŸige Datenextraktion und -verarbeitung
  • Endergebnis: Tabellenkalkulation mit Daten aus PDF-Dateien
  • Weitergehende Automatisierung: TĂ€gliches Abrufen und Verarbeiten der E-Mails

Schlussgedanken

  • Flexibel Anwendbar: Nutzen fĂŒr verschiedene Dokumententypen und AnwendungsfĂ€lle
  • Call to Action: Feedback und Fragen in Kommentaren, Business-Anfragen ĂŒber Link in der Videobeschreibung