So extrahieren Sie automatisch und ohne Codierung Text aus PDFs!
Durch die Nutzung unseres Produkts können Benutzer ihren Arbeitsablauf optimieren und in wenigen Minuten effizient Text aus PDFs extrahieren. Unser automatisiertes System macht die manuelle Dateneingabe überflüssig, reduziert das Fehlerrisiko und erhöht die Gesamtproduktivität. Mit nur wenigen einfachen Klicks können Benutzer Text aus mehreren PDF-Dateien gleichzeitig extrahieren, was es zu einem wertvollen Werkzeug für Unternehmen und Privatpersonen macht.
Erstellen Sie in einer Minute Ihren automatisierten PDF-zu-Text-Extraktor! Die perfekte Lösung für alle, die mit großen Mengen eingehender Lebensläufe oder anderer Dokumente zu tun haben! Extrahieren Sie Daten aus Dokumenten mithilfe des Remote-Workflows auf Latenode.com!
Es gibt einen Teil der ... In diesem Artikel erfahren Sie, wie Sie einen automatisierten Workflow ohne Code erstellen, der mithilfe von API und Chat GPT Daten aus den PDF-Dateien auf Ihrem Google Drive extrahiert und das Google Sheet-Formular mit den Daten füllt.
Außerdem können Sie die Vorlage für dieses Szenario kostenlos kopieren und für sich selbst verwenden!
Sie können diese Vorlage aktualisieren oder sie nicht nur zur PDF-Textextraktion verwenden.
Szenarioübersicht
Schauen wir uns zunächst das gesamte PDF-Scraper-Szenario an und analysieren dann jeden Schritt.
Es gibt einen Teil der ...
Wie funktioniert dieses PDF-Extrakt-Szenario? Einmal pro Stunde werden alle Lebensläufe im PDF-Format aus Google Drive abgerufen, mithilfe einer HTTP-Anforderung in TXT-Dateien konvertiert und anschließend vom ChatGPT-Assistenten die benötigten Daten extrahiert und die Google-Tabelle ausgefüllt.
Hauptschritte des Szenarios:
Zeitplan-Trigger. Aktiviert das Szenario in einem festgelegten Zeitraum.
Google Drive. Hier haben wir zwei Knoten: „Datei suchen“ und „Datei herunterladen“.
Javascript Wir werden im gesamten Szenario Javascript-Knoten mit AI Copilot zur Dateiformatierung verwenden. Zuerst habe ich AI gebeten, mir Code zu geben, der Dateien von Google Drive in das Base64-Format konvertiert.
HTTP-Anfrage. Verwenden Sie die API, um Text aus PDF-Dateien zu extrahieren und dabei die API-Dokumente bewährter Dienste von Drittanbietern zu verwenden.
ChatGPT. Der ChatGPT-Assistent extrahiert die Daten aus dem Text.
Google-Tabellen. Füllt das Blatt mit diesen Informationen aus,
Szenarioaufschlüsselung
Und hier ist eine Schritt-für-Schritt-Anleitung für diejenigen, die den Vorgang erlernen möchten. Denken Sie an die kostenlosen und einsatzbereiten Vorlagen am Ende des Artikels.
Vorbereitungen
Für dieses Szenario müssen Sie Open AI Assistants und einen beliebigen API-Konverter verwenden können.
OpenAI-Assistent
Das ist ganz einfach. Loggen Sie sich in Ihr OpenAI-Konto ein und gehen Sie dann zu Assistentenund klicken Sie oben rechts auf die Schaltfläche „Erstellen“. Sie sehen das Einstellungsfenster des Assistenten.
Hier müssen Sie:
Geben Sie Ihrem Assistenten einen Namen
Geben Sie ihm Anweisungen davon, wie Sie antworten möchten, und etwas Kontext. Wir empfehlen Ihnen, es anzuweisen, angehängte Dateien zu verwenden, da es sonst möglicherweise vergisst, dies zu tun.
Wähle ein Modell
Verfügbare Tools auswählen und Dateien hinzufügen die der Assistent verwenden kann. Vergessen Sie nicht, den Abruf zu aktivieren, damit das Hinzufügen von Dateien möglich ist.
Kopieren Sie die ID des Assistenten (Sie sehen sie unter der Spalte Name) und gehen Sie dann zuAPI-Schlüssel, erstellen Sie eins und speichern Sie es.
PDF-zu-TXT-Konverter
Verwenden Sie, was Sie möchten. Ich nahm ConvertAPI weil es eine kostenlose Testversion gibt und viele Informationen bietet.
Es gibt einen Teil der ...
Szenario erstellen
Nun wechseln wir zuLatenode.com. Hier müssen wir das Szenario zur Konvertierung von PDF in Text erstellen: (Sie müssen es nicht von Grund auf neu erstellen, kopieren Sie einfach die Vorlage am Ende des Artikels)
Zeitplan-Trigger
Klicken Sie auf der Registerkarte „Szenario“ auf „Knoten hinzufügen“ und wählen Sie „Planen“ aus der Liste. Klicken Sie auf den Knoten, um ihn einzurichten. Geben Sie das Intervall und die Zeitzone an und speichern Sie die Änderungen. Ich habe der Einfachheit halber auch einen Trigger für „Einmal ausführen“ hinzugefügt.
Google Drive-Knoten
Klicken Sie auf „Knoten hinzufügen“, suchen Sie auf der Registerkarte „Aktionen“ nach dem Google Drive-Ordner und wählen Sie den Knoten „Datei suchen“. Damit es funktioniert, müssen Sie sich bei Ihrem Gmail-Konto anmelden, um ein Zugriffstoken zu erhalten, Laufwerk und Suchnamen auswählen. In diesem Fall möchte ich Daten aus Dateien extrahieren, deren Name „CV“ enthält.
Es gibt einen Teil der ...
Fügen Sie als Nächstes „Datei herunterladen“ aus demselben Aktionsordner von Google Drive hinzu.
Verwenden Sie die ID aus den Ergebnissen des vorherigen Knotens und klicken Sie dann einmal auf „Knoten ausführen“, um die Änderungen zu speichern und den Datenfluss durch das Szenario zu steuern. Sie erhalten die Datei in der Ausgabe.
Javascript Nr. 1: In Base64 konvertieren
Das ist der Code, den mir die KI gegeben hat. Du kannst ihn nehmen hier(#1). Ersetzen Sie const fileContentPath durch Ihr Objekt aus dem vorherigen Knoten.
HTTP-Anfrage
Suchen Sie in der Liste der Aktionen nach HTTP-Anfragen. Um zu erfahren, wie Sie diese erstellen, besuchen Sie ConvertAPI Dokumentation. Hier können wir Informationen zum Einrichten der Anfrage entnehmen.
So sieht meine Anfrage zur Konvertierung von PDF in TXT aus.
Es gibt einen Teil der ...
Ich verwende ein Objekt aus dem Google Drive-Knoten „Datei suchen“, um den Namen der heruntergeladenen Datei und den Dateiinhalt in Base64 aus dem Javascript-Knoten anzugeben. Und füge in den Headern das Paar Content-Type=application/json hinzu.
Führen Sie den Knoten einmal aus, um die Datei aus der HTTP-Anforderung abzurufen.
Dieses Mal habe ich die KI gebeten, Text aus der TXT-Datei zu extrahieren.
ChatGPT-Knoten
Wir werden hier auf 3 GPT-Knoten stoßen:
Erstelle einen Thread
Nachricht erstellen
Lauf erstellen
Jeder Knoten führt eine Aktion mit OpenAI aus.
Zuerst erstellen wir einen Thread oder eine Konversation mit dem GPT-Assistenten
Geben Sie Ihren Open AI API-Schlüssel ein, das war‘s! Führen Sie den Knoten einmal aus und erhalten Sie die ID des erstellten Threads in der Ausgabe.
Nachricht erstellen:
Auch hier benötigst du wieder einen API-Schlüssel. In das Thread-ID-Feld trägst du das Ergebnis des vorherigen Knotens ein. Du siehst es im Hilfsfenster, nachdem du auf das Eingabefeld geklickt hast.
Geben Sie unter „Nachrichteninhalt“ bei Bedarf zusätzliche Anweisungen ein und fügen Sie den Dateiinhalt des letzten Javascript-Knotens ein. Der automatische PDF-Extraktor ist einen Schritt näher gekommen!
Lauf erstellen
Dieser Knoten erhält die PDF-Scraper-Antwort.
Geben Sie den Knoten genau wie Ihren OpenAI-Assistenten an und verwenden Sie die GPT-Assistenten-ID.
Javascript #3
Hier verwenden wir ein letztes Mal den JS-Knoten, um aus der Antwort des Assistenten drei separate JSON-Objekte zu machen.
Hier ist die Beispiel, geben Sie Ihre Daten einfach in content const ein.
Google Blätter
Lassen Sie uns diese Daten irgendwo ablegen. Google Sheets ist für dieses Szenario zum Extrahieren von PDF-Daten auf latenode.com eine gute Option.
Melden Sie sich noch einmal beim Gmail-Konto an, um einen Zugriffstoken zu erhalten, wählen Sie das Laufwerk und das Blatt aus und geben Sie JSONs in die Felder ein, speichern Sie das Szenario und klicken Sie einmal auf „Ausführen“, um das Szenario auszuführen oder bereitzustellen und den Zeitplanauslöser zu aktivieren.
Ergebnisse
Nach einer erfolgreichen Szenarioausführung extrahiert dieser Workflow den Text aus der PDF-Datei auf Ihrem Google Drive und fügt ihn in Ihre Google-Tabelle ein.
So erstellen Sie einen PDF-Extraktor ohne Code auf Latenode.
Wie versprochen finden Sie hier die Vorlage für diesen Workflow. Kopieren Sie sie einfach und folgen Sie diesem Anleitungsartikel, um ihn einzurichten.
Es gibt ein Video dazu, Sie brauchen es also nicht zu lesen!
Wenn Sie möchten, dass Ihnen jemand hilft, schauen Sie in unserem Discord-Kanal vorbei. Dort haben wir einige Entwickler, die Ihnen gerne weiterhelfen!
Kann ich Latenode verwenden, wenn ich mich mit Programmierung nicht auskenne?
Ja, Latenode ist für Benutzer aller Fähigkeitsstufen konzipiert. Es bietet erweiterte Funktionen für JavaScript-Kenntnisse und intuitive visuelle Tools und KI-Unterstützung für Anfänger. Egal, ob Sie ein erfahrener Entwickler oder ein Anfänger sind, Latenode bietet eine benutzerfreundliche Erfahrung, die auf Ihr Fähigkeitsniveau zugeschnitten ist.
Kann Latenode in Dienste und APIs von Drittanbietern integriert werden?
Ja, Latenode unterstützt die Integration mit einer Vielzahl von Diensten und APIs von Drittanbietern. Sie können Latenode mit verschiedenen Online-Plattformen, Datenbanken und Softwaresystemen verbinden, um Datenübertragungen zu automatisieren, Aktionen auszulösen und Arbeitsabläufe zu optimieren. Latenode bietet auch Tools und Ressourcen, um den Integrationsprozess zu erleichtern.
Gibt es eine kostenlose Version von Latenode?
Ja, Latenode bietet eine kostenlose Version an, mit der Sie die Funktionen erkunden können. Diese Version enthält eine Teilmenge der Funktionen von Latenode, sodass Sie mit der Automatisierung beginnen und ihre Vorteile erleben können. Sie können dann entscheiden, ob Sie auf einen kostenpflichtigen Plan mit zusätzlichen Funktionen und Ressourcen upgraden möchten.
Was ist Latenode?
Latenode ist ein visuelles und intuitives Automatisierungstool, das Benutzern die Möglichkeit bietet, ihre Arbeitsabläufe durch Automatisierung zu optimieren. Benutzer können damit automatisierte Strategien erstellen, indem sie verschiedene Webdienste und Geräte miteinander verbinden, sodass sie Aufgaben automatisieren und die Produktivität effektiv steigern können.
Wie hilft Latenode dabei, Chancen zu maximieren?
Durch die Integration aller Ihrer Marketingtools an einem Ort mittels Datenintegration hilft Ihnen Latenode, einen umfassenden Überblick über Ihre Abläufe zu erhalten. So können Sie potenzielle Chancen leichter erkennen und fundierte Entscheidungen auf der Grundlage genauer Daten treffen.