Preços
PRODUTO
SOLUÇÕES
por casos de uso
AI Gestão de leadsFacturaçãoMídia socialGestão de ProjetosGestão de dadospor setor
saber mais
BlogModelosVÍDEOSYoutubeRECURSOS
COMUNIDADES E MÍDIAS SOCIAIS
PARCEIROS
Ao utilizar nosso produto, os usuários podem agilizar seu fluxo de trabalho e extrair texto de PDFs de forma eficiente em questão de minutos. Nosso sistema automatizado elimina a necessidade de entrada manual de dados, reduzindo o risco de erros e aumentando a produtividade geral. Com apenas alguns cliques simples, os usuários podem extrair texto de vários arquivos PDF simultaneamente, tornando-o uma ferramenta valiosa para empresas e indivíduos.
Crie seu extrator automatizado de PDF para texto em um minuto! Solução perfeita para quem lida com grandes quantidades de CVs ou outros documentos recebidos! Extraia dados de documentos usando fluxo de trabalho remoto no Latenode.com!
Neste artigo, você verá como criar um fluxo de trabalho automatizado sem código que extrairá dados dos arquivos PDF no seu Google Drive usando API e Chat GPT, além de preencher o formulário do Planilhas Google com os dados.
Além disso, você pode obter o modelo desse cenário que pode copiar e usar gratuitamente!
Você pode atualizar este modelo ou usá-lo não apenas para extração de texto em PDF.
Vamos primeiro dar uma olhada em todo o cenário do PDF Scraper e depois detalhar cada etapa.
Como funciona esse cenário de extração de PDF? Uma vez por hora, ele pega todos os CVs em formato PDF do Google Drive, converte para arquivos txt usando solicitação HTTP, então o assistente chatGPT extrai os dados necessários e preenche a Planilha do Google.
E aqui vai uma instrução passo a passo para aqueles que querem aprender o processo. Lembre-se dos modelos gratuitos e prontos para uso no final do artigo.
Para este cenário, você precisará ter a capacidade de usar Open AI Assistants e qualquer conversor de API.
Isso é simples. Entre na sua conta OpenAI e vá para assistentes, e clique no botão “criar” no canto superior direito. Você verá o painel de configurações do assistente.
Aqui você precisa:
Copie o ID do assistente (você o vê na coluna Nome) e vá para Chaves API, crie um e salve-o.
Use qualquer um que você goste. Eu peguei ConvertAPI porque tem um teste gratuito e fornece muitas informações.
Agora mudamos para Latenode.com. Aqui, temos que criar o cenário de conversão de pdf para texto: (Você não precisa criá-lo do zero, basta copiar o modelo no final do artigo)
Clique em “Add node” na aba de cenário, escolha “Schedule” na lista. Clique no nó para configurá-lo. Especifique o intervalo e o fuso horário, salve as alterações. Também adicionei um gatilho em Run once, apenas por conveniência.
Clique em “Adicionar nó”, procure pela pasta do Google Drive na aba de ações e escolha o nó “Localizar arquivo”.
Para fazer funcionar, você tem que fazer login na conta do Gmail para obter o token de acesso, escolher a unidade e Pesquisar nome. Neste caso, quero extrair dados de arquivos que têm CV no nome.
Em seguida, adicione “Baixar arquivo” da mesma pasta de ação do Google Drive.
Use id dos resultados do nó anterior e, em seguida, clique em run node uma vez para salvar as alterações e fazer os dados fluírem pelo cenário. Você obterá o arquivo na saída.
Esse é o código que a IA me deu. Você pode pegá-lo aqui(#1). Substitua const fileContentPath pelo seu objeto do nó anterior.
Encontre a solicitação HTTP na lista de ações. Para entender como criá-la, visite ConvertAPI documentação. Aqui podemos obter informações sobre como configurar a solicitação.
Veja como ficou minha solicitação de conversão de PDF para txt.
Eu uso um objeto do nó Find file Google Drive para especificar o nome do arquivo baixado e o conteúdo do arquivo em base64 do nó Javascript. E adicione o par Content-Type=application/json em Headers.
Execute node uma vez para obter o arquivo da solicitação HTTP.
Outro nó de código, #2 aqui.
Desta vez, pedi à IA para extrair o texto do arquivo txt.
Enfrentaremos 3 nós GPT aqui:
Cada nó executa uma ação com o OpenAI.
Primeiro criamos um tópico ou conversa com o Assistente GPT
Insira sua chave Open AI API, pronto! Execute node uma vez e obtenha o id do thread criado na saída.
Aqui você precisa de uma chave API novamente. No campo thread ID, coloque o resultado do nó anterior. Você o verá na janela auxiliar depois de clicar no campo de entrada.
Em “Message content” dê algumas instruções adicionais se quiser e coloque o filecontent do último nó Javascript. O extrator de PDF automatizado está um passo mais perto!
Este nó recebe a resposta do scraper de PDF.
Especifique o nó como seu assistente OpenAI e use o ID do assistente GPT.
Aqui usamos o nó JS pela última vez para criar 3 objetos JSON separados a partir da resposta dos Assistentes.
Aqui está o exemplo, basta colocar seus dados em content const.
Vamos colocar esses dados em algum lugar. O Planilhas Google é uma boa opção para esse cenário de extração de dados em PDF no latenode.com.
Efetue login na conta do Gmail mais uma vez para obter o token de acesso, escolha a unidade e a planilha, coloque jsons nos campos, salve o cenário e clique em executar uma vez para executar ou implantar o cenário para ativar o gatilho de agendamento.
Após a execução bem-sucedida do cenário, este fluxo de trabalho extrairá o texto do arquivo PDF no seu Google Drive e o colocará na sua Planilha Google.
É assim que se cria um extrator de PDF sem código no latenode.
Como prometi, aqui está o modelo deste fluxo de trabalho. Basta copiá-lo e seguir este artigo guia para configurá-lo.
Há um vídeo sobre isso, não perca tempo lendo!
Se você quiser que alguém o ajude, confira nosso canal no Discord, temos alguns desenvolvedores prontos para ajudar!
Sim, o Latenode foi projetado para usuários de todos os níveis de habilidade. Ele oferece recursos avançados para aqueles proficientes em JavaScript e ferramentas visuais intuitivas e assistência de IA para iniciantes. Seja você um desenvolvedor experiente ou um novato, o Latenode fornece uma experiência amigável ao usuário, adaptada ao seu nível de habilidade.
Sim, o Latenode suporta integração com uma ampla gama de serviços e APIs de terceiros. Você pode conectar o Latenode a várias plataformas online, bancos de dados e sistemas de software para automatizar transferências de dados, disparar ações e otimizar fluxos de trabalho. O Latenode também fornece ferramentas e recursos para facilitar o processo de integração.
Sim, o Latenode oferece uma versão gratuita que permite que você explore seus recursos. Esta versão inclui um subconjunto de recursos do Latenode, permitindo que você comece com a automação e experimente seus benefícios. Você pode então decidir se deseja atualizar para um plano pago para obter recursos e funcionalidades adicionais.
Latenode é uma ferramenta de automação visível e intuitiva projetada para capacitar os clientes a otimizar seus fluxos de trabalho por meio da automação. Ela permite que os clientes criem estratégias computadorizadas por meio da conexão de diversas ofertas e gadgets de internet, permitindo que automatizem obrigações e decorem a produtividade com sucesso.
Ao integrar todas as suas ferramentas de marketing em um só lugar por meio da integração de dados, o Latenode ajuda você a obter uma visão abrangente de suas operações. Isso permite que você identifique oportunidades potenciais mais facilmente e tome decisões informadas com base em dados precisos.