Automatize a extração de dados com plataformas de baixo código | Tutorial Latenode

Automatize a extração de dados com o Latenode: um guia passo a passo

Se você costuma trabalhar com grandes quantidades de arquivos, como CSVs ou relatórios, a automação pode mudar o jogo. Neste tutorial, mostraremos como criar um fluxo de trabalho automatizado para extrair e armazenar dados necessários de arquivos sem nem mesmo lê-los. Usaremos três ferramentas principais: ChatGPT Assistant, API de conversores de arquivos online e Latenode, a melhor plataforma de automação de low-code.

Para aqueles interessados ​​em replicar esse fluxo de trabalho, há um link na descrição para um modelo pronto para uso. Agora, vamos mergulhar nos detalhes da criação desse fluxo de trabalho.

Um passo a passo do fluxo de trabalho

Primeiro, precisamos de uma conta do Google Drive. Imagine que você tem algumas pessoas para contratar, e elas enviam seus CVs para o seu Google Drive. Este fluxo de trabalho verificará arquivos com "CV" em seus nomes, converterá esses arquivos PDF em texto, extrairá dados como nome, e-mail e experiência e, finalmente, armazenará essas informações em uma Planilha do Google.

Configuração inicial: gatilhos e Google Drive

Comece fazendo login na sua conta Latenode e criando um novo cenário. Adicione dois gatilhos: um para um cronograma e outro para ativação manual, útil para desenvolvimento e teste. Após configurar os gatilhos, mude para a seção Google Drive para encontrar e baixar arquivos com 'CV' em seus nomes.

Para configurar o nó do Google Drive, você precisa de um token de autorização. Se não tiver um, crie uma nova autorização. Especifique a unidade, pesquise por arquivos com "CV" em seus nomes e inicie a execução do nó. Isso exibirá os detalhes do arquivo no console.

Convertendo e analisando arquivos

Em seguida, converteremos os arquivos PDF baixados em texto usando a API do Converter. Adicione um nó de solicitação HTTP, conecte-o aos nós anteriores e preencha os detalhes necessários da documentação da API. Isso converterá os arquivos PDF em um texto formatado em base64.

Para decodificar o formato base64, use um nó JavaScript. Os exemplos de código são fornecidos na descrição, facilitando sua tarefa. Copie e cole o código, garantindo que ele esteja alinhado com o formato de dados do nó anterior. Execute o nó para decodificar o conteúdo para uma sequência de texto.

Extraindo informações usando ChatGPT

Em seguida, use o ChatGPT Assistant para extração de dados. Crie três nós ChatGPT: Create Thread, Create Message e Get Reply. Na sua conta OpenAI, configure o assistente para extrair nome, e-mail e experiência. Você precisará do ID do assistente para isso.

Primeiro, crie um thread para iniciar uma conversa com o ChatGPT. Depois, crie uma mensagem detalhando o que você quer extrair. Use o conteúdo do arquivo decodificado como entrada. Por fim, obtenha a resposta do assistente, que conterá os dados extraídos em um formato estruturado.

Etapa final: Preenchendo a planilha do Google

Na última etapa, inseriremos os dados extraídos na Planilha Google. Use o nó Planilhas Google para adicionar uma única linha. Autorize as Planilhas Google e especifique os detalhes da planilha e os nomes das colunas. Mapeie os dados extraídos pelo ChatGPT para as respectivas colunas.

Execute o nó para verificar se os dados estão preenchidos corretamente na sua planilha. Você pode refinar ainda mais a precisão do modelo ajustando o prompt do assistente.

Economizando tempo com automação

Este fluxo de trabalho automatizado pode economizar tempo significativamente, especialmente para tarefas como contratação e manuseio de grandes volumes de relatórios. Uma vez implantado, o fluxo de trabalho dispara conforme o cronograma e processa novos arquivos automaticamente, reduzindo a intervenção manual.

Se você achou este guia útil, considere assinar nosso canal. Para quaisquer perguntas, sinta-se à vontade para se juntar à nossa comunidade Discord, onde discutimos automação e muito mais. Boa automação!

Outros vídeos