Automatize a extração de dados com plataformas de baixo código | Tutorial Latenode
Automatize a extração de dados com o Latenode: um guia passo a passo
Se você costuma trabalhar com grandes quantidades de arquivos, como CSVs ou relatórios, a automação pode mudar o jogo. Neste tutorial, mostraremos como criar um fluxo de trabalho automatizado para extrair e armazenar dados necessários de arquivos sem nem mesmo lê-los. Usaremos três ferramentas principais: ChatGPT Assistant, API de conversores de arquivos online e Latenode, a melhor plataforma de automação de low-code.
Para aqueles interessados em replicar esse fluxo de trabalho, há um link na descrição para um modelo pronto para uso. Agora, vamos mergulhar nos detalhes da criação desse fluxo de trabalho.
Um passo a passo do fluxo de trabalho
Primeiro, precisamos de uma conta do Google Drive. Imagine que você tem algumas pessoas para contratar, e elas enviam seus CVs para o seu Google Drive. Este fluxo de trabalho verificará arquivos com "CV" em seus nomes, converterá esses arquivos PDF em texto, extrairá dados como nome, e-mail e experiência e, finalmente, armazenará essas informações em uma Planilha do Google.
Configuração inicial: gatilhos e Google Drive
Comece fazendo login na sua conta Latenode e criando um novo cenário. Adicione dois gatilhos: um para um cronograma e outro para ativação manual, útil para desenvolvimento e teste. Após configurar os gatilhos, mude para a seção Google Drive para encontrar e baixar arquivos com 'CV' em seus nomes.
Para configurar o nó do Google Drive, você precisa de um token de autorização. Se não tiver um, crie uma nova autorização. Especifique a unidade, pesquise por arquivos com "CV" em seus nomes e inicie a execução do nó. Isso exibirá os detalhes do arquivo no console.
Convertendo e analisando arquivos
Em seguida, converteremos os arquivos PDF baixados em texto usando a API do Converter. Adicione um nó de solicitação HTTP, conecte-o aos nós anteriores e preencha os detalhes necessários da documentação da API. Isso converterá os arquivos PDF em um texto formatado em base64.
Para decodificar o formato base64, use um nó JavaScript. Os exemplos de código são fornecidos na descrição, facilitando sua tarefa. Copie e cole o código, garantindo que ele esteja alinhado com o formato de dados do nó anterior. Execute o nó para decodificar o conteúdo para uma sequência de texto.
Extraindo informações usando ChatGPT
Em seguida, use o ChatGPT Assistant para extração de dados. Crie três nós ChatGPT: Create Thread, Create Message e Get Reply. Na sua conta OpenAI, configure o assistente para extrair nome, e-mail e experiência. Você precisará do ID do assistente para isso.
Primeiro, crie um thread para iniciar uma conversa com o ChatGPT. Depois, crie uma mensagem detalhando o que você quer extrair. Use o conteúdo do arquivo decodificado como entrada. Por fim, obtenha a resposta do assistente, que conterá os dados extraídos em um formato estruturado.
Etapa final: Preenchendo a planilha do Google
Na última etapa, inseriremos os dados extraídos na Planilha Google. Use o nó Planilhas Google para adicionar uma única linha. Autorize as Planilhas Google e especifique os detalhes da planilha e os nomes das colunas. Mapeie os dados extraídos pelo ChatGPT para as respectivas colunas.
Execute o nó para verificar se os dados estão preenchidos corretamente na sua planilha. Você pode refinar ainda mais a precisão do modelo ajustando o prompt do assistente.
Economizando tempo com automação
Este fluxo de trabalho automatizado pode economizar tempo significativamente, especialmente para tarefas como contratação e manuseio de grandes volumes de relatórios. Uma vez implantado, o fluxo de trabalho dispara conforme o cronograma e processa novos arquivos automaticamente, reduzindo a intervenção manual.
Se você achou este guia útil, considere assinar nosso canal. Para quaisquer perguntas, sinta-se à vontade para se juntar à nossa comunidade Discord, onde discutimos automação e muito mais. Boa automação!