Uma plataforma de baixo código que combina a simplicidade sem código com o poder do código completo 🚀
Comece gratuitamente

Artigo de RAG Lewis de 2020: Compreendendo a Pesquisa de Geração Aumentada de Recuperação Original

Índice
Artigo de RAG Lewis de 2020: Compreendendo a Pesquisa de Geração Aumentada de Recuperação Original

Geração Aumentada de Recuperação (RAG) é uma estrutura que combina modelos de IA pré-treinados com sistemas externos de recuperação de dados para melhorar a precisão e a relevância das respostas geradas. Apresentado por Patrick Lewis e sua equipe em seu artigo de 2020, o RAG aborda uma limitação fundamental dos modelos de IA tradicionais: sua incapacidade de acessar informações atualizadas ou específicas armazenadas fora de seus dados de treinamento.

Esta abordagem integra dois tipos de memória - conhecimento de modelo pré-treinado (paramétrico) e fontes de dados externas como Wikipedia (não paramétricos). Ao recuperar dados relevantes em tempo real, os modelos RAG produzem resultados mais precisos, tornando-os particularmente eficazes para tarefas como responder a perguntas complexas ou verificar fatos.

O artigo de Lewis de 2020 lançou as bases para esse método, alcançando resultados de ponta em benchmarks como resposta a perguntas de domínio aberto e verificação de fatos. Sua influência continua a moldar a pesquisa e as aplicações práticas da IA, incluindo ferramentas como Nó latente que simplificam a implementação do RAG para empresas.

Vamos explorar como o RAG funciona, seu impacto e como ferramentas como o Latenode o tornam acessível para uso diário.

O cientista que cunhou a geração aumentada de recuperação

Principais contribuições do artigo RAG de Lewis 2020

O artigo de Lewis de 2020 apresentou avanços importantes que remodelaram tarefas intensivas em conhecimento e estabeleceram as bases para a estrutura moderna de Geração Aumentada de Recuperação (RAG).

Combinando memória paramétrica e não paramétrica

Uma das contribuições de destaque foi a integração da memória armazenada (paramétrica) com a memória sob demanda (não paramétrica). Ao incorporar a recuperação de conhecimento externo ao modelo, o artigo abordou os desafios de acesso a informações específicas ou atualizadas. A estrutura RAG alcança esse objetivo combinando um mecanismo de recuperação com um gerador de sequência para sequência, permitindo acesso dinâmico aos dados atuais. Essa abordagem não apenas expandiu as capacidades do modelo, como também abriu caminho para o refinamento de todo o pipeline do RAG.

Ajuste fino unificado para RAG

Outro avanço foi a introdução de um método de ajuste fino conjunto para todo o pipeline do RAG. Esse processo de treinamento unificado garante que o recuperador identifique com eficiência as passagens relevantes, enquanto o gerador aprende a incorporar perfeitamente as informações recuperadas em saídas coerentes e sensíveis ao contexto. Essa estratégia de treinamento coesa aprimora significativamente a sinergia entre os componentes de recuperação e geração.

Avanços em tarefas intensivas em conhecimento

As inovações apresentadas no artigo se traduziram em melhorias notáveis ​​de desempenho. Experimentos demonstraram que os modelos RAG superaram abordagens anteriores em benchmarks com uso intensivo de conhecimento. Especificamente, eles alcançaram resultados de ponta em três tarefas de Resposta a Perguntas (QA) de domínio aberto, superando tanto os modelos paramétricos independentes de sequência para sequência quanto os métodos anteriores baseados em recuperação. . Para a geração da linguagem, os modelos produziram respostas mais precisas, diversas e verificáveis ​​em comparação com as técnicas tradicionais .

Métodos e Resultados Experimentais

O artigo de Lewis de 2020 mostrou como a estrutura de Recuperação-Geração Aumentada (RAG) supera os métodos tradicionais ao alavancar um design eficiente e uma avaliação completa.

Abaixo, detalhamos a arquitetura, os conjuntos de dados e os resultados comparativos que destacam os pontos fortes do RAG.

Visão geral da arquitetura RAG

O MVP da Geração Aumentada de Recuperação (RAG) A estrutura introduzida por Lewis em 2020 consiste em dois componentes fortemente integrados. O componente de recuperação emprega Recuperação de passagem densa (DPR) para localizar passagens relevantes de uma base de conhecimento, enquanto o componente de geração usa BART para gerar respostas com base na consulta de entrada e nas informações recuperadas.

Este sistema opera como um pipeline de duas etapas. Primeiro, o recuperador codifica a consulta de entrada e seleciona os cinco principais trechos da Wikipédia usando representações vetoriais densas. Em seguida, o gerador sintetiza uma resposta combinando a consulta de entrada com os trechos recuperados. A estrutura se beneficia do treinamento conjunto de ponta a ponta, que refina a precisão da recuperação e melhora a qualidade das respostas geradas.

Conjuntos de dados e benchmarks intensivos em conhecimento

A avaliação do Estrutura RAG abrangeu várias tarefas factuais exigentes, incluindo respostas a perguntas de domínio aberto e verificação de fatos. Para respostas a perguntas de domínio aberto, conjuntos de dados como Questões naturais, Trivia QA e Perguntas da Web foram usados ​​para testar a capacidade do modelo de lidar com consultas factuais complexas. Questões naturais, em particular, representou um desafio único devido às suas consultas no estilo de mecanismos de busca que imitam cenários do mundo real.

Para verificação dos fatos, o modelo foi avaliado usando o FEBRE conjunto de dados (Extração e Verificação de Fatos). Esta tarefa exigiu que o modelo classificasse as alegações como corroboradas, refutadas ou sem evidências suficientes, com base em informações recuperadas da Wikipédia. Este benchmark testou tanto a precisão de recuperação quanto a capacidade de raciocínio do sistema.

Comparação com métodos anteriores

Os resultados experimentais destacaram a superioridade do RAG em todos os benchmarks avaliados, em comparação com métodos anteriores. O RAG superou consistentemente tanto os modelos paramétricos de sequência para sequência quanto os sistemas tradicionais baseados em recuperação.

Categoria de tarefa Conjunto de dados Desempenho RAG Melhor anterior Melhoria
Controle de qualidade de domínio aberto Questões naturais 44.5% 36.6% + 7.9%
Controle de qualidade de domínio aberto Trivia QA 56.8% 50.1% + 6.7%
Controle de qualidade de domínio aberto Perguntas da Web 45.2% 42.4% + 2.8%
Verificação de fatos FEBRE 70.0% 65.1% + 4.9%

Os resultados revelaram que, quando o recuperador identificava com sucesso passagens relevantes, o gerador produzia resultados de maior qualidade de forma confiável. Isso ressalta o papel crítico da recuperação eficaz no desempenho geral do sistema.

Essas descobertas demonstram que a combinação de recuperação com geração melhora significativamente os resultados em tarefas factuais complexas, mostrando o potencial do RAG para aplicações práticas que exigem acesso dinâmico ao conhecimento externo.

sbb-itb-23997f1

Impacto no campo e evolução dos conceitos de RAG

A publicação do artigo de Lewis de 2020 sobre geração aumentada de recuperação (RAG) marcou uma virada na IA intensiva em conhecimento, moldando tanto a pesquisa acadêmica quanto as primeiras aplicações da indústria.

Influência na Pesquisa em PNL Intensiva em Conhecimento

O artigo de Lewis de 2020 introduziu uma abordagem inovadora para a gestão do conhecimento factual em IA. Antes disso, os sistemas de IA frequentemente dependiam de bases de conhecimento estáticas, o que levava a imprecisões frequentes. Ao combinar memória paramétrica com mecanismos de recuperação externos, o artigo abordou essas limitações e abriu caminho para sistemas de IA mais confiáveis. Essa ideia desencadeou uma onda de pesquisas subsequentes, dando origem a abordagens como Fusão no Decodificador (FiD) e REINO, que refinou ainda mais como a IA interage com o conhecimento.

Adoção do RAG na indústria

Os conceitos descritos no artigo rapidamente encontraram aplicação em aplicações industriais. As empresas começaram a utilizar a geração aumentada de recuperação para aprimorar o acesso dos usuários a grandes repositórios de informações. Esses sistemas agora alimentam interfaces que fornecem respostas precisas e verificáveis, aprimorando a experiência do usuário em diversos domínios. Essa adoção reflete como a pesquisa fundamental pode se transformar em ferramentas práticas que atendem às necessidades do mundo real.

Desenvolvimento de sistemas RAG mais interativos

Com o tempo, o RAG evoluiu de benchmarks estáticos para sistemas mais dinâmicos e interativos. Pesquisadores expandiram a estrutura original para enfrentar desafios como raciocínio em várias etapas e tomada de decisão adaptativa. Esses avanços expuseram dificuldades práticas, como garantir um tratamento robusto de erros e gerenciar indexação em larga escala com eficiência. Plataformas como o Latenode exemplificam essa evolução, transformando conceitos complexos do RAG em ferramentas visuais intuitivas que simplificam o desenvolvimento e permitem aplicações no mundo real.

Esses desenvolvimentos ilustram o progresso constante da geração aumentada por recuperação. A visão de sistemas de IA que acessam dinamicamente conhecimento externo está se tornando realidade, graças a soluções inovadoras que quebram barreiras técnicas e tornam recursos avançados mais acessíveis a um público mais amplo.

Nó latente: Implementação prática da visão do RAG

Nó latente

O artigo de Lewis de 2020 apresentou a estrutura teórica para a Geração Aumentada de Recuperação (RAG). A Latenode dá vida a essa visão, transformando-a em ferramentas práticas que as empresas podem usar no dia a dia.

Fluxos de trabalho visuais para automação aprimorada por conhecimento

O artigo de Lewis de 2020 descreveu sistemas de IA capazes de acessar dinamicamente conhecimento externo para aprimorar as respostas. O Latenode leva essa ideia adiante, oferecendo fluxos de trabalho visuais que integram perfeitamente o processamento de documentos com a geração de relatórios por IA. As configurações tradicionais de RAG geralmente exigem a configuração de bancos de dados vetoriais, serviços de incorporação e fragmentação de documentos — um processo que pode ser desafiador. O Latenode simplifica isso ao fornecer uma plataforma completa.

Com Latenode's Armazenamento de dados de IA Com este recurso, as empresas podem agilizar a criação de agentes de IA centralizando o acesso à sua base de conhecimento. A interface visual e de baixo código da plataforma permite que os usuários carreguem arquivos e conectem nós sem esforço. Ela abstrai as complexidades técnicas de vetores, embeddings e algoritmos de recuperação que pesquisadores como Lewis antes precisavam gerenciar manualmente. Por exemplo, quando você carrega documentos, o Latenode gerencia automaticamente a fragmentação de documentos, a criação de embeddings e a indexação de conteúdo, eliminando a necessidade de intervenção manual.

"O RAG sempre foi poderoso, mas desnecessariamente complicado de configurar. Eliminamos o atrito entre as empresas e essa tecnologia. Se você puder carregar um arquivo e conectar dois nós, poderá criar um agente de IA com tecnologia RAG." – Equipe Latenode

Os primeiros usuários do recurso de armazenamento de dados de IA relatam que as tarefas que levavam dias para serem configuradas em configurações tradicionais agora levam apenas alguns minutos . Essa eficiência abre caminho para aplicativos de negócios robustos e integrações nativas de IA sem esforço.

Integrações nativas de IA e aplicativos de negócios

O Latenode suporta uma ampla gama de tipos de arquivo, incluindo PDFs, arquivos de texto, JSON, Markdown e imagens com OCR. Uma vez carregados, esses dados tornam-se instantaneamente pesquisáveis ​​por meio de consultas em linguagem natural, alinhando-se à visão apresentada no artigo de Lewis. A plataforma integra recursos RAG em agentes de IA, processando e indexando documentos com ferramentas como Cloudflare LhamaIndex incorporação de modelos. Em seguida, utiliza a busca semântica para recuperar as informações mais relevantes.

Além disso, o Latenode automatiza os pipelines RAG gerenciando o dimensionamento dos trabalhadores, a movimentação de dados e a troca de índices para grandes conjuntos de dados.

"O Latenode lida perfeitamente com toda a orquestração. Criei todo o pipeline lá e ele gerencia o escalonamento de workers, a movimentação de dados e a troca de índices automaticamente." – marcoMingle

Para usuários corporativos, os recursos avançados de orquestração do Latenode automatizam tarefas como particionamento de documentos, geração de incorporação paralela e seleção dinâmica de índices (por exemplo, denso vs. esparso). Ele também gerencia dados em todo o seu ciclo de vida, desde as camadas "quentes" acessadas com frequência até o armazenamento "frio" menos utilizado. Esse nível de automação elimina a necessidade de ajustes manuais e aborda os desafios de escalabilidade, tornando-o uma solução de destaque para processos que exigem conhecimento intensivo.

Pesquisa RAG vs. Abordagem da Latenode

A evolução das implementações tradicionais de RAG para a plataforma intuitiva da Latenode marca uma mudança significativa. Embora os sistemas de RAG para pesquisa frequentemente exijam profundo conhecimento técnico e configuração manual, a Latenode oferece uma experiência simplificada e sem código, onde o trabalho técnico pesado acontece nos bastidores.

Aspecto Pesquisa RAG (Lewis 2020) Implementação do Latenode
Tempo de preparação Dias a semanas de configuração Minutos com fluxos de trabalho visuais
Requerimentos técnicos Profundo conhecimento em PNL, bancos de dados vetoriais Uploads de arquivos por arrastar e soltar
Infraestrutura Vários serviços e integrações Solução de plataforma única

O Latenode automatiza todo o fluxo de trabalho do GenAI, desde a ingestão de dados até as respostas do modelo. Ele atualiza continuamente os embeddings e otimiza a recuperação com base em métricas de desempenho. Ao transformar os conceitos avançados de Lewis 2020 em ferramentas acessíveis, o Latenode permite que as empresas explorem todo o potencial da tecnologia RAG.

Essa abordagem torna as soluções RAG de nível empresarial disponíveis para organizações de todos os tamanhos, independentemente de sua especialização técnica, nivelando o campo de atuação para a inovação orientada pelo conhecimento.

Conclusão: Impacto a longo prazo e direções futuras

O artigo de Lewis de 2020 reformulou a maneira como os sistemas de IA interagem com o conhecimento externo, estabelecendo um novo padrão para tarefas que exigem muito conhecimento.

Influência duradoura do artigo de Lewis de 2020

O estudo, intitulado Geração aumentada de recuperação para tarefas de PNL intensivas em conhecimento, introduziu uma abordagem transformadora à IA. Demonstrou que a combinação de parâmetros aprendidos com bases de conhecimento externas poderia aprimorar significativamente o desempenho da IA. Desde então, esse conceito se tornou um pilar fundamental no desenvolvimento de muitos sistemas avançados de IA, influenciando tanto a pesquisa quanto as aplicações práticas.

Uma das contribuições mais notáveis ​​do artigo é seu método de fundamentar respostas geradas por IA em dados factuais recuperados. Essa inovação abordou o problema persistente da alucinação da IA ​​em tarefas que exigem grande conhecimento, tornando as aplicações de IA mais confiáveis ​​e confiáveis. Esses insights continuam a moldar a direção da pesquisa em IA, particularmente em áreas que exigem precisão e exatidão factual.

Com base nos fundamentos estabelecidos por Lewis em 2020, pesquisadores e líderes da indústria estão explorando novas dimensões da tecnologia de Geração Aumentada de Recuperação (RAG). Os avanços atuais concentram-se em sistemas multimodais e IA adaptativa, que não apenas recuperam e geram informações, mas também planejam e refinam seus resultados com base nos dados que processam.

O desenvolvimento de sistemas de IA adaptáveis ​​marca uma evolução significativa dos princípios de RAG. Esses sistemas vão além da recuperação e geração para incorporar o raciocínio iterativo, permitindo-lhes lidar com problemas mais complexos. Os setores estão cada vez mais adotando soluções de RAG especializadas, adaptadas para enfrentar desafios específicos de cada domínio, como saúde, finanças e serviços jurídicos. Embora as ideias centrais de Lewis 2020 permaneçam centrais, sua aplicação está se diversificando rapidamente em vários setores.

Latenode como o futuro do acesso RAG

O Latenode exemplifica como os conceitos inovadores introduzidos em Lewis 2020 podem ser traduzidos em ferramentas práticas e acessíveis. Ao transformar os princípios de geração de recuperação em ferramentas fáceis de usar, fluxos de trabalho sem códigoA Latenode capacita empresas a aproveitar os benefícios da tecnologia RAG sem exigir profundo conhecimento técnico.

Com o Latenode, as equipes podem projetar sistemas de IA em minutos, eliminando a necessidade de amplo conhecimento em PLN ou configurações complexas. Essa facilidade de uso torna a tecnologia RAG mais acessível, alinhando-se à visão original de criar sistemas de IA que sejam ao mesmo tempo conhecedores e confiáveis.

O armazenamento de dados de IA e as integrações robustas da plataforma permitem a implantação de recursos RAG em escala empresarial. Ao automatizar processos-chave como análise de documentos, geração de incorporação e otimização de recuperação, o Latenode permite que as organizações se concentrem na aplicação dessas ferramentas para resolver problemas do mundo real, em vez de construir sistemas do zero.

À medida que o campo da tecnologia RAG continua a avançar, soluções como a Latenode garantem que as ideias influentes de Lewis 2020 permaneçam práticas e impactantes para organizações de todos os tamanhos, impulsionando inovação e eficiência em todos os setores.

FAQ

Como a combinação de memória interna e externa no RAG melhora a precisão das respostas da IA?

Combinando memória paramétrica - o conhecimento incorporado do modelo - com memória não paramétrica, que se refere a dados externos recuperados dinamicamente, permite que sistemas de Geração Aumentada de Recuperação (RAG) produzam respostas mais precisas e contextualizadas. Ao utilizar fontes externas atualizadas, a RAG minimiza as chances de informações desatualizadas ou detalhes inventados, tornando-se especialmente valiosa para tarefas que exigem um alto grau de precisão e dados confiáveis ​​e atuais.

Essa combinação de conhecimento pré-treinado e recuperação de dados em tempo real permite que os sistemas de IA lidem com aplicações que exigem muito conhecimento com maior precisão factual e confiabilidade, garantindo que atendam às demandas de cenários em que permanecer atualizado é essencial.

Quais avanços inovadores o artigo de Lewis de 2020 introduziu na Geração Aumentada de Recuperação (RAG)?

O artigo de 2020 de Lewis apresentou Geração Aumentada de Recuperação (RAG), uma estrutura inovadora que combina recuperação e geração para lidar com tarefas que exigem amplo conhecimento. Ao contrário dos modelos que dependem exclusivamente de parâmetros pré-treinados, o RAG recupera ativamente documentos externos relevantes – como entradas da Wikipédia – usando um índice vetorial denso. Isso permite que o modelo incorpore informações atualizadas em suas respostas.

Ao integrar a recuperação, o RAG aumenta a precisão e a relevância, especialmente para tarefas que exigem conhecimento atual ou especializado. O artigo também descreveu um método de ajuste fino que permite ao modelo usar passagens recuperadas, token por token ou em uma sequência inteira. Esse refinamento aumenta a precisão e a variedade dos resultados do modelo. Esses avanços tornam o RAG uma abordagem de destaque, preenchendo a lacuna entre o conhecimento estático pré-treinado e o acesso à informação em tempo real.

Como o Latenode facilita o uso da Geração Aumentada de Recuperação (RAG) pelas empresas e quais são os principais benefícios?

Latenode simplifica o processo de utilização da Geração Aumentada de Recuperação (RAG) por meio de seu plataforma visual sem código, eliminando a necessidade de configurações complexas, como bancos de dados vetoriais externos ou configurações detalhadas. Este design intuitivo permite que as empresas implementem sistemas RAG com eficiência, mesmo sem amplo conhecimento técnico.

Essa abordagem otimizada não apenas reduz custos e tempo de implantação, como também disponibiliza recursos avançados de IA para uma gama mais ampla de empresas. Seja para automatizar fluxos de trabalho ou aprimorar tarefas que exigem amplo conhecimento, o Latenode transforma o RAG em uma ferramenta prática e escalável, projetada para atender aos desafios diários dos negócios.

Artigos Relacionados

Trocar aplicativos

Aplicativo 1

Aplicativo 2

- Escolha um gatilho

- Escolha uma ação

Quando isso acontece...

Nome do nó

ação, por exemplo, excluir

Nome do nó

ação, por exemplo, excluir

Nome do nó

ação, por exemplo, excluir

Nome do nó

descrição do gatilho

Nome do nó

ação, por exemplo, excluir

Obrigado! Sua submissão foi recebida!
Opa! Ocorreu um erro ao enviar o formulário.

Faça isso.

Nome do nó

ação, por exemplo, excluir

Nome do nó

ação, por exemplo, excluir

Nome do nó

ação, por exemplo, excluir

Nome do nó

descrição do gatilho

Nome do nó

ação, por exemplo, excluir

Obrigado! Sua submissão foi recebida!
Opa! Ocorreu um erro ao enviar o formulário.
Experimente agora

Sem necessidade de cartão de crédito

Sem restrição

Jorge Miloradovitch
Pesquisador, redator e entrevistador de casos de uso
23 de agosto de 2025
.
11
min ler

Blogs relacionados

Caso de uso

Apoiado por