Intégration de LangChain Chroma : tutoriel complet sur le magasin vectoriel

Table des matières

Intégration de LangChain Chroma : tutoriel complet sur le magasin vectoriel

LangChaîne Chroma L'intégration est un outil de pointe qui transforme la recherche documentaire en permettant des recherches vectorielles sémantiques. Contrairement aux systèmes traditionnels basés sur des mots-clés, cette approche comprend le contexte et le sens des requêtes, ce qui la rend particulièrement efficace pour des applications telles que le support client, la recherche juridique et la gestion des connaissances. En combinant LangChaîneGrâce aux outils d'orchestration de Chroma et à la base de données vectorielle de Chroma, les utilisateurs peuvent créer des systèmes qui récupèrent les documents les plus pertinents en fonction de la similitude conceptuelle.

Ses principaux avantages incluent le stockage persistant des intégrations, une utilisation efficace de la mémoire et des vitesses de récupération rapides. Par exemple, une recherche sur « automobile » peut faire apparaître des documents sur les « voitures », ou une requête sur « croissance du chiffre d'affaires » peut renvoyer des résultats concernant « l'augmentation des ventes ». Cela en fait un outil idéal pour gérer de grandes bases de connaissances avec des requêtes diverses.

La configuration de LangChain Chroma nécessite l'installation de plusieurs packages Python, notamment langchain-chroma et la chromadbLes développeurs peuvent choisir entre un déploiement local pour le développement ou un déploiement cloud pour l'évolutivité. En organisant les projets avec une gestion sécurisée des clés API et des répertoires structurés, les utilisateurs peuvent éviter les pièges courants comme les erreurs de configuration ou la perte de données.

Pour ceux qui recherchent des flux de travail plus simples, Laténode offre une alternative visuelle. Il permet aux utilisateurs de créer des systèmes de recherche documentaire sans configuration complexe de bases de données, ce qui le rend accessible aux utilisateurs non techniques. En automatisant des tâches telles que la génération d'intégrations et le stockage de vecteurs, Latenode réduit le temps et les efforts de développement.

Que vous construisiez un système de support client, effectuiez des recherches juridiques ou gériez de la documentation technique, LangChain Chroma et des outils comme Latenode offrent la flexibilité et la puissance nécessaires pour répondre à vos besoins.

En utilisant Langchain et base de données vectorielles Open Source Chroma pour la recherche sémantique avec OpenAIMaster en droit de l'Université de Californie | Code

Langchain

Prérequis et configuration de l'environnement

Pour mettre en place le Intégration de LangChain Chroma, il est essentiel d'utiliser les versions de package correctes et de gérer les dépendances avec soin.

Paquets et dépendances requis

L'intégration entre LangChain et Chroma repose sur plusieurs packages clés, chacun contribuant au stockage, à la récupération et au traitement des vecteurs. Le package principal : langchain-chroma, agit comme la connexion entre le framework de LangChain et la base de données vectorielle de Chroma.

Pour installer les packages requis, utilisez les commandes suivantes :

pip install -qU "langchain-chroma>=0.1.2"
pip install chromadb
pip install langchain
pip install -qU langchain-openai
pip install python-dotenv

langchain-chroma: Fournit la couche d'intégration pour une interaction transparente entre LangChain et Chroma.
chromadb: Gère les opérations principales de la base de données vectorielle.
langchain:Fournit les outils fondamentaux pour le traitement des documents et l'orchestration de la chaîne.
langchain-openai: Active l'intégration des modèles OpenAI. Vous pouvez remplacer cette option par des alternatives comme langchain-google-genai or langchain-huggingface si besoin.
python-dotenv: Gère les variables d'environnement de manière sécurisée.

Un problème courant lors de la configuration a été partagé par un Stack Overflow utilisateur lors de la création d'une application Chat PDF :

"ImportError : Impossible d'importer le package Python chromadb. Veuillez l'installer avec pip install chromadb" ¹

Cette erreur survient généralement lorsque chromadb est manquant ou présente des conflits de versions. La réinstallation ou la mise à niveau du package résout le problème.

Une fois les dépendances installées, il est temps d'organiser votre projet et de gérer les clés API en toute sécurité.

Structure du projet et gestion des clés API

Une configuration de projet bien structurée permet d'éviter les erreurs de configuration et de garantir la protection des données sensibles. Voici une suggestion de structure :

langchain-chroma-project/
├── .env
├── .gitignore
├── main.py
├── documents/
│   └── sample_docs/
├── vector_store/
│   └── chroma_db/
└── requirements.txt

.envUtilisez ce fichier pour stocker en toute sécurité les clés API et les variables de configuration. Il ne doit jamais être inclus dans le contrôle de version.
.gitignore: Ajouter .env et la vector_store/chroma_db/ pour empêcher la validation de données sensibles et de fichiers de base de données volumineux.

Voici un exemple de variables d'environnement à inclure dans le .env fichier:

OPENAI_API_KEY=your_openai_api_key_here
CHROMA_HOST=localhost
CHROMA_PORT=8000

Pour charger ces variables dans votre application, utilisez le python-dotenv package. Par exemple, le tutoriel de Callum Macpherson sur l'implémentation de RAG avec LangChain et Chroma recommande d'utiliser dotenv.load_dotenv() comme méthode fiable pour gérer les clés API en toute sécurité ².

Une fois votre projet organisé et les dépendances prêtes, l’étape suivante consiste à choisir entre un déploiement local et cloud pour votre configuration Chroma.

Options de déploiement Chroma locales ou cloud

Lors du déploiement de votre Magasin de vecteurs LangChain Chroma, vous pouvez opter pour un déploiement local ou cloud, en fonction de vos besoins de performances et d'évolutivité.

Déploiement localIdéal pour le développement et le prototypage, l'exécution locale de Chroma offre un contrôle total et élimine les coûts d'hébergement. Cependant, cela peut limiter l'évolutivité et nécessiter une gestion manuelle des sauvegardes.
Déploiement en nuageCette option offre une plus grande évolutivité, des sauvegardes automatiques et une maintenance réduite grâce au service hébergé de Chroma ou aux instances cloud autogérées. Le compromis réside dans le coût supplémentaire de l'hébergement et la dépendance à une infrastructure externe.

Pour la plupart des projets, commencer par un déploiement local permet de valider votre configuration sans introduire de dépendances externes ni de latence réseau. Une fois les détails réglés, la transition vers un environnement cloud peut prendre en charge des applications à plus grande échelle.

Alors que LangChain Chroma permet des capacités de recherche vectorielle avancées, des outils comme Latenode simplifient le processus avec des flux de travail visuels, éliminant ainsi le besoin de configurations de base de données complexes.

Création d'un magasin de vecteurs Chroma LangChain

Création d'un Magasin de vecteurs LangChain Chroma implique plusieurs étapes clés : le chargement des documents, la génération des intégrations, l'initialisation du magasin et la configuration des méthodes de récupération. Chaque étape joue un rôle crucial dans la création d'un système efficace et évolutif de récupération de documents.

Chargement de documents dans LangChain

Le chargement de documents constitue la base de l'intégration de LangChain Chroma. Ce framework prend en charge divers formats de fichiers, avec des chargeurs optimisés pour différents types de documents.

Par exemple, les documents PDF peuvent être traités à l’aide de PyPDFLoader, qui extrait le texte tout en préservant la structure du document :

from langchain_community.document_loaders import PyPDFLoader

loader = PyPDFLoader("path/to/document.pdf")
documents = loader.load()
print(f"Loaded {len(documents)} pages from PDF")

Si vous manipulez plusieurs fichiers dans un dossier, le DirectoryLoader simplifie le processus en chargeant par lots tous les fichiers pertinents :

from langchain_community.document_loaders import DirectoryLoader, TextLoader

loader = DirectoryLoader(
    "documents/",
    glob="**/*.txt",
    loader_cls=TextLoader,
    show_progress=True
)
documents = loader.load()

Pour le contenu Web, le WebBaseLoader récupère et traite les documents HTML à partir des URL :

from langchain_community.document_loaders import WebBaseLoader

loader = WebBaseLoader("https://example.com/article")
web_documents = loader.load()

Lorsque vous travaillez avec des fichiers volumineux, il devient essentiel de les diviser en morceaux plus petits, préservant le contexte. RecursiveCharacterTextSplitter gère cela efficacement :

from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200,
    length_function=len
)
chunks = text_splitter.split_documents(documents)

Ce processus de segmentation garantit que les documents sont gérables et prêts à être intégrés et récupérés.

Création et configuration d'intégrations

Les intégrations sont essentielles à la recherche sémantique, convertissant le texte en représentations numériques. LangChain Chroma prend en charge plusieurs modèles d'intégration, les intégrations OpenAI étant un choix populaire pour les environnements de production.

Pour configurer les intégrations OpenAI, vous aurez besoin d'une clé API et d'un modèle spécifié :

import os
from langchain_openai import OpenAIEmbeddings
from dotenv import load_dotenv

load_dotenv()

embeddings = OpenAIEmbeddings(
    model="text-embedding-3-small",
    openai_api_key=os.getenv("OPENAI_API_KEY")
)

Pour ceux qui recherchent des options économiques, Étreindre le visage propose des modèles d'intégration gratuits :

from langchain_huggingface import HuggingFaceEmbeddings

embeddings = HuggingFaceEmbeddings(
    model_name="sentence-transformers/all-MiniLM-L6-v2"
)

Avant de continuer, il est judicieux de tester votre configuration d'intégration pour vous assurer que tout fonctionne correctement :

# Test embedding generation
test_text = "This is a sample document for testing embeddings."
test_embedding = embeddings.embed_query(test_text)
print(f"Embedding dimension: {len(test_embedding)}")

Une fois les intégrations vérifiées, vous pouvez passer à la création d’un magasin de vecteurs persistant.

Initialisation et persistance du magasin de vecteurs

Les Magasin de vecteurs Chroma Il sert de base de données pour le stockage des incorporations de documents. Il permet également un stockage persistant, permettant ainsi la réutilisation des incorporations stockées.

Pour créer un nouveau magasin de vecteurs à partir de vos documents :

from langchain_chroma import Chroma

# Create vector store from documents
vectorstore = Chroma.from_documents(
    documents=chunks,
    embedding=embeddings,
    persist_directory="./vector_store/chroma_db"
)

print(f"Vector store created with {vectorstore._collection.count()} documents")

Si un magasin vectoriel existe déjà, il peut être chargé directement sans le recréer :

# Load existing vector store
vectorstore = Chroma(
    persist_directory="./vector_store/chroma_db",
    embedding_function=embeddings
)

Pour gérer plusieurs collections au sein d'une seule instance Chroma, vous pouvez spécifier un nom de collection :

# Create named collection
vectorstore = Chroma(
    collection_name="technical_docs",
    embedding_function=embeddings,
    persist_directory="./vector_store/chroma_db"
)

En conservant les incorporations, vous permettez une récupération efficace, ce qui est essentiel pour les applications nécessitant des recherches de documents rapides et précises.

Modèles d'indexation et de recherche de documents

LangChain Chroma fournit des outils polyvalents pour l'indexation, la mise à jour et la récupération de documents, ce qui le rend idéal pour les systèmes de génération augmentée de récupération (RAG).

Pour ajouter de nouveaux documents :

# Add new documents
new_documents = ["Additional document content here"]
vectorstore.add_texts(
    texts=new_documents,
    metadatas=[{"source": "manual_addition", "date": "2025-08-22"}]
)

Pour récupérer des documents, la recherche de similarité identifie les correspondances les plus proches en fonction de la proximité du vecteur :

# Perform similarity search
query = "What are the main features of the product?"
results = vectorstore.similarity_search(
    query=query,
    k=3  # Return top 3 most similar documents
)

for i, doc in enumerate(results):
    print(f"Result {i+1}: {doc.page_content[:200]}...")

Pour inclure des mesures de confiance, utilisez la recherche de similarité avec des scores :

# Similarity search with scores
results_with_scores = vectorstore.similarity_search_with_score(
    query=query,
    k=3
)

for doc, score in results_with_scores:
    print(f"Score: {score:.4f} - Content: {doc.page_content[:150]}...")

Pour des résultats plus diversifiés, la recherche par pertinence marginale maximale (MMR) équilibre la pertinence avec la variété :

# MMR search for diverse results
mmr_results = vectorstore.max_marginal_relevance_search(
    query=query,
    k=3,
    fetch_k=10,  # Fetch more candidates
    lambda_mult=0.7  # Balance relevance vs diversity
)

Alors que LangChain Chroma excelle dans la gestion des intégrations et de la recherche, des plateformes comme Latenode offrent une approche plus visuelle pour automatiser les flux de travail, réduisant ainsi le besoin de gestion complexe des bases de données.

Optimisation des performances et pièges courants

Une fois votre base de données vectorielle configurée, il est essentiel d'optimiser ses performances pour une récupération rapide et précise des données. Des configurations correctement optimisées peuvent améliorer la vitesse de récupération jusqu'à 300 % et la précision jusqu'à 45 % par rapport à une recherche textuelle de base. Cependant, ces gains ne sont possibles que si vous maîtrisez les bonnes techniques d'optimisation et évitez les erreurs courantes qui peuvent compromettre votre implémentation.

Optimisation des performances des magasins vectoriels

Lorsque vous travaillez avec de grandes collections de documents, l'indexation par lots est un moyen pratique d'accélérer le processus d'ingestion. Ajouter des documents un par un peut être lent et gourmand en ressources, mais les traiter par lots réduit la charge et optimise l'utilisation de la mémoire.

# Adding documents one by one (inefficient)
for doc in documents:
    vectorstore.add_documents([doc])

# Adding documents in batches (optimized)
batch_size = 100
for i in range(0, len(documents), batch_size):
    batch = documents[i:i + batch_size]
    vectorstore.add_documents(batch)
    print(f"Processed batch {i // batch_size + 1}")

Un autre point clé est le réglage des paramètres de recherche. Ajuster des valeurs comme k (le nombre de voisins les plus proches) et la définition de seuils de similarité garantissent à la fois la rapidité et la pertinence des résultats de recherche.

# Optimized search configuration
results = vectorstore.similarity_search_with_score(
    query=query,
    k=5,
    score_threshold=0.7
)

# Filter results based on confidence scores
filtered_results = [(doc, score) for doc, score in results if score >= 0.75]

Une gestion efficace de la mémoire est également essentielle, notamment pour les stockages vectoriels à grande échelle. Des techniques comme le traitement par lots et le découpage en blocs permettent d'éviter les problèmes de mémoire. Les fonctionnalités de persistance de Chroma garantissent la stabilité en enregistrant les données sur disque.

# Managing memory with chunking
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=50,
    length_function=len
)

# Selecting an efficient embedding model
embeddings = HuggingFaceEmbeddings(
    model_name="sentence-transformers/all-MiniLM-L6-v2",
    model_kwargs={'device': 'cpu'}
)

Pour les environnements de production, Nuage Chroma Offre une solution de stockage vectoriel sans serveur, éliminant les contraintes de ressources locales. Elle promet une création et un déploiement rapides des bases de données (moins de 30 secondes, semble-t-il) et offre 5 $ de crédits gratuits aux nouveaux utilisateurs. ³.

Ces stratégies établissent une base pour des performances fiables, rendant votre magasin de vecteurs prêt pour les applications du monde réel.

Dépannage des problèmes courants

Même avec une optimisation minutieuse, certains défis peuvent survenir. Un problème fréquent est intégration des incohérences de dimension, qui se produisent lorsque différents modèles sont utilisés pour l'indexation et l'interrogation. Cette incohérence conduit à des représentations vectorielles incompatibles.

# Problem: Dimension mismatch due to different embedding models
# Indexing with one model
indexing_embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
vectorstore = Chroma.from_documents(docs, indexing_embeddings)

# Querying with another model
query_embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")

# Solution: Use the same embedding model consistently
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
vectorstore = Chroma.from_documents(docs, embeddings)
results = vectorstore.similarity_search(query)

Un autre piège courant est problèmes de persistance, ce qui peut entraîner une perte de données si le stockage vectoriel n'est pas correctement sauvegardé ou restauré. Spécifiez toujours un répertoire de persistance et testez régulièrement le processus de restauration pour garantir l'intégrité des données.

# Setting up persistence
vectorstore = Chroma(
    persist_directory="./chroma_db",
    embedding_function=embeddings,
    collection_name="my_documents"
)

# Save the state
vectorstore.persist()
print(f"Stored {vectorstore._collection.count()} documents")

# Test loading the saved data
loaded_store = Chroma(
    persist_directory="./chroma_db",
    embedding_function=embeddings,
    collection_name="my_documents"
)

Une segmentation incorrecte peut également dégrader les performances de récupération. Des segments trop petits ou trop grands peuvent perdre leur sens contextuel ou réduire l'efficacité. Recherchez un équilibre qui préserve le contexte tout en maintenant des tailles gérables.

Zone d'optimisation	Best Practice	Impact positif
Indexage	Utiliser le traitement par lots (100 à 500 documents par lot)	Accélère l'ingestion
Paramètres de recherche	Mise au point `k` (par exemple, 3-5) et définir des seuils de similarité (≥ 0.7)	Améliore la pertinence et la rapidité
Gestion de la mémoire	Découpez le texte en 500 à 1000 XNUMX caractères et activez la persistance	Prévient les problèmes de mémoire
Intégration de la cohérence	Utiliser le même modèle pour l’indexation et l’interrogation	Évite les incohérences de dimensions
Persistence	Enregistrez et testez régulièrement les processus de restauration	Empêche la perte de données

Enfin, le erreurs de configuration des variables d'environnement peut entraîner des problèmes d'authentification, notamment dans les déploiements cloud. L'utilisation d'outils comme Chroma CLI et .env Les fichiers simplifient la configuration de l'environnement et minimisent les erreurs.

# Setting up environment variables for Chroma Cloud
import os
from dotenv import load_dotenv

load_dotenv()

# Check required environment variables
required_vars = ["CHROMA_API_KEY", "CHROMA_SERVER_HOST"]
for var in required_vars:
    if not os.getenv(var):
        raise ValueError(f"Missing required environment variable: {var}")

En relevant ces défis courants et en mettant en œuvre les optimisations décrites, vous pouvez garantir que votre magasin vectoriel fonctionne de manière efficace et fiable, même dans des conditions exigeantes.

sbb-itb-23997f1

Exemples de code pratiques pour les cas d'utilisation de LangChain Chroma

Cette section présente des applications pratiques de LangChain et Chroma, avec des exemples étape par étape pour gérer divers types de documents et des tâches de récupération complexes. Ces exemples sont conçus pour vous aider à créer des intégrations fonctionnelles et prêtes à la production.

Configuration d'intégration rapide en 10 minutes

Exemple de code : configuration de l'intégration LangChain + Chroma

Voici un exemple simple pour mettre en place une intégration entre LangChain et Chroma en seulement 10 minutes. Cette configuration se concentre sur les composants essentiels à la plupart des applications de génération augmentée de données (RAG).

import os
from langchain_community.vectorstores import Chroma
from langchain_openai import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import TextLoader
from dotenv import load_dotenv

# Load environment variables
load_dotenv()

# Initialize embeddings
embeddings = OpenAIEmbeddings(
    model="text-embedding-3-small",
    openai_api_key=os.getenv("OPENAI_API_KEY")
)

# Load and split documents
loader = TextLoader("sample_document.txt")
documents = loader.load()

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200,
    length_function=len
)
splits = text_splitter.split_documents(documents)

# Create vector store with persistence
vectorstore = Chroma.from_documents(
    documents=splits,
    embedding=embeddings,
    persist_directory="./chroma_db",
    collection_name="quick_setup"
)

# Test the setup
query = "What is the main topic discussed?"
results = vectorstore.similarity_search(query, k=3)
print(f"Found {len(results)} relevant chunks")

Cet exemple montre comment créer un magasin vectoriel fonctionnel à l'aide de valeurs par défaut judicieuses. Il utilise intégration de texte-3-small pour des intégrations rentables, divise les documents en segments de 1,000 200 caractères avec un chevauchement de XNUMX caractères pour la préservation du contexte et utilise la persistance locale pour la fiabilité.

Pour vérifier la configuration, vous pouvez interroger le magasin de vecteurs à l'aide de l' similarity_search méthode qui récupère les morceaux de documents les plus pertinents en fonction de la similarité vectorielle.

# Enhanced search with confidence scores
results_with_scores = vectorstore.similarity_search_with_score(
    query="main topic",
    k=5
)

for doc, score in results_with_scores:
    print(f"Score: {score:.3f}")
    print(f"Content: {doc.page_content[:100]}...")
    print("---")

Combinaison de plusieurs types de documents

Stockage unifié des documents : Cette approche vous permet de charger et de traiter des documents de différents formats (PDF, fichiers texte, pages web et fichiers CSV) dans un seul magasin vectoriel Chroma. En centralisant votre base de connaissances, vous simplifiez la recherche parmi diverses sources. ⁴.

Dans les cas d'utilisation concrets, la gestion de plusieurs types de fichiers est souvent essentielle. Les chargeurs de documents de LangChain facilitent le traitement de ces formats tout en maintenant des stratégies de segmentation cohérentes.

from langchain_community.document_loaders import (
    DirectoryLoader,
    PyPDFLoader,
    WebBaseLoader,
    CSVLoader
)
from pathlib import Path

def load_mixed_documents():
    all_documents = []

    # Load PDFs from directory
    pdf_loader = DirectoryLoader(
        path="./documents/pdfs/",
        glob="**/*.pdf",
        loader_cls=PyPDFLoader
    )
    pdf_docs = pdf_loader.load()
    all_documents.extend(pdf_docs)

    # Load web content
    web_urls = [
        "https://example.com/article1",
        "https://example.com/article2"
    ]
    web_loader = WebBaseLoader(web_urls)
    web_docs = web_loader.load()
    all_documents.extend(web_docs)

    # Load CSV data
    csv_loader = CSVLoader(
        file_path="./data/knowledge_base.csv",
        csv_args={'delimiter': ','}
    )
    csv_docs = csv_loader.load()
    all_documents.extend(csv_docs)

    return all_documents

# Process all document types uniformly
documents = load_mixed_documents()

# Assign document type metadata
for doc in documents:
    if hasattr(doc, 'metadata'):
        source = doc.metadata.get('source', '')
        if source.endswith('.pdf'):
            doc.metadata['doc_type'] = 'pdf'
        elif source.startswith('http'):
            doc.metadata['doc_type'] = 'web'
        elif source.endswith('.csv'):
            doc.metadata['doc_type'] = 'csv'

En étiquetant chaque document avec des métadonnées, comme son type, vous pouvez facilement filtrer les résultats lors de la recherche. Cela garantit un traitement cohérent pour tous les formats, tout en conservant la flexibilité nécessaire pour interroger des types de documents spécifiques.

# Create unified vector store
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=800,
    chunk_overlap=100,
    separators=["", "", " ", ""]
)

splits = text_splitter.split_documents(documents)

# Add chunk metadata
for i, split in enumerate(splits):
    split.metadata['chunk_id'] = i
    split.metadata['chunk_size'] = len(split.page_content)

vectorstore = Chroma.from_documents(
    documents=splits,
    embedding=embeddings,
    persist_directory="./multi_format_db",
    collection_name="mixed_documents"
)

# Search with document type filtering
def search_by_document_type(query, doc_type=None, k=5):
    if doc_type:
        # Filter by document type using metadata
        results = vectorstore.similarity_search(
            query=query,
            k=k*2,  # Get more results to filter
            filter={"doc_type": doc_type}
        )
        return results[:k]
    else:
        return vectorstore.similarity_search(query, k=k)

# Example searches
pdf_results = search_by_document_type("technical specifications", "pdf")
web_results = search_by_document_type("latest updates", "web")

Cette configuration unifiée simplifie non seulement la gestion des documents, mais améliore également la précision de la récupération en exploitant les métadonnées pour le filtrage.

Utilisation de LangChain Chroma dans les chaînes RAG

L'intégration des bases de données vectorielles Chroma aux chaînes RAG (Retrieval-Augmented Generation) transforme les collections de documents statiques en systèmes dynamiques, pilotés par requêtes. En combinant la recherche vectorielle à la génération de modèles de langage, vous pouvez créer des workflows de recherche hautement réactifs.

from langchain.chains import RetrievalQA
from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate

# Initialize language model
llm = ChatOpenAI(
    model="gpt-3.5-turbo",
    temperature=0.1,
    openai_api_key=os.getenv("OPENAI_API_KEY")
)

# Create retriever from vector store
retriever = vectorstore.as_retriever(
    search_type="similarity_score_threshold",
    search_kwargs={
        "k": 4,
        "score_threshold": 0.7
    }
)

# Custom prompt template for RAG
rag_prompt = PromptTemplate(
    template="""Use the following context to answer the question. If you cannot find the answer in the context, say "I don't have enough information to answer this question."

Context: {context}

Question: {question}

Answer:""",
    input_variables=["context", "question"]
)

# Create RAG chain
rag_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever,
    chain_type_kwargs={"prompt": rag_prompt},
    return_source_documents=True
)

# Test the RAG
rag_result = rag_chain({"question": "What is the main topic?"})
print(rag_result)

Cet exemple montre comment intégrer des magasins vectoriels Chroma à une chaîne RAG, permettant ainsi le traitement des requêtes contextuelles et la génération de contenu dynamique. En combinant récupération et modélisation du langage, vous pouvez créer des systèmes fournissant des réponses précises et contextuelles.

Laténode: Flux de travail de Visual Document Intelligence

Laténode

Latenode simplifie les workflows d'intelligence documentaire grâce à ses outils visuels, offrant une alternative à LangChain Chroma pour la recherche sémantique de documents. En utilisant des composants visuels pour gérer la similarité et la recherche de vecteurs, Latenode élimine le recours à des configurations de bases de données complexes, rendant le processus plus fluide et plus accessible.

Intelligence documentaire simplifiée, efficacité comparable à celle de Chroma

Les outils de traitement visuel de Latenode rationalisent le développement et réduisent la maintenance par rapport aux intégrations de bases de données vectorielles traditionnelles. générateur de flux de travail visuel permet aux utilisateurs d'automatiser l'intégration de modèles, le stockage vectoriel et les chaînes de récupération avec la fonctionnalité glisser-déposer, réduisant ainsi le temps et les efforts requis pour les configurations riches en code.

Avec son base de données intégréeLatenode gère automatiquement des tâches telles que le découpage, la génération d'intégrations et les recherches de similarité. Aucune configuration manuelle, comme le fractionnement de texte ou la sélection de modèles d'intégration, n'est nécessaire. Cette approche offre les mêmes avantages que LangChain Chroma : récupération précise des documents et réponses IA contextuelles, sans les difficultés techniques liées à la gestion d'une base de données vectorielle.

Latenode prend en charge plus de 200 modèles d'IA, notamment OpenAI, Claude et Gemini, permettant un traitement transparent des fragments de documents récupérés avec n'importe quel modèle de langage. En automatisant l'extraction de documents multi-sources, Latenode remplace le recours à des chargeurs et des scripts de prétraitement distincts, simplifiant ainsi encore davantage le flux de travail.

LangChain Chroma vs. Latenode : comparaison des flux de travail

Aspect	LangChain Chroma	Laténode
La configuration initiale	Installer les dépendances, configurer les intégrations, configurer le magasin vectoriel	Faites glisser les composants, connectez les sources de données
Chargement de documents	Écrire des chargeurs pour chaque format (PDF, CSV, Web)	Les connecteurs intégrés gèrent plusieurs formats
Gestion des vecteurs	Configuration et persistance de l'intégration manuelle	Intégration et stockage automatiques
Logique de récupération	Recherche de similarité de code et seuils de notation	Composants de similarité visuelle avec les contrôles de l'interface utilisateur
Implémentation du RAG	Enchaîner plusieurs composants par programmation	Connectez visuellement la récupération aux modèles d'IA
Entretien	Mettre à jour les dépendances, gérer les versions de la base de données	La plateforme gère automatiquement les mises à jour
écaillage	Configurer les paramètres du cluster, optimiser les requêtes	Mise à l'échelle automatique en fonction des crédits d'exécution
Débogage	Analyse des journaux et débogage du code	Historique d'exécution visuel et réexécutions

Les workflows de Latenode simplifient la recherche sémantique et la récupération de contexte, offrant une alternative intuitive et visuelle aux configurations traditionnelles.

Avantages de l'approche de workflow visuel de Latenode

L’une des fonctionnalités remarquables de Latenode est son vitesse de développementLes tâches qui peuvent prendre des heures à configurer et à tester avec LangChain Chroma peuvent souvent être accomplies en quelques minutes à l'aide des composants prédéfinis de Latenode.

Pour les besoins avancés, Latenode Copilote de code IA Il comble le fossé entre les outils visuels et les fonctionnalités personnalisées. Il génère du code JavaScript directement dans les workflows, permettant aux équipes d'étendre leurs capacités sans réécriture complète du code.

La plateforme excelle également dans débogageAu lieu de parcourir les fichiers journaux, les utilisateurs peuvent suivre visuellement chaque étape du processus de traitement des documents. En cas de problème, des segments spécifiques peuvent être réexécutés avec des paramètres différents, ce qui rend le dépannage beaucoup plus efficace.

Le modèle tarifaire de Latenode renforce son attrait. Avec des forfaits à partir de $ 19/mois, incluant 5,000 10 crédits d'exécution et jusqu'à XNUMX workflows actifs, il offre une solution économique. Contrairement aux configurations nécessitant une infrastructure de base de données vectorielle distincte, Latenode facture en fonction du temps d'exécution, ce qui permet souvent de réduire les coûts opérationnels.

Pour les équipes soucieuses de la confidentialité des données, Latenode propose options d'auto-hébergement, permettant aux workflows de s'exécuter sur leurs propres serveurs. Cela garantit la sécurité des documents sensibles tout en conservant les avantages des workflows visuels. De plus, déclencheurs et réponses de webhook Permet le traitement des documents en temps réel et une intégration transparente avec les systèmes existants. Au lieu de développer des API autour de LangChain Chroma, Latenode fournit des points de terminaison HTTP qui gèrent automatiquement l'authentification, la limitation du débit et les réponses aux erreurs.

Stratégies de déploiement et de mise à l'échelle de la production

Le déploiement de LangChain Chroma dans un environnement de production nécessite une infrastructure bien pensée, une gestion efficace des données et une optimisation des performances pour gérer efficacement les volumes de données croissants.

Fonctionnalités Chroma avancées

Chroma déploiement en nuage Les fonctionnalités de Chroma permettent aux magasins vectoriels mono-machine d'évoluer vers des systèmes distribués, les rendant ainsi adaptés aux charges de travail à l'échelle de l'entreprise. Grâce à des fonctionnalités telles que la mise à l'échelle automatique, la gestion des sauvegardes et le déploiement multirégional, Chroma assure une transition fluide vers des opérations prêtes pour la production.

Pour les organisations au service de plusieurs clients ou départements, architectures multi-locataires sont inestimables. Ils permettent d'isoler les collections, de contrôler les accès et de définir des quotas de ressources pour différents locataires. Cette approche réduit les dépenses d'infrastructure en évitant les déploiements distincts tout en garantissant une sécurité des données robuste.

Une autre caractéristique clé est traçage automatisé, qui fournit des informations sur les performances des requêtes et la qualité de l'intégration. En intégrant des outils comme Datadog or New RelicLes équipes peuvent surveiller et recevoir des alertes en temps réel en cas de problèmes de latence ou d'incohérence des résultats générés par les modèles intégrés. Ces outils garantissent l'efficacité et la fiabilité des charges de travail de production.

Ces fonctionnalités avancées jettent les bases de stratégies de production évolutives et sécurisées.

Stratégies prêtes à la production

La mise à l’échelle de Chroma pour la production implique une expansion horizontale et des mesures robustes de protection des données.

Mise à l'échelle horizontale Cela implique le partitionnement des collections sur plusieurs instances Chroma. Cela peut être réalisé par partitionnement selon le type de document, les plages de dates ou les catégories de contenu, garantissant ainsi des réponses rapides aux requêtes, même lorsque le volume de données augmente.

Exécution protocoles de sauvegarde et de reprise après sinistre Il est essentiel de protéger les intégrations vectorielles et les métadonnées. Des stratégies telles que les sauvegardes incrémentielles régulières, les snapshots complets et la réplication interrégionale minimisent les pertes de données et renforcent la résilience, en particulier pour les applications critiques.

Pour répondre aux exigences de conformité de la Normes américaines de protection des données Conformément aux normes SOC 2 Type II et HIPAA, les organisations doivent appliquer le chiffrement des données au repos et en transit, tenir des journaux d'audit pour toutes les opérations vectorielles et mettre en place des contrôles de résidence des données. Des mesures supplémentaires, telles que les clés de chiffrement gérées par le client et la connectivité réseau privée, renforcent encore la conformité et la sécurité.

En adoptant ces stratégies, les déploiements peuvent évoluer efficacement tout en garantissant la sécurité et la conformité réglementaire.

Mise à l'échelle pour les grandes collections de documents

Lors de la manipulation de vastes collections de documents, mise à l'échelle horizontale devient essentiel. Des techniques comme le hachage cohérent ou le partitionnement par plage répartissent les opérations vectorielles sur plusieurs instances Chroma, permettant un traitement parallèle et maintenant des performances de requête élevées.

À mesure que les collections s'agrandissent, optimisation de la mémoire joue un rôle crucial. Des algorithmes comme HNSW, avec des paramètres optimisés, réduisent l'utilisation de la mémoire tout en préservant des taux de rappel élevés. Pour l'ingestion de données à grande échelle, l'intégration par lots et les insertions en masse optimisent le débit et préviennent les goulots d'étranglement mémoire lors des pics d'activité.

Si la mise à l'échelle de l'infrastructure est nécessaire, la simplification des workflows reste tout aussi importante. C'est là que Latenode se démarque. Ses workflows visuels automatisent des tâches comme la recherche sémantique et la récupération de contexte, permettant aux équipes de production de se concentrer sur les priorités métier au lieu de se débattre avec une infrastructure complexe.

Accélérez le développement de solutions d'IA prenant en charge les documents avec la plate-forme de traitement visuel de Latenode - une alternative efficace à LangChain Chroma pour créer des systèmes évolutifs et intelligents.

FAQ

Comment l’intégration de LangChain avec Chroma améliore-t-elle la récupération de documents par rapport aux méthodes traditionnelles basées sur des mots-clés ?

L'intégration de LangChain avec Chroma amène la récupération de documents à un nouveau niveau en tirant parti encastrements vectoriels pour la recherche sémantique. Contrairement aux systèmes traditionnels basés sur des mots-clés qui dépendent de correspondances exactes, la recherche sémantique se concentre sur contexte et signification derrière les mots, ce qui le rend idéal pour gérer des requêtes complexes ou nuancées.

Chroma organise les documents en utilisant leurs intégrations, ce qui lui permet de récupérer des informations pertinentes même en l'absence de mots-clés spécifiques. Cette méthode garantit non seulement des résultats plus précis, mais améliore également l'efficacité de la recherche. génération augmentée par récupération (RAG) applications, où le maintien de la précision et du contexte est essentiel.

Comment puis-je configurer un magasin de vecteurs LangChain Chroma pour la recherche sémantique ?

Pour configurer un magasin vectoriel LangChain Chroma pour la recherche sémantique, commencez par installer la base de données Chroma et la configurer dans votre environnement LangChain. Une fois la base de données prête, créez un magasin vectoriel dans LangChain en choisissant Chroma comme serveur de stockage. Préparez vos documents en générant des représentations vectorielles continues avec un modèle d'intégration adapté, puis stockez-les dans la base de données vectorielle Chroma.

Pour garantir une récupération efficace et précise, ajustez les paramètres tels que les mesures de similarité et les stratégies d'indexation en fonction de vos besoins spécifiques. Pour une utilisation durable, activez la persistance de la base de données afin de conserver les données et de planifier les mises à jour futures. En suivant les bonnes pratiques de prétraitement des documents et de génération d'intégration, vous pouvez améliorer considérablement la pertinence et la précision de vos résultats de recherche.

Comment Latenode facilite-t-il la création de systèmes de récupération de documents par rapport aux méthodes traditionnelles ?

Latenode simplifie la création de systèmes de récupération de documents en fournissant un plateforme visuelle sans code qui automatise des processus complexes tels que la similarité vectorielle et la recherche sémantique. Les approches traditionnelles exigent souvent une compréhension approfondie des intégrations vectorielles et de la gestion des bases de données, ce qui peut constituer un obstacle pour beaucoup. Latenode simplifie cette tâche et permet aux utilisateurs de créer des workflows sans expertise technique.

En simplifiant ces tâches, Latenode réduit non seulement les délais de développement, mais élimine également les contraintes liées à la maintenance de l'infrastructure de base de données. Les équipes peuvent ainsi se concentrer sur l'amélioration des fonctionnalités de l'application et la livraison de résultats plus rapidement, ouvrant ainsi les systèmes de recherche documentaire à un public plus large tout en optimisant l'efficacité.