Guide de la base de connaissances IA

Entraînez votre IA avec vos propres documents, sites web et paires Q/R.

Vue d'ensemble

La base de connaissances (RAG — Retrieval-Augmented Generation) vous permet de nourrir l'IA avec vos propres données. Quand un client pose une question, l'IA cherche dans votre base de connaissances le contexte pertinent et l'utilise pour générer des réponses précises et à jour.

Import de documents

Importez des fichiers PDF, DOCX, TXT, JSON ou CSV jusqu'à 50 Mo. Les documents sont automatiquement découpés (1000 caractères, 200 de chevauchement) et convertis en embeddings avec le modèle multilingue de Cohere.

Scan de sites web

Entrez une URL et NevoChat va parcourir et extraire le contenu du site. Configurez la profondeur d'exploration (1-5 niveaux), le délai entre les pages, ou collez un sitemap.xml personnalisé pour un ciblage précis des URLs.

Paires Q/R

Créez des paires question-réponse pour des réponses précises et artisanales. Elles sont converties en embeddings aux côtés des morceaux de documents pour la recherche sémantique.

Recherche sémantique

Recherchez dans toute votre base de connaissances avec des requêtes en langage naturel. Activez le reranking IA (Cohere rerank-multilingual-v3.0) pour une meilleure précision des résultats.

Modes RAG

RAG direct : La base de connaissances est toujours consultée avant chaque réponse IA. Idéal quand les réponses doivent toujours référencer vos documents.

RAG basé sur les outils : L'IA décide quand chercher dans la base de connaissances. Idéal pour les flux conversationnels où chaque message n'a pas besoin d'une recherche documentaire.

Formats de contenu supportés

📄

PDF

Documents

📝

DOCX

Fichiers Word

📃

TXT

Texte brut

🌐

URL

Scan de sites web

Utiliser la base de connaissances dans les flux

1.Importez vos documents dans Tableau de bord → Base de connaissances
2.Dans le constructeur de flux, ajoutez un nœud Requête RAG
3.Connectez-le avant un nœud Réponse IA
4.Le nœud Réponse IA utilisera les extraits récupérés comme contexte

Spécifications techniques

Modèle d'embeddingCohere embed-multilingual-v3.0

Dimensions vectorielles1024

Stockage vectorielpgvector (PostgreSQL)

Métrique de similaritéSimilarité cosinus

Taille de chunk500 tokens (configurable)

Chevauchement50 tokens

Langues100+ supportées

Résultats maxTop 5 chunks par requête