In der Basis-Version stehen zwei Indexierungsmöglichkeiten zur Verfügung. Es können sowohl komplette Sitemaps als auch einzelne Seiten als URL eingetragen werden. Zusätzlich können dem Agent verschiedene Dateiformate als Wissensbasis zur Verfügung gestellt werden.
Websites
Es besteht die Möglichkeit, sowohl eine Sitemap im XML-Format als auch eine einfache Website-URL indexieren zu lassen. Die Sitemap-URL muss über das Internet öffentlich abrufbar sein.
Wir empfehlen dir den Upload einer (Teil-)Sitemap im XML-Format. So kannst du gezielt Seiten ausschließen, musst jedoch nicht alle einzeln indexieren.
Sitemap
Bei der Indexierung einer (Teil-)Sitemap werden die darin enthaltenen Seiten einzeln in die Wissensbasis des RAG Agent eingetragen. Eine bereits vorhandene URL muss zuerst gelöscht werden, um sie erneut indexieren zu können.
Sobald die Indexierung einer Seite erfolgreich abgeschlossen ist und der Agent auf das Wissen zugreifen kann, erhältst du eine Bestätigung per E-Mail und der Status der Seite in deinem Dashboard ändert sich von Pending in Live.
Die meisten Content-Management-Systeme (Typo3, WordPress, Drupal etc.) sowie eCommerce-Plattformen (Shopware, Shopify, Magento etc.) liefern standardmäßig entsprechende Sitemap-URLs mit.
Beispiel-Format für eine Produkt-Sitemap in Wordpress:
https://www.deinedomain.de/product-sitemap.xml
Wir empfehlen, neben der Sitemap-URL auch einen Namen bzw. Beschreibungstext einzugeben. Das erleichtert die spätere Zuordnung einzelner Seiten zu einer bestimmten Sitemap, da die URL-Liste über ein Dropdown entsprechend gefiltert werden kann.
Einzel-URL
Es besteht außerdem die Möglichkeit, einzelne Unterseiten oder bspw. Landingpages dem RAG-Agent als Wissen zur Verfügung zu stellen. Dazu muss über das gleiche Eingabeformular lediglich anstelle einer Sitemap die direkte Seiten-URL übermittelt werden. Nach erfolgreicher Indexierung erhältst du auch in diesem Fall eine Bestätigung per E-Mail und der Status der Seite in deinem Dashboard ändert sich von Pending in Live.
Dateien
Neben der Indexierung von Websites ermöglicht der Datei-Upload eine flexible und schnelle Integration eigener Dokumente als Wissensquelle für den RAG-Agent.
Im Bereich Dateien ist der Upload einer oder mehrerer Dateien per Drag and Drop möglich, dort findest du auch die bereits indexierten Dateien.
Aktuell sind die Dateiformate PDF, XLS/XLSX, DOC/DOCX, TXT und CSV zugelassen. Wir empfehlen dir bei Tabellen den Upload kommagetrennter CSV-Dateien.
Mehr Informationen zum verfügbaren Speicherplatz findest du hier.
Knowledge Bases (Add-On)
Optional hast du die Möglichkeit, bereits vorhandene interne Wissensdatenbanken bzw. Speicherorte für den RAG-Agent zu nutzen. Dazu kannst du uns hier eine individuelle Anfrage schicken.
Aktuell unterstütze Plattformen sind:
Melde dich bei anderen Plattformen gerne mit einem Feature Request bei uns.