- Zpracovávat JSON soubory z předem nastavené složky.
- Struktura JSON bude konfigurovatelná, tedy skript musí umožnit specifikovat, které části (elementy) každého souboru mají být zpracovány.
- Embedding: Vybraná data z JSON souboru budou převedena pomocí embedding (např. OpenAI, Cohere, Google apod.).
- Výsledné embedované vektory budou ukládány do databáze ChromaDB – s volitelným uložením buď do lokální instance, nebo do instance v cloudu.
- Konfigurace: Skript musí být jednoduše konfigurovatelný (tj. možnost specifikace cesty ke složce, ke zdroji JSON, výběr elementů, parametry pro embedding, parametry pro připojení k ChromaDB apod.).
- Skript bude snadno spustitelný (např. přes command line).
- Přehledná konfigurace (soubor nebo parametry na příkazové řádce).
- Práce s JSON soubory s různou strukturou.
- Možnost použít různé embedding modely dle volby.
- Ukládání do ChromaDB s volbou lokace.
- Výstupem bude dobře dokumentovaný skript s příkladem konfigurace.
- Krátký návod ke spuštění a základní informace k integraci.
- Možnost rozšiřitelnosti.