Agregátor obsahu by měl obsahovat tématický strom kategorií (seznam kategorií, jejich hierarchii a seznam kanálů do kategorií bych dodal)
Na stránce každé kategorie zpráv je třeba zobrazit seznam zpráv, každou položku ve formátu: vždy nadpis zprávy (s odkazem) a začátek perexu přebíraného z RSS
Odkaz na zprávu musí vést na stránku na agregátoru, kde se vypíše nadpis a kompletní perex z RSS + odkaz na kompletní článek. Dále nadpisy a začátky perexů spřízněných článků z jiných webů.
Postup zjišťování příbuzných článků: Vždy, když je zařazen do databáze agregátoru nový článek, systém projede např. 1000 předchozích článků ze všech zdrojů, spočte Jaccardův index (http://en.wikipedia.org/wiki/Jaccard_coefficient), nebo podobnost podle komprese (není to komplikované, podrobnosti o algoritmech mohu vysvětlit) a vybere top 20 nejpodobnějších článků dle skóre
Dále se na stránce článku zobrazí štítky (seznam štítků by měl být konfigurovatelný pomocí textového souboru, počítám nejméně s tisíci štítků)
Výpis článků dle štítku: Pomocí interního fulltextového vyhledávání. Opět zobrazit nadpisy + začátky perexů, opět s odkazy na stránky v agregátoru
*****
Kontakt: info@integria.cz, tel. 732 214 094 nebo 776 65 91 97