Zadejte hledaný výraz...

Algoritmus pro výběr nejzajímavějšího obsahu

Karel Novák
verified
rating uzivatele
(1 hodnocení)
8. 5. 2010 08:32:12
Nenapadá mě lepší sekce než tato, pokud není právě tak se omlouvám :)
Pracuji teď na jednom projektu, ve kterém bych potřeboval nějak řešit automatický výběr nejzajímavějšího obsahu. Nemohu moc popisovat přesnou podstatu projektu, protože jsem vázaný mlčenlivostí ale zjednodušeně.
Jedná se o projekt, ve kterém vzniká relativně velké množství obsahu (řekněme 500 článků/den). Požadavek klienta je aby se na hlavní stránku webu nějakým způsobem automaticky vybírali nejzajímavější/nejdůležitější obsah za daný den nebo jinou časovou jednotku.
V zásadě vidím jen tyto možnosti:
- Automaticky podle počtu zobrazení (zaznamenávat počty zobrazení stránek s daným obsahem a pak mít něco jako „nejčtenější obsah“). Problém ale je, že nejčtenější obsah se stane nejčtenějším až za nějaký čas, pokud to bude třeba týden tak novému textu bude trvat několik dní, než se dostane mezi nejčtenější
- Automaticky podle hodnocení (spolehnout se na uživatele a řešit to podobně jako vybrali.sme.sk nebo linkuj.cz). To by předpokládalo spolupráci uživatelů, a musel bych řešit nějaký způsob ochrany proti podvodům
Spíše ale uvažuji spíše nad něčím, co by se více blížilo Google news = nějaký algoritmus který by vyhodnotil obsah a na základě nějakého skóre vytáhl aktuálně zajímavý obsah. (i když je mi jasné že naprogramovat vlastní algoritmus který by byl srovnatelný s google news je utopie :) )
Zatím jsem ale nepřišel na to jak toto uchopit. Napadá mě mít nějaký seznam slov, která by měla nějaké bodové ohodnocení, a pak sledovat četnost výskytu podobných slov v textu a počítat skóre pro článek. Tento způsob by ale znamenal hodně velké zkoušení pro nastavení váhy pro daná slova a navíc se asi dá jen těžko sestavit nějaký obecně platný seznam.
Nebo nějakým jiným způsobem zkombinovat počet zobrazení + hodnocení uživatelů + nějaké další faktory ….
Napadá vás něco?
8. 5. 2010 08:32:12
https://webtrh.cz/diskuse/algoritmus-pro-vyber-nejzajimavejsiho-obsahu#reply502128
Nenapadá mě jak toto vyřešit s tím co jsi navrhl. Napadá mě jak to vyřešit správně. :-)
- porovnávat obsah v T časovém intervalu
- v něm porovnávat n-tice klíčových slov (nezávisle na jejich tvaru (pádu, osoby atd)
- v tomto čase T dělat scoring n-tic slov automatizovaně
Tím zjistíš o čem se nejvíc píše...
8. 5. 2010 09:28:04
https://webtrh.cz/diskuse/algoritmus-pro-vyber-nejzajimavejsiho-obsahu#reply502127
Pro odpověď se přihlašte.
Přihlásit