Zadejte hledaný výraz...

Vyhľadávanie podobností

Jakub
verified
rating uzivatele
(25 hodnocení)
16. 7. 2009 15:53:26
Zdravím,
keďže ja programátor nie som (a najímam si na to iných), chcel by som vedieť, či by bolo možné vytvoriť skript (PHP?), ktorý prejde databázu a vyfiltruje z nej záznamy, ktoré sú si navzájom podobné.
Čiže mám pomerne obsiahlu databázu, ktorá má 90 - 100 000 záznamov. Každý záznam obsahuje okrem iného aj text, na základe ktorého by filtrovanie prebiehalo. Chcel by som vedieť, či by bolo možné vytvoriť skript, ktorý by túto DB prešiel a tieto podobné záznamy by vyhľadal. Samozrejme nejaká následná akcia ako ich vymazanie, alebo vypísanie by už problém nebol. Podobnosť je myslená ako napr. zopár slov navyše, nejaký apostrof atď.
Čo sa týka podoby samotných textov, ktoré by sa mali porovnávať, sú to povedzme krátke články o rozsahu cca 800 - 1000 znakov.
16. 7. 2009 15:53:26
https://webtrh.cz/diskuse/vyhladavanie-podobnosti#reply337748
Jaromir Fojtu
verified
rating uzivatele
(10 hodnocení)
20. 7. 2009 21:41:30
Teoreticky to neni problem, prakticky se u 100K zaznamu, kdy by se musel porovnat "kazdy s temer kazdym" ASI dostanes na takovou vypocetni narocnost, ze se to neoplati...
20. 7. 2009 21:41:30
https://webtrh.cz/diskuse/vyhladavanie-podobnosti#reply337747
Neměl by to být žádný problém, záleží na implementaci, optimalizaci a přesných požadavcích. Případně mě můžete kontaktovat, nějak bychom se domluvili.
21. 7. 2009 08:46:17
https://webtrh.cz/diskuse/vyhladavanie-podobnosti#reply337746
Pro odpověď se přihlašte.
Přihlásit