Prodej projektu Duchod.cz - cena 665 tis Kč. Dále MojeFinance.cz, DuchodovaReforma.cz
Zobrazují se odpovědi 1 až 15 z 15

Rychlý fulltextový našeptávač slov a produktů pro eshopy

  1. Ahoj, zdravím všechny.

    Procházel jsem české eshopy abych zjistil, jak jsou na tom s našeptáváním slov a produktů. A nevím, co si o tom mám myslet, takže víc hlav, víc ví :)

    U nalezených eshopových řešení s našeptávači byla důležitá funkcionalita, relevance a přehlednost výsledků a především rychlost našeptávání, která se ukázala jako zásadní slabina u většiny z testovaných.

    Co mne jako uživatele eshopů nejvíc trápilo:
    - některé našeptávače napovídají jen celá hledaná slova a ve správném pořadí
    - našeptávání začíná až poté, co dopíšete hledaný text (někdy až s 3s zpožděním)
    - většina menších eshopů a krabicových řešení napovídá mezi 0.4 - 0.6s (při rychlém psaní se některé na chvílí zaseknou)
    - valná většina našeptává jen produkty, pouze malé množství eshopů nabízí našeptávání existujících slovních kombinací, na které vždy najdu alespoň jeden výsledek (viz Q1/b)

    Takže mne napadlo několik otázek.

    Q1: Jaká varianta našeptávače je pro uživatele nejpřirozenější?

    a) našeptávání slov, která reálně mohou následovat (podobné jako google a pod.)
    - uživateli je nabídnuta pouze slovní kombinace, kterou musí následně vyhledat, poté může vybrat jeden z výsledků, coz vede k delší cestě k produktu
    + přirozené napovídání slov a názvů produktů umožňuje uživateli vybrat výrazy z nabídky a pokračovat dalšími slovy, která mohou dále specifikovat, co hledá.

    b) našeptávání konkrétních produktů a přímé přesměrování uživatele na vybraný produkt
    - tato varianta direktivně nasměruje uživatele na jeden konkrétní produkt, pro ostatní produkty ve shodě s hledaným výrazem musí provádět nové hledání/našeptávání.
    + proti tomu je v opozici fakt, že pokud uživatel zná dobře sortiment eshopu, nemusí klikat nikam jinam (má, co chce koupit na první kliknutí v našeptávači).

    c) kombinace (nahoře našeptávaná slova, pod nimi produkty, případně i kategorie)
    - častá nepřehlednost a velké množství našeptávaných informací, často i nižší rychlost našeptávání
    + kombinovaná funkcionalita (přímý proklik na produkt i možnost vybrat slova z nápovědy a ta doplnit o další)

    Q2: Jak velkou roli hraje rychlost našeptávání v chování uživatele?

    Q3: Máte prosím někdo zkušenosti, jak se změnilo chování uživatelů po nasazení našeptávače?

    Po testech cz eshopů mne napadlo, že bych mohl našeptávač, který mám vyvinutý, uvolnit jako službu, protože uživatelský dojem z existujících našeptávačů není zrovna moc pozitivní a jsou to občas spíš "brzdiče" než pomocníci. Ale možná jsem jen narazil na špatné vzorky (mno že jich teda bylo :). Nebo na to už je i nějaká tuzemská rychlá mikroslužba? ..nějak jsem ji nenašel, jen na adresy.

    Díky všem za názory a třeba i hlubší myšlenky či zkušenosti
    Přeju příjemné volné dny.

  2. Co se právě děje na Webtrhu?
  3. A1) žádná, všude existují všechny skupiny uživatelů. Očekávané chování se liší podle kontextu a není snadné to udělat pro spokojenost všech. Velké portály mají kombinaci, primárně našeptávají již uložené celé fráze, pokud se schodují, když si neví rady, našeptávají jen slova. Někdy uživatel hledá kategorii, z dat lze vidět, že skočí na první produkt a hned klidne v drobečkové navigaci na kategorii, špatné vyhodnocení našeptávače pak jde proti uživatelům.

    A2) pomalý našeptávač podle uživatelských testů lidé nepoužívají/ignorují, je občas vhodné výsledky skrýt, pokud je odezva až příliš vysoká (zatížení serverů či špatné spojení), našeptávač totiž pak zobrazuje něco, co už v políčku není a je to zmatečné (viz divnosti na Alze).

    A3) strašně špatně se to vyhodnocuje, viz odpověď A1, každý analytik data vyhodnocuje jinak a výsledky jsou opačné, primárně testujeme uživatelskou přívětivost vlastní sadou testů a zkušebních uživatelů. Dlouhodobě se sleduje míra prokliku z našeptávače proti prokliku z výsledové stránky a udržení se na dané stránce.

  4. Hele koukáš na to moc technicky i z pohledu uživatele a to většina uživatelů nedělá. Já u e-shopu co prodávám též používám našeptávač. Příklad: eshop s gadgety, který ho má zabudovaný též a funguje vcelku jednoduše. Ale on je to úmysl. Čím více toho umí, např. hledat kombinace tím to máš náročnější na db. A samozřejmě s tím se to násobí s počtem zákazníků co vyhledávají něco současně.
    No o to se ti pak projeví na té rychlosti. Samozřejmě si můžeš pomoci třeba indexací, nebo omezením množství produktů co to na klíčové slovo najde. Já mám obvykle 10, ale myslím si že je důležité zákazníka jen nasměrovat a nedávat mu moc na výběr. Co mám zkušenosti, tak drtivá většina lidí chce jednoduché a názorné řešení a ne technické vyhledávání.

    Jinak vyhledávání jako SAS službu jsem už viděl, ale ne na eshopech a ne v CZ.

  5. to je pravda, že malé eshopy si musí vystačit s čím co mají a na klasické db ty možnosti jsou omezené. U nás našeptávač produktů nemá špatně udělaná třeba Alza nebo Slevomat (už dlouho jsem ale jejich řešení nezkoumal, snad to nezkazili). V drtivě většině to běží nad Elasticsearch, v zahraničí jde hodně vidět zmíněný SAP, v ČR ho používají ve velkém automobilky pro vlastní objednávkové stránky třeba pro náhradní díly (vč. jeho našeptávače).

  6. Díky za reakce

    TomasX: k A3) podle toho typu naseptavace (a/b) přece musí někde být vidět identifikovatelná změna, ne? Třeba pokud by byl nasazeny slovní našeptávač (a), může se to projevit na skladbě hledaných slov, případně rozptylu, variantách....? Minimálně pokud to lidé používají, tak vždy najdou alespoň jeden produkt ve vyhledávání (na hodně shopech když hledám, nenajdu často x-krát nic a až pak se trefím do něčeho, co existuje). Fakt to nikde není identifikovatelné?

    MirekNovotny: tak to musím pochválit, protože ten našeptávač na eshopu elektroprodejce.cz jede moc pěkně. Tohle fakt není běžné. A díky za poznámku, že na to koukám moc technicky, na tom určitě je kus pravdy :) ... ale asi jsem taky dost zhýčkaný googlem a pod., který prostě frčí rychle a chci dělat podobně rychlé věci, když to jde.. a tak si říkám, proč to nedělají i ostatní (dělají našeptávače, co lidi nepoužívají, jak trefně píše TomášX).

    Je samozřejmě otázka, nad kolika produkty/daty to vyhledává a na čem to běží (ať už sw, nebo železo).
    A že není zatím známa rychlá česká mikroslužba je taky fajn zpráva, díky :)

  7. pokud nastavíš kritéria kvality našeptávače, že něco najde, tak to limitně končí s tím, že podle skóre seřadí všechny produkty a kategorie a vratí prvních deset. Stejně tak měřit to podle prokliku může být chybné, viz můj argument s prokliknutím produktu a pak jeho kategorie. Měřit podle toho, kolikátou položku dotyčný prokliknul může být také nebezpečné, ty první mohou být plně relevantní, ale již je třeba návštěvník viděl. Stejný problém řeší vyhledávače (google, seznam) a mají na to mnohem větší tým a rozpočet, než kolik má běžný eshop. Vidím velký rozptyl mezi segmenty eshopů, jinak se lidé chovají v obecném obchodě typu mall, alza, jinak se chovají ve specializovaném třeba pro zmíněné autodíly.

    V jednom eshopu tam lidé masivně zadávali částku, což jinde nedělali, pátráním jsme si odvodili, že chtějí asi filtr na částku do. Zatím si nedokážu představit, jak by musely vypadat KPI na našeptávač. Většinu zpětné vazby získáváme z uživatelských či pseudouživatelských testů, měří se pak často jednotlivé typy frází či jejich verze a již ne našeptávač jako celek.

    No, pokud hledáš konkurenci, tak algolia.com je česká :), používá jí na vyhledávání a našeptávač třeba twitch od Amazonu, cenově to pro eshop není likvidující a klidně bych jí někde nasadil, kdybych dělal malé eshopy :).

  8. Určitě záleží na odvětví a cílovce, nám třeba u sportovního vybavení (https://www.e-sportshop.cz/cz/) vyšlo nejlepší vybírat především z kategorií a značek (i když v názvu produktu přímo není) a co nejrychleji dostat návštěvníka do dané části sortimentu a tam ať si už filtruje, z tohoto důvodu není tak podstatné ukazovat cenu a zobrazujeme jen 6 výsledků, aby se nad tím nemuselo moc přemýšlet. Odpovídající produkty ale samozřejmě také ukazujeme. Pro fulltext používáme ElasticSearch a je to myslím velmi rychlé i s desítkami tisíc produktů. Rychlost byla velkou prioritou a když to vrací relevantní výsledky, tak to uživatelé o dost raději využívají.

  9. TomášX: díky za odkaz, docela trefa ta algolia.com zajímavá inspirace. Jen to asi nebude mikroslužba pro ty úplně "nízkonákladové" pidi shopy (pokud dobře chápu, je to v základu několikrát dražší než hosting, nebo krabicové řešení mnoha shopů a to někdo musí i naimplementovat..). Pro střední a větší (dlé Tvého ty malé :) to je asi dobrá služba.

    smitka: tak teď se konečně dostáváme do ostrého provozu - tahle to má být :) E-sportshop.cz běhá našeptávač fakt krásně rychle. Jen díky tomu, že neznám sortiment, tak se mi nedaří našeptat třeba "zelený batoh" atp. Ale jinak to je jeden z nejschopnějších našeptávačů a řadil bych ho do první ligy ala "alza a spol". Chápu dobře, že jde o interní (vlastní) řešení nad Elasticem?

    Ohledně toho našeptávání a relevance, tak naprosto záleží na datech. Na začátku vývoje mi to napovídalo dost děsivý věci včetně ras*stických kombinací, ale když to člověk poladí, tak to dělá jen radost, jako na tom e-sportshopu treba :)

  10. elasticsearch je fulltext databáze připravená k použití, stačí naplnit daty a použít nějaký jednoduchý indexer, drží si odezvy v desítkách až stovkách ms i bez ladění. Největší problém je, jakými daty ho naplnit :). Potřebuješ k němu vps a dostatek paměti, jen tohle tě výjde na několik stovek měsíčně. Programátor za pár hodin může vyhledávat a zpravidla do týdne má hotové demo pro našeptávač (hodně orientační odhad). V produkci provozujeme 3 a zpravidla více instancí s replikací na hoodně silných strojích.

    Algolia výjde v nejmenší verzi na 1000 - 1500, pokud si platím programátora na vývoj, tohle ušetří spousty peněz, je ale otázka jaké jsou rozpočty. Elasticsearch lze také pronajmout. Pro mě malý eshop je takový, který uživí aspoň dva lidi, hobby podnikání po večerech jako přivídělek bych spíše nazval mikro :).

    Ano, největší práce na vyhledávání/našeptávání je ladění a práce s vlastními daty, trvá i měsíce než se to vyšperkuje, aby to dávalo uživatelům smysl a fungovalo jim to jak si představují. Každý sortiment a typ zákazníků vyžaduje trochu něco jiného.

  11. skorozacatecnik: ano, je to vlastní řešení nad elasticem, ale je to přesně, jak píše TomášX - technicky na tom nic moc není, ale bylo dost práce to správně naplnit. Zrovna v parametrech, jako je třeba právě barva, nevyhledáváme i když je indexované taky máme (využíváme to pak ve filtraci), aby to správně plnilo náš cíl (běž rychle do sekce a filtruj), tak bychom proto museli mít přímo třeba sekci “žluté boty”, ale ty máme zase ve více kategoriích a aby to dobře fungovalo (klíčové je to slovo “dobře”, automaticky to nějak vygenerovat není problém) tak by to vyžadovalo zbytečně hodně práce od toho, kdo to plní.

    V našem použití elastic není ani nějak extrémně náročný, sebere jen jednotky GB RAM. Myslím, že pokud by se dělalo “našeptávání jako služba”, tak by byla docela škoda to využít jen na našeptávání, když už ten pěkný index máme...

  12. pro doplnění, jak správně naráží smitka, když už jsou data v elasticu, je škoda je využít jen pro našeptávač, tuhle věc si řiká více lidí, např. Slevomat má komplet kategorizaci produktů na frontendu přes elastic :)

  13. Naseptavani produktu jsem resil pro par ceskych a slovenskych eshopu. Vyuzivali pritom nas nastroj dadatu.cz tedy to nezatezovalo jejich stroje a nebylo potrebne zadne programovani uprav na jejich strane.

    Casto lide ikdxz neznaji sortiment zkusi zacit psat do hledaciho pole a ocekavaji ze jim bude nabidnuta kategorie nebo primo vypis produktu. Technicky tohle nikdo z Beznych uzivatelu neresi, do sekundy je odpoved v pohode pokud ma smysl.

    Pokud hledam slovo kafe a naseptavac mi napise ze kafe nemaji, protoze to maji naparovane jen na slovo kava je to problem ktery nastve.

  14. Díky chlapy za reakce,

    TomášX: asi máme podobný pohled, co je micro, malý atp. eshop :) Pohybuju se teda mezi mikro až střední.. ale z pohledu nákladů, tak se je snaží pochopitelně hlídat všichni, proto jsem sondoval i ty přínosy a případně nějaká reálně uchopitelná "čísla". Nezkoušeli jste třeba podstrčit do našeptávače slova a kombinace, která by ověřila, že ho lidé používají atp.?

    Vit Michalek: asi to mělo být datatu.cz, na té dada* nic neni. Na datatu je logo biosfera.cz a tam to našeptávání jede podobně jako třeba na elektroprodejce.cz. Zatím mě nejvíc oslovila hbytost e-sportshopu. Přehlednost se mi ale zdá na té biosféře trochu lepší.

    Koukám, že když už má někdo schopný našeptávač, tak je na elasticu. Použil jsem trochu jiné, "lehčí", technologie ("nejtěžsí" je asi Redis) a cílem byla možnost provozovat na tom X* našeptávačů (na produkty, na články, na poradnu, na kde co).

    Našeptávání konkrétních produktů (verze B) je kombinačně jednodušší, takže nejdřív testuju tu komplikovanější slovní (verzi A - našeptávání existujících sl. kombinací) nad dvěma xml feedy (jeden s 8k+, druhý s cca 6k+ produkty). Snažím se co nejméně zasahovat do vstupních dat, v podstatě jen strojová příprava.

    V prvním případě (8k+) kombinuji našeptávaná slova z názvů produktů a kategorií, v druhém případě (6k+) našeptávám kombinace z názvů produktů, klíčových slov/frází (to je mnohem relevantnější). Zatím to chodí nějak takhle: https://beta.dataapps.cz/ftts.words.html

    U té produktové varianty našeptávání je hodně možností, jak informace zobrazovat a už jen rozdíly v eshopech z téhle diskuze ukazují, že to bude trochu oříšek pro UXařku.

    Ještě by mě zajímaly názory spadající spíš do toho UX. Jak hodně ovlivňuje uživatele miniatura v našeptávači?
    Tohle asi nemá nikdo změřený, ale z mého pohledu, kdy neznám produkty a na miniatuře nic nepoznám, tak tam jen zabírá místo textu. "UX/Grafik by mě hnal" :)

  15. Na miniatury asi nebude jednotný názor. Alza je třeba nemá, MALL je má. Z hlediska výkonu to bude samozřejmě lepší bez, ale s nima to zas lépe vypadá. Takže já je tam dávám.

    Pardon, tak Alza u zboží také. Jen ne vždy to ukáže zboží místo KW.

  16. skorozacatecnik : přesně tak psani na mobilu no;) Pro biosferu momentálně už nic neřešíme jen tam zůstalo logo.

Hostujeme u Server powered by TELE3