08.09.2022 13:47
1
Ahoj všem,

po delším čase jsem spustil nový free nástroj určený těm, kdo si chtějí udělat rychlou analýzu slov z českého textu (pro SEO, copywriting, marketing a pod.), nebo vyfiltrovat (vyčistit) a automaticky clusterizovat textová data (hledané výrazy z reklamních systmů aj.). Vyčištěná data lze následně exportovat jako CSV a použít například v rozšířené klasifikační analýze klíčových slov, nebo je můžete zpracovat v Excelu či databázi.

Pokud si chcete nástroj na filtraci a analýzu slov vyzkoušet, najdete ho na adrese www.analyza-slov.cz

Ladil jsem to s kolegyní, které to šetří cca 50% času při čištění textu a základní analýze klíčových slov. V některých případech šlo o zmenšení datasetu (po vyčištění a clusterizaci) až na 22% původní velikosti. Při následné klasifikační analýze klíčových slov pracuje s menším množstvím dat a vygenerované slovníky mnohem rychleji roztřídí do klasifikačních dimenzí.

Budu rád za konstruktivní zpětnou vazbu, kolik času to ušetří vám, co tam třeba chybí, nebo co se špatně chápe nebo ovládá.

Díky všem za případnou debatu a snad vám nátroj taky pomůže.
12.09.2022 17:04
2
Pěkný. Mrknu na to :)
12.09.2022 18:01
3
Toto je výsledek z Excelu tvého příspěvku, asi se to nemá vkládat ctrl+c a ctrl+v

Základ Slova Řádky Výskyty Zahrnuto
a a 4 8 1
adresa adrese 1 1 1
ahoj ahoj 1 1 1
analýza analyza, analýze, analýzu 5 6 1
automatickĂ˝ automaticky 1 1 1
budu budu 1 1 1
cca cca 1 1 1
chce chcete, chtějí 2 2 1
chybět chybí 1 1 1
chápat chápe 1 1 1
co co 1 2 1
dát dat 1 1 1
datum data 1 2 1
databáze databázi 1 1 1
debata debatu 1 1 1
delší delším 1 1 1

Ten video návod je rychlejší než já chápu:(
12.09.2022 19:08
4
Původně odeslal láďa1979
Toto je výsledek z Excelu tvého příspěvku, asi se to nemá vkládat ctrl+c a ctrl+v

Základ Slova Řádky Výskyty Zahrnuto
a a 4 8 1
adresa adrese 1 1 1
ahoj ahoj 1 1 1
analýza analyza, analýze, analýzu 5 6 1
automatickĂ˝ automaticky 1 1 1
budu budu 1 1 1
cca cca 1 1 1
chce chcete, chtějí 2 2 1
chybět chybí 1 1 1
chápat chápe 1 1 1
co co 1 2 1
dát dat 1 1 1
datum data 1 2 1
databáze databázi 1 1 1
debata debatu 1 1 1
delší delším 1 1 1

Ten video návod je rychlejší než já chápu:(
Ahoj Láďo,

to bude myslím jen kódováním, které je potřeba nastavit na UTF-8 při otevírání výstupních CSV v Excelu. 

Při ladění frontendu jsem zkoušel i copy/paste z Excelu do toho pole pro import a šlo to, tak tipuju, že to bude tím kódování při otevírání CSV v Excelu.

V případě, kdy se do nástroje importuje soubor (text) s jiným než UTF-8 kódováním, tak to ořeže češtinu úplně. To by ti pak ani nedělalo ty paznaky v exportu očištěných dat, protože by tam čeština nebyla.

Pokud by ti to nešlo i při tom UTF-8 kódování, mohl bys mi prosím poskytnout vzorek dat (nebo zdrojový soubor), abych to mohl poladit?
13.09.2022 12:03
5
Promiň asi jsem to špatně popsal. Zkopíroval jsem část tvého příspěvku výše, vložit do analýzy, projel, zpracoval poslal do Excelu a otevřel Excel.
13.09.2022 13:07
6
Původně odeslal láďa1979
Promiň asi jsem to špatně popsal. Zkopíroval jsem část tvého příspěvku výše, vložit do analýzy, projel, zpracoval poslal do Excelu a otevřel Excel.
Myslím, že jsi to popsal v pohodě už poprvé a snad to chápu správně. Při testech jsem to zkoušel stejně, jako ty, jen na jiném textu. Pokud se ti v tom nástroji zobrazuje čeština (ve filtru vidíš česká slova), tak je vše v pořádku a bude to tím kodováním výstupního CSV, které pak asi otevíráš v Excelu.

Excel sice nemám, ale udělal jsem screen (viz přiložený obrázek), jak exportuju z nástoje data a kde nastavím UTF-8 kódování, když je otevírám v OpenOffice. Ono v tom Excelu je to podobně, volí se tam kódování a oddělovač sloupců, jen ti na to nemůžu udělat přímo Excelový screenshot.

Pak mě ještě napadá, v jakém prohlížeči to zkoušíš (Firefox, Chrome, ..)  a jaký máš operační systém, win, mac, linux? Pokud to nebude tím nastavením kódování při otevírání CSV dat v Excelu, potřeboval bych to umět replikovat, tu chybu, abych ji odladil.

Každopádně díky za zpětnou vazbu a snad to bude jen to kódování.

Přiložené miniatury
13.09.2022 13:50
7
Mám to stejné jako Láďa, ale stačí když v posledním kroku neotevřu soubor v Excelu, ale nejdřív otevřu Excel a pak soubor načtu jako CVS. Vyskočí klasická tabulka s výběrem formátování a oddělovačů a pak je to v pořádku. (Chrome, Win 11, čistokrevný Excel)
13.09.2022 14:55
8
ano když to naimportuji jako csv tak je to v pořádku jako u všech jiných stahovatelných csv nebo feedů. Takže trošku pro nás pomalejší a méně chápavé prosím uprav popis funkčnosti, děkuji.

I když otázkou je kolik méně chápavých jako já pracuje s rozšířenou analýzou a čištěním:)
13.09.2022 17:52
9
Původně odeslal Zapdox
Mám to stejné jako Láďa, ale stačí když v posledním kroku neotevřu soubor v Excelu, ale nejdřív otevřu Excel a pak soubor načtu jako CVS. Vyskočí klasická tabulka s výběrem formátování a oddělovačů a pak je to v pořádku. (Chrome, Win 11, čistokrevný Excel)
Super vodítko, díky moc.

Původně odeslal láďa1979
ano když to naimportuji jako csv tak je to v pořádku jako u všech jiných stahovatelných csv nebo feedů. Takže trošku pro nás pomalejší a méně chápavé prosím uprav popis funkčnosti, děkuji.

I když otázkou je kolik méně chápavých jako já pracuje s rozšířenou analýzou a čištěním:)
Zkusil jsem to poladit, aby se CSV exporty otevíraly v Excelu dobře hned napoprvé. Bylo by otravné všechno ukládat, hledat a otevírat. Už by to ale mělo fungovat. (vyžkoušeno na Win + plnokrevný Excel i Win + OpenOffice).

Ještě jednou dík za feedback, snad už to bude sloužit, jak má.
13.09.2022 18:57
10
Jsem ted sice na jiném PC, ale funguje.
18.09.2022 15:42
11
Původně odeslal láďa1979
Ten video návod je rychlejší než já chápu:(
Tak ještě doplním, už tam je i návod s podrobným popisem, jak využít nástroj pro filtraci klíčových slov. Jsou to v podstatě screeny z toho rychlého videa, ale připsal jsem k nim textové pokyny a vysvětlení, jak na to. Snad to usnadní pochopení a práci s nástrojem. Z toho rychlého videa je to trochu nepraktické.
Analýza Slov CZ - Postup filtrace (čištění) slov datasetu