27.10.2021 19:41
1
Ahoj,

pro pracovní web bychom chtěli využít stažení volných pozic z Úřadu práce ČR.

Řešil to někdo z Vás? Já zkusil uvedené JSON soubory načíst srkze Postmana, aby se mi hezky naformátoval datový výstup, viděl jsem přehledně strukturu, atd. Ten soubor je zřejmě velký jako prase a nedokáže to načíst ani Postman ani prohlížeč.

Jak se k těm datům dostat? Od IT oddělení ÚP jsem dostal odpověď:

Z Vaší strany bude potřeba si napsat skript pro stahování nebo vytvořit program, který dokáže data stáhnout a rozdělit a nebo třetí možnost, použít nějaký program pro automatické stahování, který nebude mít problém s větším objemem dat.
https://data.mpsv.cz/web/data/volna-mista-za-celou-cr - kdyžtak hned ten první soubor v pravém sloupci.

Dáte mi prosím někdo nějaký tip? Tam není ani žádná filtrace pomocí stránkování, datumu, lokality, atd. Prostě se mi to jeví jako vše dohromady.
27.10.2021 20:11
2
No 350MB json file s 11 080 951 řádků je krapet overkill :D Sem musel z 512MB paměti dát serveru 2GB :D
Kód:
<?php
    $fle = file_get_contents( 'https://data.mpsv.cz/od/soubory/volna-mista/volna-mista.json' );
    file_put_contents( 'test.json', $fle );
Asi je jasný, proč to prohlížeč nedá :D 

---------- Příspěvek doplněn 27.10.2021 v 20:20 ----------

Btw co tohle https://www.api.store/volna-pracovni-mista/
27.10.2021 20:33
3
Použít knihovnu která nestaví DOM.
27.10.2021 21:17
4
mrkni třeba na tuhle knihovnu https://github.com/salsify/jsonstreamingparser