Ahoj, nevíte kde třeba CSFD, FDb atd... berou kompletní informace o filmech, které mají v Databázích? Vím, že se dají sehnat popisky ke všem kino premiérám, ale co ostatní filmy, které kinopremiéru nemají a vyjdou pouze na DVD?
Ahoj, nevíte kde třeba CSFD, FDb atd... berou kompletní informace o filmech, které mají v Databázích? Vím, že se dají sehnat popisky ke všem kino premiérám, ale co ostatní filmy, které kinopremiéru nemají a vyjdou pouze na DVD?
IMDB -> překlad -> web :)
tak nejak, hlavne myslim ze davaji moznost vkladat informace i navstevnikum, ti se toho casto radi zhosti a navic zdarma, protoze pak maji pocit ze se taky neceho ucastnili
No ale co do začátku? :) Když potřebuji seznam filmů pro jeden svůj projekt - český název, originální název, režisér, rok. Dají se tato data někde stáhnout (XML, CSV...)
IMDB appi a můžeš tahat herce, fotky, videa a popis si napíšeš vlastní, enbo dáš možnost, jak bylo řečeno, uživatelům.
Pokial viem, tak imdb api nema.
tak to nekde dataminingujte :) kdo vam dokaze ze jste si zrovna od nich zkopirovali nazev filmu/cesky nazev rezisera/rok ? na tyhle data nikdo copyright nema :)
Marty_SVK: Jediné co jsem od imdb našel tak byla textová data. Na Googlu ale je ale pár Api od třetích stran
AlesiBoss: asi to tak dopadne :)
IMDb nemá přímo API, ale viděl jsem hodně skriptu na tahání dat od nich a též i návod jsem na to našel. IMDb bude asi jediná spolehlivá cesta, mno.
Nevíte někdo, jak získat všechny funkční odkazy z www.csfd.cz/film/* zbytek si pak z jednotlivých stánek stáhnu. Řešit to vše budu přes PHP
DÍKY
pocitej od jednicky
www.csfd.cz/film/1-dfg
www.csfd.cz/film/2-dfg
pokud existuje tak tit o vyhodi presmerovani na spravny odkaz
http://www.csfd.cz/film/1-first-do-no-harm/
http://www.csfd.cz/film/2-pripoutejte-se-prosim/
Tak to moc nefunguje, hází to 403 :( všechny podstránky jdou, jen u filmů je problém :/ asi to nějak detekujou.
V adresách problém není, ale mají omezenej přístup, když tam přistupuju skriptem. Např. -http://www.csfd.cz/film/1-first-do-no-harm/ Nejde ani prověřit ve W3C validatoru.
Asi to stáhnu z fdb.cz ale asi to budu chtít rozšířit o popisky filmů, ale nevím, jak to rozlišit, nechci jim brát vlastní popisky, ale jen officiální popisky od distributorů :) , u csfd to tam je alespoň dopsáno (oficiální text distributora).
Co třeba obaly filmů? To je legální si jen tak házet miniatury na web? :) něco jako má MovieZone, CSFD, FDB apod... od nikoho jsem se nedostal k tomu jestli mají nějáké povolení nebo licenci nebo popř. jak je toto právně upraveno :) díky
Štěpán L.: Myslím, že je to jedno, nikdo to nijak neřeší (asi). Jen nechci brát ten jejich vlastní obsah (popisky)
No tak proč to enbereš z IMDb? Štrachá tma každý takový skript. Mimochodem zkoušel jsi u ČSFD si prolézt stránky a mrknout na způsoby zapsání URL? ;)
Pavel Janků: Protože tam většinou nejsou české názvy. Tím způsobem zapsání URL nevím co myslíš :)
Jinak jsem na netu našel CSFD Parser A přes ten by to vydolovat šlo, teď jen získat URLs ale musím získat ty celé http://www.csfd.cz/film/2-pripoutejte-se-prosim/ protože http://www.csfd.cz/film/2/ to nevezme.
Ono to ale funguje i se samotným číslem, jen musí být (pokud je to v cURL) nastaveno FOLLOWLOCATION, aby se to nechalo z http://www.csfd.cz/film/2/ přesměrovat na http://www.csfd.cz/film/2-pripoutejte-se-prosim/. Mělo by to tak fungovat.
Takže něco jako:
EDIT:PHP kód:curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
Tak "my bad", skutečně musí být první adresa http://www.csfd.cz/film/2-random-string/, stačilo použít web-sniffer.net a poučit se z hlaviček.
---------- Příspěvek doplněn 10.12.2010 v 22:33 ----------
Tak zkouším ten CSFD Parser. Sice vypadá dobře, ale ideální to nebude. Pro zobrazení kompletního textu popisku je třeba kliknout na odkaz, autor parseru to řeší tak, že přidá k url ?text=1, ovšem to ukáže pokaždé jiný text. jednou se jedná o popisek oficiálního distributora, podruhé o popis od nějakého uživatele.
Vyzkoušejte si to na:
http://www.csfd.cz/film/236435-proroctvi/?text=1
Párkrát refreshněte a uvidíte.
popisky bych jim nekradl ;) (muzou byt pod copyrightem to nevis ani u textu ofic distributora)
@AlesiBoss: Já to v plánu ani nemám, jen mě strašně zajímá parsování, atp., i když mi to moc nejde. Zrovna teď si prostě dělám blbůstku, co mi vyparsuje komentáře z WP blogu. Prostě proto, abych si to dokázal.
v parseru jsem použil ?text=1 jelikož to byla teoreticky nejlepší možnost...i když to tam není tak se pokaždé zobrazí jiný popis, takhle se aspoň zobrazí celej :-)
@Zemistr: Však já nechci nijak útočit na tvoji práci, jen jsem na to upozornil :)
určitě by šlo z odkazu získat id toho popisku a pak ho použít :) až to budu řešit tak to vyzkouším a kdyžtak to sem pak postnu :)
ale tak když to má víc popisků tak jak mam vědět kterej znich by byl ten OK? :-D
To tam u nějakýho je více popisků jo? To jsem si nikdy nevšiml :) Víš o nějakém filmu, rád bych na to mrknul? Jedině načíst všechny popisky do pole a pak preferovat ten s tim oficiálním textem distributora.
Například film Počátek:
http://www.csfd.cz/film/254156-pocatek/?text=150579
http://www.csfd.cz/film/254156-pocatek/?text=143271
Problém je že musíš stránku obnovit třeba 2krát nebo 3krát aby se ti objevil další popisek.
Takže, kdybych chtěl načíst všechny popisky, tak by to bylo krapet náročnější na načítání. :-D
Už jenom to, že sem do verze 1.4 přidal načítání všech obrázků a videí je celkem záhul pro server. :-D
Nová verze je na světě a hádejte co?!?
Už umí ono přesměrování :-)
Do php nyní stačí zadat pouze:
Nová verze je zde: http://www.phpclasses.org/package/65...CSFD-site.htmlPHP kód:<?
include 'csfd.class.php';
$csfd = new CSFD();
$csfd_out = $csfd->Show(236435, true, true, true);
print_r($csfd_out);
?>
Gratuluji :)