IT SYSTEMS 4/2026 , IT právo

Právní problematika automatického shromažďování dat na internetu

s využitím specializovaných aplikací

Josef Balín


V oblasti digitálních technologií bývá pravidlem, že nové postupy a technologické možnosti předbíhají specifickou právní úpravu. Nové nástroje a způsob jejich používání tak přináší řadu otázek. Nevstupují ovšem do nějakého právního vakua a je třeba se zabývat jejich fungováním v rámci platné legislativy. V tomto článku se proto zaměříme na často sporné právní aspekty používání aplikací určených pro automatizované shromažďování a vyhledávání dat na internetu, zejména prostřednictvím tzv. web scrapingu. 


S tím, jak se postupně značná část různých aspektů lidské činnosti přesouvá do virtuálního prostoru, roste i potřeba automatizovaného sběru, třídění a shromažďování dat. K tomu slouží různé softwarové nástroje – aplikace určené právě pro jejich vyhledávání a třídění.
Předmětem tohoto článku je rozebrat a posoudit právní aspekty používání právě takových softwarových aplikací, jejichž účelem je vyhledávat určitá data na internetu (podle předem zadaných kritérií), popřípadě na založení či vznik určitého datového souboru ve virtuálním prostoru uživatele upozornit. 
 
Ačkoliv se celá tato problematika může na první pohled jevit jako příliš okrajová či složitá, jedná se vlastně o aplikace, se kterými se běžně denně setkáváme. Typicky půjde například o aplikaci, jejímž účelem je na realitních serverech vyhledávat inzeráty podle zadaných kritérií (lokalita, velikost, cena apod.) a/nebo upozorňovat uživatele na založení nového inzerátu k prodeji či pronájmu. 
 
Může to na první pohled vypadat, že takové aplikace fungují na podobném principu jako standardní běžně používané webové vyhledávače, ovšem skutečnost je poněkud jiná. Internetové vyhledávače totiž zpravidla pouze vyhledávají a indexují webové stránky jako takové. Zatímco tyto aplikace určené pro sběr či třídění informací na internetu pro účely svého provozu využívají a indexují již konkrétní data či soubory dat. A v tomto ohledu se stává jejich použití z právního hlediska poměrně problematické. 
 
S ohledem na již řečený překotný vývoj technologií chybí relevantní konkrétní právní úprava týkající se používání cizích dat na internetu. Nicméně mezi právní předpisy, jejichž ustanovení mohou být dotčena, patří například autorský zákon, zákon o ochraně osobních údajů a nepochybně též nařízení o ochraně fyzických osob v souvislosti se zpracováním osobních údajů a o volném pohybu těchto údajů (GDPR). 
 
Lze totiž předpokládat, že v rámci používání takové aplikace mohou být vytěžovány osobní údaje (zvláště vycházíme-li z faktu, že definice pojmu osobní údaj je poměrně široká), popřípadě předměty duševního vlastnictví, na které se může vztahovat ochrana autorského díla ve smyslu autorského zákona (typicky fotografie). 
 
Taková aplikace by tedy neměla zpracovávat a používat v rámci svého provozu žádné konkrétní údaje či autorská díla (osobní údaje, fotografie). Při vyhledávání dat a jejich indexaci (třídění a vytváření vlastní databáze) by aplikace měly využívat pouze metadata ve smyslu základních parametrů, které jsou veřejně dostupné i pro ostatní vyhledávače. V opačném případě hrozí konflikt se shora uvedenými právními předpisy. 
 
Samostatnou a neméně problematickou otázkou je pak samotná metoda vyhledávání dat na internetu. K tomu obvykle dochází prostřednictvím tzv. web scrapingu, tj. s využitím automatického získávání, stahování a vytěžování dat z webových stránek. Web scraping sice není (v rámci České republiky ani EU) výslovně zakázaný, avšak měl probíhat výhradně na veřejně dostupných datech, která jsou již naindexována i pro veřejné vyhledávače, a jak již bylo řečeno, nesmí využívat osobní údaje, jakož ani díla chráněná autorským zákonem. 
 
Při provozu aplikace určené pro automatické vytěžování a sběr dat na internetu by rovněž neměla být využívána žádná již existující a třetí osobou vytvořená databáze, neboť i ta je předmětem ochrany podle autorského zákona. Že tomu tak v praxi vždy není (neboť by to bylo na úkor efektivity takové aplikace), jistě nebude pro nikoho žádným překvapením. 
 
V některých případech, kdy to provozovatel daného webu umožňuje a poskytuje, lze využít pro provoz aplikace API. Tedy speciální softwarové rozhraní umožňující programům a aplikacím výměnu dat. To je pak situace jiná a takový postup se mi jeví jako zcela v pořádku.
Autorovi článku není známo žádné konkrétní rozhodnutí vydané soudy České republiky, které by se uvedené problematiky týkalo, nicméně v případě jiných evropských států judikatura přece jen existuje a její závěry jsou použitelné a aplikovatelné i v rámci našeho právního řádu. Obecně lze konstatovat, že automatické vyhledávání a zpracování dat je soudy považováno za nepřípustné, pokud by vedlo k systematickému účelovému využívání dat cizího webu obcházejíc jeho rozhraní za účelem vlastní monetizace ze strany provozovatele takové parazitující aplikace. 
 
V neposlední řadě je pak třeba respektovat podmínky přístupu provozovatele webu. Ty mohou obsahovat výslovný zákaz automatizovaného získávání dat. Autor tohoto článku může potvrdit, že některé široce známé a uživateli často navštěvované (a z tohoto důvodu i pro automatizovaný sběr dat velmi oblíbené) weby zmíněný zákaz ve svých podmínkách opravdu zahrnutý mají. V takovém případě by metodu web scrapingu využít (legálně) nešlo. 
 
Lze uzavřít, že provoz takového softwarového nástroje je sice možný, je však třeba splnit určité (nemalé) podmínky a omezení. Shromažďování dat (zejména metodou web scrapingu) není samo o sobě přímo zakázáno, nesmí však porušovat právo k databázi, porušovat jiná autorská práva, ochranu osobních údajů, nebo porušovat podmínky přístupu provozovatele webu. Citovaná omezení pochopitelně užitnou hodnotu takového softwarového nástroje poněkud devalvují. 
 
Jak vidno, používání aplikace vyhledávající data na internetu se z právního pohledu může jevit jako poněkud kontroverzní. V případě tohoto článku jde navíc jen o krátký vhled do problematiky a detailní zpracování tohoto tématu by jistě přineslo mnohem více otázek. To však nebylo jeho účelem. Smyslem této úvahy bylo spíše poukázat na fakt, že užívání běžně dostupných aplikací, které se nám uživatelům jeví jako zcela bezproblémové a ani se nad tím nezamyslíme, v sobě skrývá mnohá (právní) rizika. 
 
Mgr. Josef Balín, LL.M.
Autor článku působí jako advokát a v rámci projektu swpravo.cz se specializuje na právní problematiku implementace informačních systémů, softwarové a IT právo.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.