- Přehledy IS
- APS (20)
- BPM - procesní řízení (22)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (33)
- CRM (51)
- DMS/ECM - správa dokumentů (20)
- EAM (17)
- Ekonomické systémy (68)
- ERP (79)
- HRM (27)
- ITSM (6)
- MES (32)
- Řízení výroby (36)
- WMS (29)
- Dodavatelé IT slueb a řeení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (39)
- Dodavatelé CRM (33)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (71)
- Informační bezpečnost (50)
- IT řeení pro logistiku (45)
- IT řeení pro stavebnictví (26)
- Řeení pro veřejný a státní sektor (27)
Tematické sekce
ERP systémy
CRM systémy
Plánování a řízení výroby
AI a Business Intelligence
DMS/ECM - Správa dokumentů
HRM/HCM - Řízení lidských zdrojů
EAM/CMMS - Správa majetku a údrby
Účetní a ekonomické systémy
ITSM (ITIL) - Řízení IT
Cloud a virtualizace IT
IT Security
Logistika, řízení skladů, WMS
IT právo
GIS - geografické informační systémy
Projektové řízení
Trendy ICT
E-commerce B2B/B2C
CAD/CAM/CAE/PLM/3D tiskBranové sekce
![]() | |
| Přihlaste se k odběru newsletteru SystemNEWS, který kadý týden přináí výběr článků z oblasti podnikové informatiky | |
![]() | |
Partneři webu
Scrapování pomocí AI botů
přináí nové výzvy pro poskytovatele webů
Uivatelé čím dál více vyhledávají informace pomocí AI, která je pro ně automaticky získává, třídí a vyuívá z veřejně dostupných webových stránek. Toto takzvané scrapování vak na weby vytváří velký nápor, který můe mít i parametry kybernetického útoku. Umělá inteligence zároveň často přebírá obsah bez povolení ze strany webu. Jejich provozovatelé se proto scrapování snaí zakázat, některé AI platformy je přesto obcházejí.

V souvislosti s umělou inteligencí se dnes skloňují zejména výhody, o něco méně jsou zmiňovány potenciální problematické aspekty. Jedním z nich je takzvané scrapování pomocí AI botů, tedy automatické získávání dat z webů, typicky v případě, kdy uivatel vyhledává pomocí AI modelu konkrétní informace v otevřených zdrojích. Pro poskytovatele webů to znamená v řadě případů extrémní zátě. V praxi jsme se u jednoho z naich klientů setkali s tím, e se jeho web musel během několik dní vypořádat se 120 tisíci dotazů od jediného AI bota, řekl Martin Michálek ze společnosti Pagespeed.ONE, která se zaměřuje na měření a optimalizaci rychlosti webů.
AI někdy doluje data z webů tak intenzivně, e její nápor má parametry kybernetického útoku.
Kdy se například uivatel zeptá ChatGPT na něco, co vyaduje procházení internetu, model si obsah z webů stáhne v reálném čase. Běně na jeden dotaz projde třeba deset stránek i více, z toho několik můe být na jednom webu. Na běném sdíleném webhostingu to můe způsobit krátké zpomalení nebo zpodění odpovědí pro ostatní návtěvníky, vysvětlil princip Ivan Sárközi z obchodního oddělení poskytovatele hostingu WEDOS.AI nemá index a stahuje obsah pořád dokola
To je přitom zásadní rozdíl oproti vyhledávačům, které stránku načtou pouze jednou. Pak ji zařadí do indexu a dál pracují s uloenými daty. Jazykové modely jako ChatGPT ádný index nemají, naopak při kadém dotazu stahují obsah znovu a znovu. To můe být problém i u meních webů, doplnil Sárközi.
Některé konkrétní příklady přitom ukazují, e chování AI botů můe často nést podobné znaky jako kybernetický útok. Setkali jsme se s tím, e přístup z infrastruktury AI modelu Claude byl natolik intenzivní, e začal zpomalovat nebo i krátkodobě odstavovat několik webů na sdíleném hostingu. Technicky to odpovídalo menímu DDoS útoku, tak k tomu při řeení přistupovali i technici, řekl Sárközi.

Právní aspekty scrapování
Problémem scrapování bývá to, e k němu často dochází bez jakéhokoliv povolení ze strany provozovatelů webů. Z právního hlediska můe scraping zasahovat do autorských a souvisejících práv, případně do práv k databázím. Zejména v případě
takzvaného dolování z textu a dat. U obecnějích forem scrapingu můe za určitých okolností dojít také k poruení smluvních podmínek, například pokud je přístup ke slubě vázán na souhlas s nimi. Docházet můe i k nekalé soutěi, jako je poruení obchodního tajemství, nebo neoprávněnému zpracování osobních údajů, řekl Jiří Čermák z advokátní kanceláře Jansa, Mokrý, Otevřel & partneři.
takzvaného dolování z textu a dat. U obecnějích forem scrapingu můe za určitých okolností dojít také k poruení smluvních podmínek, například pokud je přístup ke slubě vázán na souhlas s nimi. Docházet můe i k nekalé soutěi, jako je poruení obchodního tajemství, nebo neoprávněnému zpracování osobních údajů, řekl Jiří Čermák z advokátní kanceláře Jansa, Mokrý, Otevřel & partneři.Zákazy nejsou řeením, obranu je třeba postavit chytře
Některé weby a sociální sítě se proto snaí scrapování zakázat, podle odborníků jim vak tento přístup můe paradoxně ukodit, jak u ukázaly
příklady v minulosti. V dávných dobách podobně někteří zakazovali přístup botům od Googlu. A pozdě zjistili, e je konkurence předběhla, protoe Google jim přináel cennou návtěvnost. Podobně je to teď s novou vlnou AI botů na webu. Rozhodně nedoporučuji pauálně přístupy zakazovat a dělat to jen v opodstatněných případech, řekl Martin Michálek.
příklady v minulosti. V dávných dobách podobně někteří zakazovali přístup botům od Googlu. A pozdě zjistili, e je konkurence předběhla, protoe Google jim přináel cennou návtěvnost. Podobně je to teď s novou vlnou AI botů na webu. Rozhodně nedoporučuji pauálně přístupy zakazovat a dělat to jen v opodstatněných případech, řekl Martin Michálek.Navíc je podle něj na zákazy ji pozdě. Vechno, co lo, tak u AI boty scrapováno bylo, případně se tak stane na jiných podobných webech. Nehledě na to, e někteří AI boti například velmi známý AI nástroj Perplexity poměrně vychytrale obcházejí vechny zákazy, řekl Michálek.
Klíčová je tak podle něj ochrana jednotlivých webů, která by měla zahrnovat rozeznání AI botů a jejich případné zablokování či zpomalení. Kromě toho mohou být důleitými prvky také skrytí e-mailových adres či ochrana proti načítání obrázků z jiných stránek. Podobně se na problém dívá i marketingový specialista poskytovatele hostingu FORPSI Roman Pech, podle kterého zákazy samy o sobě problém nevyřeí. Důleitějí je kombinace technických opatření a právních kroků, doplnil.AI Act nastaví hranice
Jedním z právních zásahů by měla být připravovaná evropská legislativa pod označením AI Act. Ta scraping sám o sobě nezakazuje, ale vyaduje transparentnost ohledně dat pouitých pro trénink velkých jazykových modelů a obecných modelů umělé inteligence, která jsou často získávána prostřednictvím vytěování textu a dat, upřesnil advokát Jiří Čermák. Začátek platnosti AI Actu vyhlíí i poskytovatelé hostingu. Dá se očekávat, e scrapování bude legální jen v určitých mezích například pro výzkum nebo s výslovným souhlasem. Pro firmy to znamená potřebu více hlídat, odkud data pocházejí a jak jsou vyuívána, nastínil Roman Pech.
Sám přitom vidí budoucnost v regulovaném, transparentním a férovém scrapování. AI podle něj bude stále více potřebovat kvalitní data a scrapování je jedním ze způsobů, jak je získat. Pokud se podaří nastavit jasná pravidla technická i právní můe scrapování přináet hodnotu bez toho, aby pokozovalo původní autory obsahu, uvedl. Podobný pohled přináí i advokát Jiří Čermák, podle něj zůstane scrapování běnou a rozířenou praxí, by ve více regulované a technicky kontrolované podobě.
Scrapování pomocí AI botů je fenomén, se kterým se musíme smířit
Odborníci zaměřující se na rychlost a výkon webu vnímají scrapování pomocí AI botů jako nový standard. Je to fenomén, se kterým se musíme smířit. Neodejde sám od sebe pryč. AI boti a agenti budou stále schopnějí a kromě pasivní konzumace textu a multimédií budou schopní plnit úkoly jako objednání letenek nebo nákup na eshopu, řekl Martin Michálek.
Zásadní v tomto směru proto bude zejména tlak uivatelů AI nástrojů, kteří budou pokročilé funkce zvyující komfort vyadovat. V takových případech u nebude moné provoz jednodue blokovat, protoe zákazníci tyto interakce budou chtít, uzavřel Sárközi.
IT Systems podporuje
Formulář pro přidání akce











