- Přehledy IS
- APS (20)
- BPM - procesní řízení (22)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (33)
- CRM (51)
- DMS/ECM - správa dokumentů (20)
- EAM (17)
- Ekonomické systémy (68)
- ERP (79)
- HRM (27)
- ITSM (6)
- MES (32)
- Řízení výroby (36)
- WMS (29)
- Dodavatelé IT slueb a řeení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (39)
- Dodavatelé CRM (33)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (71)
- Informační bezpečnost (50)
- IT řeení pro logistiku (45)
- IT řeení pro stavebnictví (26)
- Řeení pro veřejný a státní sektor (27)
ERP systémy
CRM systémy
Plánování a řízení výroby
AI a Business Intelligence
DMS/ECM - Správa dokumentů
HRM/HCM - Řízení lidských zdrojů
EAM/CMMS - Správa majetku a údrby
Účetní a ekonomické systémy
ITSM (ITIL) - Řízení IT
Cloud a virtualizace IT
IT Security
Logistika, řízení skladů, WMS
IT právo
GIS - geografické informační systémy
Projektové řízení
Trendy ICT
E-commerce B2B/B2C
CAD/CAM/CAE/PLM/3D tisk![]() | |
| Přihlaste se k odběru newsletteru SystemNEWS, který kadý týden přináí výběr článků z oblasti podnikové informatiky | |
![]() | |
Pokročilá analýza provozu datových sítí (4. díl)
Sledování výkonu sítě a aplikací
V předchozích dílech naeho seriálu jsme se věnovali monitorování datových toků, paketové analýze a výhodám spojení obou přístupů. Celé téma v tomto článku uzavřeme a ukáeme si, jak je moné odliit výkonnostní problémy na úrovni sítě a na úrovni aplikace. Zaměříme se přitom na sledování parametrů, jako je zpodění sítě, jitter nebo doba odezvy aplikace konkrétnímu uivateli.

Jistě to znáte z praxe. Za vechno můe sí. Pokud si uivatel stěuje na odezvu aplikace, větinou to končí rozepří mezi správcem sítě a aplikací/serverů o příčině problému. Nástroj, který by tento spor rozhodl, chybí. Jako obvykle se pravda ukrývá v paketech, pakety toti nelou.
Na úrovni datové sítě lze sledovat základní parametry jako je RTT (Round Trip Time), tedy cesta paketu od klienta k serveru a zpět, nebo SRT (Server Response Time), tedy zpodění aplikace jako takové. Právě tyto parametry ukazují, zda je problém na úrovni sítě nebo na úrovni aplikace. Jejich měření označujeme zkratkou NPM (Network Performance Monitoring) a opět platí, e jde o funkci, kterou najdeme v moderních řeeních pro monitorování provozu na základě datových toků. Ve se toti odvíjí od časování jednotlivých paketů, jakým způsobem prochází aktivním prvkem nebo monitorovací sondou. Funkci NPM najdeme rovně v moderních přepínačích a směrovačích, aktivní prvky společnosti Cisco například nabízí funkci AVC (Application Visibility and Control). Výhodou je, e můeme kontinuálně sledovat výkonové parametry vekeré datové komunikace bez ohledu na pouitou aplikaci, jediným omezením je protokol TCP, bez kterého se neobejdeme.
Round Trip Time
RTT měříme v komunikaci od klienta k serveru. Při navazování spojení (tzv. TCP handshake) je změřena doba mezi SYN paketem a ACK paketem, kterým klient zahájí komunikaci, resp. potvrdí navázání spojení. Tato doba odpovídá právě cestě paketu od klienta k serveru a zpět. SRT měříme v komunikaci od serveru ke klientovi mezi posledním potvrzením přijetí poadavku (ACK) a prvním datovým paketem odpovědi. Pro dalí pakety měříme prodlevy mezi pakety, které označujeme jako zpodění (delay), ze kterého odvozujeme rozptyl zpodění (jitter). Právě rozptyl zpodění, tedy kolísání zpodění, můe způsobovat problémy ve videokonferencích nebo VoIP hovorech, například na rozdíl od přenáení velkých objemů dat, na které prakticky nemá vliv.
Obr. 1 Princip měření výkonových parametrů datové sítě
Mimo uvedených výkonových parametrů můeme měřit počet retransmisí a tzv. out-of-order paketů. Tyto ukazatele indikují problémy s přenosem dat. Retransmise jsou samo-korekčním mechanismem protokolu TCP při ztrátě nebo pokození dat při přenosu, jejich výskyt indikuje problémy na komunikační lince. Podobně out-of-order pakety znamenají, e k doručení paketů dolo v jiném pořadí, ne v jakém byly odeslány. Taková situace můe nastat, pokud pakety cestují různými trasami nebo v případě problémů na komunikačních linkách. Zejména na základě zvyujícího se počtu retransmisí lze detekovat zhorující se kvalitu komunikační linky a vysvětlit tak klesající rychlosti datových přenosů.
Pojďme se podívat na příklad vyuití RTT. Tato informace je v případě moderních řeení součástí statistik o provozu datové sítě. Jsme tak schopni se kolektoru dotázat na průměrnou hodnotu RTT pro jednotlivé klientské stanice komunikující se serverem informačního systému. Snadno tím odliíme stanice, které se připojují vzdáleně, např. přes VPN (segment 192.168.3.0/24), stanice připojené přes wifi (192.168.0.32) a stanice připojené přes lokální sí ethernet (ostatní stanice). Tento příklad ilustruje obrázek 2.
Obr. 2 Příklad statistiky RTT, klientské stanice jsou seřazeny sestupně podle nejvyí (nejhorí) průměrné hodnoty RTT naměřené při komunikaci se serverem informačního systému.
Monitorování výkonu aplikací
Zatím jsme se pohybovali pouze na třetí a čtvrté síové vrstvě a měřili výkonové parametry bez jakékoliv vazby na konkrétní aplikaci. Pokud chceme sledovat výkon aplikací pohledem jejich uivatelů, tedy sledovat, jak se jednotlivé aplikace opravdu chovají k jejich uivatelům, musíme opět na aplikační vrstvu. Díky tomu je moné sledovat rychlost odezvy aplikace pro vechny uivatele v souladu s logikou obchodních procesů, např. přihláení do internetového bankovnictví, zaloení účtu, vygenerování výpisů atd. V reálném čase tak odhalíme, který uivatel, skupina uivatelů, pobočka, která transakce a za jakých podmínek měli problém.
Tuto oblast označujeme jako APM (Application Performance Monitoring) a tradičně se jedná o doménu velmi nákladných řeení renomovaných výrobců, kteří nabízí sadu monitorovacího software ve formě agentů instalovaných na jednotlivé servery. Přitom odpovědi na otázky ohledně výkonu aplikace se opět ukrývají v provozu datové sítě. Lze tak bez jakéhokoliv zásahu do aplikací (například instalace agentů či rekonfigurace serverů) monitorovat dobu odezvy a dobu přenosu poadavku i odpovědi, co jsou hlavní metriky, které nás zajímají. Tento bez-agentní přístup navíc umoňuje nasadit monitoring aplikace v řádu minut, nebo opět nepotřebujete prakticky nic jiného ne viditelnost do síového provozu. Dodejme, e metoda je pouitelná pro aplikace, které vyuívají standardizované komunikační protokoly, tedy je moné takto monitorovat elektronické bankovnictví, e-shop nebo podnikový systém, který s uivatelem komunikuje prostřednictvím internetového prohlíeče. U proprietárních aplikací s tlustými klienty a uzavřenými binárními protokoly tento přístup bohuel aplikovat nelze.
Princip fungování APM vyaduje záznam provozu dané aplikace v plném rozsahu (vzpomeňme na druhý díl tohoto seriálu o záchytu paketů a paketové analýze), rekonstrukci TCP spojení a vzájemného párování poadavků a odpovědí. Znamená to tedy, e je moné měřit jak tradiční model poadavek-odpověď, tak i asynchronní komunikaci, kdy klient zadá i několik poadavků najednou, ani by čekal vdy na dokončení zpracování poadavku a vrácení odpovědi. Sledované parametry jsou RT (response time), tedy doba zpracování poadavku na straně aplikace a TT (transport time), tedy doba strávená na transportní vrstvě přenosem odpovědi.
Obr. 3 Princip měření výkonových parametrů aplikace
Rozdíl mezi RT a TT nám podobně jako v případě sledování výkonových parametru sítě ukazuje, zda se problém nachází v aplikaci nebo v komunikační infrastruktuře. Pokud si bude uivatel stěovat na pomalé odezvy, jsme schopni na základě normální hodnoty RT a vysoké hodnoty TT ihned jeho stínost posoudit jako neoprávněnou a vysvětlit mu, e z druhého konce světa přes mobilní připojení a VPN to opravdu rychlejí nebude a vy jako správce aplikace s tím nic neuděláte.
Na základě měření doby odezvy lze kontinuálně měřit výkonnost aplikace. Můete si definovat poadovanou kvalitu sluby (tzv. SLA) a sledovat, kolik poadavků tuto úroveň SLA splňuje. Moderní APM systémy umoňují měřit výkon aplikace jediným výsledným indexem, který vzniká právě jako váený průměr počtu uivatelských transakcí splňujících SLA a transakcí, které toto SLA násobně překračují a mění se v čase. Je tak moné notifikovat sníení výkonu aplikace jako celku a následně identifikovat, zda se problém týká konkrétní části aplikace nebo konkrétní skupiny uivatelů, případně zda se projevuje ploně. Ji tato základní diagnostika v řadě případů ukáe správci aplikace nebo jejím vývojářům přesně na místo problému. Nemluvě o tom, e lze tak sledovat a srovnat změny v dobách odezvy aplikace po nasazení nové verze nebo po navýení výpočetních zdrojů.
Obr. 4 Příklad výstupů APM, levý graf ukazuje dobu odezvy v čase (průměrná hodnota, medián, 95-percentil, 99-percentil), pravý graf ukazuje počet uivatelů souběně pracujících s aplikací.
Díky viditelnost do sedmé vrstvy je moné identifikovat uivatele nejen IP adresou, ale např. z parametru v URL nebo z cookie. Stejně tak je moné sledovat URL v plném rozsahu včetně parametrů, typ a verzi internetového prohlíeče klienta (to je vhodné např. při řeení problémů s kompatibilitou) nebo návratové hodnoty poadavků, zejména chybové kódy. Pokud je pouit ifrovaný přenosový protokol HTTPS, je nezbytné provoz před analýzou deifrovat. S tím musí systém APM počítat a umonit vloení ifrovacího klíče pro převod provozu do neifrované podoby. Technicky to ale nepředstavuje ádný problém nebo omezení.
Odpovědi se ukrývají v datovém provozu
V tomto článku jsme se seznámili s problematikou monitorování výkonu na úrovni datové sítě a na úrovni aplikace. Opět platí, e vechny odpovědi na nae otázky se ukrývají v datovém provozu a moderní monitorovací nástroje nám je umí poskytnout. V rámci čtyř dílů naeho seriálu jsme pokryli témata monitorování provozu prostřednictvím datových toků, záchyt provozu v plném rozsahu a analýzu paketů, spojení výhod obou přístupů do monitorovacího systému a nakonec oblast sledování výkonových parametrů. Cílem seriálu bylo seznámit IT manaery, bezpečnostní manaery, správce sítí i aplikací s aktuálními monosti v oblasti monitorování IT infrastruktury a vysvětlit principy jejich fungování tak, aby mohli získané informace vyuít při návrhu strategie monitoringu IT infrastruktury a doplnění chybějících funkcí ve stávajícím konceptu. Nebo prostě jen inspirovat a rozířit obzory.
![]() |
RNDr. Pavel Minařík, PhD. Autor článku se oblastí kybernetické bezpečnosti zabývá od roku 2006. Účastnil se řady výzkumných projektů v oblasti analýzy provozu datových sítí a detekci pokročilých hrozeb jako výzkumný pracovník Ústavu výpočetní techniky Masarykovy univerzity. Během posledních čtyř let se účastnil několika desítek projektů nasazení řeení pro monitorování provozu a detekci pokročilých hrozeb. V současné době pracuje jako technologický ředitel ve společnosti INVEA-TECH zodpovědný za návrh a vývoj produktů pro Flow Monitoring a Network Behavior Analysis. |





















