Wat betekent Latentie?

Definitie

Latentie is de tijd die verstrijkt tussen het versturen van een verzoek en het binnenkomen van het eerste antwoord. Het wordt gemeten in milliseconden (ms). Vanaf een computer in Nederland naar een server in Amsterdam zit de latentie typisch onder 5 ms, naar een server in New York rond 80 ms, naar Sydney boven 300 ms.

Het verschil met bandbreedte: bandbreedte is hoeveel data per seconde door de leiding kan, latentie is hoe lang het duurt voordat het eerste bitje aankomt. Een dikke leiding met hoge latentie voelt traag aan ondanks de capaciteit. Voor veel zakelijke toepassingen is latentie belangrijker dan bandbreedte.

Waarom het ertoe doet voor MKB

Latentie bepaalt hoe “snappy” een applicatie aanvoelt. Bij webapplicaties die 100 keer per pagina-laden met een server praten (en dat is bij moderne single-page applications normaal), levert 50 ms extra latentie 5 seconden vertraging op. Voor video-vergaderen, telefonie over internet en kassasystemen is hoge latentie direct merkbaar als haperingen of vertraging.

Voor MKB-bedrijven die met internationale klanten werken of die productiemachines op afstand besturen, is latentie een ontwerpparameter geworden. Cloud-keuzes (welke regio), CDN-gebruik en zelfs softwarearchitectuur (minder calls, batch-verwerking) hangen ervan af.

Concreet voorbeeld

Een Nederlandse softwareleverancier draaide zijn SaaS-platform in een AWS-regio in de Verenigde Staten. Voor klanten in Nederland leverde dat een latentie van rond 95 ms op. Functioneel werkte alles, maar gebruikers klaagden dat het platform “traag” voelde. Performance-metingen lieten zien dat de pagina’s per laadbeurt 30 tot 50 keer met de server praatten.

Na verhuizing van de productie-omgeving naar de AWS-regio Frankfurt zakte de latentie naar 15 ms. Eindgebruikers ervoeren een drastische verbetering, zonder dat er een regel applicatiecode is veranderd. Kosten van de migratie: €3.500 eenmalig, vergelijkbare maandkosten. Klanttevredenheid steeg meetbaar en het aantal supportvragen over snelheid halveerde.

Misverstanden en valkuilen

“Snel internet betekent lage latentie.” Niet noodzakelijk. Glasvezel kan 1 Gbps leveren met 50 ms latentie naar een verre server. Voor sommige toepassingen voelt dat trager dan een 50 Mbps verbinding met 5 ms latentie.
“Latentie is alleen een issue voor gamers.” Ook voor zakelijk gebruik: video-vergaderen, telefonie, kassa-systemen, machine-besturing en real-time samenwerking lijden direct onder hoge latentie.
“Door dichtbij te hosten is latentie opgelost.” Helpt, maar de architectuur van de applicatie speelt een minstens zo grote rol. Een applicatie die 200 calls per pagina maakt blijft traag, ongeacht de afstand.
“Wij merken niks van latentie.” Vaak wel, maar gebruikers benoemen het als “die applicatie is traag” zonder de oorzaak te kennen. Het is een blinde vlek bij veel performance-discussies.

Wanneer moet je hiervan wakker liggen, wanneer niet

Wakker liggen: als jouw bedrijf een eigen webapplicatie levert aan klanten op meerdere continenten, of als operationele systemen (kassa, productie, voorraad) over internet praten met centrale servers. Onverwachte latentie-issues leiden dan tot directe klacht en omzetverlies.

Niet wakker liggen: als jouw bedrijf voornamelijk Nederlandse klanten heeft met SaaS-leveranciers die in Europa draaien. Latentie is dan zelden de bottleneck.

Gerelateerde termen

Bandbreedte: de andere helft van het netwerk-prestatieverhaal.
CDN: brengt content dichter bij de gebruiker, direct latentie-reducerend.
Edge computing: verwerkt data dichtbij de bron juist om latentie te minimaliseren.
Cloud computing: regio-keuze in de cloud bepaalt latentie naar eindgebruikers.
API: API-design beinvloedt hoeveel calls (en dus hoeveel latentie) een applicatie kent.
SLA: serieuze SLA’s specificeren naast uptime ook maximale latentie.

Latentie