Event stream processing: krachtige technologie, maar niet voor ieder probleem
Event stream processing (ESP), een technologie om near real-time op gebeurtenissen te reageren, is al een tijdje hot. En zoals de Gartner Hype Cycle voorspelt, duurt het dan nooit lang voordat zo’n technologie in het dal van de desillusies belandt. ESP is zo’n lot ook beschoren. Tenzij organisaties zich heel goed realiseren wat de consequenties zijn van deze technologie en wat je moet organiseren om alle onderdelen van de gedistribueerde architectuur goed met elkaar te laten communiceren.
6 februari 2020 | Blog | Door: Virtual Sciences Conclusion
Deel
Allereerst: waar hebben we het over? Met Event Stream Processing (ESP) kun je event driven reageren. Dat betekent dat je reageert op basis van een gebeurtenis: een klant die langs je winkel loopt en die je wilt targetten met een persoonlijk aanbod; een ander voorstel voor een vervangende vlucht doen nog voordat de passagier in de gaten heeft dat zijn vlucht is gecancelled of ernstig vertraagd. Het is niet vreemd dat bedrijven prachtige mogelijkheden zien in deze technologie. Er wordt zelfs in directiekamers over gesproken. De techniek staat voor niets, laten we deze kans pakken.
Wat mij betreft een heel goed idee, maar niet zonder dat je weet waar je het over hebt. Want deze technologie biedt niet alleen veel mogelijkheden, maar is ook complex. Gedistribueerd event driven werken betekent dat je parallel reactief aan de bak gaat. Voor de duidelijkheid: over het algemeen is reactief niet een term die als vooruitstrevend wordt gezien. Maar voor bijvoorbeeld een infrastructuur die je bij een derde afneemt per transactie, is dit prima. In dit geval vergroot het je flexibiliteit enorm, maar het betekent wel dat je de complexiteit die hier aan de achterkant bij hoort moet managen. Als je de consequenties niet volledig doorziet en als je niet begrijpt dat je bijvoorbeeld op een andere manier over data en dataconsistentie moet gaan nadenken, dan kun je er beter niet aan beginnen.
De bedoeling van dit artikel is niet om bedrijven angst aan te jagen, maar om aan development teams en IT-management duidelijk te maken wat de trade offs zijn van ESP en Streaming, zodat zij goed beslagen ten ijs komen als ze het gesprek aangaan met het C-level.
Ander architectuurmodel
Kafka verreweg het meest bekende ESP-platform. Het stelt je in staat om real-time reacties op events te reageren, en dit met hoge beschikbaarheid en schaalbaarheid. In dit artikel gaan we daarom met name uit van Kafka, al zijn de meeste implicaties ook op andere oplossingen van toepassingen.
Oplossingen die gebruik maken van een ESP hanteren over het algemeen een ander architectuurmodel. Namelijk het scheiden van lees- en schrijfacties over streams en databases. De mutaties vinden in dit geval eerst plaats op de stream en pas later op de database. Dat brengt een aantal consequenties met zich mee.
In de eerste plaats zul je moeten accepteren dat de onderliggende databases niet altijd helemaal synchroon zijn. Data die meteen wordt verwerkt in de stream wordt immers pas later een keer opgeslagen in de database. Wanneer dat later precies is, weet je niet. Het concept gaat uit van ‘eventually consistent’ in plaats van real-time consistent. Er is dus nooit één versie van de waarheid. Overigens wordt in dit soort gevallen vaak de stream als primaire waarheid gebruikt. Logisch ook, zeker als je bedenkt dat het streaming platform schaalbaar, robuust en overal beschikbaar is.
Een ander facet waar je rekening mee moet houden, is de webservices architectuur die ten grondslag ligt aan de applicaties die je real-time wilt laten reageren. Als je webwinkel bestaat uit 100 webservices die allemaal hun eigen data gebruiken, wil je er niet 100 databases onder leggen, dat wordt te duur. Je kunt wel de webservices gebruik laten maken van event streams, wat een veel goedkopere oplossing is. Dit betekent echter wel dat je gedistribueerde event streams creëert die uiteindelijk weer bij elkaar moeten komen. Dat is prima mogelijk, het lukt immers ook om de webservices zelf met elkaar te laten communiceren. Er moet wel goed over nagedacht worden.
Bijvoorbeeld over wat te doen bij een actie die 100 keer parallel wordt aangeboden maar slechts één maal tot resultaat mag leiden in het achterliggende landschap. Als een klant uit ongeduld 100 op de submit knop kopen drukt, mag dat maar één transactie tot gevolg hebben. De services moeten op dat gedrag zijn gebouwd. Het zogenaamde ‘Idem potent’-gedrag. Dat wordt niet standaard door het onderliggende event platform geregeld, dat is gewoon onderdeel van de service implementatie. Development werk dus.
Complexiteit managen
Het feit dat parallel event gedreven een uitdaging is, is niet nieuw. Ik vergelijk het graag met het verbouwen van een huis. De aannemer komt om een offerte te maken en schat de klus in op 1000 manuren. Hij kan een timmerman, stukadoor, loodgieter, elektricien en tegelzetter sturen, die allemaal ongeveer 200 uur werk hebben. Dan zou de klus in theorie in vijf weken klaar kunnen zijn, maar de praktijk is dat ze op elkaar moeten wachten. De stukadoor kan immers pas beginnen als alle waterleidingen en elektriciteitskabels zijn weggewerkt. En de tegelzetter kan pas aan het werk als het stucwerk klaar is. De klus zal dus minimaal tien weken duren.
Stel dat de opdrachtgever als harde eis stelt dat het binnen drie weken af moet zijn. Dan kun je meer mensen inhuren, maar dat betekent dat de afstemming – die met vijf werklui al complex was – nog vele malen ingewikkelder wordt. Niet onmogelijk, maar wel lastig. De kans dat er in de afstemming wat fout gaat, met rework en vertraging tot gevolg, is erg groot. Voor één bouwbeleider is het eigenlijk niet meer te overzien, je zult een heel leger bouwbegeleiders nodig hebben: iemand voor de woonkamer, iemand voor de keuken, iemand voor de badkamer en ga maar door. Die moeten onderling ook weer afstemmen. Je wilt immers niet in je net afgetimmerde keuken ineens nog een buis van het toilet in de badkamer naar beneden krijgen. Je voegt dus extra lagen toe die op hun beurt voor extra complexiteit zorgen. Eén ding is zeker: de kosten pakken veel hoger uit dan wanner je akkoord was gegaan met tien weken. En de kans dat je concessies moet doen, neemt significant toe.
Zo is het met webservices ook. Het is niet zo ingewikkeld om een webservice te bouwen die goed samenwerkt met vier andere webservices. Het al een stuk ingewikkelder om 100 webservices te laten samenwerken. En het wordt helemaal complex als die webservices ook nog eens via event streams real-time data van elkaar krijgen die ze real-time moeten verwerken. Net zoals met de bouw van een huis neemt de foutkans navenant toe met de complexiteit.
Kortom, al je monolitische applicaties opknippen in microservices en die combineren met event streams is een mooi concept. Maar let wel op dat je het niet teveel fragmenteert. Anders heb je, bij wijze van spreken, al die werklui tegelijkertijd in je huis rondlopen.
Kosten managen
Microservices combineren met event streams betekent ook dat het concept ‘eventually consistent’ vergaande consequenties heeft. Zoals gezegd wordt de real-time actie niet eerst in een database weggeschreven. Er gebeuren veel acties tegelijkertijd waarbij de services elkaar onderling op de hoogte houden zonder dat er één versie van de waarheid is. Natuurlijk, als je heel goed over de architectuur nadenkt en alle maatregelen neemt die nodig zijn – lees: je huurt tien bouwopzichters in die een heel procedurehandboek volgen om ervoor te zorgen dat ze binnen hun domein en onderling goed afstemmen – kun je dit wel realiseren. Maar dat brengt hoge kosten bij de implementatie van de services met zich mee. En kostenbesparing was juist een van de redenen om met microservices te gaan werken. De vraag is dus hoe hoog de uiteindelijke kostenbesparing gaat zijn als je in je berekeningen ook het managen van de complexiteitskosten meeneemt.
Eventually inconsistent
Een ander aspect is dat we moeten accepteren dat de databases in bepaalde mate ‘eventually inconsistent’ zijn, simpelweg omdat je van tevoren weet dat er bij de afstemming altijd wel iets tussen wal en schip valt. Dat is misschien ook niet zo erg, mits je van te voren maar goede afspraken maakt welke fouten zeker niet gemaakt mogen worden. Dat maakt dus dat je heel goed moet nadenken over: in welke gevallen is het niet zo heel erg dat mijn data niet consistent zijn en in welke gevallen is het een ramp?
Begin klein met Kafka-as-a-Service
Wat kun je doen om de consequenties te leren doorzien? Ervaring opdoen, maar dan klein. En dat kan, want steeds meer partijen bieden Kafka-as-a-Service. Je betaalt dan bijvoorbeeld per transactie. Tevens bieden deze platformen meer functionaliteit dan de standaard Kafka-omgeving. Dit geeft je de mogelijkheid om met ESP te spelen en te onderzoeken: wat kan ik ermee? Hoe zorg ik ervoor dat de data consistent blijven? Wat doe ik in geval van failure? En wat als zo’n failure leidt tot ‘eventually inconsistent’? In welke gevallen kan ik dat tolereren en in welke niet?
Virtual Sciences kan je op deze reis begeleiden. We kunnen je laten zien waar de voordelen liggen, voor welke valkuilen je moet uitkijken en welke trade offs er zijn. We kunnen je wegwijs maken in de techniek, maar vooral ook in de manier waarop je dit organiseert. En we kunnen je vertellen wat je intern minimaal moet regelen om hier een succes van te maken. Dat laatste kan voor veel bedrijven een showstopper zijn, en in dat geval zullen we dat ook helder vertellen. Wat wij te allen tijde willen voorkomen is dat onze klanten een technologie omarmen die zich op de top van de hype cycle bevindt, en vervolgens mee het dal van de desillusies in duikelen.
Wil jij weten of ESP jouw organisatie meerwaarde kan bieden? En wat erbij komt kijken om dat te realiseren? Neem dan contact op met Jos Smits. Wij sturen geen sales consultant op je af die gouden bergen belooft. Wij bekijken samen met jou, vanuit alle beperkingen die er zijn, of het loont om eens met ESP-as-a-Service te experimenteren.
5 februari 2020 is er een interview van Frenk Ochse - voormalig CTO Virtual Sciences gepucliceerd op computable.nl
Share