De agentic loop uitgelegd: de motor achter elke AI-agent

Een chatbot beantwoordt je vraag. Een AI-agent maakt je werk áf — en het verschil zit in één technisch idee: een loop. We leggen de agentic loop volledig uit, van het ReAct-principe tot de valkuilen in de praktijk.

Vraag tien ondernemers wat een AI-agent is, en negen beschrijven een slimmere chatbot. Dat is op dit moment de duurste misvatting in AI.

Want het verschil tussen ChatGPT en een échte AI-agent zit niet in het model, de prijs of de hoeveelheid data. Het zit in één onopvallend stukje techniek: een loop. Een chatbot doet één ding — vraag erin, antwoord eruit. Een agent draait rondjes: hij denkt na, doet iets, kijkt wat er gebeurt, en stuurt zichzelf bij — net zo lang tot de taak klaar is.

Gartner verwacht dat eind 2026 40% van alle zakelijke applicaties een taakspecifieke AI-agent bevat, tegenover minder dan 5% in 2025. Toch kan bijna niemand uitleggen wát die agent fundamenteel anders maakt. Dit artikel doet precies dat: het legt de agentic loop volledig uit — de motor onder de motorkap van elke AI-agent.

Van antwoordmachine naar doe-machine

Een taalmodel zoals het brein achter ChatGPT is in de basis een geavanceerde tekstvoorspeller: het krijgt tekst en voorspelt het meest waarschijnlijke vervolg. Krachtig, maar passief. Het weet niets van de wereld nadat zijn training stopte, en uit zichzelf kan het niets doen.

De agentic loop: een cyclus van denken, handelen en observeren

De doorbraak was om dat model in een loop met gereedschap te zetten. Geef het een doel, laat het bedenken welke stap nodig is, laat het die stap uitvoeren met een tool, en voer het resultaat terug. Anthropic — het bedrijf achter Claude — vat het in zijn invloedrijke gids Building Effective Agents kernachtig samen: agents zijn in essentie taalmodellen die op basis van feedback uit hun omgeving in een loop gereedschap gebruiken.

Dat is het hele idee. Eén losse modelaanroep is een rekenmachine: je krijgt eenmalig een antwoord. Een model in een loop met tools is een medewerker: het werkt door tot de klus geklaard is.

De agentic loop in vier slagen

Onder de motorkap draait elke agent steeds dezelfde cyclus. Noem het de vier slagen van de agentic loop — en zodra je ze ziet, herken je ze overal, van een programmeerassistent tot een klantenservice-agent.

Slag 1 — Doel & context. De agent krijgt een opdracht ("plan een kennismaking met deze klant") plus de context die hij nodig heeft: instructies, beschikbare tools en wat hij al weet.
Slag 2 — Redeneren. Het model denkt hardop na: wat is de eerstvolgende zinvolle stap? Niet het hele plan in één keer, maar de volgende zet. Deze "gedachte" maakt de agent slim.
Slag 3 — Handelen. De agent voert die ene stap uit met een tool: een zoekopdracht, een database-query, een stukje code, een e-mail, of een aanroep naar je CRM.
Slag 4 — Observeren. De tool geeft een resultaat terug — Anthropic noemt dit ground truth, de harde waarheid uit de omgeving. De agent leest dat resultaat en keert terug naar slag 2.

Die terugkoppeling is cruciaal. De loop sluit zich omdat de agent het échte resultaat van zijn actie ziet, niet zijn eigen aanname. Mislukte de zoekopdracht? Dan past hij de volgende aan. Klopte het adres niet? Dan corrigeert hij. Zo blijft de agent rondjes draaien — redeneren, handelen, observeren — tot het doel bereikt is of een stopconditie ingrijpt.

Dit patroon is niet nieuw; het is hoe mensen onder onzekerheid beslissen. Luchtmachtstrateeg John Boyd doopte het de OODA-loop: Observe, Orient, Decide, Act — waarnemen, oriënteren, beslissen, handelen, en dan opnieuw. Een monteur die sleutelt, kijkt, bijstelt en opnieuw kijkt, doet exact hetzelfde. Een AI-agent ook, alleen volledig in tekst.

Een voorbeeld, slag voor slag

Stel: je vraagt een agent om "een kennismaking in te plannen met de klant die gisteren ons contactformulier invulde". De loop ziet er dan zo uit:

Redeneer → "Ik moet eerst weten wie dat was." Handel → query op het CRM. Observeer → de agent krijgt de naam en het e-mailadres terug.
Redeneer → "Nu een vrij moment vinden." Handel → check de agenda. Observeer → donderdag 14:00 blijkt vrij.
Redeneer → "Tijd om iets voor te stellen." Handel → concept-uitnodiging klaarzetten. Observeer → wacht op akkoord van een mens.

Geen van deze stappen stond vooraf vast. De agent ontdekte ze gaandeweg, op basis van wat elke tool teruggaf. Dát is het verschil met een ouderwets script.

Waar de loop vandaan komt: het ReAct-principe

Het ReAct-principe: redeneren en handelen afwisselen in één keten

De agentic loop heeft een duidelijk geboortemoment. In 2022 publiceerden onderzoekers van Princeton en Google een paper met de titel ReAct: Synergizing Reasoning and Acting in Language Models.

Hun inzicht was even simpel als krachtig: laat een model niet eerst álles uitdenken en dan pas handelen, maar wissel redeneren en handelen af. Eerst een gedachte ("ik moet de openingstijden opzoeken"), dan een actie (de zoekopdracht), dan de observatie, dan weer een gedachte.

Dat afwisselen — reason plus act, samengetrokken tot "ReAct" — bleek modellen dramatisch beter te maken in complexe taken. Het veranderde een tekstvoorspeller in een doener. Vrijwel elke AI-agent die je vandaag gebruikt, draait op een variant van dit principe.

Eén ding had de loop nog nodig: betrouwbare handen. Een agent is zo capabel als de tools die hij mag gebruiken. De afgelopen twee jaar zijn die tools volwassen geworden — met als kantelpunt het Model Context Protocol (MCP), een open standaard die AI-agents op een uniforme manier met software en data verbindt. We schreven er een apart artikel over: MCP: de stille revolutie die AI-agents voor het MKB bereikbaar maakt.

De anatomie: vijf bouwstenen van een werkende agent

Een loop op papier is mooi, maar in de praktijk heb je vijf onderdelen nodig om een agent écht te laten werken:

Het model — de hersenen. Doet het redeneren en bepaalt de volgende stap.
Tools — de handen. Zoeken, code uitvoeren, API's, databases, e-mail. Zonder tools kan de agent denken maar niets doen.
Context & geheugen. Wat de agent weet, en wat hij onthoudt tussen de slagen door.
De loop zelf — de orchestratie. De code die de slagen aaneenrijgt en elk resultaat terugvoert.
De stopconditie. Wanneer is het klaar? Doel bereikt, een maximumaantal stappen, of een mens die ingrijpt.

Die laatste — de stopconditie — is de onbezongen held. Zonder duidelijk eindpunt stopt een loop nooit uit zichzelf. En dat is precies waar het mis kan gaan.

Niet elke taak heeft een loop nodig

Hier komt het tegengeluid dat je zelden hoort in de AI-hype: een agent is vaak overkill. Anthropic is er in diezelfde gids expliciet over — begin simpel, en zet pas een agent in bij open vraagstukken waarbij je vooraf niet weet hoeveel stappen nodig zijn.

Voor veel taken is een workflow beter: een vast, voorspelbaar pad dat je in code vastlegt. Een agent bepaalt zélf zijn stappen; een workflow volgt een script dat jij hebt geschreven. Dat verschil bepaalt je kosten, je controle én je risico.

Kenmerk	Workflow (vast pad)	Agent (eigen loop)
Wie bepaalt de stappen	Jij, vooraf in code	Het model, ter plekke
Voorspelbaarheid	Hoog	Lager
Kosten & snelheid	Laag en snel	Hoger en trager
Geschikt voor	Bekende, herhaalbare taken	Open taken zonder vast stappenplan

De grootste fout die bedrijven maken, is een agent loslaten op een taak die net zo goed — en goedkoper, en veiliger — een simpel script had kunnen zijn. Agents ruilen snelheid en kosten in voor flexibiliteit. Gebruik die ruil alleen waar het echt loont.

Als de loop vastloopt: de faalmodi

De kracht van de loop is meteen het grootste risico. Een agent die zichzelf bijstuurt, kan zichzelf ook de vernieling in sturen. Drie faalmodi kom je in de praktijk steeds tegen:

De doom loop. De agent herhaalt steeds dezelfde mislukte aanpak omdat hij de context mist om het anders aan te pakken. Anthropics eigen onderzoek naar programmeer-agents beschrijft precies dit gedrag.
De oneindige loop. Er is geen stopconditie, of een tool geeft telkens dezelfde staat terug die de agent steeds opnieuw "wil aanpassen". Het gevolg: rondjes tot het budget op is.
Context-overstroming. Elke slag groeit de geschiedenis. Zonder opschonen loopt het contextvenster vol en daalt de kwaliteit van de beslissingen — bekend als context rot.

De rode draad: een loop zonder rem is gevaarlijk. Goede agents hebben harde stopcondities, een maximumaantal stappen, en momenten waarop een mens kan ingrijpen voordat er iets onomkeerbaars gebeurt.

De mens in de loop (en agents die agents aansturen)

Mens-in-de-loop: een checkpoint dat de agent pauzeert voor goedkeuring

Daarom bouw je bij belangrijke acties een mens-in-de-loop in: de agent pauzeert en vraagt om akkoord voordat hij een factuur verstuurt, geld uitgeeft of gegevens verwijdert. De loop draait autonoom waar het veilig is, en stopt voor goedkeuring waar het spannend wordt.

Een stap verder gaan multi-agent-systemen: een hoofd-agent (de orchestrator) hakt een grote taak in stukken en zet voor elk stuk een sub-agent aan het werk, elk met zijn eigen loop. Zo pak je klussen aan die te groot zijn voor één enkele loop — denk aan een compleet researchrapport of een heel softwareproject.

Wat dit betekent voor jouw bedrijf

Waarom zou een ondernemer dit moeten snappen? Omdat de loop precies is wat "AI die teksten schrijft" verandert in "AI die werk afmaakt". Een offerte niet alleen opstellen, maar ook in je systeem zetten en versturen. Een lead niet alleen herkennen, maar ook kwalificeren en opvolgen.

Maar — en hier gaat het in de praktijk mis — een agent is zo goed als zijn tools, zijn context en zijn remmen. Hij moet gekoppeld zijn aan jouw systemen, jouw data kennen én jouw grenzen respecteren. Dat is geen kwestie van een slimme prompt; het is maatwerk-engineering.

Niet voor niets verwacht Gartner dat meer dan 40% van de agent-projecten vóór 2027 sneuvelt — door onduidelijke waarde, oplopende kosten en zwakke sturing. De bedrijven die het wél laten werken, beginnen klein: één concrete, meetbare taak, eerst als simpele workflow, en pas een loop eromheen waar die zichzelf terugverdient. Die aanpak beschreven we in waarom 95% van AI-projecten in het MKB faalt en de Value-First-methode.

Begin bij de taak, niet bij de hype

De agentic loop is het belangrijkste idee in moderne AI — en tegelijk het meest misbegrepen. Een chatbot antwoordt; een agent wérkt, omdat hij rondjes draait: redeneren, handelen, observeren, bijsturen, tot het doel bereikt is.

Wil je weten welke taak in jouw bedrijf zich leent voor een agent — en welke beter een simpele automatisering blijft? Bij Datapad bouwen we dit soort AI-agents en automatiseringen op maat, gekoppeld aan je eigen systemen, via Development as a Subscription. Begin met één taak, meet het resultaat en schaal wat werkt.

Meer lezen? Onze introductie tot AI-agents voor het MKB en de analyse waarom 2026 het kantelpunt voor agentic AI is bouwen voort op wat je hier hebt gelezen.

De agentic loop uitgelegd: de motor achter elke AI-agent

Van antwoordmachine naar doe-machine

De agentic loop in vier slagen

Een voorbeeld, slag voor slag

Waar de loop vandaan komt: het ReAct-principe

De anatomie: vijf bouwstenen van een werkende agent

Niet elke taak heeft een loop nodig

Als de loop vastloopt: de faalmodi

De mens in de loop (en agents die agents aansturen)

Wat dit betekent voor jouw bedrijf

Begin bij de taak, niet bij de hype

Gerelateerde artikelen

IBM-onderzoek 2026: AI-winnaars groeien 17% sneller — en doen iets fundamenteel anders

271 Firefox-bugs in één AI-pass: wat dit betekent voor jouw software-leverancier

Deepfake-fraude: hoe één videocall €23,6 miljoen kostte — en waarom 93% van de bedrijven onvoorbereid is

Meer weten over wat Datapad voor u kan doen?