Hoe AI werkt

Multimodale AI en GEO: wat verandert er met beeld en spraak?

Door Tijm de Jong · 5 minuten leestijd · 20 maart 2026

De meeste GEO-discussies gaan over tekst: hoe zorgt u dat AI uw organisatie noemt in tekstuele antwoorden? Maar AI-systemen worden multimodaal. Ze verwerken naast tekst ook beeld, audio en video. Wat betekent die ontwikkeling voor uw zichtbaarheid en aanpak?

Wat multimodale AI inhoudt

Multimodale AI-systemen verwerken meerdere soorten input: tekst, afbeeldingen, audio en video. GPT-4o en Gemini Ultra zijn voorbeelden van modellen die al multimodaal zijn. Een gebruiker kan een foto van een product sturen en vragen: "Wat is dit en wie verkoopt het?" of een audiofragment sturen en vragen: "Van welk bedrijf is dit?"

Die mogelijkheden zijn nu nog relatief beperkt in dagelijks gebruik, maar ze groeien snel.

Wat dit nu al betekent voor GEO

Voor de meeste organisaties heeft multimodale AI op dit moment beperkte directe impact op GEO. De kern van AI-zichtbaarheid blijft tekstueel: AI-antwoorden op oriënterende vragen zijn vrijwel altijd tekstgebaseerd. De aanpak die vandaag werkt — structuur, positionering, kennisbasis, schema.org — blijft de basis.

Maar er zijn al concrete aanpassingen die nu zinvol zijn:

Voeg beschrijvende alt-teksten toe aan alle afbeeldingen op uw website
Maak video-content doorzoekbaar via transcripties en beschrijvingen
Gebruik beschrijvende bestandsnamen voor afbeeldingen en media
Voeg schema.org ImageObject en VideoObject toe aan relevante media

Voice search en GEO

Spraakgestuurde AI-interactie, via Siri, Google Assistant of de spraakfunctie van ChatGPT, stelt andere eisen aan content dan tekstuele zoekopdrachten. Gesproken vragen zijn langer, meer conversationeel en direct gericht op een antwoord. Dat sluit nauw aan bij de GEO-principes die al gelden: vraaggerichte content, volledige antwoorden en een heldere structuur.

Wie nu zijn GEO goed op orde heeft voor tekstuele AI-vragen, is ook goed voorbereid op voice-gebaseerde AI-interactie.

De kern blijft tekst

Multimodale ontwikkelingen zijn relevant om in de gaten te houden, maar ze veranderen de kern van GEO niet. Structuur, positionering en een uitgebreide kennisbasis blijven de basis. Wie die basis nu goed legt, is ook voorbereid op de multimodale toekomst. Meer over de GEO-basis leest u in 5 structuurwijzigingen die uw AI-score direct verhogen. OpenAI publiceert technische documentatie over multimodale mogelijkheden op platform.openai.com/docs.

Wilt u weten hoe zichtbaar uw organisatie is in AI?

Start de gratis AI-scan en ontdek in 60 seconden uw huidige positie.

🔍 Start gratis AI-scan Plan een gesprek

← Hoe AI werkt