Så får du AI-botarna att se ditt Javascript-innehåll
Publicerad 8 januari 2025, senast uppdaterad 2025-01-08
Är din sajt beroende av mycket JavaScript för att fungera? Då kan många av de vanligaste botarna som samlar in data till large language models ha problem att förstå ditt innehåll. Som tur är finns en enkel, och bekant, lösning på problemet.
För de sajter som använder mycket JavaScript till att bygga upp sitt centrala innehåll har det i många år varit standard att servera färdigrenderade versioner av sidorna när Googlebot besöker sajten – medan vanliga användare serveras sidor där en större del av innehållet renderas upp direkt i webbläsaren när sidan besöks.
Anledningen till denna workaround är att Google historiskt har haft, och fortfarande till viss del har, svårt att rendera JavaScript korrekt.
Nu visar det sig att det inte bara är Googlebot som har utmaningar med att rendera JavaScript-tunga sajter.
En nyligen publicerad studie från Vercel visar att majoriteten av de crawlers som samlar in webbdata till large language models faktiskt har ännu större problem att hantera JavaScript än Google.
Bara Gemini och Applebot renderar JS
Av de vanligaste botarna som crawlar Internet för att samla in den här typen av data är det enligt analysen i dagsläget bara Gemini (Google) och Applebot (Apple) som renderar JavaScript. Däremot ingen av dessa:
- OAI-SearchBot, ChatGPT-User & GPTBot (OpenAI)
- ClaudeBot (Anthropic)
- Meta-ExternalAgent (Meta)
- Bytespider (ByteDance/TikTok)
- PerplexityBot (Perplexity)
Vissa av dessa botar kan dock hämta och läsa andra filer än html. Så finns ditt innehåll i andra typer av filer är det möjligt att de ser det, fastän själva renderingen inte sker.
Potentiell minskad synlighet för ditt varumärke
Effekten av att dessa botar inte kan läsa allt ditt innehåll är såklart att du ger AI-modellerna mindre träningsdata om ditt varumärke.
Dessutom minskar sannolikheten att de delar av ditt innehåll som renderas med Javascript inte syns i ”AI-sökmotorer” såsom ChatGPT Search och Perplexity.
Allt viktigt innehåll ska renderas i förväg
Som tur är går problemet enkelt att lösa. Och det är samma lösningar som vi redan idag använder för att säkerställa att Google kan ta del av allt innehåll som renderas med JavaScript.
Se till att allt viktigt innehåll (titlar, meta description, rubriker, brödtext, meny, länkar till interna sidor) renderas i förväg – och servera just den versionen av sidan till de botar du vill ska ha den.