Japanese Keyword Hack – Hur du löser det
Publicerad 20 november 2019, senast uppdaterad 2024-01-29
Att jobba med SEO innebär att man ständigt ställs inför nya utmaningar. En utmaning av den tråkigare sorten är när ens sajt blir hackad. Ett av de mer kända hacken i SEO-kretsar kallas Japanese Keyword Hack, ett hack som auto-genererar innehåll på er sajt och promotar allt från fejkade märkeskläder till medicin som tillhör svarta marknaden.
Här kommer en artikel på vad Japanese Keyword Hack är, hur det påverkar din SEO och hur du råder bot på problemet.
Vad är Japanese Keyword Hack?
Japanese Keyword Hack är ett hack där massvis med innehåll skapas på er sajt (som indexeras då massvis med skräp-länkar pekas till er sajt). Oftast används en cloaking-teknik som gör att Google ser innehållet, men du som vanlig användare ser det inte. Hackarna länkar sedan till sin egna sajt eller sin produkt och använder din länkkraft för att dels ranka högt på relevanta sökord kopplat till deras produkter, men även att stärka deras egna sajt med länkar.
Hacket är välkänt inom SEO-världen och förekommer i princip på alla marknader och inom alla segment. Det finns därför mycket information om detta och Google har själva kommit ut med riktlinjer på hur man ska lösa på problemet. Den guiden är jättebra, men när en betydande del av ens affär kommer från SEO, så har man inte råd att vänta i flera veckor tills Google besökt alla hackade sidor (ibland hundratusentals) och av-indexerat dessa.
Med 404-statuskod, som Google rekommenderar att man svarar med på de hackade sidorna, kommer sidorna så småningom avindexeras men det kan dröja lång tid innan det sker. Vår guide är för dig som inte vill vänta ut att de hackade sidorna avindexeras utan istället påskynda processen och ta tillbaka dina positioner snabbt.
Du kan själv se vad Google ser genom att rendera upp sajten som Google i Google Search Console så förstår du problematiken bättre.
Hur det drabbar din sajt rent SEO-mässigt
Din sajt, i och med hacket, har flera hundratusentals sidor av låg kvalité, vilket kan göra att er sajt nedvärderas i Googles ögon. Ni får oftast även massvis med skräp-länkar pekade till er sajt, och länkar ut till oseriösa aktörer som antagligen har hackat flera tusentals sidor som alla pekar till en och samma sajt. Det blir väldigt lätt för Google att se att er sajt inte är någon att rekommendera för deras besökare, och de nedvärderar er på era viktigaste sökord.
Såhär kan det se ut när man råkar ut för hacket:
Bilden är en anonymiserad Sistrix-graf. Sistrix är ett verktyg som kan hjälpa dig se din organiska synlighet ur ett helhetsperspektiv och används i detta fall som en indikation på att synligheten störtdök. Enligt Sistrix tappade sajten 3/4 av sin totala synlighet när den blev hackad.
Hur du löser Japanese Keyword Hack
Har du råkat ut för Japanese Keyword Hack? Då kan det skada er ranking och ni kan förlora de positioner ni jobbat upp er till i flera år. Här är en åtgärdsplan på hur du skall tackla problemet.
1. Hitta och ta bort roten till problemet
Innan vi börjar av-indexera dessa sidor så är det viktigt att vi faktiskt tar tag i problemet. Det är något i er server som gör att någon hacker kan generera nya sidor. Oftast handlar det om infekterade index.php filer som, trots att du tar bort de, skapas på nytt eller .htaccess som fylls med redirect-regler som används. Med brasklapp för att jag personligen inte är någon expert på detta så handlar det ofta om att byta lösenord och ominstallera sajten (använd en backup, för ni har väl en backup på er sajt?). Har ni en webbyrå eller ett bra webbhotell bör ni kontakta dessa och rådfråga hur det kan hjälpa er. Det bör vara i deras intresse också, speciellt för webbhotellet där det kan påverka fler kunder.
Detta är prio 1 och ni måste säkerställa att själva hacket är borta innan ni går vidare till steg 2. Hoppar ni över detta kommer problemet aldrig lösas utan ni kommer fortsätta släcka brand efter brand, då fler hackade sidor kommer auto-genereras hela tiden.
2. Samla ihop alla indexerade URL:er (som är hackade)
Steg två är att kartlägga dem olika URL:erna som är indexerade som är hackade. Är det runt 300 sidor som har blivit hackade kan du använda Google för att lokalisera alla. Ett tips är att försöka hitta en gemensam nämnare på alla indexerade URL:er. Ofta brukar dem ligga under foldern /index.php/, då kan vi använda detta för att snabbt hitta alla hackade URL:er.
Skriv då följande:
Ser du någon annan bättre gemensam nämnare så byter du självfallet ut index.php mot det du hittat i URL:en. Här är vår artikel om avancerade sökfunktioner.
Har ni fler hackade URL:er än 300 (då Google inte visar fler än 300 sökresultat), så behöver ni använda er av Google Search Console.
Klicka på ”Hämta som CSV”.
Rensa ut alla hackade mot era ”vanliga” URL:er i CSV-filen. Även här kommer gemensamma nämnare tillhands där vi kan använda Excel för att sortera ut alla rader som innehåller t.ex. /index.php/. Kanske har ni skickat in alla era vanliga sidor med en sitemap, och med de hackade inte gjort det? Exportera då ut alla som inte har blivit angivna i en sitemap. Nu skall du ha en lista på alla hackade URL:er i en .csv-fil. Detta kommer vara viktigt i de kommande stegen.
3. Sätta statuskod 410 på hackade URL:erna
När ni löser hacket kommer alla nertagna hackade URL:er som standard svara med statuskod 404, alltså att de inte hittas på servern. Genom att sätta dessa till 410 så signalerar vi för Google att vi plockat bort innehållet på sidan och sidan ej bör indexeras. Vad som kan hända vid en 404 är att Google, under en period, håller kvar sidan i sitt index tills att den kontinuerligt svarat med statuskod 404 ett tag – först då plockas URL:en bort från indexet. Med statuskod 410 så säger vi att de inte behöver vänta och kan plocka bort direkt, för sidan har tagits bort medvetet. Detta kommer ge en god effekt, speciellt i samband med nästa åtgärd.
4. Skapa sitemap med URL:erna – och skicka till Google
När vi löst problemet, sidorna svarar med 410 så skall ett av våra mål vara att få Google att spindla av dessa sidor och därmed plocka bort dem ur sitt index. Här rekommenderar vi att man skapar en sitemap med dem hackade URL:erna, lägger upp sitemapen (i XML-format) på servern och skickar in denna till Google. Detta kan tänkas konstigt då vi absolut inte vill indexera dessa sidor, men just i detta fall är vårt mål att få dessa URL:er avspindlade så fort som möjligt så att Google förstår att de bör plockas ner. När vi gjorde detta med kunden vars graf vi visade förut så försvann nästan 30 000 URL:er på en natt.
Att skicka in sitemapen gör man genom Google Search Console under avsnittet ”Webbplatskartor”.
Tips! Kom ihåg att sitemaps har en limit på antal URL:er på 50 000 som vi måste följa, skapa flera sitemaps ifall ni överstiger detta antal URL:er.
5. Skicka in webbadresser för borttagning i Google Search Console
Googles verktyg ”Ta bort webbadresser” är menat för att temporärt ta bort indexerade URL:er. Vi kan använda detta idag för att ta bort alla indexerade URL:er snabbare, och därav se effekt snabbare. Den plockar bort URL:en vi skickar in under 90 dagar, sedan kommer Googlebot försöka besöka sidan igen. Ifall den inte lyckas (att URL:en svarar med statuskod 410, till exempel) så kommer den alltså inte inkludera URL:en i deras index igen.
Detta är ett verktyg som man vanligtvis endast skall använda för att skicka in en URL i taget, men eftersom vi har tusentals, eller hundratusentals sidor som vi vill få bort så behöver vi ett sätt att automatisera detta på. Det finns ett smidigt plugin för Google Chrome vi kan använda oss av för att skicka in en hel lista med URL:er som plugin:et matar in, en efter en. En nackdel med detta är att din dator kommer vara ockuperad under denna period, men då kan du unna dig en promenad så länge.
Hur man använder pluginet
- Ladda ner pluginet från Github
- Skapa en .csv fil av alla indexerade hackade URL:er
- Sätt på Developer mode i Google Chrome
- Zippar upp pluginet och laddar upp på chrome://extensions/ (genom en Google Chrome-webbläsare)
- Gå in på https://www.google.com/webmasters/tools/url-removal
- Nu finns en dropdown-meny här där du kan välja vilken .csv-fil du vill ladda upp
Risken med att automatisera denna process
Jag vill passa på att lyfta risken och påtala hur viktigt det är att detta sker på ett korrekt sätt. Det är viktigt att vi är noggranna under genomgången av URL:er så att vi bara inkluderar de URL:er vi faktiskt vill av-indexera. Som med allt automatiserat så kan det bli fel i processen om man inte gör rätt från början. Efter verktyget har kört igenom alla URL:er så kan vi gå igenom listan vi skickat in och klicka ”Avbryt” på de URL:er som hamnat där av misstag. Det är en temporär av-indexering så en risk som inte är speciellt stor, men som sagt, viktigt att vara vaksam när vi går igenom URL:erna att ta bort.
6. Avvisa/disavow:a länkarna
Min kollega Sara har skrivit en grym artikel om just hur man disavow:ar länkar, så jag kommer inte gå djupare in på detta just nu. Men kom ihåg att gå igenom alla dem länkar ni fått medan ni blivit hackade och ladda upp detta i er disavow-fil. Detta kan påverka er ranking långsiktigt, även fast Google själva påstår att de blivit bättre på att inte ta spam-länkar i beaktning.
7. Återta alla positioner (förhoppningsvis!)
Löser ni dessa punkter kan man hoppas att det ser ut som det gjorde för vår kund, att de inom en vecka hoppade tillbaka och fortsatte sin resa uppåt i sökresultaten. Det finns alltid en risk att ni inte återtar all synlighet, men har ni säkerställt att alla URL:er har blivit av-indexerade har ni gjort vad ni kan för att släcka denna brand.
Kommentera gärna ifall du blivit utsatt för ”Japanese Keyword Hack”. Hur löste du det?
Känner du att detta känns övermäktigt att lösa? Tveka inte på att kontakta oss på Pineberry så kan vi hjälpa dig!
2 kommentarer på "Japanese Keyword Hack – Hur du löser det"
Kommentarsfältet är stängt.
Tack för en bra artikel! Hur vet man om ens webbplats är utsatt för detta hack (om man ännu inte har sett någon drop i organisk trafik)?
Hej Joachim! Tack för din kommentar!
Ett sätt att upptäcka detta är genom att göra en site:-sökning med din domän. Som användare ser man ju inte hacket men eftersom Googlebot blir visad hacket så ser man det lättast i deras index.
I vissa fall rapporterar även Google i Search Console om att ni blivit hackade, men skulle i första tag hålla lite koll genom en site:-sökning. Du googlar då alltså site:dindoman.se och får upp alla indexerade URL:er som din sajt har.
Allt väl!