Google lanserar Gemini

Efter mycket hype och spekulationer är vad som förväntas vara Googles utmanare till GPT-4 äntligen här. Eller är den verkligen det? Vi sammanfattar det viktigaste om gårdagens nyhet från Google. 

Första gången vi hörde talas om Gemini var i juni under Googles utvecklarkonferens I/O, men det är först nu vi får stifta bekantskap med den.

Tre modeller

Geminis tre modeller

Gemini visade sig inte bara vara en, utan tre, large languange models som kan appliceras på olika användningsområden beroende på situation.

Gemini Nano är den enklaste modellen, tänkt att kunna köras on-device och offline på Android-enheter.

Gemini Pro är mellanmodellen som inom kort kommer finnas integrerad i flera Google-tjänster och lär se det bredaste användningsområdet, åtminstone initialt.

Slutligen har vi Gemini Ultra som är byggd för mer komplexa användningsområden och med större företagskunder som huvudsaklig målgrupp.

Effektiv och multimodal

Gemini sägs vara Googles mest resurseffektiva språkmodell hittills och är både snabbare och billigare att köra än deras tidigare modeller.

Den är därtill konstruerad att vara multimodal från start vilket betyder att den mer sömlöst kan hantera text, video, bild och ljud.

Besök gärna den här spellistan som Google satt ihop på Youtube med olika exempel på Gemini in action för att få en känsla för modellen.

Hur står sig Gemini mot GPT-4?

Den oundvikliga frågan alla ställer sig är givetvis hur Gemini står sig mot OpenAIs mest avancerade modell, GPT-4.

Enligt Google själva presterar Gemini Ultra bättre än GPT-4 på 30 av 32 områden (även om båda språkmodellernas resultat i jämförelsen är väldigt nära varandra).

En mycket viktig sak att understryka här är att det endast är den mer avancerade Ultramodellen som avses i jämförelsen – inte Pro. Ultra kommer inte lanseras förrän nästa år.

Gemini Pro jämförs bara mot den simplare GPT-3.5-modellen från OpenAI och ska då prestera bättre än den på 6 av 8 jämförelseområden. Gemini Pro kommer bland att finnas tillgänglig i Google Bard från och med nu (dock inte inom EU ännu).

Om vi bortser från gårdagens hype var det Google verkligen lanserade alltså en språkmodell som är bättre än GPT-3.5 – men inte når upp till samma nivåer som GPT-4.

I samband med att Ultra görs tillgänglig för företagskunder någon gång nästa år kommer den också finnas tillgänglig i Bard Advanced (vilket verkar vara typ en motsvarighet till ChatGPT Plus fast för Bard).

Snart i en sökmotor nära dig

Med gårdagens nyhet lägger Google i en till växel för att ta upp kampen med OpenAI som den upplevda ledaren på AI-området.

Ända sedan lanseringen av ChatGPT och rapporteringen om code red hos Google har den allmänna uppfattningen varit att Google, trots sin uttalade ambition att vara AI-first, det gångna året konstant legat några steg bakom Open AI och Microsoft.

Ser vi bortom hypen och den snygga paketeringen från igår är jag lite förvånad att Google bara gör Gemini Pro tillgänglig i samband med lanseringen och fortsatt håller på den verkliga GPT4-utmanaren Ultra ett tag till. Tänk vilket antiklimax om OpenAI skulle hinna lansera GPT-5, eller någon annan ny modell, innan Google lanserar Ultra!

Samtidigt ska det såklart bli spännande att se vad Gemini kommer innebära för de tjänster från Google vi använder idag, såsom Chrome, Google Ads och inte minst Google Search. Samt alla kommande innovationer och tjänster som kommer använda sig av tekniken.

Vilka intressanta användningsområden ser du för Gemini? Kommentera gärna.