Googles motangrep starter? AGI-nivå resonnering mulig lokalt, full oversikt over Gemma 4
Øyeblikket vi har ventet på er endelig her. Forrige uke rullet Big Tech stille (men kraftfullt) ut den nye generasjonen åpen kildekode AI-modeller – Gemma 4-familien. I miljøet har den allerede fått kallenavnet ‘Gemma4you’, og denne lanseringen er langt mer enn en enkel oppdatering. Det er startskuddet for «en tid der modellene kjører direkte på din egen datamaskin eller mobil».
Reaksjonene har vært så hete at utviklere allerede spøker med ‘Gemma4664’ (en intern meme-kode for 2B-, 9B- og 27B-versjonene). Etter å ha gravd dypt i interne tekniske dokumenter og økosystemtrender i flere dager, ser jeg tre tydelige punkter som skiller denne Gemma 4 fra alt før den.
1. Ekte ‘On-Device’ – AGI-nivå som kjører på mobilen
Den største overraskelsen er nok ytelsen til Gemma4847122Sm (den lettvektede 27B-versjonen, kjent under intern kodenavn). Normalt tenker man at når parameterne passerer 20 milliarder, så er modellen «kun for skyen». Men her har de presset 4-bits kvantiseringsteknologi til det ekstreme, slik at den kjører sømløst ikke bare på nyeste enheter som Galaxy S26, men også på middels kraftige Android-plattformer hvis miljøet er optimalisert. Appene dine kan håndtere kompleks, flertrinns resonnering direkte på mobilen, uten nettverkstilkobling. Det er derfor hashtaggen ‘Gemma4Heaven’ har dukket opp.
2. Verktøy som temmer ‘hallusinasjoner’ – Gemma 4s skjulte våpen
Den største utfordringen med åpen kildekode-modeller har vært at de «pakker inn løgner pent». Nå meldes det at hele Gemma 4-serien har et «faktasjekklag» innebygd som standard. Spesielt 9-milliarders versjonen Gemma4658 oppnår hele 87,2 % nøyaktighet på valideringsdatasett og har omtrent halvert hallusinasjonsraten sammenlignet med tilsvarende modeller.
- Resonneringsagenter: En ‘agentic workflow’ som leser søkeresultater, kjører kode og sammenstiller data – nå fullt ut på mobilen.
- Utviklervennlighet: Kjørbart direkte med Keras, JAX og også PyTorch. Én linje med «import gemma4» er alt som trengs.
- Android Studio-integrasjon: Takket være det nye ‘Android Nano 4’ SDK-et er kompatibiliteten med Android bedre enn noen annen åpen kildekode-modell.
3. Utviklerøkosystemet – nå begynner virkelig ‘Gemma4you’-tiden
Ærlig talt hadde jeg tidligere fordommen om at «en bestemt vendors åpen kildekode bare fungerer skikkelig i deres egen sky». Men Gemma 4-familien er virkelig annerledes. Jeg startet Docker lokalt, lastet ned modellen fra fellesskapet på to minutter, og kjørte den. Selv med bare 9B parametere løste den romlige resonneringsoppgaver som ‘å skrelle en banan’ – noe som tidligere krevde en kjempemodell på 405B. Dette er en av de få modellene jeg har sett som gir «følelsen av at hunden din plutselig snakker et fremmed språk hjemme».
Konklusjonen er at de virkelig har levert varene denne gangen. AI er ikke lenger forbeholdt dyre GPU-klynger. Gemma 4 kommer til å endre Edge AI-landskapet fullstendig det neste året. Hvis du er utvikler, gå til de offisielle kanalene akkurat nå og hent «Gemma4658»-sjekkpunktet. Dagen da appene dine ikke lenger trenger å stole på skyen – den dagen er i dag.