AI-høydepunkter fra uke 41 2025 🤯
Hold på hatten – uke 41 (6.–12. oktober 2025) var helt vanvittig i AI-verdenen! Mens vi nordmenn nøt høstferien, eksploderte AI-landskapet med lanseringer som vil endre hvordan vi jobber, koder og lager innhold. Her er ukas syv største høydepunkter.
🚀 ChatGPT blir en app-plattform (endelig!)
OpenAI DevDay 6. oktober var ikke bare en utviklerkonferanse – det var et statement. Sam Altman annonserte at ChatGPT nå blir en fullverdig applikasjon-plattform med den nye Apps SDK.
Tenk deg dette: Du kan nå bestille flybilletter via Expedia, designe grafikk i Canva, og finne bolig på Zillow – alt uten å forlate ChatGPT-vinduet. Zillow, Coursera, Spotify og Figma er blant de første partnerne.
Men det stopper ikke der. OpenAI lanserte også AgentKit, et visuelt verktøy for å bygge autonome AI-agenter. Med dra-og-slipp-grensesnitt kan utviklere nå lage agenter som faktisk gjør ting – fra å behandle innkjøpsforespørsler til å sjekke bedriftens retningslinjer. En demo fra Ramp viste hvordan en ansatt kunne si "Jeg trenger fem ChatGPT Business-seter", og agenten håndterte alt fra policy-sjekk til virtuelt kredittkort på minutter.
Nick Turley, leder for ChatGPT, var krystallklar: "Vi hadde aldri tenkt å bygge en chatbot. Vi mente å bygge en super-assistent." Og nå beveger de seg endelig i den retningen.
🛡️ Google CodeMender: AI som fikser bugs før hackerne gjør det
Google DeepMind droppet også en bombe 6. oktober med CodeMender – en AI-agent som automatisk finner og fikser sikkerhetshull i kode. Og den gjør det skikkelig bra.
På bare seks måneder har CodeMender allerede sendt inn 72 sikkerhetsfikser til åpen kildekode-prosjekter, inkludert noen med over 4,5 millioner kodelinjer. Det fungerer både reaktivt (fikser nye sårbarheter øyeblikkelig) og proaktivt (omskriver eksisterende kode for å eliminere hele klasser av sårbarheter).
CodeMender bruker Gemini Deep Think-modeller kombinert med avansert programanalyse – debuggere, statisk analyse, fuzzing og SMT-løsere – for å spore feil til deres opprinnelse. Før en fix sendes til mennesker for gjennomgang, validerer systemet at patchen faktisk løser problemet, er funksjonelt korrekt, ikke forårsaker nye bugs, og følger kodestandarder.
Google er forsiktige med utrullingen: "Alle patcher som genereres av CodeMender gjennomgås av menneskelige forskere før de sendes." Smart trekk når feil i sikkerhetskode kan være ekstremt kostbare.
🖱️ Gemini 2.5 Computer Use: AI som faktisk kan bruke en nettleser
Google slo til igjen 9. oktober med Gemini 2.5 Computer Use – en spesialisert modell som kan navigere nettsider autonomt ved å klikke, skrive og scrolle basert på skjermbilder.
I motsetning til konkurrenter som kan aksessere hele skrivebordet, er Googles tilnærming fokusert spesifikt på nett- og mobilgrensesnitt. Modellen fungerer i en feedback-loop: Den mottar en forespørsel, et skjermbilde og historikk over tidligere handlinger, analyserer det hele, og genererer en konkret UI-aksjon som "klikk på koordinat X,Y" eller "skriv denne teksten".
Google hevder modellen utkonkurrerer andre ledende alternativer på flere benchmarks for nett- og mobilkontroll – med lavere latenstid. Demos viser at den kan spille spillet 2048, fylle ut komplekse skjemaer, og til og med løse Google Search-CAPTCHAs (litt skummelt, det der).
Sikkerheten står sentralt: Modellen har innebygde sikkerhetstiltak som kan kreve menneskelig bekreftelse før høyrisiko-handlinger som betalinger eller tilgang til sensitive data.
🎬 Grok Imagine 0.9: Elon Musks AI-videoverktøy blir gratis (og kontroversielt)
xAI slapp Grok Imagine 0.9 den 5. oktober, og Elon Musk gjorde det klart: Dette er svaret på OpenAIs Sora 2.
Den nye versjonen bringer forbedringer i videokvalitet (fra 16 til 24 FPS), synkronisert lydgenerering, og kanskje viktigst – det er nå gratis for alle brukere. Grok Imagine kan generere 6-sekunders videoer fra bilder eller tekstprompter, og genererer vanligvis innhold på sekunder (sammenlignet med 1-2 minutter for Sora).
Men det er også et etisk minefelt. Den kontroversielle "Spicy Mode" fortsetter å tillate generering av kjendis-deepfakes og eksplisitt innhold uten sterke guardrails. En tester kunne lage videoer av Donald Trump som sa tilfeldige ting, helt uten restriksjoner.
Som en skrev: "Gratis, overbevisende og dypt urovekkende."
🎙️ ElevenLabs Agent Workflows: Design samtaleagenter visuelt
ElevenLabs lanserte Agent Workflows 6. oktober – en visuell editor for å designe komplekse samtaleflyter for stemme-AI-agenter.
I stedet for å bygge all forretningslogikk i én stor agent, lar Workflows deg nå rute til spesialiserte "Subagenter" og overføre til mennesker når det trengs. Hvert Subagent har sin egen systemprompt, verktøy og kunnskapsbase.
Et eksempel: Et kundeservicesystem kan bruke en lett modell til å klassifisere forespørsler, rute faktureringsspørsmål til et fakturaSubagent med tilgangsrettede data, sende tekniske problemer til et supportSubagent som kan kjøre diagnostikk, og eskalere til mennesker når tilliten faller under en terskel.
Systemet lar deg også velge den ideelle LLM for hvert steg – bruk lette modeller for klassifisering og routing, tyngre modeller for kompleks resonnering. Dette reduserer tokenbruk og latenstid samtidig som presisjonen forbedres.
🧠 Samsung's lilleputt slår gigantene: 7 millioner parametere vs. hundrevis av milliarder
Her kommer virkelig det overraskende: En ny forskningsartikkel fra Alexia Jolicoeur-Martineau ved Samsung SAIL Montreal viser at en lillebitte AI-modell med bare 7 millioner parametere kan slå massive LLM-er i kompleks resonnering.
Tiny Recursive Model (TRM) oppnådde 45% nøyaktighet på ARC-AGI-1-benchmarket, og slo dermed Googles Gemini 2.5 Pro (37%), OpenAIs o3-mini-high (34,5%), og DeepSeek-R1 (15,8%). Disse modellene har hundrevis av milliarder parametere.
Hemmeligheten? Rekursiv resonnering. TRM bruker sin egen output til å bestemme neste steg, og skaper en selvforbedrende feedback-loop. Ved å gjenta output gjennom iterativ resonnering kan modellen simulere en mye dypere arkitektur uten den tilhørende minne- eller beregningskostnaden.
På kostnadssiden er forskjellen absurd: TRM koster en brøkdel av en cent per oppgave, mens store LLM-er ofte koster fra 25 cent til over en dollar for samme resultat.
Jolicoeur-Martineau var tydelig: "Ideen om at man må stole på massive fundasjonsmodeller trent for millioner av dollar av store selskaper for å lykkes med vanskelige oppgaver, er en felle."
🇳🇴 Norske AI-nyheter: Narvik på AI-kartet
Selv om det var stille på norsk AI-front i selve uke 41, må vi nevne den spektakulære nyheten fra uke 40: Aker og Nscale etablerer Aker Narvik DC – et massivt datasenter for kunstig intelligens i Narvik.
Prosjektet har sikret en femårig avtale med Microsoft verdt rundt 6 milliarder dollar for leie av AI-kapasitet. Dette gjør Narvik til et sentralt knutepunkt for europeisk AI-infrastruktur, drevet av fornybar norsk energi.
Det er ikke småtteri: Dette plasserer Norge solid på det europeiske AI-kartet, og viser at vi kan kombinere teknologisk ambisjon med bærekraft.
🎯 Konklusjon: En uke som endret spillereglene
Uke 41 2025 beviste at AI-utviklingen ikke bare går fort – den går i flere retninger samtidig:
- Integrasjon: ChatGPT blir en plattform, ikke bare en chatbot
- Autonomi: AI-agenter som faktisk kan gjøre ting, ikke bare snakke om dem
- Sikkerhet: AI som fikser sårbarheter raskere enn mennesker
- Demokratisering: Gratis verktøy som Grok Imagine (selv om etikken halter etter)
- Effektivitet: Bevis på at mindre faktisk kan være mer
De neste månedene blir spennende. Spørsmålet er ikke lenger om AI vil endre hverdagen vår – men hvor raskt du rekker å tilpasse deg.