Anthropic slår tilbake med sin mest kapable modell
Anthropic lanserte i dag Claude Opus 4.7 - og forbedringene er ikke små. Visjonstester hopper fra 54,5% til 98,5%, kodingsevneene overgår GPT-5.4, og kontekstvinduet er på hele 1 million token.
Dette er hva norske bedrifter trenger å vite.
Tallene som teller
Visjon: 98,5% vs 54,5%
Kanskje den mest sjokkerende forbedringen. På en visuell presisjonstest hoppet Claude Opus 4.7 fra 54,5% til 98,5% - nesten perfekt. Modellen kan nå behandle bilder opp til 2576 pixels på den lengste siden, mer enn tre ganger høyere enn før.
Ifølge XBOW, som bruker modellen for autonom penetrasjonstesting: "Our single biggest Opus pain point effectively disappeared, and that unlocks its use for a whole class of work where we couldn't use it before."
Koding: +13% vs 4.6, leder over GPT-5.4
På SWE-bench - en test der modeller må fikse ekte GitHub-issues - rangerer Claude Opus 4.7 nå over GPT-5.4. På Hex sin 93-task coding benchmark forbedret Opus 4.7 oppløsningen med 13% vs 4.6, inkludert fire oppgaver verken 4.6 eller Sonnet 4.6 kunne løse.
CodeRabbit rapporterer: "Recall improved by over 10%, surfacing some of the most difficult-to-detect bugs in our most complex PRs. It's a bit faster than GPT-5.4 xhigh på vår test."
Warp logget: "It passed Terminal Bench tasks that prior Claude models had failed, and worked through a tricky concurrency bug Opus 4.6 couldn't crack."
Agentisk arbeid: Færre verktøykall, bedre resultater
Claude Opus 4.7 bruker færre verktøykall som standard, og resonerer mer før den handler. Notion rapporterer: "plus 14% over Opus 4.6 at fewer tokens and a third of the tool errors. It's the first model to pass our implicit-need tests, and it keeps executing through tool failures that used to stop Opus cold."
Genspark konkluderer: "Opus 4.7 achieves the highest quality-per-tool-call ratio we've measured."
Det virkelige kvantehavet: autonomous Rust engine
Anthropic selv deler et imponerende eksempel: Claude Opus 4.7 bygde autonomt en komplett Rust text-to-speech engine fra bunnen av - neural model, SIMD kernels, browser demo - og verifiserte deretter sitt eget arbeid ved å kjøre output through a speech recognizer for å sjekke at det matchet Python-referansen.
Som CodeRabbit beskriver det: "Months of senior engineering, delivered autonomously."
Hva betyr dette for norske bedrifter?
Claude Opus 4.7 er ikke bare en teknisk oppdatering - det er en modell som kan jobbe som en selvstendig medarbeider på komplekse oppgaver.
Konkrete bruksområder for norske bedrifter:
- Kodegjennomgang: Gi Claude en hel kodebase (1M token) og be den finne feil, foreslå forbedringer, eller dokumentere funksjonalitet.
- Dokumentanalyse: Sammenlign kontrakter, rapporter eller regulatoriske dokumenter med 98,5% visuell forståelse.
- Automatisering av kunnskapsarbeid: La AI-en håndtere oppgaver som krever langvarig fokus og kontekstforståelse.
- Agentiske arbeidsflyter: Med adaptive tenking og færre verktøykall, kan norske bedrifter bygge mer pålitelige AI-agenter.
Tilgjengelig nå
Claude Opus 4.7 er allerede tilgjengelig via Anthropics API, Amazon Bedrock, Google Vertex AI og Microsoft Foundry.
Pris: $5 per million input tokens, $25 per million output tokens - samme pris som 4.6.
Snakk med AIKI om hvordan Claude Opus 4.7 kan integreres i din bedrift.



