Hopp til hovedinnhold
AIKI

Claude Opus 4.7: Anthropic lanserer sin kraftigste modell noensinne

||2 min lesing

Kort fortalt

  • Claude Opus 4.7 kan nå behandle bilder med oppløsning på 2576px - 3x bedre enn før
  • Visjonstest: 98,5% nøyaktighet mot 54,5% for forgjengeren
  • 1 million token kontekstvindu - nok til å lese hele kodebaser
  • Koding: +13% vs 4.6, leder over GPT-5.4

Anthropic slår tilbake med sin mest kapable modell

Anthropic lanserte i dag Claude Opus 4.7 - og forbedringene er ikke små. Visjonstester hopper fra 54,5% til 98,5%, kodingsevneene overgår GPT-5.4, og kontekstvinduet er på hele 1 million token.

Dette er hva norske bedrifter trenger å vite.

Tallene som teller

Visjon: 98,5% vs 54,5%

Kanskje den mest sjokkerende forbedringen. På en visuell presisjonstest hoppet Claude Opus 4.7 fra 54,5% til 98,5% - nesten perfekt. Modellen kan nå behandle bilder opp til 2576 pixels på den lengste siden, mer enn tre ganger høyere enn før.

Ifølge XBOW, som bruker modellen for autonom penetrasjonstesting: "Our single biggest Opus pain point effectively disappeared, and that unlocks its use for a whole class of work where we couldn't use it before."

Koding: +13% vs 4.6, leder over GPT-5.4

På SWE-bench - en test der modeller må fikse ekte GitHub-issues - rangerer Claude Opus 4.7 nå over GPT-5.4. På Hex sin 93-task coding benchmark forbedret Opus 4.7 oppløsningen med 13% vs 4.6, inkludert fire oppgaver verken 4.6 eller Sonnet 4.6 kunne løse.

CodeRabbit rapporterer: "Recall improved by over 10%, surfacing some of the most difficult-to-detect bugs in our most complex PRs. It's a bit faster than GPT-5.4 xhigh på vår test."

Warp logget: "It passed Terminal Bench tasks that prior Claude models had failed, and worked through a tricky concurrency bug Opus 4.6 couldn't crack."

Agentisk arbeid: Færre verktøykall, bedre resultater

Claude Opus 4.7 bruker færre verktøykall som standard, og resonerer mer før den handler. Notion rapporterer: "plus 14% over Opus 4.6 at fewer tokens and a third of the tool errors. It's the first model to pass our implicit-need tests, and it keeps executing through tool failures that used to stop Opus cold."

Genspark konkluderer: "Opus 4.7 achieves the highest quality-per-tool-call ratio we've measured."

Det virkelige kvantehavet: autonomous Rust engine

Anthropic selv deler et imponerende eksempel: Claude Opus 4.7 bygde autonomt en komplett Rust text-to-speech engine fra bunnen av - neural model, SIMD kernels, browser demo - og verifiserte deretter sitt eget arbeid ved å kjøre output through a speech recognizer for å sjekke at det matchet Python-referansen.

Som CodeRabbit beskriver det: "Months of senior engineering, delivered autonomously."

Hva betyr dette for norske bedrifter?

Claude Opus 4.7 er ikke bare en teknisk oppdatering - det er en modell som kan jobbe som en selvstendig medarbeider på komplekse oppgaver.

Konkrete bruksområder for norske bedrifter:

  • Kodegjennomgang: Gi Claude en hel kodebase (1M token) og be den finne feil, foreslå forbedringer, eller dokumentere funksjonalitet.
  • Dokumentanalyse: Sammenlign kontrakter, rapporter eller regulatoriske dokumenter med 98,5% visuell forståelse.
  • Automatisering av kunnskapsarbeid: La AI-en håndtere oppgaver som krever langvarig fokus og kontekstforståelse.
  • Agentiske arbeidsflyter: Med adaptive tenking og færre verktøykall, kan norske bedrifter bygge mer pålitelige AI-agenter.

Tilgjengelig nå

Claude Opus 4.7 er allerede tilgjengelig via Anthropics API, Amazon Bedrock, Google Vertex AI og Microsoft Foundry.

Pris: $5 per million input tokens, $25 per million output tokens - samme pris som 4.6.

Snakk med AIKI om hvordan Claude Opus 4.7 kan integreres i din bedrift.

Del:LinkedInXFacebook