Er Gemma gratis for kommersiell bruk?

Ja. Apache 2.0-lisensen gir deg ubegrenset rett til å bruke, modifisere og distribuere Gemma kommersielt uten å betale lisensavgifter eller dele proprietær kode.

Hvor mye koster det å kjøre Gemma 4 lokalt?

For en 4B-modell: ca. 500-1500 kr/måned på en vanlig server. For 27B: 3000-8000 kr/måned. Sammenlignet med API-kall til GPT-4 blir dette lønnsomt ved mer enn ~10 000 spørringer i måneden.

Trenger jeg GPU for å kjøre Gemma?

4B-versjonen kjører fint på CPU. 9B og 27B krever GPU for god ytelse. Med quantisering (4-bit) kan 27B kjøre på en enkelt A100 eller RTX 4090.

Hvordan sikrer jeg at Gemma-overføringen er GDPR-kompliant?

1) Kjør modellen på infrastruktur i EU (f.eks. OVHcloud, Hetzner Helsinki, eller eget datasenter). 2) Dokumenter databehandlingen i DPIA. 3) Ikke send personopplysninger til Googles sky. 4) Bruk modellen bak brannmur.

Hva er forskjellen på Gemma 3 og Gemma 4?

Gemma 4 (april 2026) har bedre norsk-støtte, lavere latens, og større kontekstvindu (1M tokens vs 128K). For norske bedrifter er 4-versjonen å foretrekke.

Gemma: AI-kontroll uten leverandørafhengighet

AIKIAI Consultancy

|21. mai 2026|3 min lesing

Kort fortalt

Gemma 4 (april 2026) er Googles nyeste åpne LLM med 400M+ nedlastinger
Apache 2.0-lisens gir full kommersiell frihet uten bruksbegrensninger
Lokal drift = GDPR-kompliant, ingen data til USA eller Kina

Gemma: AI-kontroll uten leverandørafhengighet

For norske bedrifter som vurderer AI, står valget ofte mellom to ulike veier: cloud-baserte API-er fra OpenAI eller Anthropic, eller åpne modeller som kan kjøres lokalt. Googles Gemma-familie, med Gemma 4 lansert i april 2026, representerer det mest modne alternativet for den andre veien.

Hva er Gemma?

Gemma er en familie av åpne språkmodeller fra Google, lansert i februar 2024 og nå i fjerde generasjon. Modellene er tilgjengelige i flere størrelser:

Gemma 4 4B (~4 milliarder parametere): Rask, rimelig, god til enkle oppgaver
Gemma 4 9B (~9 milliarder parametere): Balanse mellom ytelse og ressursbruk
Gemma 4 27B (~27 milliarder parametere): Sterk ytelse for krevende oppgaver
Gemma 4 1M (~1 milliard parametere, 1M kontekst): Spesiell modell for ekstremt lang kontekst

Per mai 2026 har Gemma-familien over 400 millioner nedlastinger, ifølge Google.

Hvorfor åpne modeller for norske bedrifter?

Når du bruker en cloud-basert API, sendes data til leverandørens servere. For norske bedrifter som behandler personopplysninger eller sensitiv forretningsinformasjon, skaper dette juridiske og praktiske utfordringer:

Schrems II-avgjørelsen fra EU-domstolen i 2020 begrenser overføring av personopplysninger til USA
GDPR artikkel 44 krever at data som forlater EØS har «tilstrekkelig beskyttelsesnivå»
Databehandleravtaler med amerikanske selskaper blir stadig mer komplekse

Med Gemma kjørt lokalt eller på EU-basert infrastruktur, forblir alle data i din kontroll.

2. Forutsigbare kostnader

Cloud-API-er fakturerer per token. For en bedrift med 50 ansatte som bruker AI daglig, kan kostnadene raskt bli uforutsigbare:

Bruksmønster	Cloud-API (est.)	Lokal Gemma 27B (est.)
10 000 spørringer/mnd	2 000-4 000 kr	3 000-8 000 kr (fast)
100 000 spørringer/mnd	20 000-40 000 kr	3 000-8 000 kr (fast)
1 000 000 spørringer/mnd	200 000-400 000 kr	3 000-8 000 kr (fast)

Estimater basert på GPT-4-turbo-priser vs. Hetzner/Helsinki GPU-server. Egen drift krever kompetanse.

3. Ingen leverandørlås

Med en åpen modell eier du vektene. Du kan:

Finjustere modellen på egne data
Kjøre den på hvilken som helst maskinvare
Bytte leverandør for hosting uten å endre kode
Videreutvikle modellen internt

Apache 2.0: Hva betyr det i praksis?

Gemma er lisensiert under Apache 2.0, en av de mest permissive open source-lisensene. For norske bedrifter betyr dette:

Kommersiell bruk tillatt: Du kan bruke Gemma i produkter du selger
Ingen copyleft: Du trenger ikke åpne din egen kildekode
Patentbeskyttelse: Google gir patentlisens til brukere
Viderelisensiering: Du kan bygge videre på Gemma og selge resultatet

Sammenlignet med Meta Llama (som har spesielle lisensvilkår for bedrifter med >700M brukere) eller Mistral (som har begrenset kommersiell lisens for noen modeller), gir Apache 2.0 maksimal fleksibilitet.

Tekniske krav for lokal drift

Maskinvare

Modell	Minne	GPU (anbefalt)	CPU-fallback
Gemma 4 4B	8 GB RAM	Ikke nødvendig	Ja, treg
Gemma 4 9B	16 GB RAM	RTX 3060 / T4	Ja, svært treg
Gemma 4 27B	48 GB RAM	A100 40GB / RTX 4090	Nei
Gemma 4 1M	32 GB RAM	A100 80GB	Nei

Programvare

For å kjøre Gemma lokalt trenger du:

llama.cpp eller Ollama for enkel kjøring
Hugging Face Transformers for Python-integrasjon
vLLM eller TGI for produksjons-servering

Rask start med Ollama

# Installer Ollama
curl -fsSL https://ollama.com/install.sh | sh
 
# Last ned Gemma 4 4B
ollama pull gemma4:4b
 
# Kjør interaktivt
ollama run gemma4:4b

Hvordan kommer du i gang?

Steg 1: Definer bruksområdet

Ikke alle oppgaver krever en 27B-modell. Start med å kartlegge:

Hva slags tekst skal modellen generere? (E-post, rapporter, kode, kundeservice?)
Hvor viktig er latens? (Skal brukeren vente 1 sekund eller 10?)
Hvor viktig er nøyaktighet? (Kreativ tekst vs. medisinsk informasjon)

Steg 2: Velg modellstørrelse

For de fleste norske SMB-er er 4B eller 9B et godt utgangspunkt:

4B: Chatbot, enkel tekstgenerering, interne verktøy
9B: Kundeservice, mer krevende tekstanalyse
27B: Kodegenerering, kompleks analyse, finjustering

Steg 3: Sett opp infrastruktur

Alternativ A: Egen server

Hetzner Helsinki: ~500-1500 kr/mnd for GPU-server
OVHcloud Gravelines: ~800-2000 kr/mnd
Eget datasenter: Høy initialkostnad, lave driftskostnader

Alternativ B: Sky med EU-datasenter

Google Cloud europe-west3 (Frankfurt)
Azure West Europe (Amsterdam)
AWS eu-north-1 (Stockholm)

Steg 4: Test og finjuster

Last ned modellen, test den på representative oppgaver, og finjuster om nødvendig:

from transformers import AutoModelForCausalLM, AutoTokenizer
 
model = AutoModelForCausalLM.from_pretrained("google/gemma-4-4b-it")
tokenizer = AutoTokenizer.from_pretrained("google/gemma-4-4b-it")
 
# Test på norsk
prompt = "Skriv en kort e-post til en kunde som ber om tilbakemelding."
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=200)
print(tokenizer.decode(outputs[0]))

Vanlige fallgruver

1. Undervurdering av infrastruktur En 27B-modell krever betydelig mer ressurser enn en 4B-modell. Mange bedrifter starter for stort og sliter med ytelse.

2. Manglende finjustering Gemma er trent på generelle data. For spesialiserte oppgaver (f.eks. norsk juridisk tekst) kreves finjustering på egne datasett.

3. Sikkerhetsglipper Selv lokale modeller kan lekke data hvis de er tilgjengelige fra internett uten autentisering. Bruk VPN/brannmur.

4. Undervurdering av drift Lokal drift krever kompetanse på modell-servering, oppdateringer, og overvåkning. Dette er ikke «sett opp og glemt».

Oppsummering

Gemma representerer et modent, åpent alternativ for norske bedrifter som vil ha AI-kontroll. Med Apache 2.0-lisens, lokal drift, og forutsigbare kostnader, adresserer den de viktigste bekymringene rundt cloud-baserte AI-tjenester.

For de fleste SMB-er er 4B- eller 9B-modellen et godt utgangspunkt. Start med en tydelig bruks-case, test på representative data, og skaler oppgradert etter behov.

Neste steg: Vil du vite om AIKI kan hjelpe deg med å sette opp Gemma for din bedrift? Book en uforpliktende samtale.

Kilder:

Gemma 3-announcement (Google, februar 2025)
Gemma 4-announcement (Google, april 2026)
Gemma-modeller på Hugging Face (Google)
Apache 2.0-lisens (Apache Software Foundation)
GDPR artikkel 44 (EU)

Del:LinkedIn X Facebook

Relaterte innlegg

Norsk veiledning for ChatGPT med priser, sikkerhet og bruksområder

AI & Automatisering

ChatGPT Norsk 2026: Komplett veiledning for norske bedrifter

ChatGPT er det mest brukte KI-verktøyet blant norske virksomheter. Men mange bruker det uten å forstå forskjellene mellom abonnementene, sikkerhetsimplikasjonene eller hvordan de faktisk får mest muli

1. apr. 20263 min lesing

OpenClaw-agent koblet til Microsoft 365 og Teams for norske bedrifter

AI & Automatisering

OpenClaw i Microsoft 365: hva bør bedrifter vite?

OpenClaw Microsoft 365 er et tema norske bedrifter bør følge. Signalene peker mot at Microsoft beveger seg mot personlige AI-agenter i Microsoft 365 og Teams, samtidig som OpenClaw beskriver Teams som

2. juni 20265 min lesing

AI & Automatisering

GPT-5.5: Agentene er her - hva betyr det for norske SMB-er?

Nylig kunngjorde OpenAI GPT-5.5 som en ny klasse av intelligent programvare for arbeidshverdagen. Men hva betyr det egentlig for deg som driver en norsk mellomstor bedrift? AI-agenter: mer enn en chat

24. apr. 20262 min lesing

AI & Automatisering · 1. apr. 2026ChatGPT Norsk 2026: Komplett veiledning for norske bedrifter AI & Automatisering · 2. juni 2026OpenClaw i Microsoft 365: hva bør bedrifter vite?AI & Automatisering · 24. apr. 2026GPT-5.5: Agentene er her - hva betyr det for norske SMB-er?

Gemma: AI-kontroll uten leverandørafhengighet

Kort fortalt

Gemma: AI-kontroll uten leverandørafhengighet

Hva er Gemma?

Hvorfor åpne modeller for norske bedrifter?

1. GDPR og datasuverenitet

2. Forutsigbare kostnader

3. Ingen leverandørlås

Apache 2.0: Hva betyr det i praksis?

Tekniske krav for lokal drift

Maskinvare

Programvare

Rask start med Ollama

Hvordan kommer du i gang?

Steg 1: Definer bruksområdet

Steg 2: Velg modellstørrelse

Steg 3: Sett opp infrastruktur

Steg 4: Test og finjuster

Vanlige fallgruver

Oppsummering

Relaterte innlegg

ChatGPT Norsk 2026: Komplett veiledning for norske bedrifter

OpenClaw i Microsoft 365: hva bør bedrifter vite?

GPT-5.5: Agentene er her - hva betyr det for norske SMB-er?