Third-Party Model Governance¶
Doel
Governance-raamwerk voor het beheren van externe AI-modelleveranciers — inclusief leveranciersbeoordeling, versiepinning, afhandeling van deprecatie en fallback-architectuur.
De meeste Blauwdruk-projecten zijn deployers: ze gebruiken externe modellen via API in plaats van zelf te trainen. Dit brengt andere risico's mee dan modeligenaarschap — afhankelijkheidsrisico's, deprecatierisico's, leveranciersgebondenheid en aansprakelijkheidsketenproblemen.
1. Leveranciersbeoordelingschecklist¶
Voordat u een externe AI-modelleverancier integreert, beoordeelt u:
Technische Beoordeling¶
| Criterium | Wat controleren | Minimumvereiste |
|---|---|---|
| Versiestabiliteit | Biedt de leverancier pinbare modelversies? | Benoemde versies (gpt-4-0613) niet alleen gpt-4 |
| Deprecatiemelding | Minimale vooropzegtermijn vóór versie-einde | ≥ 6 maanden (12 maanden bij Hoog Risico) |
| SLA uptime | Contractuele beschikbaarheidsgarantie | ≥ 99,5% voor productie |
| Latentiegaranties | p99-responstijd onder belasting | Documenteer basislijn; verifieer in loadtest |
| Gegevensverwerkinginlocatie | Waar worden gegevens verwerkt? | Moet voldoen aan AVG-gegevenslocatie bij EU-data |
| Auditlogboeken | Heeft u toegang tot per-verzoeklogboeken? | Verplicht bij Hoog Risico (Art. 12 EU AI Act) |
| Fine-tuning eigenaarschap | Wie is eigenaar van gefinetuned modelgewichten? | Uw organisatie moet eigenaarschap behouden |
Compliance-Beoordeling¶
| Criterium | Wat controleren |
|---|---|
| GPAI-classificatie | Is het leveranciersmodel GPAI met systemisch risico? (>10²⁵ FLOP) — zie EU AI Act §4 |
| GPAI Code of Practice | Heeft de leverancier de Code of Practice ondertekend? (conformiteitsvermoeden) |
| Gegevensbewaarbeleid | Bewaart de leverancier prompts/uitvoer? Hoe lang? |
| Subverwerkers | Zijn externe subverwerkers bekendgemaakt? (AVG Art. 28) |
| Incidentmelding | Informeert de leverancier u over modelincidenten? Onder welke SLA? |
| Aansprakelijkheidsclausule | Aanvaardt de leverancier aansprakelijkheid voor modelgebreken? Tot welk bedrag? |
2. Contractvereisten voor AI-Leveranciers¶
Minimale Contractclausules¶
Neem deze clausules op in elk AI-leverancierscontract (pas aan naar lokaal recht):
1. Modelversionering: Leverancier biedt pinbare versie-eindpunten.
Afgeschreven versies blijven beschikbaar gedurende [X] maanden na EOL-melding.
2. Deprecatie-SLA: Leverancier geeft ≥ [6/12] maanden schriftelijke opzegging vóór verwijdering eindpunt.
Leverancier handhaaft afgeschreven eindpunt ≥ 90 dagen na EOL-datum.
3. Gegevensverwerking: Prompts en uitvoer worden niet gebruikt voor modeltraining zonder expliciete toestemming.
Gegevens bewaard ≤ [X] dagen; auditlogboek beschikbaar op aanvraag.
4. Incidentrespons: Leverancier meldt klant binnen 24 uur bij modelgedragsincident
dat de uitvoerkwaliteit of -veiligheid wezenlijk beïnvloedt.
5. Audittoegang: Leverancier verleent toegang tot per-verzoeklogboeken gedurende [bewaarperiode].
6. Aansprakelijkheid: Leverancier aanvaardt productaansprakelijkheid voor gebreken in modeluitvoer
tot [bedrag / 12 maanden vergoeding]. AI Act-nalevingsdocumentatie beschikbaar op aanvraag.
Open-source modellen
Open-source modellen gehost door uw organisatie (zelfgehost Llama, Mistral, etc.) verschuiven de "leveranciers"-aansprakelijkheid naar u — u wordt de provider onder de PLD. Pas dezelfde governance toe als Scenario B in AI-Aansprakelijkheid.
3. Versiepinning-Strategie¶
Gebruik nooit zwevende modelaliassen in productie (gpt-4, claude-3, gemini-pro). Zwevende aliassen veranderen stilzwijgend van gedrag wanneer de leverancier het onderliggende model bijwerkt.
Pinningregels¶
| Omgeving | Regel | Voorbeeld |
|---|---|---|
| Ontwikkeling | Zwevende alias toegestaan | claude-sonnet-4 |
| Staging | Pinned versie verplicht | claude-sonnet-4-6 |
| Productie | Pinned versie verplicht | claude-sonnet-4-6 |
Versiebeheerproces¶
- Actieve versies bijhouden in het Modelregister (zie Model Governance §3)
- Leveranciersreleasenotes monitoren — abonneer op vendor-changelog RSS of e-mail
- Nieuwe versies testen op staging met volledige Golden Set vóór promotie naar productie
- Versiewijziging documenteren als configuratiewijziging (peer review verplicht, zie Model Governance §6)
- Modelkaart bijwerken met nieuwe versie en testresultaten
4. Playbook Modeldeprecatie¶
Wanneer een leverancier een model-einde-levensduur aankondigt:¶
Onmiddellijk (binnen 1 week na melding):
- Deprecatiemelding vastleggen in Modelregister met EOL-datum
- Impact beoordelen: welke productiesystemen gebruiken de afgeschreven versie?
- Migratieticket aanmaken met prioriteit op basis van EOL-nabijheid
Binnen 30 dagen na melding:
- Opvolgend model evalueren: Golden Set-test uitvoeren met kandidaatvervanger
- Uitvoer vergelijken: regressies signaleren in kernmetrics (feitelijkheid, taakvoltooiing, bias)
- Evaluatieresultaten documenteren als addendum bij Validatierapport
Minimaal 30 dagen vóór EOL:
- Stagingmigratie en -validatie afronden
- Harde Grenzen en systeemprompts bijwerken voor gedragswijzigingen
- Guardian-review bij Hoog Risico (gedragswijzigingen kunnen hercertificering vereisen)
- Productieovergang plannen
Productieovergang:
- Standaard deploymentprocedure volgen (Ingebruikname Plan)
- Uitvoerkwaliteit 2 weken na migratie monitoren
- Afgeschreven modelconfiguratie archiveren voor traceerbaarheid
Risico harde deadline
Als een leverancier een model-eindpunt verwijdert zonder voldoende vooropzegtermijn of voordat uw migratie is voltooid, heeft u een fallback nodig. Zie §5.
5. Multi-Vendor Fallback-Architectuur¶
Afhankelijkheid van één leverancier is een operationeel risico. Voor Beperkt Risico en hoger ontwerpt u fallback-mogelijkheden:
Fallback-Niveaus¶
| Niveau | Activering | Fallback-actie |
|---|---|---|
| Primair | Normale werking | Primaire leveranciersmodel (pinned versie) |
| Fallback | Primair API-foutpercentage > 5% over 5 min, of deprecatie | Secundair leveranciersmodel met vooraf gevalideerde prompt |
| Degraded | Beide leveranciers niet beschikbaar | Regelgebaseerde of gecachte respons; menselijke overdracht |
Implementatiechecklist Fallback¶
- Fallback-model geïdentificeerd en gevalideerd tegen Golden Set
- Promptpariteit: primaire prompt aangepast voor fallback-model (verschillende modellen vereisen verschillende prompts)
- Routeringslogica geïmplementeerd met automatische failover (bijv. circuit breaker-patroon)
- Fallback-triggers gemonitord en waarschuwingen geconfigureerd
- Fallback-activering gelogd (voor auditspoor en incidentreview)
- Menselijke melding geactiveerd bij degraded-modus
Leveranciersconcentratierisico¶
Voor Hoog Risico AI-systemen die >10.000 verzoeken/dag verwerken, beoordeelt u concentratierisico:
- Marktaandeel primaire leverancier > 60%? Documenteer concentratierisico in Risico Pre-scan
- Overweeg contracten met ≥ 2 leveranciers om monopoliedruk te vermijden
- Zelfgehost open-source model als degraded-mode fallback elimineert API-afhankelijkheid volledig
6. Leveranciersgovernacer Reviews¶
Kwartaalreview Leveranciers¶
| Item | Controle |
|---|---|
| Versiestatus | Alle pinned productieversies nog ondersteund? |
| Aankomende deprecaties | EOL-meldingen ontvangen? Migratietickets open? |
| Incidenthistorie | Leveranciersincidenten afgelopen kwartaal? Impact beoordeeld? |
| Kostenoptimalisatie | Gebruik binnen budget; kleiner nieuwer model voor dezelfde taak? |
| Compliance | GPAI Code of Practice-status leverancier bijgewerkt? |
| Contractverlenging | Nadert verlenging — SLA-clausules heronderhandelen? |
7. Gerelateerde Modules¶
- Model Governance
- AI-Aansprakelijkheid (PLD)
- AI-Architectuur
- Kostenoptimalisatie
- Leveranciersbeheer Sjablonen