Eine Checkliste, um ein bestehendes oder geplantes System gegen die MCP-first-Prinzipien zu prüfen.
Product
- Ist jedes Feature als Capability beschrieben, nicht nur als Screen oder Button?
- Gibt es für jede Capability einen klaren Benutzer-Intent?
- Gibt es für jede Capability sowohl eine menschliche als auch eine agentenfähige Nutzungsform?
- Ist klar definiert, welche Capabilities autonom ausgeführt werden dürfen?
- Ist klar definiert, welche Capabilities eine explizite Bestätigung durch den Benutzer benötigen?
Engineering
- Gibt es einen zentralen Action Layer, den alle Interfaces gemeinsam nutzen?
- Sind alle Actions typisiert mit klar definierten Schemas?
- Gibt es Input- und Output-Schemas für jedes Tool?
- Gibt es klare, maschinenlesbare Fehlercodes pro Tool?
- Gibt es eine zentrale Policy Engine, die alle Interfaces gemeinsam verwenden?
- Gibt es Audit Logs für jede ausgeführte Aktion?
- Gibt es Tests pro Tool, die Inputs, Outputs und Fehlerfälle abdecken?
- Gibt es einen Dry-Run-Modus für riskante Aktionen?
Security
- Sind alle Tools nach Risikostufe klassifiziert (low / medium / high / critical / forbidden)?
- Werden Tools bereits bei der Tool Discovery nach Benutzerrechten, Rolle und Scopes gefiltert, nicht erst beim Aufruf?
- Gibt es Step-up Authentication für besonders sensible Aktionen?
- Gibt es Human Confirmation Gates für kritische Aktionen?
- Gibt es Redaction und Context-Filtering, damit Agents nur den für ihre Aufgabe nötigen Kontext erhalten?
- Gibt es Tenant Isolation, sodass keine mandantenübergreifenden Zugriffe möglich sind?
- Gibt es Rate Limits pro Agent, Client und Tool?
- Gibt es Schutz gegen Prompt-Injection-Angriffe?
- Wird Tool-Metadata serverseitig validiert und nicht blind vom Client übernommen?
- Gibt es Monitoring und Alerting für ungewöhnliche oder anomale Agentenaktionen?
UX
- Kann der Benutzer jederzeit nachvollziehen, welche Aktionen ein Agent ausgeführt hat oder ausführen will?
- Sieht der Benutzer klar und verständlich, was bei einer Bestätigungsanfrage konkret passieren wird?
- Kann der Benutzer eine vorgeschlagene Agentenaktion ablehnen oder abbrechen?
- Gibt es einen Entwurfsmodus, bei dem der Agent vorbereitet und der Mensch abschließend entscheidet?
- Gibt es Undo- oder Rollback-Optionen für reversible Aktionen?
- Werden riskante Aktionen mit klarer Sprache erklärt, Empfänger, Umfang, externe Effekte, Risikostufe?
Build capabilities once. Expose them everywhere.