Checkliste

MCP-first Checkliste

Eine Checkliste, um ein bestehendes oder geplantes System gegen MCP-first zu prüfen, Product, Engineering, Security und UX.

Eine Checkliste, um ein bestehendes oder geplantes System gegen die MCP-first-Prinzipien zu prüfen.

Product

  • Ist jedes Feature als Capability beschrieben, nicht nur als Screen oder Button?
  • Gibt es für jede Capability einen klaren Benutzer-Intent?
  • Gibt es für jede Capability sowohl eine menschliche als auch eine agentenfähige Nutzungsform?
  • Ist klar definiert, welche Capabilities autonom ausgeführt werden dürfen?
  • Ist klar definiert, welche Capabilities eine explizite Bestätigung durch den Benutzer benötigen?

Engineering

  • Gibt es einen zentralen Action Layer, den alle Interfaces gemeinsam nutzen?
  • Sind alle Actions typisiert mit klar definierten Schemas?
  • Gibt es Input- und Output-Schemas für jedes Tool?
  • Gibt es klare, maschinenlesbare Fehlercodes pro Tool?
  • Gibt es eine zentrale Policy Engine, die alle Interfaces gemeinsam verwenden?
  • Gibt es Audit Logs für jede ausgeführte Aktion?
  • Gibt es Tests pro Tool, die Inputs, Outputs und Fehlerfälle abdecken?
  • Gibt es einen Dry-Run-Modus für riskante Aktionen?

Security

  • Sind alle Tools nach Risikostufe klassifiziert (low / medium / high / critical / forbidden)?
  • Werden Tools bereits bei der Tool Discovery nach Benutzerrechten, Rolle und Scopes gefiltert, nicht erst beim Aufruf?
  • Gibt es Step-up Authentication für besonders sensible Aktionen?
  • Gibt es Human Confirmation Gates für kritische Aktionen?
  • Gibt es Redaction und Context-Filtering, damit Agents nur den für ihre Aufgabe nötigen Kontext erhalten?
  • Gibt es Tenant Isolation, sodass keine mandantenübergreifenden Zugriffe möglich sind?
  • Gibt es Rate Limits pro Agent, Client und Tool?
  • Gibt es Schutz gegen Prompt-Injection-Angriffe?
  • Wird Tool-Metadata serverseitig validiert und nicht blind vom Client übernommen?
  • Gibt es Monitoring und Alerting für ungewöhnliche oder anomale Agentenaktionen?

UX

  • Kann der Benutzer jederzeit nachvollziehen, welche Aktionen ein Agent ausgeführt hat oder ausführen will?
  • Sieht der Benutzer klar und verständlich, was bei einer Bestätigungsanfrage konkret passieren wird?
  • Kann der Benutzer eine vorgeschlagene Agentenaktion ablehnen oder abbrechen?
  • Gibt es einen Entwurfsmodus, bei dem der Agent vorbereitet und der Mensch abschließend entscheidet?
  • Gibt es Undo- oder Rollback-Optionen für reversible Aktionen?
  • Werden riskante Aktionen mit klarer Sprache erklärt, Empfänger, Umfang, externe Effekte, Risikostufe?

Build capabilities once. Expose them everywhere.