Modelo de Risco & Classes de Proteção

Capacidade total de agente não significa que um agente pode fazer tudo. Significa que o sistema pode descrever de forma estruturada cada um de seus estados e cada uma de suas capacidades, incluindo as capacidades que permanecem fundamentalmente vedadas a um agente. O modelo de risco é a ferramenta que traça esse limite: de forma precisa, legível por máquina e sem exceções.

Áreas sensíveis

Algumas partes de um sistema exigem proteção maior, não apenas contra invasores externos, mas também contra agentes internos. Um equívoco comum diz:

O usuário pode ver, portanto a IA também pode ver.

Isso não é correto. O acesso efetivo da IA resulta da interseção de permissão do usuário, permissão do agente, nível de confiança do cliente, sensibilidade do recurso, finalidade e status de confirmação. Cada um desses elementos é uma barreira independente, não apenas a função do usuário.

As áreas sensíveis que precisam ser especialmente protegidas incluem:

Dados financeiros, dados bancários, dados de pagamento, detalhes de faturamento
Dados de saúde, documentos médicos, prontuários, atestados
Dados salariais, salário, bônus, histórico salarial, ciclos de folha de pagamento
Dossiês de pessoal, contratos, documentos de candidatura, avaliações internas
Credenciais de acesso & API Keys, senhas, chaves privadas, tokens de acesso
Funções de exclusão e em massa, excluir usuários, excluir tenant, exportação em massa
Gestão de direitos, conceder e revogar permissões, alterar funções
Logs de segurança, Audit Trails, Security Events, sessões ativas
Comunicação privada, notas confidenciais, avaliações internas
Dados fiscais e contratos, documentos fiscalmente relevantes, contratos com efeito jurídico
Dados pessoais nos termos do RGPD, todos os dados que identificam uma pessoa natural

Seis classes de proteção

Cada Resource e cada Tool é atribuída a uma das seis classes de proteção. A classe determina quem tem acesso, se um agente vê a Tool na Discovery e qual aprovação é necessária antes da execução.

Public

Low

Conteúdo publicamente acessível sem restrições. Sem autenticação, sem função especial, sem confirmação necessária. Adequado para artigos de ajuda, informações de produto e capacidades de sistema documentadas.

help.article.read
public.product_info.read

Internal

Low

Apenas para usuários autenticados. A autenticação é suficiente; sem direitos especiais necessários. Típico para consultas de lista, pesquisas e visualizações de trabalho gerais do próprio contexto.

project.list
contact.search

Confidential

Medium

Acessível apenas com função explícita e scope atribuído. Um simples login não é suficiente. Os dados são internos, mas não destinados a todos os colaboradores.

contract.read
customer_private_note.read

Sensitive

High

Apenas com aprovação adicional ou transmissão de contexto restrita. Um agente não pode carregar esses dados sem verificação em seu contexto. Ao transmitir para uma IA, o escopo deve ser estritamente limitado e a finalidade documentada.

salary.read
bank_account.read
health_document.read

Critical

A IA não pode agir de forma autônoma nesta classe. Cada execução requer uma aprovação explícita do usuário, frequentemente Step-up Authentication. As ações geram efeito externo, são difíceis de reverter ou afetam terceiros diretamente.

payment.execute
user.delete
contract.send
email.send_external
security.change_permissions

Forbidden for AI

Esta classe é um limite rígido, não uma decisão de policy. Tools e Resources desta classe são completamente ocultadas da Tool Discovery para agentes. Um agente não pode lê-las, invocá-las nem usá-las como referência.

password.read
private_key.read
full_database_export
raw_access_token.read

O que um agente não pode ver, ele não pode encontrar. Tools Forbidden não aparecem nas respostas de Discovery.

O modelo de risco

O modelo de risco traduz as classes de proteção em regras operacionais para cada caso de execução. Define se a autonomia é permitida, se a confirmação é necessária e que tipo de aprovação é exigida.

Low

Operações puramente de leitura ou ações sem efeito externo permanente. Agentes podem invocar essas Tools de forma autônoma.

Low Risk, Exemplos

list_projects Low
get_current_user Low
search_contacts Low
get_help_article Low
create_reminder Low

Medium

Dados ou estados são criados ou alterados, mas dentro de um scope estritamente definido sem efeito externo. A execução autônoma é permitida quando o scope e o contexto emergem inequivocamente do workflow.

Medium Risk, Exemplos

create_note Medium
update_task_status Medium
generate_summary Medium
create_draft Medium

High

Ações que alteram estados relevantes do sistema ou afetam outros usuários e recursos externos. Uma confirmação explícita é geralmente necessária.

High Risk, Exemplos

change_project_status High
invite_calendar_attendee High
share_file_link High
update_customer_data High

Critical

Comunicação externa, pagamentos, exclusões, alterações de permissões. Sempre confirmação, frequentemente Step-up Auth. A execução autônoma não é permitida.

Critical Risk, Exemplos

emails.send_external Critical
payment.execute Critical
user.delete Critical
security.change_permissions Critical
payroll.export Critical
contract.send Critical

Forbidden

Forbidden for AI

Completamente bloqueado para AI Agents, nem leitura nem escrita. Não visível na Discovery, não invocável, não utilizável como referência.

Forbidden, Exemplos

password.read Forbidden for AI
private_key.read Forbidden for AI
raw_access_token.read Forbidden for AI
disable_audit_log Forbidden for AI
full_database_export Forbidden for AI

UX de Aprovação

O modelo de risco técnico só funciona completamente quando a interface do usuário também cumpre seu papel. Uma confirmação é tão boa quanto a informação com base na qual ela é concedida.

Antes de um humano confirmar uma ação crítica de agente, ele deve ser capaz de reconhecer claramente sete coisas:

O que o agente quer fazer?, A ação concreta, não a intenção do agente em suas próprias palavras.
Por que o agente quer fazer isso?, Qual intenção ou tarefa desencadeou essa ação.
Quais dados são usados?, Destinatários, anexos, entidades referenciadas.
Quais efeitos externos surgem?, O que muda fora do sistema: e-mail é enviado, pagamento é disparado, documento é transmitido.
Quem é afetado?, Pessoas, empresas, tenants, partes externas.
A ação pode ser desfeita?, Declaração clara: reversível ou irreversível.
O que acontece ao confirmar?, Descrição completa dos próximos estados do sistema.

O exemplo a seguir mostra como um cartão de aprovação completo para a tool emails.send_external se parece:

Sales Assistant

emails.send_external

Critical

Follow-up ao projeto Havelblick com base na última interação.

Destinatário: Max Müller, Müller GmbH <[email protected]>
Assunto: Follow-up ao projeto Havelblick
Anexo: Sem anexo direto, link de download expira após 14 dias.
Efeito externo: E-mail será enviado e passará a fazer parte do histórico de comunicação.
Reversível: Não, não pode ser desfeito após o envio.

GrundComunicação externa com informações relacionadas ao projeto e link de download. Irreversível após o envio.

O agente aguarda a decisão do usuário. Ele não pode antecipar a confirmação, definir uma ação padrão nem basear a execução no timestamp de uma aprovação anterior.

100% controlável não significa 100% autônomo.