Capacidade total de agente não significa que um agente pode fazer tudo. Significa que o sistema pode descrever de forma estruturada cada um de seus estados e cada uma de suas capacidades, incluindo as capacidades que permanecem fundamentalmente vedadas a um agente. O modelo de risco é a ferramenta que traça esse limite: de forma precisa, legível por máquina e sem exceções.
Áreas sensíveis
Algumas partes de um sistema exigem proteção maior, não apenas contra invasores externos, mas também contra agentes internos. Um equívoco comum diz:
O usuário pode ver, portanto a IA também pode ver.
Isso não é correto. O acesso efetivo da IA resulta da interseção de permissão do usuário, permissão do agente, nível de confiança do cliente, sensibilidade do recurso, finalidade e status de confirmação. Cada um desses elementos é uma barreira independente, não apenas a função do usuário.
As áreas sensíveis que precisam ser especialmente protegidas incluem:
- Dados financeiros, dados bancários, dados de pagamento, detalhes de faturamento
- Dados de saúde, documentos médicos, prontuários, atestados
- Dados salariais, salário, bônus, histórico salarial, ciclos de folha de pagamento
- Dossiês de pessoal, contratos, documentos de candidatura, avaliações internas
- Credenciais de acesso & API Keys, senhas, chaves privadas, tokens de acesso
- Funções de exclusão e em massa, excluir usuários, excluir tenant, exportação em massa
- Gestão de direitos, conceder e revogar permissões, alterar funções
- Logs de segurança, Audit Trails, Security Events, sessões ativas
- Comunicação privada, notas confidenciais, avaliações internas
- Dados fiscais e contratos, documentos fiscalmente relevantes, contratos com efeito jurídico
- Dados pessoais nos termos do RGPD, todos os dados que identificam uma pessoa natural
Seis classes de proteção
Cada Resource e cada Tool é atribuída a uma das seis classes de proteção. A classe determina quem tem acesso, se um agente vê a Tool na Discovery e qual aprovação é necessária antes da execução.
Public
LowConteúdo publicamente acessível sem restrições. Sem autenticação, sem função especial, sem confirmação necessária. Adequado para artigos de ajuda, informações de produto e capacidades de sistema documentadas.
help.article.read
public.product_info.read
Internal
LowApenas para usuários autenticados. A autenticação é suficiente; sem direitos especiais necessários. Típico para consultas de lista, pesquisas e visualizações de trabalho gerais do próprio contexto.
project.list
contact.search
Confidential
MediumAcessível apenas com função explícita e scope atribuído. Um simples login não é suficiente. Os dados são internos, mas não destinados a todos os colaboradores.
contract.read
customer_private_note.read
Sensitive
HighApenas com aprovação adicional ou transmissão de contexto restrita. Um agente não pode carregar esses dados sem verificação em seu contexto. Ao transmitir para uma IA, o escopo deve ser estritamente limitado e a finalidade documentada.
salary.read
bank_account.read
health_document.read
Critical
CriticalA IA não pode agir de forma autônoma nesta classe. Cada execução requer uma aprovação explícita do usuário, frequentemente Step-up Authentication. As ações geram efeito externo, são difíceis de reverter ou afetam terceiros diretamente.
payment.execute
user.delete
contract.send
email.send_external
security.change_permissions
Forbidden for AI
Forbidden for AIEsta classe é um limite rígido, não uma decisão de policy. Tools e Resources desta classe são completamente ocultadas da Tool Discovery para agentes. Um agente não pode lê-las, invocá-las nem usá-las como referência.
password.read
private_key.read
full_database_export
raw_access_token.read
O que um agente não pode ver, ele não pode encontrar. Tools Forbidden não aparecem nas respostas de Discovery.
O modelo de risco
O modelo de risco traduz as classes de proteção em regras operacionais para cada caso de execução. Define se a autonomia é permitida, se a confirmação é necessária e que tipo de aprovação é exigida.
Low
LowOperações puramente de leitura ou ações sem efeito externo permanente. Agentes podem invocar essas Tools de forma autônoma.
-
list_projectsLow -
get_current_userLow -
search_contactsLow -
get_help_articleLow -
create_reminderLow
Medium
MediumDados ou estados são criados ou alterados, mas dentro de um scope estritamente definido sem efeito externo. A execução autônoma é permitida quando o scope e o contexto emergem inequivocamente do workflow.
-
create_noteMedium -
update_task_statusMedium -
generate_summaryMedium -
create_draftMedium
High
HighAções que alteram estados relevantes do sistema ou afetam outros usuários e recursos externos. Uma confirmação explícita é geralmente necessária.
-
change_project_statusHigh -
invite_calendar_attendeeHigh -
share_file_linkHigh -
update_customer_dataHigh
Critical
CriticalComunicação externa, pagamentos, exclusões, alterações de permissões. Sempre confirmação, frequentemente Step-up Auth. A execução autônoma não é permitida.
-
emails.send_externalCritical -
payment.executeCritical -
user.deleteCritical -
security.change_permissionsCritical -
payroll.exportCritical -
contract.sendCritical
Forbidden
Forbidden for AICompletamente bloqueado para AI Agents, nem leitura nem escrita. Não visível na Discovery, não invocável, não utilizável como referência.
-
password.readForbidden for AI -
private_key.readForbidden for AI -
raw_access_token.readForbidden for AI -
disable_audit_logForbidden for AI -
full_database_exportForbidden for AI
UX de Aprovação
O modelo de risco técnico só funciona completamente quando a interface do usuário também cumpre seu papel. Uma confirmação é tão boa quanto a informação com base na qual ela é concedida.
Antes de um humano confirmar uma ação crítica de agente, ele deve ser capaz de reconhecer claramente sete coisas:
- O que o agente quer fazer?, A ação concreta, não a intenção do agente em suas próprias palavras.
- Por que o agente quer fazer isso?, Qual intenção ou tarefa desencadeou essa ação.
- Quais dados são usados?, Destinatários, anexos, entidades referenciadas.
- Quais efeitos externos surgem?, O que muda fora do sistema: e-mail é enviado, pagamento é disparado, documento é transmitido.
- Quem é afetado?, Pessoas, empresas, tenants, partes externas.
- A ação pode ser desfeita?, Declaração clara: reversível ou irreversível.
- O que acontece ao confirmar?, Descrição completa dos próximos estados do sistema.
O exemplo a seguir mostra como um cartão de aprovação completo para a tool
emails.send_external se parece:
Sales Assistant
emails.send_external Follow-up ao projeto Havelblick com base na última interação.
- Destinatário
- Max Müller, Müller GmbH <[email protected]>
- Assunto
- Follow-up ao projeto Havelblick
- Anexo
- Sem anexo direto, link de download expira após 14 dias.
- Efeito externo
- E-mail será enviado e passará a fazer parte do histórico de comunicação.
- Reversível
- Não, não pode ser desfeito após o envio.
GrundComunicação externa com informações relacionadas ao projeto e link de download. Irreversível após o envio.
O agente aguarda a decisão do usuário. Ele não pode antecipar a confirmação, definir uma ação padrão nem basear a execução no timestamp de uma aprovação anterior.
100% controlável não significa 100% autônomo.