Se amanhã um cliente B2B ou um regulador fizer essa pergunta à sua empresa: quais sistemas de IA vocês têm em produção, com qual dado e quem é o responsável por cada um? Quanto tempo levaria para responder?
A maioria das empresas não saberia. Na minha leitura, não é descuido: a adoção de IA aconteceu mais rápido do que qualquer estrutura de governança consegue acompanhar quando não há um processo dedicado a isso. Já vi esse padrão em outros ciclos: o ERP chegou primeiro nas empresas, a auditoria de controles veio depois, frequentemente empurrada por um auditor externo ou por um incidente. Com IA, o compressor de tempo é mais curto. Auditoria interna de IA é o processo que fecha essa lacuna, antes que alguém de fora exija.
Pontos principais
- 88% das organizações globais já usam IA em alguma função de negócio (McKinsey, 2026), mas a maioria não sabe quantos sistemas tem em produção, com qual dado e com qual responsável.
- O PL 2338 e o EU AI Act exigem governança documentada para sistemas de alto risco empresa sem inventário não consegue classificar risco nem responder a uma fiscalização.
- Quatro passos para estruturar do zero: inventário → classificação de risco → avaliação técnica → governança com responsáveis nomeados e comitê constituído.
O cenário que torna a pergunta urgente
88% das organizações globais já usam IA em alguma função de negócio, segundo o relatório State of AI da McKinsey (2026). No Brasil, a adoção saltou de 20% para 51% das empresas em apenas 12 meses, um avanço de 31 pontos percentuais em um ano, de acordo com o Cloud and Threat Report da Netskope (janeiro de 2026).
O que esses números mostram é que a IA virou padrão operacional antes que a gestão de risco de IA se tornasse prática corrente. O The Institute of Internal Auditors registrou isso formalmente: no Risk in Focus 2026, o risco de IA generativa foi colocado entre os principais para auditoria interna neste ano, ao lado de cibersegurança e ESG.
A constatação operacional é direta: empresa que usa IA sem saber quantos sistemas tem em produção, com qual dado e com qual responsável vai descobrir tudo isso sob pressão. Quando o regulador perguntar. Quando o cliente B2B exigir. Quando o incidente acontecer.
O timing regulatório torna a urgência concreta:
- O PL 2338/2023 (Marco Legal da IA) está em fase final de tramitação no Brasil, com requisitos de governança e auditabilidade estruturalmente alinhados ao EU AI Act
- O EU AI Act (Regulamento UE 2024/1689) está em vigor desde 1º de agosto de 2024; a proibição de práticas vedadas (art. 5°) passou a se aplicar em fevereiro de 2025 e as obrigações para sistemas de alto risco a partir de agosto de 2026; alcança empresas brasileiras com qualquer operação europeia, mesmo indireta
- Setores como finanças (Bacen), saúde (ANS) e telecom (Anatel) estão incorporando IA aos frameworks de supervisão regulatória
- A ISO/IEC 42001, publicada em dezembro de 2023, é o primeiro padrão internacional para sistemas de gestão de IA e ganha massa crítica de adoção em 2026
Este post cobre o que é auditoria interna de IA, por que ela é diferente de auditoria de TI tradicional e os quatro passos para montar essa estrutura do zero, com os frameworks que ajudam em cada etapa.
O que é auditoria interna de sistemas de IA

Auditoria interna de sistemas de IA é o processo sistemático de identificar, classificar e avaliar todos os sistemas de IA usados pela empresa, desde ferramentas como o ChatGPT corporativo até os embarcados em produto e em decisão automatizada, quanto à conformidade, ao risco, à qualidade técnica e ao impacto sobre titulares de dados.
O nome lembra auditoria de TI. Mas há quatro razões concretas pelas quais não é a mesma coisa:
1. IA produz resultados probabilísticos, não determinísticos. Auditoria de TI tradicional verifica se a regra foi seguida: o sistema fez o que deveria fazer. Auditoria de IA precisa medir taxa de acerto, taxa de erro e degradação do modelo ao longo do tempo. A pergunta não é “o sistema executou a instrução?”, é “o sistema continua acertando na mesma proporção que acertava seis meses atrás?”
2. IA tem dependência externa que o TI tradicional não tem. O modelo que roda no chatbot de atendimento foi treinado pela OpenAI, pela Anthropic ou pela Google. Dado de treinamento é opaco. Atualizações do modelo acontecem fora do controle da empresa. Auditoria precisa mapear essas dependências e entender o que está protegido contratualmente, e o que não está.
3. IA opera no cruzamento de múltiplas responsabilidades legais simultaneamente. Dado pessoal sensível (LGPD, art. 5º, II), decisão automatizada com efeito jurídico sobre pessoas (LGPD, art. 20), discriminação algorítmica, propriedade intelectual e responsabilidade civil podem estar em jogo no mesmo sistema. Auditoria precisa cobrir todas essas frentes, não em sequência, mas ao mesmo tempo.
4. As competências necessárias raramente coexistem em uma só pessoa. Quem desenvolveu o sistema raramente é quem o opera. Quem o opera raramente é quem audita. Auditoria de IA exige que três competências trabalhem juntas: técnica (o que o modelo faz), jurídica (o que a lei exige) e de negócio (o que o sistema decide e qual o impacto).
Uma distinção que evita confusão frequente:
- Auditoria interna não é avaliação técnica de qualidade do modelo: essa é função de quem desenvolve
- Auditoria interna não é auditoria externa certificadora: essa é função de organismo independente, conforme a ISO/IEC 42006:2025, que define os requisitos para quem certifica AIMS
- Auditoria interna é a estrutura que dá à organização visibilidade contínua sobre seus próprios sistemas, antes que alguém de fora pergunte
Passo 1: inventário de sistemas em produção
O primeiro passo de qualquer auditoria interna de IA é fazer o inventário completo dos sistemas em uso. Sem inventário, não se audita o que não se sabe que existe. Todo o resto é exercício teórico.
Os sistemas se distribuem em quatro categorias:
Ferramentas corporativos ChatGPT Enterprise, Claude for Business, Microsoft 365 Copilot, Gemini for Business, GitHub Copilot. Geralmente o mais fácil de mapear: há contrato corporativo, console administrativo e controle de acesso centralizado.
Embarcados em produto interno Sistemas que a empresa desenvolveu, próprios ou via integradora, usando modelos de terceiros via API. Chatbot de atendimento, sistema de triagem de currículos, motor de recomendação, classificador de fraude. Geralmente o mais difícil de mapear: cada time desenvolveu para sua necessidade, frequentemente sem comunicar ao restante da organização.
Embarcados em fornecedor (vendor lock-in) Módulos de IA dentro de SaaS já contratado: Salesforce Einstein, HubSpot AI, plataformas de RH com triagem automatizada. Aqui, auditar significa entender o que está habilitado, o que é configurável pela empresa e o que é caixa-preta do fornecedor.
Shadow AI Uso de IA sem aprovação formal, por exemplo colaboradores usando contas pessoais de ChatGPT para processar contratos ou análises com dados da empresa. Identificável por análise de tráfego de rede, questionário interno ou análise de gastos em cartão corporativo.
Para cada sistema, registrar:
| Campo | O que responder |
|---|---|
| Nome e fornecedor | Nome interno + nome do produto/fornecedor |
| Função operacional | O que faz, em qual processo |
| Tipo de dado | Público · interno · sensível · dado pessoal · dado pessoal sensível |
| Decisão automatizada? | Sim / Não / Parcial, com efeito jurídico ou econômico sobre pessoas |
| Responsável humano | Pessoa específica, não “a equipe X” |
| Base contratual | DPA assinado? Cláusula de retreinamento? Retenção de dado? |
| Histórico de revisão | Início em produção · última revisão · próxima revisão prevista |
Recomendação prática: começar pelo ambiente de nuvem (AWS, Azure, GCP) e pelos sistemas SaaS em uso. Quase tudo deixa rastro de infraestrutura e é o ponto de partida mais confiável porque produz um inventário baseado em evidência de uso real, não em declaração de times.
Passo 2: classificação de risco por profundidade de auditoria
Classificar risco antes de auditar é o que diferencia auditoria viável de auditoria que nunca acontece. Tratar todos os sistemas com o mesmo rigor paralisa a iniciativa. Tratar todos com o mesmo descaso é o que produz incidente.
As três categorias alinhadas ao EU AI Act e ao PL 2338:
| Categoria | Exemplos | O que fazer |
|---|---|---|
| Risco inaceitável (proibido) | Pontuação social generalizada, manipulação subliminar, identificação biométrica remota em espaço público | Não auditar. Desativar. Documentar a desativação com data e racional. |
| Alto risco | Triagem de currículos, decisão de crédito, classificação escolar, sistema judicial automatizado, biometria em ambiente regulado | Auditoria completa: técnica, jurídica, paridade demográfica, trilha de decisão, mecanismo de contestação. Revisão semestral. |
| Risco limitado / mínimo | Chatbot de atendimento, sistema de recomendação não-crítico, ChatGPT corporativo para tarefas administrativas | Auditoria básica: inventário, classificação de dado, política de uso. Revisão anual. |
Cinco critérios práticos para classificar cada sistema:
- O sistema toma decisão com efeito jurídico ou econômico sobre pessoa específica? Crédito, emprego, acesso a benefício, classificação escolar. Se sim: alto risco por default.
- Opera em setor regulado? Saúde, finanças, telecom, energia. Se sim: profundidade de auditoria sobe um nível.
- Trata dado pessoal sensível? Raça, religião, saúde, dado biométrico como dado pessoal sensível, dado de menor de idade (LGPD, art. 5º, II). Se sim: profundidade sobe.
- É caixa-preta para a empresa? Modelo proprietário de terceiro sem documentação de comportamento. Se sim: auditoria precisa cobrir o gap com testes próprios.
- Qual a reversibilidade do erro? O efeito se desfaz em horas, em semanas ou nunca? Quanto menos reversível, maior a profundidade exigida.
A classificação de risco é decisão documentada, não opinião informal. Quem classificou, quando, com base em quê. Em caso de fiscalização, o regulador vai pedir a classificação e o racional por escrito. Veja metodologia detalhada em como classificar risco de aplicação de IA.
Passo 3: avaliação técnica e as métricas que importam
Auditoria técnica de IA é diferente de auditoria de software porque IA produz resultado probabilístico, não determinístico. As métricas precisam refletir isso.
Cinco dimensões a avaliar em cada sistema:
1. Acurácia agregada e por subgrupo Qual a taxa de acerto geral e qual a taxa por grupo demográfico relevante: idade, gênero, raça, região geográfica. Sistema “em média preciso” pode ser severamente assimétrico. O NIST testou 189 algoritmos de reconhecimento facial e encontrou taxas de erro até 100 vezes maiores para determinados subgrupos (NIST FRVT, 2019). Estudos análogos em sistemas de triagem de crédito, análise de currículos e modelos de risco confirmam o mesmo padrão estrutural: precisão agregada mascara assimetria demográfica. A paridade por subgrupo métricas de acurácia separadas por grupo é o que expõe esse viés.
2. Degradação do modelo ao longo do tempo Sistemas em produção perdem precisão conforme a realidade muda: novos perfis de cliente, novos padrões de uso, novos contextos de mercado. O problema não é que o sistema “quebre”. É que ele continua funcionando, mas entregando resultado cada vez mais desalinhado. Um classificador de fraude calibrado em 2023 pode estar aprovando transações que deveriam ser bloqueadas porque o perfil de fraude mudou; o sistema não sabe disso, e ninguém percebe até aparecer no balanço. Medir mensalmente para sistemas de alto risco, trimestralmente para os demais.
3. Robustez a entradas adversariais Como o sistema reage a inputs maliciosos, casos limítrofes ou instruções projetadas para enganá-lo? Para sistemas baseados em modelos de linguagem, isso inclui tentativas de manipulação via texto (prompt injection), contornamento de proteções (jailbreaking) e extração das instruções internas do sistema. Veja os riscos de prompt injection e jailbreaking em ambiente corporativo.
4. Explicabilidade da decisão Quando o sistema recusa um crédito, classifica um currículo abaixo do corte ou marca uma transação como fraude, qual é a razão? Em sistemas regulados, explicabilidade não é diferencial: é requisito. A LGPD, no art. 20, garante ao titular o direito de revisão de decisões automatizadas e de explicação dos critérios utilizados.
5. Consistência de resposta O mesmo input produz o mesmo output? Em sistemas baseados em modelos de linguagem, frequentemente não: esses modelos são projetados para ter variabilidade nas respostas. Na prática, para processos que dependem de consistência, como análise de contrato, triagem de documentos ou resumo de reuniões com efeito sobre decisão, essa variabilidade precisa ser documentada e monitorada. Definir o nível de variação tolerável para cada caso de uso é parte da auditoria.
Diferença crítica: avaliação técnica de IA precisa ser feita com base de teste representativa da população real que o sistema afeta, não com a base de treinamento. Modelo testado exclusivamente com os dados com que foi treinado essencialmente memoriza esses dados. O desempenho no mundo real costuma ser pior.
Passo 4: governança e quem responde pelo quê
Auditoria sem governança é relatório que vai para a gaveta. Governança define quem decide, quem aprova e quem responde quando algo der errado.
Cinco papéis mínimos para uma estrutura funcional:
1. Patrocinador executivo (C-level) Pessoa no nível mais alto que responde pela existência da estrutura de governança de IA. Sem patrocínio em C-level, a iniciativa não sobrevive ao primeiro corte de orçamento.
2. Responsável técnico por sistema Pessoa específica, não “o time de TI”, que conhece o sistema tecnicamente, sabe responder a uma auditoria e é informada de alertas. Um profissional pode acumular a responsabilidade técnica por mais de um sistema; o que não pode é ter “a equipe” como responsável, porque equipe não assina embaixo.
3. Responsável de negócio por sistema Pessoa da área que consome o resultado do sistema e entende o uso no fluxo operacional. Em geral, é quem detecta primeiro quando o sistema começa a entregar resultado estranho, porque é quem convive com ele diariamente.
4. Auditor interno de IA Função que coordena os trabalhos de auditoria, não necessariamente uma pessoa dedicada em tempo integral. Pode estar em compliance, risco operacional, auditoria interna existente ou jurídico, dependendo do porte da empresa.
5. Comitê de revisão de IA Órgão colegiado que decide sobre desligamento de sistemas, aprovação de novos sistemas e classificação de risco em casos limítrofes. Reúne-se trimestralmente no mínimo. Sem ele, a decisão fica órfã ou vira disputa política interna.
O que observo como ponto de partida mais seguro é definir esses cinco papéis, atribuí-los formalmente e revisitar no primeiro trimestre, antes de se preocupar com certificação. A ISO/IEC 42001:2023 estrutura esses papéis como parte de um AIMS (AI Management System), e seguir a estrutura da norma ajuda a construir uma base sólida mesmo para quem nunca pretende certificar.
Os frameworks que ajudam e o que cada um cobre
| Framework | O que é | Quando adotar |
|---|---|---|
| NIST AI RMF 1.0 (jan/2023) + perfil GenAI AI 600-1 (jul/2024) | Guia voluntário do NIST (EUA). Estrutura 4 funções: Govern, Map, Measure, Manage. | Ponto de partida para empresa que quer estruturar do zero, sem pressão de certificação imediata. Gratuito e bem documentado. |
| ISO/IEC 42001:2023 (dez/2023) | Primeiro padrão internacional para sistema de gestão de IA. Estrutura similar à ISO 27001 e à ISO 9001. Voluntário, certificável. | Empresa com clientes B2B que pedem garantia de governança; setor regulado; qualquer operação na União Europeia. |
| ISO/IEC 42006:2025 | Define requisitos para organismos certificadores que auditam AIMS conforme a ISO 42001. | Não é para a empresa adotar: é o que a empresa será avaliada quando contratar auditoria externa certificadora. |
| EU AI Act (Regulamento UE 2024/1689) | Lei europeia em vigor desde 1º/08/2024. Exige avaliação de risco, documentação técnica, supervisão humana e logs auditáveis para sistemas de alto risco. | Empresa com qualquer operação na União Europeia, mesmo indireta. Efeitos extraterritoriais alcançam fornecedores de empresas europeias. |
| PL 2338/2023 | Marco Legal da IA brasileiro, em tramitação. Convergência estrutural com o EU AI Act. | Toda empresa brasileira que usa IA precisa acompanhar. Verificar versão vigente próximo à publicação. |
Recomendação prática: comece com o NIST AI RMF, gratuito, flexível, sem custo de adoção formal. É o ponto de entrada mais acessível para estruturar o processo. Quando a operação amadurecer e houver pressão de cliente B2B, regulador ou expansão internacional, avalie a ISO/IEC 42001. O PL 2338 e o EU AI Act não são opcionais quando aplicáveis: são restrições legais. Para entender como o PL 2338 trata sistemas de alto risco, veja o post sobre como o PL 2338 classifica sistemas de IA.
O passo zero é começar
Empresa que não sabe quantos sistemas de IA tem em produção, com qual dado, com qual responsável e com qual classificação de risco está em estado pré-auditável. O regulador vai chegar. O cliente B2B vai pedir. O incidente vai acontecer. A diferença entre quem remedia com estrutura e quem remedia sob pressão é ter começado antes da pergunta.
O caminho em cinco marcos:
- 30 dias: inventário completo dos sistemas em produção, nas quatro categorias
- 60 dias: classificação de risco de todos os sistemas inventariados
- 60 dias: governança mínima, responsáveis nominados e comitê constituído
- 90 dias: avaliação técnica iniciada pelos sistemas classificados como alto risco
- 120 dias: framework formal escolhido e cronograma de adoção documentado
Empresa que tem auditoria interna de IA em 2026 não está na vanguarda: está no mínimo defensável. Empresa que ainda não tem está acumulando passivo silencioso que vai aparecer no pior momento possível.
Perguntas frequentes sobre auditoria interna de IA
O que é auditoria interna de IA e por que é diferente de auditoria de TI?
Auditoria interna de IA identifica, classifica e avalia todos os sistemas de IA em produção quanto a conformidade, risco técnico e impacto sobre titulares de dados. Difere da auditoria de TI porque IA produz resultados probabilísticos, tem dependência de modelos de terceiros opacos, opera no cruzamento de múltiplas responsabilidades legais simultâneas e exige competências técnica, jurídica e de negócio integradas no mesmo processo.
Quais sistemas de IA são considerados alto risco pelo EU AI Act?
O EU AI Act (Regulamento UE 2024/1689) classifica como alto risco sistemas que afetam decisões críticas sobre pessoas: triagem de emprego, concessão de crédito, classificação escolar, sistemas judiciais automatizados e biometria em ambiente regulado. Esses sistemas exigem avaliação de conformidade, documentação técnica, supervisão humana e logs auditáveis antes de entrar em produção na União Europeia (EU AI Act, 2024).
Qual a diferença entre ISO/IEC 42001 e NIST AI RMF?
A ISO/IEC 42001:2023 é padrão internacional certificável para sistema de gestão de IA — recomendada quando clientes B2B ou expansão internacional exigem garantia formal. O NIST AI RMF 1.0 é guia voluntário, gratuito e flexível, indicado como ponto de entrada para estruturar o processo sem pressão de certificação. Ambos são complementares: o NIST estrutura o processo; a ISO fornece a certificação quando necessária.
O que é shadow AI e por que representa risco de auditoria?
Shadow AI é o uso não autorizado de ferramentas de IA colaboradores usando contas pessoais de ChatGPT, Claude ou similares para processar dados da empresa. O risco é duplo: dado sensível sai do perímetro sem DPA assinado (LGPD, art. 46) e o sistema não entra no inventário, tornando-se ponto cego no mapa de risco. Identificável por análise de tráfego de rede ou de gastos em cartão corporativo.
Em quanto tempo é possível ter uma estrutura mínima de auditoria interna de IA?
Cronograma em quatro marcos: 30 dias para inventário completo; 60 dias para classificação de risco e governança mínima com responsáveis nomeados; 90 dias para avaliação técnica dos sistemas de alto risco; 120 dias para framework formal escolhido e documentado. Empresa que segue esse roteiro tem estrutura defensável antes que regulador ou cliente B2B façam a primeira pergunta.



