Inteligência Artificial e Dados
Processamento de Docs
Caixa de entrada com mil notas fiscais em PDF, contrato de 40 páginas que alguém precisa ler antes de assinar, ou formulário escaneado torto — isso hoje dá para encaminhar com IA sem transformar o financeiro em caça ao tesouro. A Viscale monta pipeline: entrada (e-mail, pasta, API), OCR quando precisa, classificação do tipo de documento, extração estruturada para JSON ou colunas do ERP, validação contra regras duras (CNPJ existe? valor bate linha a linha?) e fila de exceção para humano quando a máquina marca dúvida. Tudo com trilha: qual arquivo, qual versão do layout, quem aprovou correção.
Não prometemos 99,9% mágico no primeiro dia: começamos pelo tipo de documento que mais dói e com amostra que vocês já classificaram manualmente. Medimos precisão campo a campo — não só “parece leu certo”. Quando o fornecedor muda o layout da nota, o sistema pode marcar queda de confiança e mandar lote para retreino ou ajuste de template, em vez de engolir erro silencioso.
Documentos que tratamos
Nota fiscal de serviço ou produto
Linha digitável, impostos e tomador extraídos para conciliação.
Contrato com cláusulas-chave destacadas
Prazo, multa, renovação automática — checklist para jurídico não perder o fio.
Comprovante de pagamento ou TED
Associação ao pedido quando há número de referência ou valor e data.
Pedido médico ou receita (com LGPD)
Campos mínimos para logística; restante mascarado conforme política.
Documento de identidade para KYC assistido
Leitura + confronto com selfie ou dados já digitados; humano no caso limite.
Ficha cadastral de fornecedor
PDF ou scan vira registro no sistema de compras com validação de formato.
Laudo ou relatório técnico longo
Sumário executivo + extração de tabelas para planilha quando existirem.
E-mail com anexo misto
Separa NF, boleto e contrato na mesma thread e roteia cada um ao fluxo certo.
Documentos multilíngue
Mesmo schema de saída; detecção de idioma antes da extração.
Pacote ZIP com centenas de PDFs
Processamento em lote com barra de progresso e relatório de falhas por arquivo.
Integração é o destino: gravar no SAP, no sistema próprio ou só devolver planilha validada. Dados pessoais e valores financeiros trafegam criptografados onde precisa e saem de armazenamento temporário conforme política. Para auditoria fiscal ou jurídica, exportamos log de quem alterou qual campo após a leitura automática.
Operação enxerga fila: o que entrou, o que já foi para o ERP, o que está esperando correção de uma linha. Menos “sumiu no Drive” e mais trabalho de escritório com fim visível — com custo de inferência por página transparente para orçamento.
Portfólio de Processamento de Docs
Entregáveis
Pipeline em produção
Processando os tipos e volume acordados.
Schema e exemplos JSON
Contrato de saída para o sistema destino.
Relatório de acurácia
Por campo e por tipo de documento na amostra de teste.
Interface de fila (se aplicável)
Para correção rápida de campo com atalhos.
Documentação técnica
Entrada, saída, erros conhecidos e limites.
Runbook operacional
Reprocessar lote, pausar fluxo e escalar bug.
Log de auditoria
Arquivo, versão do modelo e correções humanas.
Gestão de segredos
Chaves de API e acesso a bucket isolados.
Plano de retenção
Quando apagar binário e texto intermediário.
Treinamento do time
Operação confortável na fila e no relatório de falhas.
Conjunto de testes automatizados
PDFs de referência que rodam no CI.
Roadmap de novos layouts
Priorização quando surgirem novos fornecedores.
Metodologia de execução
-
Levantamento de tipos e volume
Quais documentos, quantos por mês e qual sistema consome o resultado.
-
Definição de schema de saída
Campos obrigatórios, opcionais e formatos (data, decimal).
-
Coleta de amostra rotulada
O que humano já digitou vira referência para medir acerto.
-
Pipeline ingestão + OCR + IA
Ordem dos passos e onde regra fixa substitui modelo.
-
Validação e fila de exceção
Regras de negócio + limiar de confiança para revisão.
-
Integração ao ERP ou planilha
API, arquivo ou robô RPA quando legado exige.
-
Testes de regressão por layout
Conjunto por fornecedor ou modelo de nota.
-
Segurança e retenção
Criptografia, tempo de guarda e exclusão automática.
-
Piloto em paralelo
Máquina sugere; humano confirma até atingir taxa combinada.
-
Go-live e monitoração
Painel de fila, erro por motivo e tempo médio por página.
-
Playbook de novo layout
O que fazer quando o PDF muda de cara de um dia pro outro.