PF
Live Técnica · 2026
Pontos de Função · Engenharia de Prompt · Contratos de TI
Pontos de Função
na Era dos Prompts
O que os indicadores de produtividade não conseguem — ainda — medir quando o coração do sistema é uma cadeia de instruções para IA.
60–90 minutos
5 Atos
Analistas · Gestores · Engenheiros de Prompt
⚡ Cliffhanger de Abertura
"Você recebe um orçamento de software. Tudo medido em Pontos de Função, produtividade calculada, referência de preço unitário aplicada, contrato assinado. Está tudo certo. Só que... o coração desse sistema é uma cadeia de prompts de IA. Prompts que exigiram semanas de refinamento, especialistas de negócio, dezenas de iterações, conhecimento profundo de um domínio que pouquíssimas pessoas dominam."
"Pergunta: esses prompts estão pagos nesse contrato?"
Spoiler: provavelmente não. E esse é exatamente o buraco que a gente vai olhar hoje.
Agenda · 5 Atos
O que vamos cobrir hoje
ATO 01
O Mapa do Tesouro
O que é APF, como funciona e por que governa contratos de software hoje
Nivelamento · APF
ATO 02
O Novo Personagem
O que é Engenharia de Prompt, o que ela entrega e por que não cabe numa régua tradicional
Prompt · LLMs
ATO 03
A Lacuna
A ausência de correlação entre PF e esforço de prompt. O estado da arte e o vazio nos frameworks
Estimativas · Mercado
ATO 04
O Campo de Batalha
Riscos reais em contratos, caminhos práticos disponíveis hoje e para onde o mercado caminha
Contratos · Riscos
ATO 05
O Plot Twist
A virada epistemológica que muda tudo o que discutimos — e a pergunta que fica
Reflexão · Valor
01
O Mapa do Tesouro
"O que é Ponto de Função e por que ele ainda governa contratos de software"
Nivelamento · APF · Produtividade
Ato 1 · 1.1
1.1 O que é Ponto de Função?
A Análise de Pontos de Função (APF) é um método padronizado internacionalmente — normas ISO 20926 (IFPUG) e ISO 24570 (NESMA) — para medir o tamanho funcional de um software, independentemente da tecnologia usada.
A ideia central: quantificar o que o sistema faz para o usuário, não como ele faz.
🗄️
ALI
Arquivos Lógicos Internos — dados que o sistema mantém
🔗
AIE
Arquivos de Interface Externa — dados referenciados de fora
📥
EE
Entradas Externas — dados que entram no sistema
📤
SE
Saídas Externas — dados que saem com lógica
🔍
CE
Consultas Externas — recuperação simples de dados
💬 "O Ponto de Função é como a metragem quadrada de um imóvel: não mede o acabamento, a vista ou a localização — mas é um ponto de partida comparável e rastreável."
Ato 1 · 1.2
1.2 Indicadores de Produtividade
Os indicadores expressam a relação entre o tamanho funcional e o esforço despendido — tipicamente em Horas por Ponto de Função (h/PF).
Esforço = Tamanho (PF) × Taxa de Produtividade (h/PF)
Referências de mercado:
- ISBSG — benchmarks de milhares de projetos globais
- NESMA — normas e diretrizes europeias
- SISP/TCU/CGU — contratos públicos de TI no Brasil usam R$/PF como referência para licitações
Escopo padrão coberto pela taxa:
- Levantamento e análise de requisitos
- Design e modelagem da solução
- Codificação e testes
- Documentação técnica
- Implantação e configuração
⚠️ "O que não está no escopo de atividade não está no preço. O problema é quando ninguém percebe isso até o contrato estar assinado."
Enquete — "Você já viu um contrato que mencionava prompts de IA no escopo? (Sim / Não / Não sei o que é Engenharia de Prompt)"
02
O Novo Personagem
"O que é, o que faz e por que não cabe numa régua tradicional"
Engenharia de Prompt · LLMs · Escopo
Ato 2 · 2.1
2.1 O que é Engenharia de Prompt?
A disciplina de projetar, refinar e validar instruções textuais (prompts) que orientam o comportamento de modelos de linguagem de grande escala (LLMs) como GPT, Claude, Gemini.
Vai muito além de "escrever perguntas bem feitas":
Zero-shot / Few-shot
Instruir o modelo com ou sem exemplos explícitos no prompt
Chain-of-Thought
Induzir raciocínio passo a passo para maior precisão e auditabilidade
RAG
Conectar o modelo a bases de conhecimento externas em tempo real
System Prompts
Definir comportamento, tom, limites e identidade do modelo
Evals
Medir sistematicamente a qualidade e consistência das respostas
Iteração
Ciclos de teste com variações de prompt, temperatura e contexto
💬 "Engenharia de Prompt não é sobre digitar bem. É sobre arquitetar comportamento de sistemas inteligentes. É design de instrução."
Ato 2 · 2.2
2.2 Quando prompts são parte da funcionalidade
O Ponto de Função conta o invólucro funcional — entradas, saídas, arquivos lógicos. O que ele não captura é o conteúdo intelectual do prompt que governa o comportamento do componente de IA dentro desse invólucro.
- Módulo de análise de contratos: o fluxo de dados é mensurável em PF — o prompt que define como o modelo extrai cláusulas abusivas, calibrado por especialistas jurídicos ao longo de semanas, não é.
- Chatbot de atendimento: entradas e saídas se contam normalmente; comportamento, tom, limites e personalidade dependem de system prompts elaborados e exaustivamente testados.
- Gerador automático de relatórios: a funcionalidade é medida em PF; a diferença entre um relatório útil e um inútil depende de meses de refinamento por especialistas no domínio.
O PF paga o contêiner. O esforço que garante que o conteúdo funcione fica de fora.
Ato 2 · 2.3
2.3 Por que isso é um problema de escopo
O esforço de Engenharia de Prompt não é residual nem trivial. Envolve atividades sem correspondência direta com nenhum elemento contável da APF:
- Compreensão profunda do domínio do negócio — não da engenharia de software
- Experimentação intensiva com documentação de versões de prompt e registro de hipóteses testadas
- Criação de suítes de avaliação (evals) para medir qualidade, consistência e regressão de respostas
- Negociação com stakeholders sobre o que constitui uma resposta aceitável — definição subjetiva que precisa ser operacionalizada
- Atualizações contínuas conforme o modelo base evolui — sem que uma linha de código tenha sido alterada
⚠️ "Um prompt bem-feito para uma funcionalidade crítica pode custar mais em esforço do que a funcionalidade em si. Esse esforço não aparece no contador de Pontos de Função."
Chat aberto — "Já passou por uma situação assim? Conta pra gente."
03
A Lacuna
"Há correlação entre Ponto de Função e esforço em Engenharia de Prompt? A resposta incômoda."
Estado da Arte · Estimativas · Mercado
Ato 3 · 3.1
3.1 A ausência de correlação confiável
Ao contrário da APF — onde existe uma relação estatisticamente sustentável entre tamanho funcional e esforço —, a Engenharia de Prompt não apresenta correlação confiável com nenhuma métrica funcional disponível hoje.
- Um único prompt pode demandar semanas de refinamento em domínios altamente especializados, enquanto outro para uso genérico fica pronto em horas
- A complexidade do prompt é cognitiva, não estrutural — não há "linhas de código", elementos funcionais ou transações para contar
- Variabilidade enorme: o mesmo tipo de prompt pode exigir 2 horas ou 2 meses dependendo do domínio, do modelo e dos critérios de qualidade
- Os modelos mudam: um prompt finamente calibrado para GPT-4o pode exigir retrabalho significativo após atualização — sem que nada no sistema tenha mudado
⚠️ A ausência de correlação não é provisória — é estrutural. A natureza do esforço é fundamentalmente diferente do esforço de desenvolvimento de software tradicional.
Ato 3 · 3.2
3.2 O que existe hoje para estimar
Na ausência de padrão consolidado, o mercado recorre a cinco abordagens principais — cada uma com suas limitações:
T&MHoras-especialista
USD 47–130/h para generalistas; USD 200–400/h para especialistas em agentes. A amplitude reflete a falta de padronização.
ÁgilPrompt Complexity Points
Adaptação de Story Points: simples / médio com CoT / complexo com RAG e multi-turn. Sem benchmarking de mercado suficiente.
RigorBaseado em Evals
Complexidade estimada pelo volume e sofisticação das suítes de avaliação necessárias para validar o comportamento do prompt.
PesquisaModelos Paramétricos
Extensões do COCOMO para IA, incorporando volatilidade do modelo e grau de especialização do domínio. Ainda acadêmico.
InovadorOutput-based
Remuneração atrelada a melhoria mensurável: redução de alucinações, ganho de precisão. Difícil em contratos tradicionais.
💡 "Engenharia de Prompt bem conduzida pode entregar a mesma qualidade com redução de até 76% no custo de chamadas à API — mudando radicalmente o ROI do esforço."
Ato 3 · 3.3
3.3 O vazio nos frameworks de métricas
Nem IFPUG, nem NESMA, nem COSMIC-FFP publicaram, até o momento desta live, um guia oficial para medição de componentes de IA generativa em sistemas de software.
O SNAP (Software Non-Functional Assessment Process) do IFPUG cobre requisitos não-funcionais, mas não foi desenhado para este tipo de artefato.
∅
Estamos, literalmente, em terra sem mapa.
⚠️ "Contratos que usam APF como único instrumento de medição para sistemas com componentes de IA generativa estão comprando conflito futuro."
Enquete — "Como sua organização trata Engenharia de Prompt em contratos? A) Incluímos no PF · B) Orçamos separado · C) Não orçamos · D) Nem sabíamos"
04
O Campo de Batalha
"O que fazer enquanto o padrão não chega"
Contratos · Riscos · Caminhos Práticos
Ato 4 · 4.1 — Riscos para contratantes
4.1 Os riscos de ignorar o problema
Quando um contrato trata sistemas com componentes de IA generativa como software tradicional, os riscos se distribuem de forma diferente — mas os dois lados perdem.
Para contratantes
- Pagar por funcionalidades que "funcionam tecnicamente" mas entregam outputs inadequados para o negócio — sem instrumento contratual para exigir correção
- Contratos sem previsão de manutenção evolutiva de prompts conforme os modelos de IA são atualizados pelo provedor (OpenAI, Anthropic, Google)
- Impossibilidade de fiscalização objetiva da qualidade de entrega — o auditor não consegue avaliar sem entender profundamente o domínio
- Aceitação tácita de sistemas de IA cujos critérios de qualidade nunca foram formalmente definidos no contrato
⚠️ O problema não aparece na entrega técnica. Aparece quando o sistema entra em produção e o negócio percebe que o comportamento da IA é inadequado.
Ato 4 · 4.1 — Riscos para fornecedores
4.1 Os riscos de ignorar o problema continuação
Para fornecedores
- Subestimação de esforço e erosão de margem em projetos onde o esforço de Engenharia de Prompt não foi precificado — a pressão por prazo força atalhos
- Dificuldade em justificar retrabalho quando "o código não mudou" — mas o modelo base foi atualizado pelo provedor e os prompts pararam de funcionar adequadamente
- Risco de responsabilidade por outputs inadequados de sistemas que não foram calibrados adequadamente por falta de escopo e tempo
- Dependência de especialistas de domínio do cliente para validar qualidade — sem isso, o fornecedor não tem como saber se entregou bem
💬 "Os dois lados do contrato estão expostos. A diferença é que o fornecedor provavelmente vai absorver o custo silenciosamente e o contratante vai reclamar do resultado."
Ato 4 · 4.2
4.2 Caminhos práticos disponíveis hoje
Na ausência de padrão, contratos mais maduros estão adotando mecanismos complementares ao PF para endereçar a Engenharia de Prompt:
- Descritivo de escopo explícito: nomear a Engenharia de Prompt como atividade apartada, com deliverables próprios — biblioteca de prompts versionada, racional de decisão e resultados de avaliação documentados
- Anexo de serviços de IA: descrever modelos utilizados, critérios de qualidade esperados, processo de validação e responsabilidade por atualizações quando o modelo base mudar
- Critérios de aceitação baseados em evals: taxas de precisão, volume de casos de teste, cenários cobertos — transforma o subjetivo em auditável e contratualmente exigível
- Time & Material com revisão periódica: negociar componentes de IA em regime T&M com checkpoint de revisão após a fase exploratória inicial
- Perfilamento do especialista: definir explicitamente o perfil e senioridade do Engenheiro de Prompt — isso afeta diretamente o custo e a qualidade entregue
Perguntas do chat — reservar 5–8 minutos
Ato 4 · 4.3
4.3 Para onde o mercado está caminhando
Frameworks de Evals
Estão se tornando a nova "documentação de requisitos" do mundo de LLMs — base para estimativas mais confiáveis e contratos mais auditáveis
Certificações
Certificações específicas em Prompt Engineering estão surgindo — criarão tabelas salariais e de remuneração mais estáveis e comparáveis
Extensões de APF para IA
IFPUG ou COSMIC devem publicar orientações nos próximos 2–3 anos. Discussões acadêmicas já em curso em conferências de métricas de software.
Custo de Tokens
Métrica objetiva que pode complementar — mas não substituir — a medição de esforço humano no desenvolvimento e manutenção de prompts
05
O Plot Twist
"A virada que muda tudo o que discutimos até agora"
Reflexão Final · Epistemologia · Valor
Ato 5 · O Plot Twist — 1/3
"A gente passou a live inteira falando sobre como medir Engenharia de Prompt. Mas o verdadeiro problema não é de medição. É de epistemologia."
"Pontos de Função funcionam porque existe consenso sobre o que conta. Existe um manual. Existe uma certificação. Existe um árbitro independente do domínio. Isso é o que torna o PF um instrumento confiável para contratos."
"Com prompts, o consenso não existe. A qualidade de um prompt é inseparável do contexto para o qual foi criado. O melhor prompt para diagnosticar cláusulas abusivas em contratos de telecomunicações não pode ser avaliado por ninguém que não entenda profundamente de contratos de telecomunicações."
Ato 5 · O Plot Twist — 2/3
"O Ponto de Função nasceu exatamente para resolver esse problema — medir software sem precisar entender o software. Ele deu ao cliente o poder de fiscalizar sem depender do fornecedor. Esse foi o seu grande valor político, não apenas técnico."
"A Engenharia de Prompt desfaz esse poder. Ela devolve a dependência de especialistas. Ela exige que cliente e fornecedor colaborem na validação de uma forma que a APF havia tornado dispensável."
"Isso não é necessariamente ruim — mas é uma mudança fundamental na relação contratual. Uma mudança para a qual a maioria dos contratos de TI não está preparada."
Ato 5 · O Plot Twist — 3/3
"Estamos prontos para abrir mão do conforto da métrica objetiva em nome de um produto de IA que realmente funcione?"
"Porque se você insistir em medir por PF aquilo que não pode ser medido por PF, você vai ter um contrato perfeito... e um sistema de IA que ninguém confia."
"A métrica não é o problema. O problema é acreditar que a métrica resolve o que só a colaboração e o entendimento de domínio podem resolver."
Encerramento
Levem essas perguntas
para os seus projetos:
Onde está documentada a Engenharia de Prompt neste sistema?
Quem é responsável pela qualidade dos prompts — e como ela é medida?
O que acontece quando o modelo base for atualizado?
O contrato prevê revisão de prompts como atividade contínua?
"Se você não souber responder, o projeto já tem um risco que não aparece em nenhum indicador."
IFPUG ISO 20926
NESMA ISO 24570
ISBSG
SISP/TCU/CGU
COSMIC-FFP
COCOMO II · S-COST