Live Técnica · 2026

Pontos de Função · Engenharia de Prompt · Contratos de TI

Pontos de Função
na Era dos Prompts

O que os indicadores de produtividade não conseguem — ainda — medir quando o coração do sistema é uma cadeia de instruções para IA.

60–90 minutos 5 Atos Analistas · Gestores · Engenheiros de Prompt

⚡ Cliffhanger de Abertura

"Você recebe um orçamento de software. Tudo medido em Pontos de Função, produtividade calculada, referência de preço unitário aplicada, contrato assinado. Está tudo certo. Só que... o coração desse sistema é uma cadeia de prompts de IA. Prompts que exigiram semanas de refinamento, especialistas de negócio, dezenas de iterações, conhecimento profundo de um domínio que pouquíssimas pessoas dominam."

"Pergunta: esses prompts estão pagos nesse contrato?"

Spoiler: provavelmente não. E esse é exatamente o buraco que a gente vai olhar hoje.

Agenda · 5 Atos

O que vamos cobrir hoje

ATO 01

O Mapa do Tesouro

O que é APF, como funciona e por que governa contratos de software hoje

Nivelamento · APF

ATO 02

O Novo Personagem

O que é Engenharia de Prompt, o que ela entrega e por que não cabe numa régua tradicional

Prompt · LLMs

ATO 03

A Lacuna

A ausência de correlação entre PF e esforço de prompt. O estado da arte e o vazio nos frameworks

Estimativas · Mercado

ATO 04

O Campo de Batalha

Riscos reais em contratos, caminhos práticos disponíveis hoje e para onde o mercado caminha

Contratos · Riscos

ATO 05

O Plot Twist

A virada epistemológica que muda tudo o que discutimos — e a pergunta que fica

Reflexão · Valor

O Mapa do Tesouro

"O que é Ponto de Função e por que ele ainda governa contratos de software"

Nivelamento · APF · Produtividade

Ato 1 · 1.1

1.1 O que é Ponto de Função?

A Análise de Pontos de Função (APF) é um método padronizado internacionalmente — normas ISO 20926 (IFPUG) e ISO 24570 (NESMA) — para medir o tamanho funcional de um software, independentemente da tecnologia usada.

A ideia central: quantificar o que o sistema faz para o usuário, não como ele faz.

🗄️

ALI

Arquivos Lógicos Internos — dados que o sistema mantém

🔗

AIE

Arquivos de Interface Externa — dados referenciados de fora

📥

EE

Entradas Externas — dados que entram no sistema

📤

SE

Saídas Externas — dados que saem com lógica

🔍

CE

Consultas Externas — recuperação simples de dados

💬 "O Ponto de Função é como a metragem quadrada de um imóvel: não mede o acabamento, a vista ou a localização — mas é um ponto de partida comparável e rastreável."

Ato 1 · 1.2

1.2 Indicadores de Produtividade

Os indicadores expressam a relação entre o tamanho funcional e o esforço despendido — tipicamente em Horas por Ponto de Função (h/PF).

Esforço = Tamanho (PF) × Taxa de Produtividade (h/PF)

Referências de mercado:

ISBSG — benchmarks de milhares de projetos globais
NESMA — normas e diretrizes europeias
SISP/TCU/CGU — contratos públicos de TI no Brasil usam R$/PF como referência para licitações

Escopo padrão coberto pela taxa:

Levantamento e análise de requisitos
Design e modelagem da solução
Codificação e testes
Documentação técnica
Implantação e configuração

⚠️ "O que não está no escopo de atividade não está no preço. O problema é quando ninguém percebe isso até o contrato estar assinado."

Enquete — "Você já viu um contrato que mencionava prompts de IA no escopo? (Sim / Não / Não sei o que é Engenharia de Prompt)"

O Novo Personagem

"O que é, o que faz e por que não cabe numa régua tradicional"

Engenharia de Prompt · LLMs · Escopo

Ato 2 · 2.1

2.1 O que é Engenharia de Prompt?

A disciplina de projetar, refinar e validar instruções textuais (prompts) que orientam o comportamento de modelos de linguagem de grande escala (LLMs) como GPT, Claude, Gemini.

Vai muito além de "escrever perguntas bem feitas":

Zero-shot / Few-shot

Instruir o modelo com ou sem exemplos explícitos no prompt

Chain-of-Thought

Induzir raciocínio passo a passo para maior precisão e auditabilidade

RAG

Conectar o modelo a bases de conhecimento externas em tempo real

System Prompts

Definir comportamento, tom, limites e identidade do modelo

Evals

Medir sistematicamente a qualidade e consistência das respostas

Iteração

Ciclos de teste com variações de prompt, temperatura e contexto

💬 "Engenharia de Prompt não é sobre digitar bem. É sobre arquitetar comportamento de sistemas inteligentes. É design de instrução."

Ato 2 · 2.2

2.2 Quando prompts são parte da funcionalidade

O Ponto de Função conta o invólucro funcional — entradas, saídas, arquivos lógicos. O que ele não captura é o conteúdo intelectual do prompt que governa o comportamento do componente de IA dentro desse invólucro.

Módulo de análise de contratos: o fluxo de dados é mensurável em PF — o prompt que define como o modelo extrai cláusulas abusivas, calibrado por especialistas jurídicos ao longo de semanas, não é.
Chatbot de atendimento: entradas e saídas se contam normalmente; comportamento, tom, limites e personalidade dependem de system prompts elaborados e exaustivamente testados.
Gerador automático de relatórios: a funcionalidade é medida em PF; a diferença entre um relatório útil e um inútil depende de meses de refinamento por especialistas no domínio.

O PF paga o contêiner. O esforço que garante que o conteúdo funcione fica de fora.

Ato 2 · 2.3

2.3 Por que isso é um problema de escopo

O esforço de Engenharia de Prompt não é residual nem trivial. Envolve atividades sem correspondência direta com nenhum elemento contável da APF:

Compreensão profunda do domínio do negócio — não da engenharia de software
Experimentação intensiva com documentação de versões de prompt e registro de hipóteses testadas
Criação de suítes de avaliação (evals) para medir qualidade, consistência e regressão de respostas
Negociação com stakeholders sobre o que constitui uma resposta aceitável — definição subjetiva que precisa ser operacionalizada
Atualizações contínuas conforme o modelo base evolui — sem que uma linha de código tenha sido alterada

⚠️ "Um prompt bem-feito para uma funcionalidade crítica pode custar mais em esforço do que a funcionalidade em si. Esse esforço não aparece no contador de Pontos de Função."

Chat aberto — "Já passou por uma situação assim? Conta pra gente."

A Lacuna

"Há correlação entre Ponto de Função e esforço em Engenharia de Prompt? A resposta incômoda."

Estado da Arte · Estimativas · Mercado

Ato 3 · 3.1

3.1 A ausência de correlação confiável

Ao contrário da APF — onde existe uma relação estatisticamente sustentável entre tamanho funcional e esforço —, a Engenharia de Prompt não apresenta correlação confiável com nenhuma métrica funcional disponível hoje.

Um único prompt pode demandar semanas de refinamento em domínios altamente especializados, enquanto outro para uso genérico fica pronto em horas
A complexidade do prompt é cognitiva, não estrutural — não há "linhas de código", elementos funcionais ou transações para contar
Variabilidade enorme: o mesmo tipo de prompt pode exigir 2 horas ou 2 meses dependendo do domínio, do modelo e dos critérios de qualidade
Os modelos mudam: um prompt finamente calibrado para GPT-4o pode exigir retrabalho significativo após atualização — sem que nada no sistema tenha mudado

⚠️ A ausência de correlação não é provisória — é estrutural. A natureza do esforço é fundamentalmente diferente do esforço de desenvolvimento de software tradicional.

Ato 3 · 3.2

3.2 O que existe hoje para estimar

Na ausência de padrão consolidado, o mercado recorre a cinco abordagens principais — cada uma com suas limitações:

T&M

Horas-especialista

USD 47–130/h para generalistas; USD 200–400/h para especialistas em agentes. A amplitude reflete a falta de padronização.

Ágil

Prompt Complexity Points

Adaptação de Story Points: simples / médio com CoT / complexo com RAG e multi-turn. Sem benchmarking de mercado suficiente.

Rigor

Baseado em Evals

Complexidade estimada pelo volume e sofisticação das suítes de avaliação necessárias para validar o comportamento do prompt.

Pesquisa

Modelos Paramétricos

Extensões do COCOMO para IA, incorporando volatilidade do modelo e grau de especialização do domínio. Ainda acadêmico.

Inovador

Output-based

Remuneração atrelada a melhoria mensurável: redução de alucinações, ganho de precisão. Difícil em contratos tradicionais.

💡 "Engenharia de Prompt bem conduzida pode entregar a mesma qualidade com redução de até 76% no custo de chamadas à API — mudando radicalmente o ROI do esforço."

Ato 3 · 3.3

3.3 O vazio nos frameworks de métricas

Nem IFPUG, nem NESMA, nem COSMIC-FFP publicaram, até o momento desta live, um guia oficial para medição de componentes de IA generativa em sistemas de software.

O SNAP (Software Non-Functional Assessment Process) do IFPUG cobre requisitos não-funcionais, mas não foi desenhado para este tipo de artefato.

∅

Estamos, literalmente, em terra sem mapa.

⚠️ "Contratos que usam APF como único instrumento de medição para sistemas com componentes de IA generativa estão comprando conflito futuro."

Enquete — "Como sua organização trata Engenharia de Prompt em contratos? A) Incluímos no PF · B) Orçamos separado · C) Não orçamos · D) Nem sabíamos"

O Campo de Batalha

"O que fazer enquanto o padrão não chega"

Contratos · Riscos · Caminhos Práticos

Ato 4 · 4.1 — Riscos para contratantes

4.1 Os riscos de ignorar o problema

Quando um contrato trata sistemas com componentes de IA generativa como software tradicional, os riscos se distribuem de forma diferente — mas os dois lados perdem.

Para contratantes

Pagar por funcionalidades que "funcionam tecnicamente" mas entregam outputs inadequados para o negócio — sem instrumento contratual para exigir correção
Contratos sem previsão de manutenção evolutiva de prompts conforme os modelos de IA são atualizados pelo provedor (OpenAI, Anthropic, Google)
Impossibilidade de fiscalização objetiva da qualidade de entrega — o auditor não consegue avaliar sem entender profundamente o domínio
Aceitação tácita de sistemas de IA cujos critérios de qualidade nunca foram formalmente definidos no contrato

⚠️ O problema não aparece na entrega técnica. Aparece quando o sistema entra em produção e o negócio percebe que o comportamento da IA é inadequado.

Ato 4 · 4.1 — Riscos para fornecedores

4.1 Os riscos de ignorar o problema continuação

Para fornecedores

Subestimação de esforço e erosão de margem em projetos onde o esforço de Engenharia de Prompt não foi precificado — a pressão por prazo força atalhos
Dificuldade em justificar retrabalho quando "o código não mudou" — mas o modelo base foi atualizado pelo provedor e os prompts pararam de funcionar adequadamente
Risco de responsabilidade por outputs inadequados de sistemas que não foram calibrados adequadamente por falta de escopo e tempo
Dependência de especialistas de domínio do cliente para validar qualidade — sem isso, o fornecedor não tem como saber se entregou bem

💬 "Os dois lados do contrato estão expostos. A diferença é que o fornecedor provavelmente vai absorver o custo silenciosamente e o contratante vai reclamar do resultado."

Ato 4 · 4.2

4.2 Caminhos práticos disponíveis hoje

Na ausência de padrão, contratos mais maduros estão adotando mecanismos complementares ao PF para endereçar a Engenharia de Prompt:

Descritivo de escopo explícito: nomear a Engenharia de Prompt como atividade apartada, com deliverables próprios — biblioteca de prompts versionada, racional de decisão e resultados de avaliação documentados
Anexo de serviços de IA: descrever modelos utilizados, critérios de qualidade esperados, processo de validação e responsabilidade por atualizações quando o modelo base mudar
Critérios de aceitação baseados em evals: taxas de precisão, volume de casos de teste, cenários cobertos — transforma o subjetivo em auditável e contratualmente exigível
Time & Material com revisão periódica: negociar componentes de IA em regime T&M com checkpoint de revisão após a fase exploratória inicial
Perfilamento do especialista: definir explicitamente o perfil e senioridade do Engenheiro de Prompt — isso afeta diretamente o custo e a qualidade entregue

Perguntas do chat — reservar 5–8 minutos

Ato 4 · 4.3

4.3 Para onde o mercado está caminhando

Frameworks de Evals

Estão se tornando a nova "documentação de requisitos" do mundo de LLMs — base para estimativas mais confiáveis e contratos mais auditáveis

Certificações

Certificações específicas em Prompt Engineering estão surgindo — criarão tabelas salariais e de remuneração mais estáveis e comparáveis

Extensões de APF para IA

IFPUG ou COSMIC devem publicar orientações nos próximos 2–3 anos. Discussões acadêmicas já em curso em conferências de métricas de software.

Custo de Tokens

Métrica objetiva que pode complementar — mas não substituir — a medição de esforço humano no desenvolvimento e manutenção de prompts

O Plot Twist

"A virada que muda tudo o que discutimos até agora"

Reflexão Final · Epistemologia · Valor

Ato 5 · O Plot Twist — 1/3

"A gente passou a live inteira falando sobre como medir Engenharia de Prompt. Mas o verdadeiro problema não é de medição. É de epistemologia."

"Pontos de Função funcionam porque existe consenso sobre o que conta. Existe um manual. Existe uma certificação. Existe um árbitro independente do domínio. Isso é o que torna o PF um instrumento confiável para contratos."

"Com prompts, o consenso não existe. A qualidade de um prompt é inseparável do contexto para o qual foi criado. O melhor prompt para diagnosticar cláusulas abusivas em contratos de telecomunicações não pode ser avaliado por ninguém que não entenda profundamente de contratos de telecomunicações."

Ato 5 · O Plot Twist — 2/3

"O Ponto de Função nasceu exatamente para resolver esse problema — medir software sem precisar entender o software. Ele deu ao cliente o poder de fiscalizar sem depender do fornecedor. Esse foi o seu grande valor político, não apenas técnico."

"A Engenharia de Prompt desfaz esse poder. Ela devolve a dependência de especialistas. Ela exige que cliente e fornecedor colaborem na validação de uma forma que a APF havia tornado dispensável."

"Isso não é necessariamente ruim — mas é uma mudança fundamental na relação contratual. Uma mudança para a qual a maioria dos contratos de TI não está preparada."

Ato 5 · O Plot Twist — 3/3

"Estamos prontos para abrir mão do conforto da métrica objetiva em nome de um produto de IA que realmente funcione?"

"Porque se você insistir em medir por PF aquilo que não pode ser medido por PF, você vai ter um contrato perfeito... e um sistema de IA que ninguém confia."

"A métrica não é o problema. O problema é acreditar que a métrica resolve o que só a colaboração e o entendimento de domínio podem resolver."

Encerramento

Levem essas perguntas
para os seus projetos:

Onde está documentada a Engenharia de Prompt neste sistema?

Quem é responsável pela qualidade dos prompts — e como ela é medida?

O que acontece quando o modelo base for atualizado?

O contrato prevê revisão de prompts como atividade contínua?

"Se você não souber responder, o projeto já tem um risco que não aparece em nenhum indicador."

IFPUG ISO 20926 NESMA ISO 24570 ISBSG SISP/TCU/CGU COSMIC-FFP COCOMO II · S-COST

Pontos de Funçãona Era dos Prompts

O que vamos cobrir hoje

O Mapa do Tesouro

1.1 O que é Ponto de Função?

ALI

AIE

EE

SE

CE

1.2 Indicadores de Produtividade

O Novo Personagem

2.1 O que é Engenharia de Prompt?

Zero-shot / Few-shot

Chain-of-Thought

RAG

System Prompts

Evals

Iteração

2.2 Quando prompts são parte da funcionalidade

2.3 Por que isso é um problema de escopo

A Lacuna

3.1 A ausência de correlação confiável

3.2 O que existe hoje para estimar

Horas-especialista

Prompt Complexity Points

Baseado em Evals

Modelos Paramétricos

Output-based

3.3 O vazio nos frameworks de métricas

O Campo de Batalha

4.1 Os riscos de ignorar o problema

4.1 Os riscos de ignorar o problema continuação

4.2 Caminhos práticos disponíveis hoje

4.3 Para onde o mercado está caminhando

Frameworks de Evals

Certificações

Extensões de APF para IA

Custo de Tokens

O Plot Twist

Levem essas perguntaspara os seus projetos:

Pontos de Função
na Era dos Prompts

Levem essas perguntas
para os seus projetos: