Entre a euforia e o cinismo: por que precisamos testar melhor as IAs
Entre o entusiasmo raso e o ceticismo preguiçoso, o jeito mais honesto de entender IA é testar melhor.
Por mais que eu me esforce pra fazer um conteúdo mais atemporal, esse texto pode ficar obsoleto a qualquer momento. Portanto, preste atenção no fato de que isso foi escrito em maio de 2026.
Quando o assunto é IA, eu vejo principalmente dois grandes argumentos:
- Não presta
- Vai substituir até o seu cachorro
Os dois parecem opostos, mas nascem do mesmo problema: essas pessoas não estão testando as ferramentas de IA de verdade antes de tirar uma conclusão definitiva.
De um lado, temos pessoas que abriram o ChatGPT uma vez, há um ano ou mais, fizeram uma pergunta vaga, receberam uma resposta genérica e concluíram que aquilo só falava bobagem. De outro, temos pessoas que assistiram a uma demonstração impressionante, ouviram promessas de produtividade infinita, viram o Claude navegando na internet ou gerando código, e concluíram que estamos a poucos meses de empresas inteiras operando sem humanos.
Porém pesquisas, benchmarks e estudos de produtividade mostram uma realidade bem mais "entediante" (deixo em aspas porque, pra quem realmente aprofunda no assunto, é tudo muito fascinante).
Eu vi isso acontecer de um jeito bem concreto quando comentei no Threads que dava para usar IA como apoio no imposto de renda. Não para delegar tudo cegamente, nem para substituir contador, mas para ajudar a organizar as coisas no último dia do prazo.
A reação veio rápido. Alguns contadores apareceram desesperados dizendo que aquilo ia dar merda. Alguns hobbystas tinham certeza de que ia gerar alerta pra malha fina. E o curioso é que, em muitos casos, a crítica não parecia vir de alguém que tinha testado de verdade, ou ao menos tentado, os limites da ferramenta. Parecia mais uma reação automática: se envolve IA em algo sério, então só pode ser irresponsável.
Só que, pouco depois, um amigo me mandou um trecho da declaração dele, feita por contador. Havia um erro ali, e o ChatGPT apontou com facilidade. Não estou dizendo que isso prova que IA substitui um profissional. Pelo contrário. O ponto é outro: uma ferramenta que ajuda a encontrar uma inconsistência, formular uma dúvida ou revisar um detalhe já pode ter valor, desde que exista método, contexto e revisão humana.
Essa diferença parece pequena, mas é central. Usar IA como apoio não é a mesma coisa que entregar uma decisão importante para ela. E muita discussão sobre IA ignora justamente esse meio do caminho.
O retrato da adoção real de inteligência artificial nas empresas
A IA já está sendo adotada em escala. A pesquisa The State of AI 2025, da McKinsey, aponta que 88% das organizações entrevistadas usam IA regularmente em pelo menos uma função de negócio. O AI Index 2025, de Stanford, também mostra uma aceleração importante: em 2024, 78% das organizações reportaram uso de IA, contra 55% no ano anterior.

Fonte: McKinsey, The State of AI 2025.
Ou seja: não dá mais para tratar IA como uma curiosidade de nicho, restrita a meia dúzia de pessoas no Twitter, no LinkedIn ou em comunidades de tecnologia. Ela já entrou em empresas, bancos, sistemas de atendimento, de saúde e muitos outros. A verdade é que provavelmente tem muito mais IA envolvida no seu dia a dia do que você desconfia.
Um detalhe da McKinsey me parece mais importante do que o número de adoção: 80% dos entrevistados dizem que suas empresas usam IA com objetivo de eficiência, mas as organizações que mais capturam valor costumam combinar eficiência com crescimento e inovação. Isso muda bastante a leitura. As empresas que tiram mais valor parecem olhar para IA menos como tesoura de custo e mais como uma forma de mexer na operação de verdade.
O caso da Klarna virou o exemplo símbolo disso: em 2024 a empresa se gabou de ter substituído cerca de 700 atendentes por IA; em 2026 voltou atrás e começou a recontratar, com o próprio CEO admitindo que focar só em eficiência e custo derrubou a qualidade do atendimento.

Depois de se gabar de um layoff gigantesco, a Klarna teve que voltar atrás.
Ou seja, o ganho real parece estar em testar ideias e mudar processos que antes ninguém tinha tempo de mexer, e não substituir departamentos inteiros. Muita empresa está usando IA. Pouca empresa sabe exatamente o que fazer com ela.
Nem só as empresas: os trabalhadores vivem o mesmo dilema
O mesmo vale para indivíduos. O Pew Research Center mostrou que uma parcela grande dos trabalhadores americanos raramente ou nunca usa chatbots de IA no trabalho e está verdadeiramente preocupada com seu futuro. Toda revolução tecnológica modifica o capitalismo e, quase sempre, redistribui oportunidades de um jeito doloroso para os trabalhadores. Mas, olhando com mais detalhe, em muitos casos a pressão competitiva não vem de uma IA abstrata tomando tudo de uma vez. Ela vem de gente e empresas aprendendo a incorporar essas ferramentas melhor no trabalho real.

Ser você é mais difícil que parece.
Essa mesma pesquisa da Pew Research mostra isso. Quase 80% dos que usam IA relataram alguma melhora na agilidade do trabalho, e um pequeno percentual até na qualidade. Mas isso é no curto prazo, e há uma parte que essa pesquisa não cobre.
Uma pessoa criativa, excelente em seu trabalho, pode se beneficiar ao automatizar partes mecânicas dele (como processar páginas e páginas de extratos de banco ou relatórios), enquanto ganha mais tempo pra estudar, praticar e melhorar o que realmente importa. E, com isso, ganhar qualidade.

Fonte: Pew Research Center.
Entre o entusiasmo raso e o ceticismo preguiçoso
Enquanto apenas cerca de 20% dos entrevistados alegam usar IA corriqueiramente, parece que absolutamente todo mundo já tem uma opinião formada sobre ela. E isso é no mínimo curioso (eu vejo isso na prática interagindo com pessoas diariamente, na verdade).
Acaba que muitas opiniões sobre IA ainda estão sendo formadas por pessoas que tiveram contato superficial com a tecnologia. E contato superficial com muita coisa já costuma gerar conclusões ruins. No caso de IA, é pior, pois é um conhecimento muito recente e que muda quase diariamente. Um prompt que funcionava ontem pode não funcionar hoje. E voltar a funcionar amanhã.
Eu falo isso de um lugar bem específico: eu testo IA todos os dias. Meu primeiro repositório público nesse caminho é de março de 2023, o Chat-With-Your-Docs, uma exploração de como integrar IA e documentos longos numa época em que as janelas de contexto ainda eram pequenas demais para simplesmente jogar um PDF inteiro na conversa e esperar o melhor. Desde então, meu GitHub virou um caderno de laboratório: MCPs próprios, skills, analisadores de vídeo, ferramentas de timeline e experimentos que às vezes viram produto, às vezes só servem para entender onde a ferramenta quebra.

A gigante acordou. Esse ano decidi deixar meus experimentos open-source.
Um dos estudos mais importantes que encontrei sobre o tema, How People Can Create - and Destroy - Value with Generative AI, conduzido com consultores do BCG e pesquisadores de Harvard, descreve a IA como uma tecnologia de "fronteira irregular". A ideia é simples: a IA pode melhorar muito o desempenho em algumas tarefas e piorar em outras. É cada vez mais importante entender quais são essas tarefas, entendendo melhor como as LLMs realmente funcionam.
E uma curiosidade interessante sobre esse estudo da BCG: ele é de 2023! Foi feito com o GPT-4. Se esse modelo já era capaz de diminuir o gap de conhecimento entre profissionais e produzir resultados de inovação muito fortes, imagine os modelos atuais. É a vez dos generalistas (spoiler do meu próximo artigo).

Fonte: BCG.
Liderar é encontrar onde a IA ajuda e onde ela atrapalha
E é por isso que testar e usar, com intenção, importa. Testar uma ferramenta não é abrir uma vez por semana e jogar qualquer pergunta lá. Testar IA de verdade é descobrir onde ela aumenta sua capacidade e onde ela cria risco. É comparar resultado com e sem IA. É medir tempo, qualidade, retrabalho, clareza, criatividade, consistência e erro. É entender em quais tarefas ela funciona como assistente, em quais funciona como acelerador, em quais funciona como copiloto e em quais ela simplesmente atrapalha.

Não seja esse tipo de CEO. Fonte: Instagram, @sindpdsp.
Para pessoas em cargo de liderança, isso é essencial; senão, o medo de não conhecer a ferramenta direito acarreta a proibição de uso no ambiente de trabalho e, por consequência, uma desvantagem competitiva clara. O diferencial está em líderes que testam junto, criam boas práticas e desenvolvem método, em vez de simplesmente mandar a equipe "usar IA".
Proibir IA por medo pode parecer prudência, mas muitas vezes é só ausência de estratégia. Entre o pânico e o oba-oba, existe trabalho de verdade: definir critérios de uso, boas práticas, revisão humana, proteção de dados e experimentos mensuráveis.

Fonte: McKinsey, The State of AI 2025.
Em dezembro de 2025, uma pesquisa da FGV/Sebrae/Google também indicou familiaridade crescente com IA em empresas de diferentes portes, mostrando que, mesmo entre os grupos com menor familiaridade, cerca de 87% das empresas já tinham algum contato com IA. Achei interessante que, nesse caso, os MEIs se saíram pior. Isso mostra que, sem lideranças focadas em entender e trazer essa tecnologia para o ambiente, o trabalhador individual pode acabar ficando pra trás, aumentando cada vez mais o gap de competitividade entre grandes, médias e pequenas empresas.

Fonte: FGV/Sebrae/Google.
Como não pular pra conclusões precipitadas
O primeiro passo é não recusar o debate.
Dados do IBGE/PINTEC mostram que o percentual de empresas industriais brasileiras com 100 ou mais pessoas ocupadas usando inteligência artificial subiu de 16,9% em 2022 para 41,9% em 2024.
Isso era em 2024, imagina hoje. Espero que cada vez mais tenhamos pesquisas nesse campo para confirmar, mas é razoável esperar que esse número tenha crescido. Portanto, quem se recusa a pelo menos abrir o debate sobre o assunto vai ficar pra trás.
O próximo passo é experimentação. Antes de dizer que IA não serve para nada, teste em tarefas diferentes. Não só perguntando curiosidades, mas aplicando em problemas reais: revisar um texto, analisar extratos contábeis, explicar um código, montar uma checklist... Pense no gargalo que você possui hoje. Gargalo real! Dica: hoje as LLMs são excelentes em interpretar imagens. Portanto, jogue um print no prompt e peça ajuda sobre o que for.
E antes de dizer que IA substitui uma equipe inteira, faça o mesmo teste em tarefas que exigem um grau maior de responsabilidade. Veja onde ela parece convincente, mas está errada. Acredite, LLMs são excelentes em parecer confiantes mesmo falando bobagem. Veja onde o custo de revisar é maior que o custo de fazer direto.
Depois documente. Sim, documente esse processo. Avalie principalmente em quais processos a IA ajudou e como. Como você modificou o processo para que ela se encaixasse melhor e produzisse melhores resultados. E se ela piorou, documente isso também e entenda quais conhecimentos seus e da sua equipe alavancam os resultados. Isso vai ser importante para você repetir os testes quando novos modelos forem lançados.

Minha primeira tentativa de documentar meus estudos, ainda em 2023. Esse Notion era compartilhado com meus amigos, mas só eu contribuía. Hoje mantenho um misto de Notion privado, meu GitHub (público) e este site, onde escrevo algumas pesquisas.
Repita os testes quando novos modelos forem lançados! Não adianta nada ter todo esse trabalho com o GPT-3 e nem testar o GPT-5. Por favor.

O famoso benchmark do Will Smith comendo spaghetti. Fonte: BBC Bitesize.
O futuro é incerto, mas o presente não precisa ser
As pessoas querem uma definição simples: IA presta ou não presta? Vai substituí-los ou não vai? Devo usar ou não?
A resposta mais honesta é: depende. Depende da tarefa, da pessoa, do contexto e do método de uso.
A melhor opção é testar, testar muito e de forma intencional. Analisar esses testes.
Se ainda não entendeu como usar de forma inteligente, vou deixar aqui um vídeo do Jeremy Utley, professor de criatividade em Stanford e especialista em uso prático de IA. Ele vai saber te convencer.
No mais, é isso: IA não é mágica, nem milagrosa. Mas fugir de entender como realmente funciona talvez seja uma das formas mais rápidas de ficar para trás.
Então fica meu desafio: escolhe um gargalo real seu dessa semana e testa a IA nele, tenta resolver o problema junto do Claude ou ChatGPT. Se você testar algo essa semana e descobrir um uso que funcionou (ou um que falhou feio), compartilha e me marca. Quero montar uma coletânea desses casos reais.
Se quiser testar comigo e participar da conversa (e ocasionalmente falar de games), me siga no Twitter e/ou no Threads =D