Medicina Baseada em Evidências

Por Dr. Wanderley Marques Bernardo 
 

Há algum tempo escrevi sobre “o princípio da incerteza”, que está envolvido no dia a dia dos resultados que obtemos com nossos pacientes. Recentemente foi publicado uma crítica muito superficial à valorização indevida do valor do “p” nas tomadas de decisão¹, mas que chamou a atenção de muitos. 

Quando se comparam duas condutas, como duas medicações, operar ou não operar, dois procedimentos diferentes etc., se utiliza um determinado número de pacientes a serem estudados, que procure estimar um resultado que possa ser extrapolado para pacientes com as mesmas características em outros locais do mundo. Essa estimativa é usualmente sustentada por um cálculo da amostra, baseado também na estimativa (hipótese) de uma diferença que se espera obter nos resultados relacionados ao desfecho principal ou de interesse do pesquisador. No final do estudo essa diferença pode ou não estar presente. 

Como a amostra é só representativa da população, existe sempre a possibilidade de um erro no final do estudo, que se convencionou ser de 5% (erro tipo I). na presença de diferença, e de 20% na ausência de diferença (erro tipo II). Esses dois erros entram no cálculo amostral, permitindo que o número de pacientes a serem estudados possa ser representativo e, que o resultado obtido possa ser considerado provavelmente verdadeiro e reprodutível em outras populações, seja confirmando a hipótese, seja rejeitando-a. 

Entretanto, o uso principalmente do erro I ou “p” ou significância estatística, dissociado da ideia primordial de cálculo da amostra, é o primeiro uso indevido desse conceito. O segundo erro é considerar “p” maior ou “p” menor como sinal de resultado mais consistente ou menos consistente, pois não há erro maior ou menor, mas somente rejeitamos a hipótese ou não a rejeitamos. O terceiro erro é não considerar o intervalo de confiança de 95% - IC 95% (que nada mais é do que a variação estimada da diferença) como prioritário ao “p” na expressão da presença ou ausência de diferença nas comparações, o qual é muito mais útil para a prática médica. O quarto erro é não perceber que o conceito de significância estatística só vale para o desfecho que foi utilizado no cálculo da amostra, e que todos os demais desfechos, mesmo na vigência de “p” = 5%, podem não ter poder amostral para se sustentar em outras populações. O quinto erro é considerar que um “p” de 0,06 ou 6% traduz uma absoluta ausência da diferença entre as comparações, tornando-a geralmente a mais cara, ou mais nova que não queremos por ser desnecessária ou proibitiva. 

Mas, a ideia de se flexibilizar a interpretação dos resultados de um estudo, abrindo mão da “significância estatística” como um parâmetro rígido que separa o fazer do não fazer, o certo do errado ou o melhor do pior, é uma ameaça a todos aqueles que, mesmo sem conhecimento, buscam a certeza do “p” como forma de economizar ou de decidir o que fazer, ou de referendar o que pensa. 

Já usei, no início de minha caminhada pela evidência científica, de maneira indevida e radical, os resultados estatísticos da comparação entre duas ou mais condutas, motivado pela necessidade de responder, de oferecer soluções, de dar certeza para quem não pode aceitar alguém que não age assim. 

Mas já há algum tempo, motivado pela maturidade de traduzir a informação científica para a prática, enxergando o todo e equilibrando interesses, sei e ensino que existem inúmeros fatores interagindo em nosso grau de certeza, e a significância estatística, expressa pelo “p” apenas é um deles. Isto parece um pouco complexo e inaceitável, e o é, infelizmente a maioria escolhe o caminho mais fácil da incerta certeza que a diferença significativa oferece. 

Que outros elementos devem ser considerados ao tomar uma decisão dentro da assistência à saúde, repercutindo direta ou indiretamente nos pacientes, e no mesmo nível de consideração que o “p” = ou > 0,05 recebe? 

1. O risco de vieses do estudo – quanto maior o risco menor a certeza; 

2. A magnitude da diferença (efeito) – quanto maior, maior a certeza; 

3. A precisão da diferença (IC 95%) – quanto maior, maior a certeza; 

4. A prioridade – se a opção é importante ou única, a certeza é maior; 

5. A novidade – informações revolucionárias podem ter certeza maior; 

6. A aplicabilidade – se temos como reproduzir, a certeza de uso é maior; 

7. O desejo do paciente – compartilhar a decisão determina maior certeza; 

8. Economia – a conduta menos cara tende a conferir maior certeza;

9. O valor – que equilibra de dinâmica e individualmente os itens de 1 a 8. 

Soluções fáceis são sinônimo de conflitos entre os stakeholders, principalmente porque a probabilidade de erro estatístico, presente em uma comparação, só expressa uma pequena fração dos componentes necessários para a complexa missão de decidir onde uma pessoa, um trabalho, um número matemático mágico ou a probabilidade arbitrária de errar, não podem substituir o exercício do conhecimento e visão ampliados de todos os envolvidos na tomada de decisão, que preserva direitos, equilibra a dispensação de recursos e estabelece padrões elevados de gestão baseados em evidência e no valor. 

Referências incluídas
1. Baker M. Statisticians issue warning over misuse of P values. Nature 2016; 531(7593):151. doi: 10.1038/nature.2016.19503. PMID: 26961635.