Originalmente escrito por mim em dez/2014
Atualizado em mai/2018
"...é seguro seguir as orientações dos guidelines
sem checar os dados originais?"
Muito se tem debatido a respeito do rastreamento do câncer de
próstata nos últimos anos. Existe benefício verdadeiro? Se sim, quem se
beneficia? E os danos direto e indireto associados, é possível evita-los? O
fato é que as sociedades uro-oncológicas têm se posicionado, quando não contra, por realiza-lo somente após muitas considerações. O interessante é que ambas as
recomendações tem como substrato os mesmos estudos. J Antes de continuar, dê
uma olhada nas tabelas.
Mas será que é seguro seguir as orientações dos guidelines sem
nos dar o trabalho de checar os dados originais?
Você é meu convidado para ler esse texto e refletir um pouco sobre
o tema. Tentarei trazer uma visão geral do que temos disponível na literatura.
O raciocínio médico abandonou o dualismo e
incorporou o pensamento probabilístico. O médico não é
mais aquele mágico ou aquele alquimista da antiguidade. Somos bioestatísticos
cuidadores de pessoas. Quando falo "estatístico", me refiro à ideia
de incerteza que a palavra traz. Sem entrar em detalhes, (nem gerar polêmicas
filosóficas), gostaria que o leitor daqui pra frente passasse a pensar não mais
no "sim" ou "não", "cura" ou "morte",
"melhora" ou "piora", "oito" ou
"oitenta"... mas, sim, nas probabilidades do sim e do não, da cura e
da morte, da melhora e da piora, do benefício e do malefício.
Fechado esse acordo, vamos lá! J
Há não muito, uma colega clínica me clamou de um parente que
estava relutante em fazer o exame da Próstata. Apesar das suas longas
explicações e insistência, o indivíduo relutava em fazer o tal exame.
Perguntei sobre a presença ou não de fatores de risco para
câncer de próstata (CAP), e ela negou todos os conhecidos atualmente (idade,
história familiar, afrodescendência...). Tratava-se de um homem jovem, 45 anos,
que gozava de plena saúde. A colega então me perguntou o que ela poderia fazer
a mais para convencê-lo. Prontamente respondi: "Nada"! Ela me olhou
espantada e começamos a conversar sobre as evidências disponíveis a esse respeito...
Houve um grande impacto no meio urológico no ano de 2009 quando
um estudo americano publicado na renomada revista New England Journal of
Medicine, conhecido como PLCO (Prostate, Lung, Colorectal, and Ovarian - Cancer
Screening Trial), sugeriu que o screening populacional para detecção e
tratamento precoces do CAP não modificou o risco de morte ao longo
de 10 anos de seguimento. Coincidentemente ou não, um outro estudo, europeu, tão impactante quanto o anterior, publicado no mesmo número da mesma revista,
o ERSPC (European
Randomized Study of Screening for Prostate Cancer), mostrou redução de 21% na
mortalidade por câncer naquele grupo de pacientes que havia sido submetido ao
screening.
Em qual das evidências confiar? É essa análise que
faremos nas próximas linhas.
Durante a realização de um estudo científico, o autor elabora um Plano de Estudo. Plano de estudo nada mais é do que um
passo-a-passo que o autor deve seguir para aplicar a metodologia do seu projeto
na população-alvo ou em uma amostra dessa população. Ao implementar (ou executar)
o plano numa amostra da população-alvo, obtém-se os dados brutos que serão
trabalhados para gerar informação útil. Nem sempre os dados podem ser obtidos
conforme o planejado. Erros de implementação são extremamente comuns em estudos
clínicos complexos. Esses erros podem ser tanto aleatórios quanto sistemáticos
e muitos deles são fáceis de identificar se estivermos atentos durante a
leitura do trabalho científico.
Então, às Evidências... 👀
O PLCO, estudo
multicêntrico americano com 10 anos de seguimento, foi negativo para redução de
mortalidade por câncer de próstata no grupo rastreado. Nele, foram
seguidos 76.693 homens randomizados para realizar ou não o
screening sistemático para CAP. O maior problema desse trabalho foi a
grande perda de seguimento de 33% dos indivíduos (problema
comum de implementação), além de contaminação de 52% do grupo
controle com eventuais rastreamentos. Como comentado anteriormente, o
não cumprimento do planejamento é uma das origens mais comuns de vieses nos
estudos clínicos. A perda de seguimento, além de reduzir o poder estatístico,
gera um viés de aferição, já que nem todas as medidas do desfecho puderam ser
realizadas, e quando somada à contaminação (isto é, a não aplicação correta do
controle), aumenta a chance de erro tipo 2 (nesse caso
específico, pelo menos 52% dos pacientes do grupo controle haviam sido
submetidos a dosagem de PSA em algum momento, ou seja, fizeram screening).
O erro tipo 2 acontece quando se atribui desfechos semelhantes
entres os grupos comparados, quando haveria verdadeiramente uma diferença. Os
dados de seguimento de 13 anos do PLCO foram publicados em novembro de 2013 e
não houve mudança em relação aos dados de 10 anos, contudo a perda aumentou para 43%, reduzindo mais ainda o poder do estudo, desviando ainda mais o resultado na direção da hipótese
nula. A última atualização, publicada
recentemente em 2016 com 15 anos de seguimento, manteve o resultado negativo,
porém com piora da contaminação do grupo controle, 86%. Os autores
resolveram mudar o nome do grupo controle (originalmente sem screening) para grupo de Screening
Oportunístico. Talvez assim acreditam ter encontrado uma forma
novilinguística de amenizar a percepção do alto grau de contaminação. J
O ERSPC, (8 centros europeus), mostrou redução relativa de 21%
da mortalidade por CAP a favor do screening. Esse estudo,
com mais de 160.000 homens de
vários países europeus, foi projetado para obter poder de 80% para detectar
diferença de pelo menos 25% de mortalidade específica entre os grupos. O poder estatístico
de um estudo é derivado do tamanho da amostra e da predição da diferença que se
espera encontrar no desfecho entre os grupos estudados. Para uma dada significância, quanto maior o tamanho da amostra, maior o poder de detecção de diferenças, e maior o poder de generalização. Daí a importância da não perda de seguimento. A perda de seguimento
nesse estudo foi tolerável (< 10%) e houve baixa contaminação.
É interessante notar que a
cada atualização do ERSPC, o benefício do screening se manteve intacto, sendo de 15%,
22% e 21% de redução de mortalidade por câncer para 9, 11 e 13 anos
respectivamente, o que ilustra bem o comportamento do tumor e a necessidade de
tempo para observação do efeito do tratamento.
Ao final de 13 anos de
seguimento, o NNI (número de homens
necessário a triar para evitar 1 morte por câncer) foi de 781 e o NNT = 27. Isso equivale dizer que foi necessário
rastrear 781 homens para tratar 27 e evitar 1 morte.
Os números parecem muito
favoráveis, entretanto essas cifras foram alcançadas ás custas muitos
diagnósticos e tratamentos desnecessários. Estimou-se que cerca de 50% dos pacientes foram diagnosticados e
tratados desnecessariamente, além das muitas biópsias negativas realizadas.
L Além do mais, quantidade de diagnósticos de tumores de baixo grau foi alta, o que pode ter
contribuído para reduzir o efeito do screening.
Se observarmos os dados por centro (publicados como material suplementar),
na Finlândia (país que contribuiu com o maior número de pacientes), o screening
não levou à redução de mortalidade, enquanto que na Suécia e na Holanda
observaram-se os maiores benefícios. Essa inconsistência pode ser decorrente da
diferença do modelo e da frequência da triagem entre os países, além dos variados
graus de contaminação do grupo controle em cada centro.
Existem alguns outros estudos menores com resultados interessantes:
Em GOTEMBORG (Suécia) foi conduzido um interessante trabalho que randomizou
homens para realizar um screening organizado (seguindo um protocolo específico)
ou screening oportunístico (sem protocolo). Os dados desses dois grupos foram
comparados a uma coorte histórica local, seguida na era pré-PSA (1990-1994), para
os desfechos de mortalidade.
A coorte histórica (extraída de registro nacional na Suécia,
altamente acurado com apenas 3,7% de subnotificação) serviu de grupo controle, cujo
desfecho seria o esperado se não houvesse screening com PSA.
Comparado ao grupo histórico, o rastreamento oportunístico não
obteve redução de mortalidade. Já o grupo rastreado organizado, obteve redução relativa de 42% no risco de morte,
equivalendo a um NNI= 139 e NNT= 13,
porém à custa de importante overdiagnosis (a cada 11 rastreados, 1 era
diagnosticado desnecessariamente).
O NORRKOPING Trial, estudo também sueco, teve um poder
de 80% para detectar uma diferença de pelo menos 1% entre os grupos, contudo não
mostrou diferença nos desfechos de mortalidade. Vale frisar que nesse
estudo, houve grande probabilidade de contaminação no grupo controle (podemos
considera-lo então como screening oportunístico).
Um estudo canadense, o QUEBEC Trial, mostrou redução de 62% no
risco de morte no grupo screening em relação ao grupo controle. Entretanto,
algumas características do delineamento apontam alto risco de viés:
unicêntrico, randomização aberta e alto grau de crossover entre os grupos (apenas 23,6% dos indivíduos do grupo
screening fizeram o rastreamento e houve 7,3% de contaminação do grupo
controle). O paper do estudo não
publicou a tabela das características dos pacientes na Baseline e os
tratamentos realizados não foram padronizados.
A análise dos resultados foi feita per
protocol. Na análise per protocol
(por protocolo), os sujeitos que não cumprem adequadamente o protocolo em cada
grupo são excluídos. Isso, de certa forma “purifica” os dados, no entanto corre grande risco de
perda da randomização. Além disso, os sujeitos cumpridores do protocolo são os mais propensos
a se cuidarem e gozarem de melhor saúde. Há quem defenda que os estudos de
rastreamento são melhores conduzidos pela análise por protocolo, já que ela
possibilitaria uma medida direta e pura da aplicação do screening. Entretanto,
análise por protocolo pode levar a viés de seleção, elevando a probabilidade de erro
tipo 1. Em postagens futuras falarei da importância da análise por protocolo nos estudos PLCO e ERSPC. Será interessante, acho! J.
O erro tipo 1 acontece quando o
estudo mostra diferença entre os grupos quando na verdade essa diferença de
fato não existe. Se refizermos os cálculos do QUEBEC Trial (análise Post-Hoc
por intenção, e não por protocolo), observaremos uma queda no efeito do screening de 62% para apenas
20% na redução mortalidade por CAP. A análise por intenção utiliza todos os
participantes do grupo como denominador, não importando se houve cumprimento do protocolo
ou não. É uma análise voltada ao mundo prático, à intenção que se tem de se
aplicar algo na vida real, portanto mais realista. Podemos dizer que a análise
por protocolo nos fornece uma medida de eficácia (aplicação ideal da intervenção), enquanto a por intenção uma
medida de efetividade.
Por fim, o STOCKHOLM Study, também um estudo sueco (impressionante como os suecos adoram um rastreamento! 😊), acompanhou
durante 15 anos um total de 2.400 homens divididos para screening ou cuidados
usuais de saúde. Ao final, não encontraram evidência de redução de
mortalidade por CAP no grupo screening em relação ao controle.
Se você leu até aqui, parabéns! Você não é um daqueles que se contentam apenas com
o resumo da evidência no guideline... (ei, isso não é um elogio! 😊).
Ou, talvez, você seja apenas um humilde residente egresso de urologia buscando
desesperadamente estudar mais a fundo para a prova de título que se aproxima!
Aliás, sempre me perguntei, porque será que os caras usam tanto o rodapé do livro? 😕
Bom, a partir de agora, precisamos resumir esses dados.
Bom, a partir de agora, precisamos resumir esses dados.
Meta-análises...
Pelo menos 3 meta-análises desses estudos já foram feitas. A
mais polêmica delas (criadora de discórdias!), realizada pela USPSTF (US
Preventive Services TASK FOUCE), com base nos 6 ensaios citados, concluiu que o screening
populacional para CAP não reduz mortalidade pelo câncer, além de elevar o
número de diagnósticos e tratamentos desnecessários, e de repercutir
negativamente na qualidade de vida física e emocional do indivíduo e de sua
família.
As outras duas
meta-análises (da Cochrane com todos os estudos, exceto o Goteborg; e do British Medical Journal, que além dos trabalhos citados, incluiu o Subgrupo Francês do
ERSPC que não entrou na análise original), também não mostraram
benefício de mortalidade para os pacientes submetidos ao screening.
É preciso ressaltar que, em todas essas meta-analises, foram utilizados os dados de 9 anos de seguimento do ERSPC, nos quais, o benefício do rastreamento ainda não havia aparecido.
É preciso ressaltar que, em todas essas meta-analises, foram utilizados os dados de 9 anos de seguimento do ERSPC, nos quais, o benefício do rastreamento ainda não havia aparecido.
As meta-análises são
sínteses de dados agrupados. Cada estudo é uma unidade de análise, e seus
resultados são sintetizados em uma média ponderada geral. Na meta-análise, o pesquisador pode realizar uma análise de sensibilidade ou uma meta-regressão buscando explicar diferenças de efeitos "entre" os estudos mas, não há um
tratamento específico para os erros metodológicos e de implementação "dentro" de
cada estudo. Uma frase interessante utilizada pelos estatísticos é “em análise
de dados, se entra lixo sai lixo”. Pois, imagine o que não ocorre em uma meta-análise!
Diante de tantas informações inconsistentes, qual a melhor
evidência disponível? – ou, talvez, a menos pior? Fazer ou não fazer o
rastreamento? Como orientar meu paciente? Essas são algumas das questões que o
médico, interessado com a boa prática clínica, se faz.
A literatura médica fornece evidência para praticamente qualquer
coisa. Evidências fracas ou fortes, boas ou ruins. Temos que interpretá-las e
escolher a que melhor se encaixa na nossa realidade. Esse é o conceito de validade
externa.
A validade externa de uma evidência é interpretativa. Muitas
vezes subjetiva! Enquanto que a validade interna diz respeito ao grau de
severidade metodológica da aplicação e cumprimento do Plano de Estudo, a
validade externa é a possibilidade de extrapolação das conclusões do estudo
para a população-alvo envolvida. Em outras palavras, é a aplicabilidade na vida
real das evidências geradas pelo estudo.
Parece perigoso confiar na compilação da evidencia. Os estudos
possuem muitos erros de implementação e altíssimo risco de viés, o que ofusca a
confiabilidade da mensuração da eficácia do rastreamento. Acho imprudente
aconselhar contra o rastreamento (como fez o USPSTF nos últimos anos com base
nos resultados de sua meta-análise), até por que, o melhor trabalho (ERSPC)
teve resultado favorável. No entanto, pode-se argumentar que, diante da falta
de evidência, seria melhor ficar com a hipótese nula já que rastrear leva a
excessos de tratamentos e efeitos indesejados.
O leitor percebe como é difícil trabalhar com probabilidades?
Também não podemos simplesmente esperar o paciente ficar sintomático para então
buscarmos o câncer. Deixaremos de oferecê-lo a maior chance de cura. O
screening tem seu benefício e ficar simplesmente aguardando melhores evidências
para começar a fazê-lo não me parece uma boa estratégia. É pra você?
A ideia então é procurar combater
os danos do rastreamento. Reduzir de alguma forma o número de triados
falso-positivos, de biópsias desnecessárias, de sobrediagnósticos e de excesso
de tratamentos, sem deixar, entretanto de diagnosticar o que precisa.
Muitos trabalhos têm validado as chamadas calculadoras de risco
pré-biópsia (PCPT-RC, ERSPC-RC, CC-RC) documentando potencial redução de até
30% nas biópsias desnecessárias. Ao estimar melhor a probabilidade de câncer de
alto grau, as calculadoras ajudam na indicação da biópsia.
Mais recentemente, os estudos PROMIS (2017) e PRECISION (2018) analisaram
o papel da RNM multiparamétrica da próstata no cenário pré-biópsia durante
elevação do PSA e demonstraram redução de cerca 30% das biópsia desnecessárias,
além de diminuição do diagnóstico de tumores de baixo grau e aumento dos de alto
grau.
Considerando que 50% das biópsias são desnecessárias (negativas
ou baixo grau) quando utilizamos apenas PSA e EDR como parâmetros (dados do
ERSPC), o uso das calculadoras de risco seguido por RNM (com biópsia por fusão)
poderia reduzir esse número para 20% (dados do PRECISION, 2018), dessa forma
selecionaríamos melhor os pacientes que se beneficiam de um diagnóstico e
tratamento precoces.
É possível que um refinamento futuro da RNM para os casos de
PIRADS 3 e 4 reduza ainda mais os excessos (PIRADS 3 e 4 - versão 2 - são indicações atual de biópsia, mas com valores preditivos
de apenas 12% e 60% para CAP de alto grau, respectivamente).
Rastrear ou não Rastrear? Eis a Questão...
Enfim chegamos à reta final. Cansativo (reconheço!) e lamento
não ter chegado a uma conclusão definitiva. O que se segue é a opinião desse
autor (um pouco confuso, mas conformado, pois afinal não devo ser o único! J).
Depois de tantas discussões calorosas, troca de farpas entre as
sociedades médicas, e de várias análises post-hoc de equipes de estatísticos
dedicados (isso é sério, pretendo escrever algo sobre o estudo de Tsodikov et
al., 2017), podemos dividir o screening populacional para câncer de próstata em duas
modalidades: oportunístico e organizado.
O screening oportunístico
pode ser uma modalidade interessante. O paciente faz uma triagem eventual em
algum momento após os 50 anos e, sendo de baixo risco, poderia não entrar em
nenhum protocolo de seguimento. Ele se comportaria como os grupos controles dos
trabalhos, realizaria a triagem sob orientação do seu médico clínico ou em
alguma outra oportunidade numa consulta urológica. Nessa modalidade, não há campanha
governamental em massa com implementação de protocolos. Pode haver um incentivo
através de propaganda e o paciente vai ao médico se quiser. A solicitação da
biópsia é individualizada.
Já no screening
organizado, um protocolo de seguimento é instituído e os pacientes são
seguidos sistematicamente de forma a aumentar sua exposição ao rastreamento. A
indicação da biópsia é feita com base nos resultados de PSA (e seus derivados)
e toque e a decisão por realiza-la é tomada em conjunto com o paciente após
esclarecimento de potenciais danos e benefícios.
A diferença entre as modalidades é que o paciente do screening
oportunístico parece ter mais chance de já estar com doença metastática na
ocasião do diagnóstico e a desvantagem do screening organizado é a
possibilidade de excessos de diagnósticos e tratamentos de doença de baixo risco. Entretanto, esses
pacientes podem ser seguidos por vigilância ativa sem perda de sobrevida
conforme demonstrado no estudo PRIAS (2016), mas com a desvantagem de muitos deles sofrerem do efeito de rótulo (efeitos psicológicos decorrentes do conhecimento de albergar uma doença maligna).
Acredito que podemos otimizar o benefício se unirmos ambas as modalidades de triagem: rastreamento sistemático a partir dos 50 anos, com indicação individualizada da biopsia. Ainda advogo que é mandatório utilizar as calculadoras de
risco e a ressonância multiparamétrica como auxiliares da tomada de decisão
pré-biópsia, principalmente nos casos limítrofes (PSA entre 4 e 10, por exemplo).
O manejo do câncer de próstata é de certa forma uma arte! É
também o reino da incerteza (fazendo alusão ao grande Sir. William Osler), onde o monarca é a estatística e o
urologista desatento é o bobo da corte. No meio de tanta discussão, nós
urologistas temos por missão retomar nosso papel de príncipe e conduzir da
melhor forma o nosso povo. Não há regras rígidas. Há mapas, há probabilidades. Temos de saber
interpretá-las.
Referências:
1)
Andriole GL, et al. Prostate Cancer Screening in the
Randomized Prostate, Lung, Colorectal, and Ovarian Cancer Screening Trial:
Mortality Results after 13 Years of Follow-up. J
Natl Cancer Inst 2012;104:125–132
2)
Schroder FH, et al. Prostate-Cancer Mortality at 11 Years
of Follow-up.
N Engl J Med 366;11 march 15, 2012
3)
Schroder FH, Hugosson J, Roobol MJ et
al. Screening and prostate-cancer
mortality in a randomized European study. N Engl J Med 2009;
360: 1320–8
4)
Ilic D, O'Connor D, Green S, Wilt TJ. Screening for prostate cancer:
an updated Cochrane systematic review. BJU Int. 2011
Mar;107(6):882-91
5)
Hugosson J, et al. Mortality results from the
Göteborg randomised population-based prostate-cancerscreening trial. Lancet
Oncol. 2010 Aug;11(8):725-32
6)
Sandblom G, Varenhorst E, Rosell J, Löfman O, Carlsson
P. Randomised
prostate cancer screening trial: 20 year follow-up. BMJ. 2011
Mar 31;342
7)
Labrie F, et al. Screening decreases prostate
cancer mortality: 11-year follow-up of the 1988
Quebec prospective randomized controlled trial. Prostate. 2004
May 15;59(3):311-8
8)
Kjellman A, Akre O, Norming U, Törnblom M, Gustafsson
O. 15-year followup of
population based prostate cancer screening study. J Urol. 2009
Apr;181(4):1615-21
9) Chou R,et al. Screening for prostate cancer: a review of
the evidence for the U.S. Preventive ServicesTask Force. Ann
Intern Med. 2011 Dec 6;155(11):762-71
10) Tsodikov et al. Reconciling the
effects of screening on prostate cancer mortality in the ERSPC and PLCO trials. Ann Intern Med. 2017 October 03;
167(7): 449–455. doi:10.7326/M16-2586.
11) Ahmed et al. Diagnostic accuracy of
multi-parametric MRI and TRUS biopsy in prostate cancer (PROMIS): a paired
validating confi rmatory study.THE LANCET. January 19, 2017 http://dx.doi.org/10.1016/S0140-6736(16)32401-1
12) Kasivisvanathan
et al. MRI-Targeted or Standard Biopsy for Prostate-Cancer Diagnosis
(PRECISION). DOI: 10.1056/NEJMoa1801993
13) van den Bergh,
et al. Short-term outcomes of the prospective multicentre ‘Prostate Cancer
Research International: Active Surveillance’ study (PRIAS). JOURNAL
COMPILATION 2009 BJU INTERNATIONAL | 105,956–962 |
doi:10.1111/j.1464-410X.2009.08887.x