Diário Urológico: dezembro 2014

Originalmente escrito por mim em dez/2014

Atualizado em mai/2018

"...é seguro seguir as orientações dos guidelines

sem checar os dados originais?"

Muito se tem debatido a respeito do rastreamento do câncer de próstata nos últimos anos. Existe benefício verdadeiro? Se sim, quem se beneficia? E os danos direto e indireto associados, é possível evita-los? O fato é que as sociedades uro-oncológicas têm se posicionado, quando não contra, por realiza-lo somente após muitas considerações. O interessante é que ambas as recomendações tem como substrato os mesmos estudos. J Antes de continuar, dê uma olhada nas tabelas.

Mas será que é seguro seguir as orientações dos guidelines sem nos dar o trabalho de checar os dados originais?

Você é meu convidado para ler esse texto e refletir um pouco sobre o tema. Tentarei trazer uma visão geral do que temos disponível na literatura.

O raciocínio médico abandonou o dualismo e incorporou o pensamento probabilístico. O médico não é mais aquele mágico ou aquele alquimista da antiguidade. Somos bioestatísticos cuidadores de pessoas. Quando falo "estatístico", me refiro à ideia de incerteza que a palavra traz. Sem entrar em detalhes, (nem gerar polêmicas filosóficas), gostaria que o leitor daqui pra frente passasse a pensar não mais no "sim" ou "não", "cura" ou "morte", "melhora" ou "piora", "oito" ou "oitenta"... mas, sim, nas probabilidades do sim e do não, da cura e da morte, da melhora e da piora, do benefício e do malefício.

Fechado esse acordo, vamos lá! J

Há não muito, uma colega clínica me clamou de um parente que estava relutante em fazer o exame da Próstata. Apesar das suas longas explicações e insistência, o indivíduo relutava em fazer o tal exame.

Perguntei sobre a presença ou não de fatores de risco para câncer de próstata (CAP), e ela negou todos os conhecidos atualmente (idade, história familiar, afrodescendência...). Tratava-se de um homem jovem, 45 anos, que gozava de plena saúde. A colega então me perguntou o que ela poderia fazer a mais para convencê-lo. Prontamente respondi: "Nada"! Ela me olhou espantada e começamos a conversar sobre as evidências disponíveis a esse respeito...

Houve um grande impacto no meio urológico no ano de 2009 quando um estudo americano publicado na renomada revista New England Journal of Medicine, conhecido como PLCO (Prostate, Lung, Colorectal, and Ovarian - Cancer Screening Trial), sugeriu que o screening populacional para detecção e tratamento precoces do CAP não modificou o risco de morte ao longo de 10 anos de seguimento. Coincidentemente ou não, um outro estudo, europeu, tão impactante quanto o anterior, publicado no mesmo número da mesma revista, o ERSPC (European Randomized Study of Screening for Prostate Cancer), mostrou redução de 21% na mortalidade por câncer naquele grupo de pacientes que havia sido submetido ao screening.

Em qual das evidências confiar? É essa análise que faremos nas próximas linhas.

Durante a realização de um estudo científico, o autor elabora um Plano de Estudo. Plano de estudo nada mais é do que um passo-a-passo que o autor deve seguir para aplicar a metodologia do seu projeto na população-alvo ou em uma amostra dessa população. Ao implementar (ou executar) o plano numa amostra da população-alvo, obtém-se os dados brutos que serão trabalhados para gerar informação útil. Nem sempre os dados podem ser obtidos conforme o planejado. Erros de implementação são extremamente comuns em estudos clínicos complexos. Esses erros podem ser tanto aleatórios quanto sistemáticos e muitos deles são fáceis de identificar se estivermos atentos durante a leitura do trabalho científico.

Então, às Evidências... 👀

O PLCO, estudo multicêntrico americano com 10 anos de seguimento, foi negativo para redução de mortalidade por câncer de próstata no grupo rastreado. Nele, foram seguidos 76.693 homens randomizados para realizar ou não o screening sistemático para CAP. O maior problema desse trabalho foi a grande perda de seguimento de 33% dos indivíduos (problema comum de implementação), além de contaminação de 52% do grupo controle com eventuais rastreamentos. Como comentado anteriormente, o não cumprimento do planejamento é uma das origens mais comuns de vieses nos estudos clínicos. A perda de seguimento, além de reduzir o poder estatístico, gera um viés de aferição, já que nem todas as medidas do desfecho puderam ser realizadas, e quando somada à contaminação (isto é, a não aplicação correta do controle), aumenta a chance de erro tipo 2 (nesse caso específico, pelo menos 52% dos pacientes do grupo controle haviam sido submetidos a dosagem de PSA em algum momento, ou seja, fizeram screening).

O erro tipo 2 acontece quando se atribui desfechos semelhantes entres os grupos comparados, quando haveria verdadeiramente uma diferença. Os dados de seguimento de 13 anos do PLCO foram publicados em novembro de 2013 e não houve mudança em relação aos dados de 10 anos, contudo a perda aumentou para 43%, reduzindo mais ainda o poder do estudo, desviando ainda mais o resultado na direção da hipótese nula. A última atualização, publicada recentemente em 2016 com 15 anos de seguimento, manteve o resultado negativo, porém com piora da contaminação do grupo controle, 86%. Os autores resolveram mudar o nome do grupo controle (originalmente sem screening) para grupo de Screening Oportunístico. Talvez assim acreditam ter encontrado uma forma novilinguística de amenizar a percepção do alto grau de contaminação. J

O ERSPC, (8 centros europeus), mostrou redução relativa de 21% da mortalidade por CAP a favor do screening. Esse estudo, com mais de 160.000 homens de vários países europeus, foi projetado para obter poder de 80% para detectar diferença de pelo menos 25% de mortalidade específica entre os grupos. O poder estatístico de um estudo é derivado do tamanho da amostra e da predição da diferença que se espera encontrar no desfecho entre os grupos estudados. Para uma dada significância, quanto maior o tamanho da amostra, maior o poder de detecção de diferenças, e maior o poder de generalização. Daí a importância da não perda de seguimento. A perda de seguimento nesse estudo foi tolerável (< 10%) e houve baixa contaminação.

É interessante notar que a cada atualização do ERSPC, o benefício do screening se manteve intacto, sendo de 15%, 22% e 21% de redução de mortalidade por câncer para 9, 11 e 13 anos respectivamente, o que ilustra bem o comportamento do tumor e a necessidade de tempo para observação do efeito do tratamento.

Ao final de 13 anos de seguimento, o NNI (número de homens necessário a triar para evitar 1 morte por câncer) foi de 781 e o NNT = 27. Isso equivale dizer que foi necessário rastrear 781 homens para tratar 27 e evitar 1 morte.

Os números parecem muito favoráveis, entretanto essas cifras foram alcançadas ás custas muitos diagnósticos e tratamentos desnecessários. Estimou-se que cerca de 50% dos pacientes foram diagnosticados e tratados desnecessariamente, além das muitas biópsias negativas realizadas. L Além do mais, quantidade de diagnósticos de tumores de baixo grau foi alta, o que pode ter contribuído para reduzir o efeito do screening.

Se observarmos os dados por centro (publicados como material suplementar), na Finlândia (país que contribuiu com o maior número de pacientes), o screening não levou à redução de mortalidade, enquanto que na Suécia e na Holanda observaram-se os maiores benefícios. Essa inconsistência pode ser decorrente da diferença do modelo e da frequência da triagem entre os países, além dos variados graus de contaminação do grupo controle em cada centro.

Existem alguns outros estudos menores com resultados interessantes:

Em GOTEMBORG (Suécia) foi conduzido um interessante trabalho que randomizou homens para realizar um screening organizado (seguindo um protocolo específico) ou screening oportunístico (sem protocolo). Os dados desses dois grupos foram comparados a uma coorte histórica local, seguida na era pré-PSA (1990-1994), para os desfechos de mortalidade.

A coorte histórica (extraída de registro nacional na Suécia, altamente acurado com apenas 3,7% de subnotificação) serviu de grupo controle, cujo desfecho seria o esperado se não houvesse screening com PSA.

Comparado ao grupo histórico, o rastreamento oportunístico não obteve redução de mortalidade. Já o grupo rastreado organizado, obteve redução relativa de 42% no risco de morte, equivalendo a um NNI= 139 e NNT= 13, porém à custa de importante overdiagnosis (a cada 11 rastreados, 1 era diagnosticado desnecessariamente).

O NORRKOPING Trial, estudo também sueco, teve um poder de 80% para detectar uma diferença de pelo menos 1% entre os grupos, contudo não mostrou diferença nos desfechos de mortalidade. Vale frisar que nesse estudo, houve grande probabilidade de contaminação no grupo controle (podemos considera-lo então como screening oportunístico).

Um estudo canadense, o QUEBEC Trial, mostrou redução de 62% no risco de morte no grupo screening em relação ao grupo controle. Entretanto, algumas características do delineamento apontam alto risco de viés: unicêntrico, randomização aberta e alto grau de crossover entre os grupos (apenas 23,6% dos indivíduos do grupo screening fizeram o rastreamento e houve 7,3% de contaminação do grupo controle). O paper do estudo não publicou a tabela das características dos pacientes na Baseline e os tratamentos realizados não foram padronizados.

A análise dos resultados foi feita per protocol. Na análise per protocol (por protocolo), os sujeitos que não cumprem adequadamente o protocolo em cada grupo são excluídos. Isso, de certa forma “purifica” os dados, no entanto corre grande risco de perda da randomização. Além disso, os sujeitos cumpridores do protocolo são os mais propensos a se cuidarem e gozarem de melhor saúde. Há quem defenda que os estudos de rastreamento são melhores conduzidos pela análise por protocolo, já que ela possibilitaria uma medida direta e pura da aplicação do screening. Entretanto, análise por protocolo pode levar a viés de seleção, elevando a probabilidade de erro tipo 1. Em postagens futuras falarei da importância da análise por protocolo nos estudos PLCO e ERSPC. Será interessante, acho! J.

O erro tipo 1 acontece quando o estudo mostra diferença entre os grupos quando na verdade essa diferença de fato não existe. Se refizermos os cálculos do QUEBEC Trial (análise Post-Hoc por intenção, e não por protocolo), observaremos uma queda no efeito do screening de 62% para apenas 20% na redução mortalidade por CAP. A análise por intenção utiliza todos os participantes do grupo como denominador, não importando se houve cumprimento do protocolo ou não. É uma análise voltada ao mundo prático, à intenção que se tem de se aplicar algo na vida real, portanto mais realista. Podemos dizer que a análise por protocolo nos fornece uma medida de eficácia (aplicação ideal da intervenção), enquanto a por intenção uma medida de efetividade.

Por fim, o STOCKHOLM Study, também um estudo sueco (impressionante como os suecos adoram um rastreamento! 😊), acompanhou durante 15 anos um total de 2.400 homens divididos para screening ou cuidados usuais de saúde. Ao final, não encontraram evidência de redução de mortalidade por CAP no grupo screening em relação ao controle.

Se você leu até aqui, parabéns! Você não é um daqueles que se contentam apenas com o resumo da evidência no guideline... (ei, isso não é um elogio! 😊). Ou, talvez, você seja apenas um humilde residente egresso de urologia buscando desesperadamente estudar mais a fundo para a prova de título que se aproxima! Aliás, sempre me perguntei, porque será que os caras usam tanto o rodapé do livro? 😕
Bom, a partir de agora, precisamos resumir esses dados.

Meta-análises...

Pelo menos 3 meta-análises desses estudos já foram feitas. A mais polêmica delas (criadora de discórdias!), realizada pela USPSTF (US Preventive Services TASK FOUCE), com base nos 6 ensaios citados, concluiu que o screening populacional para CAP não reduz mortalidade pelo câncer, além de elevar o número de diagnósticos e tratamentos desnecessários, e de repercutir negativamente na qualidade de vida física e emocional do indivíduo e de sua família.

As outras duas meta-análises (da Cochrane com todos os estudos, exceto o Goteborg; e do British Medical Journal, que além dos trabalhos citados, incluiu o Subgrupo Francês do ERSPC que não entrou na análise original), também não mostraram benefício de mortalidade para os pacientes submetidos ao screening.
É preciso ressaltar que, em todas essas meta-analises, foram utilizados os dados de 9 anos de seguimento do ERSPC, nos quais, o benefício do rastreamento ainda não havia aparecido.

As meta-análises são sínteses de dados agrupados. Cada estudo é uma unidade de análise, e seus resultados são sintetizados em uma média ponderada geral. Na meta-análise, o pesquisador pode realizar uma análise de sensibilidade ou uma meta-regressão buscando explicar diferenças de efeitos "entre" os estudos mas, não há um tratamento específico para os erros metodológicos e de implementação "dentro" de cada estudo. Uma frase interessante utilizada pelos estatísticos é “em análise de dados, se entra lixo sai lixo”. Pois, imagine o que não ocorre em uma meta-análise!

Diante de tantas informações inconsistentes, qual a melhor evidência disponível? – ou, talvez, a menos pior? Fazer ou não fazer o rastreamento? Como orientar meu paciente? Essas são algumas das questões que o médico, interessado com a boa prática clínica, se faz.

A literatura médica fornece evidência para praticamente qualquer coisa. Evidências fracas ou fortes, boas ou ruins. Temos que interpretá-las e escolher a que melhor se encaixa na nossa realidade. Esse é o conceito de validade externa.

A validade externa de uma evidência é interpretativa. Muitas vezes subjetiva! Enquanto que a validade interna diz respeito ao grau de severidade metodológica da aplicação e cumprimento do Plano de Estudo, a validade externa é a possibilidade de extrapolação das conclusões do estudo para a população-alvo envolvida. Em outras palavras, é a aplicabilidade na vida real das evidências geradas pelo estudo.

Parece perigoso confiar na compilação da evidencia. Os estudos possuem muitos erros de implementação e altíssimo risco de viés, o que ofusca a confiabilidade da mensuração da eficácia do rastreamento. Acho imprudente aconselhar contra o rastreamento (como fez o USPSTF nos últimos anos com base nos resultados de sua meta-análise), até por que, o melhor trabalho (ERSPC) teve resultado favorável. No entanto, pode-se argumentar que, diante da falta de evidência, seria melhor ficar com a hipótese nula já que rastrear leva a excessos de tratamentos e efeitos indesejados.

O leitor percebe como é difícil trabalhar com probabilidades? Também não podemos simplesmente esperar o paciente ficar sintomático para então buscarmos o câncer. Deixaremos de oferecê-lo a maior chance de cura. O screening tem seu benefício e ficar simplesmente aguardando melhores evidências para começar a fazê-lo não me parece uma boa estratégia. É pra você?

A ideia então é procurar combater os danos do rastreamento. Reduzir de alguma forma o número de triados falso-positivos, de biópsias desnecessárias, de sobrediagnósticos e de excesso de tratamentos, sem deixar, entretanto de diagnosticar o que precisa.

Muitos trabalhos têm validado as chamadas calculadoras de risco pré-biópsia (PCPT-RC, ERSPC-RC, CC-RC) documentando potencial redução de até 30% nas biópsias desnecessárias. Ao estimar melhor a probabilidade de câncer de alto grau, as calculadoras ajudam na indicação da biópsia.

Mais recentemente, os estudos PROMIS (2017) e PRECISION (2018) analisaram o papel da RNM multiparamétrica da próstata no cenário pré-biópsia durante elevação do PSA e demonstraram redução de cerca 30% das biópsia desnecessárias, além de diminuição do diagnóstico de tumores de baixo grau e aumento dos de alto grau.

Considerando que 50% das biópsias são desnecessárias (negativas ou baixo grau) quando utilizamos apenas PSA e EDR como parâmetros (dados do ERSPC), o uso das calculadoras de risco seguido por RNM (com biópsia por fusão) poderia reduzir esse número para 20% (dados do PRECISION, 2018), dessa forma selecionaríamos melhor os pacientes que se beneficiam de um diagnóstico e tratamento precoces.

É possível que um refinamento futuro da RNM para os casos de PIRADS 3 e 4 reduza ainda mais os excessos (PIRADS 3 e 4 - versão 2 - são indicações atual de biópsia, mas com valores preditivos de apenas 12% e 60% para CAP de alto grau, respectivamente).

Rastrear ou não Rastrear? Eis a Questão...

Enfim chegamos à reta final. Cansativo (reconheço!) e lamento não ter chegado a uma conclusão definitiva. O que se segue é a opinião desse autor (um pouco confuso, mas conformado, pois afinal não devo ser o único! J).

Depois de tantas discussões calorosas, troca de farpas entre as sociedades médicas, e de várias análises post-hoc de equipes de estatísticos dedicados (isso é sério, pretendo escrever algo sobre o estudo de Tsodikov et al., 2017), podemos dividir o screening populacional para câncer de próstata em duas modalidades: oportunístico e organizado.

O screening oportunístico pode ser uma modalidade interessante. O paciente faz uma triagem eventual em algum momento após os 50 anos e, sendo de baixo risco, poderia não entrar em nenhum protocolo de seguimento. Ele se comportaria como os grupos controles dos trabalhos, realizaria a triagem sob orientação do seu médico clínico ou em alguma outra oportunidade numa consulta urológica. Nessa modalidade, não há campanha governamental em massa com implementação de protocolos. Pode haver um incentivo através de propaganda e o paciente vai ao médico se quiser. A solicitação da biópsia é individualizada.

Já no screening organizado, um protocolo de seguimento é instituído e os pacientes são seguidos sistematicamente de forma a aumentar sua exposição ao rastreamento. A indicação da biópsia é feita com base nos resultados de PSA (e seus derivados) e toque e a decisão por realiza-la é tomada em conjunto com o paciente após esclarecimento de potenciais danos e benefícios.

A diferença entre as modalidades é que o paciente do screening oportunístico parece ter mais chance de já estar com doença metastática na ocasião do diagnóstico e a desvantagem do screening organizado é a possibilidade de excessos de diagnósticos e tratamentos de doença de baixo risco. Entretanto, esses pacientes podem ser seguidos por vigilância ativa sem perda de sobrevida conforme demonstrado no estudo PRIAS (2016), mas com a desvantagem de muitos deles sofrerem do efeito de rótulo (efeitos psicológicos decorrentes do conhecimento de albergar uma doença maligna).

Acredito que podemos otimizar o benefício se unirmos ambas as modalidades de triagem: rastreamento sistemático a partir dos 50 anos, com indicação individualizada da biopsia. Ainda advogo que é mandatório utilizar as calculadoras de risco e a ressonância multiparamétrica como auxiliares da tomada de decisão pré-biópsia, principalmente nos casos limítrofes (PSA entre 4 e 10, por exemplo).

O manejo do câncer de próstata é de certa forma uma arte! É também o reino da incerteza (fazendo alusão ao grande Sir. William Osler), onde o monarca é a estatística e o urologista desatento é o bobo da corte. No meio de tanta discussão, nós urologistas temos por missão retomar nosso papel de príncipe e conduzir da melhor forma o nosso povo. Não há regras rígidas. Há mapas, há probabilidades. Temos de saber interpretá-las.

Referências:

1) Andriole GL, et al. Prostate Cancer Screening in the Randomized Prostate, Lung, Colorectal, and Ovarian Cancer Screening Trial: Mortality Results after 13 Years of Follow-up. J Natl Cancer Inst 2012;104:125–132

2) Schroder FH, et al. Prostate-Cancer Mortality at 11 Years of Follow-up. N Engl J Med 366;11 march 15, 2012

3) Schroder FH, Hugosson J, Roobol MJ et al. Screening and prostate-cancer mortality in a randomized European study. N Engl J Med 2009; 360: 1320–8

4) Ilic D, O'Connor D, Green S, Wilt TJ. Screening for prostate cancer: an updated Cochrane systematic review. BJU Int. 2011 Mar;107(6):882-91

5) Hugosson J, et al. Mortality results from the Göteborg randomised population-based prostate-cancerscreening trial. Lancet Oncol. 2010 Aug;11(8):725-32

6) Sandblom G, Varenhorst E, Rosell J, Löfman O, Carlsson P. Randomised prostate cancer screening trial: 20 year follow-up. BMJ. 2011 Mar 31;342

7) Labrie F, et al. Screening decreases prostate cancer mortality: 11-year follow-up of the 1988 Quebec prospective randomized controlled trial. Prostate. 2004 May 15;59(3):311-8

8) Kjellman A, Akre O, Norming U, Törnblom M, Gustafsson O. 15-year followup of population based prostate cancer screening study. J Urol. 2009 Apr;181(4):1615-21

9) Chou R,et al. Screening for prostate cancer: a review of the evidence for the U.S. Preventive ServicesTask Force. Ann Intern Med. 2011 Dec 6;155(11):762-71

10) Tsodikov et al. Reconciling the effects of screening on prostate cancer mortality in the ERSPC and PLCO trials. Ann Intern Med. 2017 October 03; 167(7): 449–455. doi:10.7326/M16-2586.

11) Ahmed et al. Diagnostic accuracy of multi-parametric MRI and TRUS biopsy in prostate cancer (PROMIS): a paired validating confi rmatory study.THE LANCET. January 19, 2017 http://dx.doi.org/10.1016/S0140-6736(16)32401-1

12) Kasivisvanathan et al. MRI-Targeted or Standard Biopsy for Prostate-Cancer Diagnosis (PRECISION). DOI: 10.1056/NEJMoa1801993

13) van den Bergh, et al. Short-term outcomes of the prospective multicentre ‘Prostate Cancer Research International: Active Surveillance’ study (PRIAS). JOURNAL COMPILATION 2009 BJU INTERNATIONAL | 105,956–962 | doi:10.1111/j.1464-410X.2009.08887.x

Diário Urológico

Translate

segunda-feira, 22 de dezembro de 2014

Rastreamento Para o Câncer de Próstata: Fazer ou não Fazer?