El proyecto de genómica global revela la complejidad del cáncer a una escala sin precedentes

Un esfuerzo internacional masivo ha dado lugar a estudios multifacéticos de más de 2.600 tumores de 38 tejidos, generando una gran cantidad de conocimientos sobre la base genética del cáncer.

La caracterización genómica completa de los tumores se convirtió en uno de los principales objetivos de los investigadores del cáncer tan pronto como se secuenció el primer genoma humano en 2001. Desde entonces, los avances en la tecnología de la secuenciación y las herramientas analíticas han permitido que este campo de investigación florezca. En seis artículos de este número de Nature, el Consorcio del Análisis Pancáncer de Genomas Enteros (PCAWG) presenta el meta-análisis más completo y ambicioso de los genomas del cáncer hasta ahora. A diferencia de los esfuerzos anteriores que se centraron en gran medida en las regiones codificadoras de proteínas del genoma del cáncer, el PCAWG analiza genomas enteros. Cada artículo examina un aspecto importante de la genética del cáncer; juntos, sus resultados serán clave para comprender toda la complejidad genética del cáncer.

Antes de analizar el impacto de estos análisis, es crucial destacar la enorme cantidad de datos y el complejo marco organizativo en el que se basa la labor del PCAWG. En el proyecto participó un grupo interdisciplinario de científicos de 4 continentes, con 744 afiliaciones entre ellos, que tuvieron que superar importantes desafíos técnicos, jurídicos y éticos para llevar a cabo análisis distribuidos, protegiendo al mismo tiempo los datos de los pacientes. Los investigadores se dividieron en 16 grupos de trabajo, cada uno de los cuales se centró en distintas facetas de la genómica del cáncer, como la evaluación de la reaparición de mutaciones, por ejemplo, o la inferencia de la evolución de los tumores.

En total, el consorcio realizó análisis integradores de 38 tipos de tumores. El grupo secuenció 2.658 genomas de cánceres completos (Fig. 1), junto con muestras coincidentes de células no cancerosas de los mismos individuos. Estos datos se complementaron con 1.188 transcriptomas, es decir, las secuencias y abundancias de transcripciones de ARN en un tumor.

Estos esfuerzos implicaron un amplio control de calidad y un procesamiento coordinado de datos, así como una validación experimental masiva y sistemática de los conductos computacionales utilizados para detectar las mutaciones. Se utilizaron muchos algoritmos computacionales y tuberías y se compararon en conjunto. Esto requirió cientos de terabytes de datos, repartidos en múltiples centros de datos, y probablemente millones de horas de procesamiento, todo ello facilitado por la computación en nube. En particular, los esfuerzos del PCAWG constituyen un ejemplo excelente de cómo la computación en nube puede hacer posible la colaboración internacional y ayudar a avanzar en los campos que requieren un gran volumen de datos.

El primero de los documentos actuales da una visión general de la amplitud y profundidad del conjunto de datos del PCAWG. El consorcio informa de que, en promedio, cada genoma canceroso lleva cuatro o cinco mutaciones conductoras, que proporcionan a las células cancerosas una ventaja selectiva. Sólo el 5% de los tumores estudiados no tenían aberraciones conductoras identificadas. En cambio, muchos cánceres presentaban características de catástrofes genómicas denominadas cromoplejía (17,8% de los tumores) y cromothripsis (22,3%), que provocan importantes cambios estructurales en el genoma.

Cada uno de los otros cinco trabajos profundiza en un aspecto diferente del conjunto de datos con más detalle. Por ejemplo, en el segundo documento, Rheinbay y otros se proponen identificar los factores genéticos del ADN no codificante. Se trata de una empresa ambiciosa, porque es mucho más difícil detectar con precisión las mutaciones en las regiones no codificantes que en las codificantes, o evaluar su recurrencia. Los autores utilizaron una cuidadosa modelización para excluir los artefactos e identificar sistemáticamente las mutaciones generadoras no codificantes.

Sus resultados ponen en duda los conductores no codificantes previamente informados, como los ARN no codificantes largos NEAT1 y MALAT1, pero también revelan otros nuevos. Por ejemplo, los autores informan de una mutación recurrente en una región no codificante del gen supresor de tumores clave TP53. También encontraron mutaciones relativamente frecuentes en regiones no codificantes del gen de la telomerasa TERT que dan lugar a la sobreexpresión de la enzima telomerasa (que ayuda a las células tumorales a dividirse de forma incontrolada), lo que refleja la alta prevalencia (12%) de las mutaciones de la telomerasa encontradas en un estudio pancanceroso anterior sobre tumores más avanzados (metastásicos). Aunque el estudio no pudo descartar la existencia de otros factores no codificantes, muestra de manera decisiva que este tipo de mutación no es común.

En los documentos tercero y cuarto, Alexandrov y otros y Li y otros se centran en las aberraciones genómicas llamadas firmas. Diferentes procesos, como los mecanismos defectuosos de reparación del ADN o la exposición a mutágenos ambientales, producen estos patrones característicos de aberraciones del ADN. Los grandes conjuntos de datos genómicos son cruciales si queremos refinar las firmas mutacionales conocidas y descubrir otras nuevas. Impresionantemente, entre ellos, Alexandrov y otros y Li y otros identifican 97 firmas. Esta ampliación de los trabajos anteriores abarca no sólo las firmas convencionales de un solo nucleótido, sino también las firmas que implican variantes de múltiples nucleótidos y pequeñas inserciones o supresiones de ADN.

En particular, Li y sus colegas se encuentran entre los primeros en descubrir firmas reproducibles que implican variantes estructurales (SV) -reordenamientos de grandes porciones del genoma. El proceso fue mucho más intrincado que el de la identificación de firmas mutacionales debido a la diversidad y complejidad de las SV.

Mediante una serie de pasos de subagrupación de mutaciones, los investigadores identificaron 16 firmas de SV, revelando, por ejemplo, un supuesto vínculo mecanicista entre dos SV, supresiones e inversiones recíprocas (la última de las cuales implica una inversión de la orientación de un segmento de ADN). También adquirieron conocimientos sobre las funciones de las 16 firmas en el cáncer. Se demostró que las mutaciones en ciertos genes reparadores de ADN se asociaban con firmas características del cáncer. Por ejemplo, el consorcio encontró que las mutaciones en el gen CDK12 se asocian con tramos en tándem de ADN duplicado, y que las variantes truncadas de la enzima reparadora de ADN MBD4 co-ocurren con una firma mutacional distintiva que involucra secuencias de ADN llamadas sitios CpG. En conjunto, estas nuevas firmas sientan las bases para comprender los mecanismos del desarrollo del cáncer, y el papel de las exposiciones mutagénicas en este proceso.

La idea de que el cáncer se desarrolla a través de un proceso evolutivo se presentó por primera vez en 1976. Desde entonces, la evolución del cáncer se ha caracterizado en términos de mutaciones aleatorias y selección natural. Una célula cancerosa que alberga una mutación que le confiere una alta aptitud prolifera rápidamente, convirtiéndose en el clon celular más prominente de la población. Este fenómeno, llamado barrido clonal, se produce en ciclos recurrentes durante el crecimiento del cáncer. La evolución del cáncer se estudia con mayor eficacia mediante la secuenciación de múltiples regiones de un tumor a lo largo del tiempo, pero también puede reconstruirse a partir de una sola biopsia, el enfoque adoptado por Gerstung y otros en el quinto trabajo.

Los autores introducen el concepto de “tiempo molecular” para clasificar las mutaciones clonales y subclonales. Razonaron que las mutaciones subclonales, que están presentes sólo en un subconjunto de las células de un tumor, deben haber surgido tarde en la evolución del cáncer. Clasifican las mutaciones clonales, que están presentes en todas las células de un tumor, como tempranas o tardías, dependiendo de si las mutaciones se produjeron antes o después de que el clon se sometiera a un aumento del número de copias (un aumento en el número de copias de un gen o región cromosómica). Los investigadores agregaron datos evolutivos de múltiples tumores, lo que les permitió identificar trayectorias mutacionales comunes como la progresión APC-KRAS-TP53, que describe la secuencia típica en la que surgen las mutaciones en el cáncer colorrectal.

Gerstung et al. descubrieron que las mutaciones conductoras que más comúnmente se producen en un determinado cáncer también tienden a ocurrir en las primeras etapas. Del mismo modo, si los aumentos de número de copias son muy recurrentes en un tipo de cáncer determinado, tienden a producirse en una fase temprana. Por ejemplo, el aumento del número de copias en parte del cromosoma 5 es común en el cáncer de riñón de células claras, y tiende a producirse en las primeras etapas de la evolución de la enfermedad. Por el contrario, la duplicación del genoma completo es un evento relativamente tardío en este cáncer. Finalmente, los investigadores encontraron que las firmas de las mutaciones cambian con el tiempo en al menos el 40% de los tumores. Estos cambios reflejan un papel cada vez menor de las exposiciones ambientales en la progresión de la enfermedad y un aumento en la frecuencia y gravedad de los defectos de reparación del ADN. En general, los hallazgos del grupo sugieren que las mutaciones conductoras pueden ocurrir años antes de que se diagnostique el cáncer, lo que tiene implicaciones para la detección temprana y el desarrollo de biomarcadores.

En el documento final, el Grupo Básico sobre Transcriptoma del PCAWG y sus colegas6 utilizaron las 1.188 muestras del PCAWG que habían coincidido con los datos del transcriptoma, para vincular funcionalmente las alteraciones del ADN y el ARN. El grupo encontró asociaciones entre cientos de mutaciones del ADN de un solo nucleótido y la expresión de genes cercanos. Sin embargo, las alteraciones de mayor número de copias fueron los principales impulsores de los cambios en la expresión de los genes en las células cancerosas. Las mutaciones también se asociaron con cambios en la estructura de la transcripción, como la formación de una nueva región codificadora de proteínas (un exón) dentro de una región no codificadora (un intrón).

Los autores también caracterizaron la frecuencia de las fusiones puente, un fenómeno en el que dos genes se fusionan debido a un tercer fragmento de ADN que interviene. Por último, aunque 87 de las 1.188 muestras analizadas no presentaban una alteración conductora a nivel del ADN, el grupo demostró que cada una de ellas presentaba una alteración a nivel del ARN. Juntos, estos conocimientos ilustran el poder de los análisis integrados de secuenciación de ARN y ADN para los estudios sobre el cáncer.

Estos seis trabajos, junto con otros que se están publicando en otros lugares (véase go.nature.com/3boajsm), representan un hito en la genómica del cáncer y de las nubes. Al centrarse en las inferencias, el PCAWG amplía con éxito una década de estudios de secuenciación del cáncer que se basaban en gran medida en observaciones. Cabe señalar que, si bien los análisis inferenciales ofrecen una mirada más profunda al cáncer que los estudios descriptivos, sus resultados también se asocian a un mayor grado de incertidumbre.

La amplia disponibilidad y la calidad del conjunto de datos del Grupo de Trabajo sobre Armas de Fuego y Explosivos estimulará casi con toda seguridad una ola de conocimientos biológicos y novedades metodológicas. La integración con otros conjuntos de datos genómicos funcionales, por ejemplo, el sondeo de la organización tridimensional del genoma, también proporcionará sin duda alguna una mayor comprensión de las causas y consecuencias de las aberraciones genéticas.

La mayor limitación de los estudios actuales es la falta de datos clínicos relativos a los resultados y tratamientos de los pacientes. Esos datos permitirían a los investigadores identificar los cambios genéticos que pueden predecir los resultados clínicos. Afortunadamente, se está llevando a cabo un proyecto denominado Consorcio Internacional del Genoma del Cáncer - Aceleración de la Investigación en Oncología Genómica (ICGC-ARGO) que creará un recurso de este tipo para más de 100.000 personas con cáncer.

En última instancia, el PCAWG reunió a miles de científicos, trabajando juntos para lograr sus objetivos. El impacto a largo plazo de estos esfuerzos no se limitará a las conclusiones publicadas hoy, sino que también provendrá de las colaboraciones que se han formado y los intercambios de conocimientos que han tenido lugar entre los miembros de este consorcio mundial de investigadores.

Fuente: Nature

Me ha dado cáncer al tratar de leerlo todo…

Talueeeee