Día 2 · Panorama · 15 min

Inteligencia artificial aplicada a citogenética

Un panorama crítico antes de la práctica
Jueves 4 de junio

Dra. Yalbi I. Balderas-Martínez
LABBIC · INER

¿Qué veremos en este panorama?

  • Qué es la IA, el machine learning y las redes neuronales — desde cero
  • Para qué sirve la IA en citogenética — y para qué no
  • Tres familias de sistemas (comerciales y académicos)
  • Datos abiertos (Kuo et al.) que usaremos en la práctica
  • Cinco preguntas para evaluar un sistema con criterio

Nota

Es la base conceptual de la práctica del bloque A: aquí entendemos qué hace un modelo antes de ejecutarlo.

El punto de partida · el cariotipo

Para seguir el resto, cuatro términos base:

  • Cariotipo (karyotype): el conjunto ordenado de los cromosomas de una célula — 46 en humanos (22 pares autosómicos + XX o XY).
  • Metafase (metaphase): fase de la división celular en que los cromosomas están condensados y visibles al microscopio; es el momento en que se fotografían.
  • 24 clases: las categorías a las que pertenece cada cromosoma — del 1 al 22, X y Y.
  • ISCN: estándar internacional para nombrar cromosomas y variantes.

Cromosomas dispersos de una metafase que se ordenan en un cariotipo de 24 clases (1–22, X, Y)

¿Qué es la inteligencia artificial?

De lo general a lo específico:

  • Inteligencia artificial (IA): que una máquina haga tareas que asociamos con la inteligencia humana (reconocer, clasificar, decidir).
  • Aprendizaje automático (machine learning): en vez de programar reglas, la máquina aprende patrones a partir de ejemplos.
  • Aprendizaje profundo (deep learning): machine learning con redes neuronales de muchas capas.

Círculos concéntricos: IA contiene a Machine Learning, que contiene al Aprendizaje Profundo

¿Qué es una red neuronal?

  • Unidades llamadas neuronas, organizadas en capas y conectadas entre sí.
  • Cada conexión tiene un peso que se ajusta mostrando muchos ejemplos — eso es “entrenar”.
  • La información fluye: entrada → capas ocultas → salida.

Nota

No “entiende”: ajusta números para acertar en los ejemplos que vio.

Red neuronal con capa de entrada de 3 neuronas, capa oculta de 4 y salida de 2, todas conectadas

De la red neuronal a la CNN

Antes: reglas geométricas (medir longitud, centrómero). Ahora: el modelo aprende de imágenes etiquetadas.

Nota

  • CNN (red neuronal convolucional): red neuronal especializada en imágenes; detecta patrones locales y los combina —bordes → texturas → formas.
  • ViT (Vision Transformer): divide la imagen en parches y pondera la relación entre regiones; con datos suficientes suele superar a la CNN.

Una imagen de cromosoma procesada por capas (bordes, texturas, formas) que produce una probabilidad por clase; recuadro del Vision Transformer por parches

⚡ Check rápido · ¿qué cambió de los 70 a hoy?

En el chat de Zoom, una palabra:

¿Qué hace una CNN que las reglas geométricas de los 70 no podían hacer?

Tip

Respuestas esperadas: aprender, generalizar, patrones, datos, ejemplos. Si nadie escribe “aprende” o sinónimo, repasar 30 s la idea “regla fija vs aprende de datos” antes de avanzar.

Tres familias de sistemas

Sistema Origen Carácter
HiBand (ASI) Comercial Detección y emparejamiento con asistencia
Metafer + Ikaros (MetaSystems) Comercial Captura automatizada (Metafer) + cariotipado (Ikaros)
Karyotype AI Académico Vision Transformers4

Nota

Comerciales: integrados al equipo del laboratorio, “caja cerrada”, con soporte. Académicos: código y pesos abiertos, pero la infraestructura la montas tú.

Qué resuelve

  • Segmentar (segmentation): separar cada cromosoma del fondo y de sus vecinos.
  • Clasificar (classification): asignar cada cromosoma a una de las 24 clases (cuando la imagen es buena).
  • Acelerar el análisis: minutos en lugar de media hora.
  • Reducir la variabilidad entre observadores.

Izquierda: cromosomas separados del fondo con recuadros (segmentar). Derecha: cada cromosoma etiquetado con su clase, por ejemplo 7, 11 o X (clasificar)

Qué no resuelve

  • Cromosomas de morfología ambigua: derivados (reordenados estructuralmente) y marcadores (de origen incierto).
  • Imágenes de baja calidad (el rendimiento cae mucho).
  • Generalizar entre laboratorios con tinción o protocolos distintos.
  • La interpretación clínica final.

Advertencia

El juicio humano experto sigue siendo indispensable.

⚡ Check rápido · de las limitaciones, ¿cuál preocupa más en tu contexto?

En el chat de Zoom:

De las cuatro limitaciones que acabamos de ver, ¿cuál sería el mayor obstáculo en tu laboratorio o el de tu hospital?

Pueden escribir una palabra clave (derivados, calidad, generalización, interpretación) o una frase breve con el caso.

Tip

No hay respuesta única. El objetivo es que conecten lo abstracto con su realidad. Si alguien dice “todos los anteriores”, invitar a priorizar uno.

Datos abiertos

Kuo et al. (2023) — An Open Dataset of Annotated Metaphase Cell Images5

  • 5 000 imágenes de metafase anotadas (annotated: cada cromosoma trae su clase correcta → permite entrenar y evaluar).
  • + 2 000 anotaciones de cromosomas individuales.
  • Etiquetado a nivel de cromosoma (no de gen).
  • Licencia abierta · https://doi.org/10.7295/W9CIL54816

En el bloque A ejecutamos un YOLO11s que entrenamos sobre este dataset (publicado en el repo del curso, con métricas reproducibles).

Cinco preguntas para evaluar un sistema

  1. ¿Qué resuelve concretamente? (segmentación, clasificación, detección de anomalías)
  2. ¿Con qué población se entrenó? — riesgo de sesgo (bias) si la cohorte es homogénea.
  3. ¿Cómo se integra con el flujo del laboratorio?
  4. ¿Cuál es la trazabilidad? — poder reconstruir por qué decidió lo que decidió.
  5. ¿Tiene validación prospectiva (probado en casos nuevos reales) y marcado regulatorio?

Nota

Marcado regulatorio: FDA (EE.UU.), CE-IVD (Unión Europea, diagnóstico in vitro), COFEPRIS (México). No hay respuesta única: depende del contexto y la regulación aplicable.

🎯 Antes de pasar al código · ticket de salida

Tres preguntas rápidas. Respondan en el chat de Zoom — una a la vez, breve:

  1. ¿Cuántas clases citogenéticas tiene el dataset de Kuo? (escriban el número)
  2. ¿Qué pasa cuando aplicamos un modelo entrenado en un laboratorio a imágenes de otro? (una palabra: el concepto técnico)
  3. ¿Quién toma la decisión clínica final, el modelo o el humano? (una palabra)

Tip

Respuestas esperadas: (1) 24, (2) domain shift / generalización / falla, (3) humano. Si en las tres hay consenso en el chat, listos para el bloque A. Si alguna se queda en silencio o se reparte, pausamos 1 min para reforzar antes de seguir.

Recursos

  • Revisión general de IA en cariotipado ·2
  • Análisis automatizado de cariograma ·3
  • Dataset abierto de metafases ·5
  • Repo público con modelo entrenado y notebook · https://github.com/yalbibalderas/cng-2026-recursos
  • Karyotype AI (Vision Transformers) ·4
  • Nomenclatura estándar · ISCN 2024 ·1

Lo que sigue

Hasta aquí la parte conceptual.

A continuación, el bloque A: la práctica con un modelo de IA sobre el dataset de Kuo et al. Ponemos en código lo que acabamos de discutir.

Tip

Verifica que tu sesión de Posit Cloud y Google Colab estén funcionando antes de continuar.

1.
ISCN 2024: An International System for Human Cytogenomic Nomenclature. (Karger, Basel, 2024).
2.
Rosenblum, L. S., Holmes, J. & Taghiyev, A. F. The Emergence of Artificial Intelligence-Guided Karyotyping: A Review and Reflection. Genes 16, 685 (2025).
3.
Tabassum, S. et al. Automated karyogram analysis for early detection of genetic and neurodegenerative disorders. Frontiers in Computational Neuroscience 18, 1525895 (2025).
4.
Shamsi, Z. et al. Karyotype AI for Precision Oncology. (2025) doi:10.48550/arXiv.2211.14312.
5.
Inicio