Día 2 · Panorama · 15 min
Inteligencia artificial aplicada a citogenética
Un panorama crítico antes de la práctica
Jueves 4 de junio
Dra. Yalbi I. Balderas-Martínez
LABBIC · INER

Nota
Es la base conceptual de la práctica del bloque A: aquí entendemos qué hace un modelo antes de ejecutarlo.
Para seguir el resto, cuatro términos base:
ISCN 2024 ·1
De lo general a lo específico:
Nota
No “entiende”: ajusta números para acertar en los ejemplos que vio.
Antes: reglas geométricas (medir longitud, centrómero). Ahora: el modelo aprende de imágenes etiquetadas.
Nota
En el chat de Zoom, una palabra:
¿Qué hace una CNN que las reglas geométricas de los 70 no podían hacer?
Tip
Respuestas esperadas: aprender, generalizar, patrones, datos, ejemplos. Si nadie escribe “aprende” o sinónimo, repasar 30 s la idea “regla fija vs aprende de datos” antes de avanzar.
| Sistema | Origen | Carácter |
|---|---|---|
| HiBand (ASI) | Comercial | Detección y emparejamiento con asistencia |
| Metafer + Ikaros (MetaSystems) | Comercial | Captura automatizada (Metafer) + cariotipado (Ikaros) |
| Karyotype AI | Académico | Vision Transformers4 |
Nota
Comerciales: integrados al equipo del laboratorio, “caja cerrada”, con soporte. Académicos: código y pesos abiertos, pero la infraestructura la montas tú.
Advertencia
El juicio humano experto sigue siendo indispensable.
En el chat de Zoom:
De las cuatro limitaciones que acabamos de ver, ¿cuál sería el mayor obstáculo en tu laboratorio o el de tu hospital?
Pueden escribir una palabra clave (derivados, calidad, generalización, interpretación) o una frase breve con el caso.
Tip
No hay respuesta única. El objetivo es que conecten lo abstracto con su realidad. Si alguien dice “todos los anteriores”, invitar a priorizar uno.
Kuo et al. (2023) — An Open Dataset of Annotated Metaphase Cell Images5
En el bloque A ejecutamos un YOLO11s que entrenamos sobre este dataset (publicado en el repo del curso, con métricas reproducibles).
Nota
Marcado regulatorio: FDA (EE.UU.), CE-IVD (Unión Europea, diagnóstico in vitro), COFEPRIS (México). No hay respuesta única: depende del contexto y la regulación aplicable.
Tres preguntas rápidas. Respondan en el chat de Zoom — una a la vez, breve:
Tip
Respuestas esperadas: (1) 24, (2) domain shift / generalización / falla, (3) humano. Si en las tres hay consenso en el chat, listos para el bloque A. Si alguna se queda en silencio o se reparte, pausamos 1 min para reforzar antes de seguir.
La práctica del bloque A retoma estos contenidos sobre el dataset abierto.
Hasta aquí la parte conceptual.
A continuación, el bloque A: la práctica con un modelo de IA sobre el dataset de Kuo et al. Ponemos en código lo que acabamos de discutir.
Tip
Verifica que tu sesión de Posit Cloud y Google Colab estén funcionando antes de continuar.

Curso pre-congreso CNG 2026 · Bioinformática · LABBIC-INER