Recursos extras · práctica con código
Recursos extras / faltantes
La práctica de Posit Cloud y R que veremos en video
Complemento de los bloques B y C
Dra. Yalbi I. Balderas-Martínez
Ing. Luis Alberto Meza Cova
LABBIC · INER

Durante la sesión en vivo, el servicio de Ensembl/biomaRt no estuvo disponible, así que la práctica con código de los bloques B y C quedó pendiente.
Aquí la reunimos completa para explicarla en videos: el setup de Posit Cloud, las consultas con biomaRt, GenomicRanges y karyoploteR, y el flujo del gen humano al ortólogo en ratón con IMPC.
Nota
Los conceptos (Human Cell Atlas, CELLxGENE, Mouse Cell Atlas, ortología, las 3R) se vieron en vivo; aquí está solo la parte práctica que faltó.
Antes de cualquier práctica: dejar el entorno de R / Bioconductor funcionando en la nube.
A continuación, el paso a paso para abrir el proyecto y verificar que biomaRt carga.
La práctica de Yalbi: del cariotipo al detalle de los genes de una región, con código reproducible.
De la vista del cariotipo completo bajamos al detalle: ¿qué genes contiene una región?
Lo que se hace clic por clic, lo automatizamos.
Los tres son de Bioconductor (software libre, revisado por pares, para genómica en R).
| Paquete | Qué hace · para qué | Quién lo creó |
|---|---|---|
biomaRt |
Trae datos de Ensembl con código: genes, coordenadas, ortólogos | Durinck et al., 20051 |
GenomicRanges |
Representa y opera regiones del genoma | Lawrence et al., 20132 |
karyoploteR |
Dibuja datos sobre el cariotipo (ideograma) | Gel & Serra, 20173 |
Nota
Ensembl: base de datos pública de genomas. GenomicRanges es tan central que cientos de paquetes de Bioconductor lo usan como cimiento.
Un mart es un catálogo consultable de Ensembl; aquí, el de genes humanos.
| Atributo | Devuelve |
|---|---|
hgnc_symbol |
Símbolo del gen |
ensembl_gene_id |
ID Ensembl |
entrezgene_id |
ID NCBI |
gene_biotype |
Codificante, lncRNA, pseudogén |
description |
Descripción funcional |
go_id, name_1006 |
Términos GO |
listAttributes(mart) lista todos los disponibles.
Representación estándar de regiones del genoma en Bioconductor.
Nota
Pieza central del análisis genómico en R. Se integra con rtracklayer, Biostrings, VariantAnnotation, etc.
Dibuja datos sobre el ideograma (el dibujo del cariotipo con sus bandas).
Tip
Funciones específicas para densidades, heatmaps, líneas, puntos: kpHeatmap, kpDensity, kpLines, kpPoints.
Lo que en el navegador (CELLxGENE) haces a mano, en R lo automatizas — igual que biomaRt.
Nota
Census: API (TileDB-SOMA) para traer el corpus de CELLxGENE a R o Python. Misma idea que biomaRt con Ensembl: pedir datos con código, reproducible.
Posit Cloud = RStudio en el navegador. Corres el notebook del bloque sustituyendo tus coordenadas; los chunks ya están escritos.
| Sección del notebook | Qué hace |
|---|---|
| 1. Setup | Carga los paquetes (ya instalados) |
| 2. Variables | Pones tu cromosoma y coordenadas |
3. Genes · biomaRt |
Genes de la región + filtrar codificantes |
4. GenomicRanges |
Tamaño de la región y solapamientos |
5. karyoploteR |
Dibuja la región y los genes en el cariotipo |
| 6. (Opcional) Expresión | HCA/CELLxGENE: ¿en qué células? |
| 7. Guardar | mis_genes.rds → insumo del bloque C |
Nota
Lo nuevo del ejercicio es sustituir las coordenadas y leer la tabla; el código ya está hecho. Al final, guarda mis_genes.rds (lo usa el bloque C).
Cada quien toma su variante del tablero de Miro y, en su notebook:
Nota
El notebook tiene los chunks pre-armados. Sustituyen las coordenadas y revisan el resultado.
Continuación del ejercicio 1:
Tip
Al terminar, guarda mis_genes.rds: es el insumo de la práctica del bloque C.
La práctica de Meza: del gen humano a su ortólogo en ratón y su fenotipo, con código.
biomaRtNota
one2one, one2many, many2many; vacío = sin ortólogo identificable.
Pedimos la info del IMPC con una API: forma estándar de pedir datos a un servicio web. REST = la petición va por una URL; JSON = el formato de texto en que responde (fácil de procesar en R).
Nota
Mismos campos que en la web del IMPC: mp_term_name (el fenotipo: rasgo o anomalía observable) y p_value (< 1e-4 = efecto real, no azar).
mis_genes.rds)Nota
La tabla integrada y la lista priorizada (con sus tres categorías y las 3R) se explicaron en vivo en el bloque C; aquí produces esa tabla con tu propia lista de genes.

Curso pre-congreso CNG 2026 · Bioinformática · LABBIC-INER