GRATÍCULAinstrumento de maestría
BancoRTX 5090 · GB202
Rev2026.06
Entrar
N0 · Fundamentos Blackwell/L0

NIVEL 0 — Fundamentos verificables sobre Blackwell (curso completo)

Índice y guía del nivel · Checkpoint C0

Este es el primero de los seis niveles desarrollados hoja por hoja. Es un curso autónomo: la teoría está explicada aquí, el código está completo y comentado, y los recursos externos son referencia, no requisito. No depende de ningún proyecto concreto; los retos son genéricos y reutilizables.


Qué vas a saber hacer al terminar (resultados de aprendizaje)

  1. Explicar, sin buscarlo, qué recurso (cómputo, ancho de banda o memoria) limita cada workload de IA en tu GPU.
  2. Calcular a mano el límite teórico de throughput de inferencia y compararlo con tu medición real.
  3. Montar un stack Blackwell (sm_120) sano y diagnosticar en segundos los 3 fallos típicos.
  4. Saber al instante si un experimento cabe en 32 GB o debe ir a cloud.
  5. Producir un benchmark de referencia reproducible de tu propia máquina (tu número base para todo el curso).

Prerrequisitos

  • Linux/WSL2, Docker, Python, y comodidad con la terminal. Nada de teoría de ML todavía.

Mapa de lecciones (documentos de este nivel)

DocumentoLecciónResultado
N0_L1_arquitectura_y_roofline.md1. La GPU como máquina física: rooflineSabes qué limita cada workload y lo calculas
N0_L2_stack_blackwell.md2. El stack sm_120 sano + diagnósticoEntorno reproducible y depurable
N0_L3_que_cabe_en_32GB.md3. Presupuesto de VRAM (inferencia y training)Decides local vs cloud al instante
N0_L4_benchmark_de_referencia.md4. Tu benchmark base (entregable de C0)Número reproducible + checkpoint C0

Cómo trabajar este nivel

  • Sigue el orden L1 → L4.
  • Aplica la regla de los dos pases (programa maestro): primero reproduce, luego reconstruye sin mirar.
  • Rellena una ficha de Lab Notebook (plantilla 08) por cada laboratorio.
  • C0 se aprueba solo en el segundo pase reproducible (ver N0_L4).

Checkpoint del nivel (resumen)

C0 — aprobado cuando tienes: stack reproducible, un comando que regenera tus números de serving y training, y sabes explicar el gap entre tu throughput real y el límite teórico. Detalle y rúbrica en N0_L4_benchmark_de_referencia.md.