NIVEL 0 — Fundamentos verificables sobre Blackwell (curso completo)
Índice y guía del nivel · Checkpoint C0
Este es el primero de los seis niveles desarrollados hoja por hoja. Es un curso autónomo: la teoría está explicada aquí, el código está completo y comentado, y los recursos externos son referencia, no requisito. No depende de ningún proyecto concreto; los retos son genéricos y reutilizables.
Qué vas a saber hacer al terminar (resultados de aprendizaje)
- Explicar, sin buscarlo, qué recurso (cómputo, ancho de banda o memoria) limita cada workload de IA en tu GPU.
- Calcular a mano el límite teórico de throughput de inferencia y compararlo con tu medición real.
- Montar un stack Blackwell (sm_120) sano y diagnosticar en segundos los 3 fallos típicos.
- Saber al instante si un experimento cabe en 32 GB o debe ir a cloud.
- Producir un benchmark de referencia reproducible de tu propia máquina (tu número base para todo el curso).
Prerrequisitos
- Linux/WSL2, Docker, Python, y comodidad con la terminal. Nada de teoría de ML todavía.
Mapa de lecciones (documentos de este nivel)
| Documento | Lección | Resultado |
|---|---|---|
N0_L1_arquitectura_y_roofline.md | 1. La GPU como máquina física: roofline | Sabes qué limita cada workload y lo calculas |
N0_L2_stack_blackwell.md | 2. El stack sm_120 sano + diagnóstico | Entorno reproducible y depurable |
N0_L3_que_cabe_en_32GB.md | 3. Presupuesto de VRAM (inferencia y training) | Decides local vs cloud al instante |
N0_L4_benchmark_de_referencia.md | 4. Tu benchmark base (entregable de C0) | Número reproducible + checkpoint C0 |
Cómo trabajar este nivel
- Sigue el orden L1 → L4.
- Aplica la regla de los dos pases (programa maestro): primero reproduce, luego reconstruye sin mirar.
- Rellena una ficha de Lab Notebook (plantilla
08) por cada laboratorio. - C0 se aprueba solo en el segundo pase reproducible (ver
N0_L4).
Checkpoint del nivel (resumen)
C0 — aprobado cuando tienes: stack reproducible, un comando que regenera tus números de serving y training, y sabes explicar el gap entre tu throughput real y el límite teórico. Detalle y rúbrica en N0_L4_benchmark_de_referencia.md.