NIVEL 0 — Fundamentos verificables sobre Blackwell (curso completo)

Índice y guía del nivel · Checkpoint C0

Este es el primero de los seis niveles desarrollados hoja por hoja. Es un curso autónomo: la teoría está explicada aquí, el código está completo y comentado, y los recursos externos son referencia, no requisito. No depende de ningún proyecto concreto; los retos son genéricos y reutilizables.

Qué vas a saber hacer al terminar (resultados de aprendizaje)

Explicar, sin buscarlo, qué recurso (cómputo, ancho de banda o memoria) limita cada workload de IA en tu GPU.
Calcular a mano el límite teórico de throughput de inferencia y compararlo con tu medición real.
Montar un stack Blackwell (sm_120) sano y diagnosticar en segundos los 3 fallos típicos.
Saber al instante si un experimento cabe en 32 GB o debe ir a cloud.
Producir un benchmark de referencia reproducible de tu propia máquina (tu número base para todo el curso).

Prerrequisitos

Linux/WSL2, Docker, Python, y comodidad con la terminal. Nada de teoría de ML todavía.

Mapa de lecciones (documentos de este nivel)

Documento	Lección	Resultado
`N0_L1_arquitectura_y_roofline.md`	1. La GPU como máquina física: roofline	Sabes qué limita cada workload y lo calculas
`N0_L2_stack_blackwell.md`	2. El stack sm_120 sano + diagnóstico	Entorno reproducible y depurable
`N0_L3_que_cabe_en_32GB.md`	3. Presupuesto de VRAM (inferencia y training)	Decides local vs cloud al instante
`N0_L4_benchmark_de_referencia.md`	4. Tu benchmark base (entregable de C0)	Número reproducible + checkpoint C0

Cómo trabajar este nivel

Sigue el orden L1 → L4.
Aplica la regla de los dos pases (programa maestro): primero reproduce, luego reconstruye sin mirar.
Rellena una ficha de Lab Notebook (plantilla 08) por cada laboratorio.
C0 se aprueba solo en el segundo pase reproducible (ver N0_L4).

Checkpoint del nivel (resumen)

C0 — aprobado cuando tienes: stack reproducible, un comando que regenera tus números de serving y training, y sabes explicar el gap entre tu throughput real y el límite teórico. Detalle y rúbrica en N0_L4_benchmark_de_referencia.md.