Files
2025-2/IA/5.md
2025-10-25 09:23:50 -03:00

1.9 KiB

¿Qué son las CNN?

Las Redes Neuronales Convolucionales (CNN) son un tipo de red neuronal diseñada para procesar datos con estructura en forma de grilla, como imágenes. Se usan principalmente en visión por computadora porque pueden extraer patrones visuales de forma automática.

¿Cómo “ven” una imagen?

Las CNN analizan imágenes en etapas para detectar patrones cada vez más complejos:

Capa Función
Convolución Aplica filtros para detectar patrones básicos (bordes, colores, texturas).
Activación (ReLU) Introduce no linealidad para que el modelo pueda aprender patrones complejos.
Pooling Reduce dimensiones reteniendo la información más relevante (resumen de características).
Capas Densas (Fully Connected) Conectan características extraídas con la salida final de clasificación.

¿Por qué son tan útiles?

Las CNN:

  • Aprenden jerarquías de características: primero bordes > luego formas > finalmente objetos completos.
  • Mantienen la relación espacial entre píxeles (a diferencia de las redes densas).
  • Son invariantes a la posición: pueden reconocer un objeto aunque esté en otro lugar de la imagen.
  • Reutilizan pesos (filtros), lo que las hace más eficientes.

Aplicaciones comunes

  • Clasificación de imágenes
  • Detección de objetos
  • Reconocimiento facial
  • Vehículos autónomos
  • Análisis médico mediante imágenes

Flujo típico del entrenamiento de una CNN

  1. Preparar dataset de imágenes (normalización, etiquetado, división train/test).
  2. Definir arquitectura (capas de conv + pooling + densas).
  3. Entrenar el modelo (ajuste de pesos para reducir error).
  4. Evitar overfitting (regularización, data augmentation, dropout).
  5. Evaluar con datos no vistos.

Idea clave para recordar

Una CNN aprende automáticamente qué características de una imagen importan sin que el programador tenga que definirlas manualmente.