Skip to main content

🧩 Efficient Vision Transformers with Partial Attention

👥 Integrantes:

  • 👤 Brayan Quintero
  • 👤 Valentina Pérez

📑 Material de apoyo:


🎯 Objetivos

✅ Seleccionar dinámicamente tokens importantes (foreground) y tokens menos relevantes (background) usando estadísticas como la media de características.
✅ Mantener o mejorar la precisión de los modelos de visión con una arquitectura más eficiente.


📊 Resultados Esperados

📍 Esta sección describe de manera general lo que se espera obtener al final de la sesión:

🔹 Lograr una reducción significativa en la complejidad computacional de la autoatención.
🔹 Identificar tokens clave que representan mejor la información relevante de la imagen.
🔹 Mantener un rendimiento competitivo en tareas de clasificación o detección usando menos recursos.


Ejemplo de imagen