🧩 Efficient Vision Transformers with Partial Attention
👥 Integrantes:
- 👤 Brayan Quintero
- 👤 Valentina Pérez
📑 Material de apoyo:
- 📊 Diapositivas: Ver presentaciones
- 📜 Paper: Ver artículos académicos
🎯 Objetivos
✅ Seleccionar dinámicamente tokens importantes (foreground) y tokens menos relevantes (background) usando estadísticas como la media de características.
✅ Mantener o mejorar la precisión de los modelos de visión con una arquitectura más eficiente.
📊 Resultados Esperados
📍 Esta sección describe de manera general lo que se espera obtener al final de la sesión:
🔹 Lograr una reducción significativa en la complejidad computacional de la autoatención.
🔹 Identificar tokens clave que representan mejor la información relevante de la imagen.
🔹 Mantener un rendimiento competitivo en tareas de clasificación o detección usando menos recursos.
No Comments