🐳Deepseek
👥 Integrantes:
- 👤 Andrea Parra
- 👤 Juan Calderón
📑 Material de apoyo:
- 📊 Diapositivas: DeepSeek
- 📜 Papers: DeepSeek-R1| DeepSeek-V3 | DeepSeekMath
- 💻 Código externo: Repositorio de código
🎯 Objetivos
📢 Como objetivos de la presente sesión, se plantean:
✅ Abordar el funcionamiento de DeepSeek y el por qué de su éxito.
✅ Comprender DeepSeek-R1 como el producto de trabajos y aportes anteriores(DeepSeek-V3, DeepSeekMath)
✅ Comprender sus fuertes frente a otros modelos
📊 Resultados Esperados
📍 Se espera que al final de esta sesión se:
🔹 Tengan conocimientos claros sobre DeepSeek-R1
🔹 Entiendan todos los métodos que hacen a DeepSeek tan eficiente computacionalmente (GRPO, MLHA, PTX).
🔹 Aprecie a DeepSeek por lo que es: un modelo que rivaliza con gigantes de código cerrado como lo es OpenAI.
📚 Referencias
📖 Esta sección recopila enlaces a recursos relevantes sobre procesamiento de imágenes:
🔹 🎞️ Video breve explicativo sobre DeepSeek R1 y V3
🔹 🎞️ Video explicativo sobre MLA
🔹 📄 Artículo explicando GRPO
No Comments