🐳Deepseek

👥 Integrantes:

👤 Andrea Parra
👤 Juan Calderón

📑 Material de apoyo:

📊 Diapositivas: DeepSeek
📜 Papers: DeepSeek-R1| DeepSeek-V3 | DeepSeekMath
💻 Código externo: Repositorio de código

🎯 Objetivos

📢 Como objetivos de la presente sesión, se plantean:
✅ Abordar el funcionamiento de DeepSeek y el por qué de su éxito.
✅ Comprender DeepSeek-R1 como el producto de trabajos y aportes anteriores(DeepSeek-V3, DeepSeekMath)
✅ Comprender sus fuertes frente a otros modelos

📊 Resultados Esperados

📍 Se espera que al final de esta sesión se:

🔹 Tengan conocimientos claros sobre DeepSeek-R1
🔹 Entiendan todos los métodos que hacen a DeepSeek tan eficiente computacionalmente (GRPO, MLHA, PTX).
🔹 Aprecie a DeepSeek por lo que es: un modelo que rivaliza con gigantes de código cerrado como lo es OpenAI.

📚 Referencias

📖 Esta sección recopila enlaces a recursos relevantes sobre procesamiento de imágenes:

🔹 🎞️ Video breve explicativo sobre DeepSeek R1 y V3
🔹 🎞️ Video explicativo sobre MLA 🔹 📄 Artículo explicando GRPO

🐳Deepseek

🎯 Objetivos

📊 Resultados Esperados

📚 Referencias

No Comments