# 🐳Deepseek

👥 **Integrantes:**  
- 👤 Andrea Parra
- 👤 Juan Calderón

📑 **Material de apoyo:**  
- 📊 **Diapositivas:** [DeepSeek](https://www.canva.com/design/DAGjZ-Kj63A/iyEenurKWINf7GenHk5-dg/edit?utm_content=DAGjZ-Kj63A&utm_campaign=designshare&utm_medium=link2&utm_source=sharebutton)  
- 📜 **Papers:**
 [DeepSeek-R1| ](https://arxiv.org/pdf/2501.12948)
 [DeepSeek-V3 | ](https://arxiv.org/pdf/2412.19437v1)
 [DeepSeekMath](https://arxiv.org/pdf/2402.03300)  
- 💻 **Código externo:** [Repositorio de código](link)  

---

## 🎯 **Objetivos**
📢 Como objetivos de la presente sesión, se plantean:\
✅ Abordar el funcionamiento de DeepSeek y el por qué de su éxito.\
✅ Comprender DeepSeek-R1 como el producto de trabajos y aportes anteriores(DeepSeek-V3, DeepSeekMath)\
✅ Comprender sus fuertes frente a otros modelos

---

## 📊 Resultados Esperados

📍 Se espera que al final de esta sesión se:

🔹 Tengan conocimientos claros sobre DeepSeek-R1\
🔹 Entiendan todos los métodos que hacen a DeepSeek tan eficiente computacionalmente (GRPO, MLHA, PTX).\
🔹 Aprecie a DeepSeek por lo que es: un modelo que rivaliza con gigantes de código cerrado como lo es OpenAI.

---

## 📚 **Referencias**
📖 Esta sección recopila enlaces a recursos relevantes sobre procesamiento de imágenes:  

🔹 [🎞️ Video breve explicativo sobre DeepSeek R1 y V3](https://www.youtube.com/watch?v=fTjPEE0fk-U)   
🔹 [🎞️ Video explicativo sobre MLA](https://www.youtube.com/watch?v=0VLAoVGf_74&t=216s)
🔹 [📄 Artículo explicando GRPO](https://huggingface.co/blog/NormalUhr/grpo)