Reinforcement Learning

🏋️Introduction to RL
👥 Expositores: 
 
 👤 Fabian Perez 
 👤 Paula Uzcátegui 
 
 📑 Material de apoyo: 
 La presentacion se hizo basado en el articulo de karpathy de introduccion a RL y en multiples fuentes externas 
 
 📊 Diapositivas: Ver presentación 
 📜 Blog: Link 
 💻 Video Externo: Enlace a Youtube 
 
 
 🎯 Objetivos 
 📢 ¿Por qué es importante este tema? 
 ✅ Introducir los conceptos básicos de Reinforcement Learning (RL). 
✅ Comprender la estructura y funcionamiento del semillero. 
✅ Identificar aplicaciones clave de RL en Computer Vision. 
 
 📊 Resultados Esperados 
 📍 Al finalizar la sesión, se espera: 
 🔹 Entender los principios fundamentales del RL. 
🔹 Familiarizarse con terminología y conceptos clave. 
🔹 Establecer una base para futuros estudios y proyectos en RL. 
 
 ⚙️ Metodología 
 📖 Temas tratados en la sesión: 
 📌 Definición y motivación del RL. 
📌 Elementos básicos y definiciones matematicas: Agentes, Entorno, Recompensas. 
📌 Ejemplos y aplicaciones en visión por computadora. 
 
 📚 Referencias 
 📖 Recursos clave para profundizar en RL: 
 🔹 📘 OpenAI Gym 
🔹 📘 Deep Reinforcement Learning

🤖Mastering the game of Go with deep neural networks and tree search
👥 Integrantes: 
 
 👤 Guillermo Pinto 
 👤 Dana Villamizar 
 
 📑 Material de apoyo: 
 
 📊 Diapositivas: Ver presentación 
 📜 Paper: Ver artículo académico 
 
 
 🎯 Objetivos 
 ✅ Explicar la combinación de deep learning y búsqueda de árboles de Monte Carlo (MCTS) en AlphaGo. 
 ✅ Analizar el impacto de AlphaGo en el desarrollo del aprendizaje por refuerzo (RL). 
 
 📊 Resultados Esperados 
 🔹 Comprender cómo AlphaGo utilizó deep learning y MCTS para vencer a jugadores profesionales de Go. 
🔹 Identificar aplicaciones actuales derivadas de AlphaGo en distintos campos, como AlphaZero y AlphaFold. 
 
 📚 Referencias 
 📖 Esta sección recopila enlaces a recursos relevantes sobre procesamiento de imágenes: 
 🔹 🎞️ Trailer AlphaGo - Netflix 
🔹 🎥 Video Explicación

🐳Deepseek
👥 Integrantes: 
 
 👤 Andrea Parra 
 👤 Juan Calderón 
 
 📑 Material de apoyo: 
 
 📊 Diapositivas: DeepSeek 
 📜 Papers: 
 DeepSeek-R1| 
 DeepSeek-V3 | 
 DeepSeekMath 
 💻 Código externo: Repositorio de código 
 
 
 🎯 Objetivos 
 📢 Como objetivos de la presente sesión, se plantean: 
✅ Abordar el funcionamiento de DeepSeek y el por qué de su éxito. 
✅ Comprender DeepSeek-R1 como el producto de trabajos y aportes anteriores(DeepSeek-V3, DeepSeekMath) 
✅ Comprender sus fuertes frente a otros modelos 
 
 📊 Resultados Esperados 
 📍 Se espera que al final de esta sesión se: 
 🔹 Tengan conocimientos claros sobre DeepSeek-R1 
🔹 Entiendan todos los métodos que hacen a DeepSeek tan eficiente computacionalmente (GRPO, MLHA, PTX). 
🔹 Aprecie a DeepSeek por lo que es: un modelo que rivaliza con gigantes de código cerrado como lo es OpenAI. 
 
 📚 Referencias 
 📖 Esta sección recopila enlaces a recursos relevantes sobre procesamiento de imágenes: 
 🔹 🎞️ Video breve explicativo sobre DeepSeek R1 y V3 
🔹 🎞️ Video explicativo sobre MLA 
🔹 📄 Artículo explicando GRPO