# Taller Entornos de Ejecución

### 👥 **Integrantes:**  
- 👤 Guillermo Pinto
- 👤 Brayan Yesid Quintero Santander

### 📑 **Material de apoyo:**  
- 📊 **Diapositivas - Do no just use Colab:** [Ver presentación](https://docs.google.com/presentation/d/11jgZ1UqEVtXdfw16FXSFKmSDhhN4cSVyqujswbwV3ks/edit?usp=sharing)
- 📓 **Notebooks - Hugging Face and Kaggle Datasets**
  -  Colab version: [Ver notebook](https://colab.research.google.com/drive/1KgxiBFN6nv-mv8r4MLpr8lSkhpIRwVrI?usp=sharing)
  - Kaggle version: [Ver notebook](https://www.kaggle.com/code/guillepinto/entornos-kaggle)

## **Entornos de ejecución**

Los entornos de ejecución son las plataformas donde podemos ejecutar nuestros experimentos de manera gratuita. Generalmente, solo se conoce Google Colaboratory para este fin, sin embargo, actualmente existen diferentes alternativas, unas mejores y otras no tanto, que nos permiten sacar adelante alguna idea.

En este taller revisamos cada una de las alternativas disponibles en Colombia en el momento. Vimos cómo usarlas, las comparamos y definimos un _tier list_ de cuáles, desde la perspectiva de Guille, son las mejores. 

Al final revisamos cómo hacer uso de los *secretos*, los cuales son claves como _tokens_ o *api keys* que nos permiten acceder a contenido privado de manera segura. Todo esto lo encuentras en las diapositivas _**Do not just use Colab**_.

## _**Datasets**_

Cuando estamos trabajando en un proyecto necesitamos datos. Pero más importante aún, necesitamos un lugar donde guardar estos datos de manera que podamos accederlos sin muchas complicaciones.

Entre las mejores alternativas encontramos _Hugging Face Datasets_ y _Kaggle Datasets_. Dos plataformas donde podemos alojar nuestros datos de manera gratuita y luego accederlos, desde cualquier lugar, a través de los secretos (_api keys_ o _tokens_). 


## **¿Cómo subir un dataset?**

Por último, se subió un **dataset de manera privada** siguiendo la estructura recomendada por _Hugging Face Datasets_, el conjunto de datos quedó organizado con la siguiente estructura:

[![](https://semillerocv.alwaysdata.net/uploads/images/gallery/2025-11/scaled-1680-/image-1762053744985.png)](https://semillerocv.alwaysdata.net/uploads/images/gallery/2025-11/image-1762053744985.png)

Esta estructura segura que cada subconjunto (train y test) tenga sus propias imágenes y metadatos, donde cada _metadata.csv_ contenga únicamente la información correspondiente a cada subconjunto. Puedes descubrir de manera práctica cómo hacerlo en los dos notebooks que encuentras en el material de apoyo.

<p style="text-align: right; font-style: italic;">
  — Guillermo Pinto y Brayan Quintero
</p>

---

> 📘 **Recursos adicionales**
> 
> * [“Lightning AI | Turn Ideas Into AI, Lightning Fast.” Lightning AI, lightning.ai.](https://lightning.ai/)
> * [Kaggle: Your Machine Learning and Data Science Community. www.kaggle.com](www.kaggle.com)
> * [SageMaker Studio Lab. studiolab.sagemaker.aws.](https://studiolab.sagemaker.aws) 
> * [“GitHub Codespaces.” GitHub, 2025, github.com/features/codespaces.](github.com/features/codespaces)
> * [“Modal: High-performance AI Infrastructure.” Modal, modal.com.](https://modal.com)
> * [AICodeKing. “These Are the Best Google Colab Alternatives! (Free Tiers With GPUs).” YouTube, 11 May 2024, www.youtube.com/watch?v=yvvNtkfJhGI.
](www.youtube.com/watch?v=yvvNtkfJhGI)
> * [Datasets. huggingface.co/docs/datasets/en/index.](https://huggingface.co/docs/datasets/en/index)
> * [Datasets Documentation. www.kaggle.com/docs/datasets.](https://www.kaggle.com/docs/datasets)