Categorías
Etiquetas
ActiveMQ Android Astro Bootstrap Clerk Convex DataFaker Docker Firebase Flutter Go GraphQL HAProxy HTML JasperReports Java Javalin JMS JS Juyper Notebook Mailjet Microservices MongoDB Mux NestJS NextAuth NextJS NLP NLTK Numpy Pandas PayPal Postgres PostgreSQL Prisma Python Re React Redis Resend RSS Scikit-learn Scikit-Learn SCSS Spacy SpringBoot Streamlit Tableau TailwindCSS Vaadin WebGPU WordPress YouTube API ZenStack
511 palabras
3 minutos
The Quiz Challenge
Dashboard Interactivo – The Quiz Challenge
Dashboard Interactivo de The Quiz Challenge es una solución de minería de datos descriptiva que combina un modelo de clustering con un portal visual en Tableau. El objetivo es ayudar al canal de YouTube “The Quiz Challenge” a descubrir patrones en sus métricas (vistas, suscripciones, comentarios, likes/dislikes) y tomar decisiones informadas sobre qué tipo de contenido producir.
Detalles del proyecto
Fuente de datos
- Conjunto original de estadísticas de YouTube (vistas, suscriptores, comentarios, likes/dislikes) agrupado en carpetas por parámetro.
- Exploración de fuentes externas de métricas de canales de YouTube para enriquecer el dataset (p.ej. demografía de audiencia, keywords trending)
Dashboard en Tableau
- Preparación y transformación de datos en Tableau Prep (unión de fuentes, limpieza de valores faltantes, creación de campos calculados para cuartiles de vistas y grupos horarios).
- Visualizaciones interactivas:
- Líneas de tiempo de vistas y suscripciones.
- Histogramas de duración y distribución por categoría.
- Filtros por cuartil de vistas, grupo horario y cluster asignado.
- Panel de detalle por video con métricas y etiquetas.
- Publicación en Tableau Public con enlace público para stakeholders.
Modelo descriptivo en clusters
- Entorno: Python 3 en Jupyter Notebook.
- Preprocesamiento: tokenización de títulos y descripciones con NLTK, limpieza de stopwords y lematización.
- Vectorización: TF-IDF para contenido textual y normalización de métricas numéricas (vistas, likes/dislikes, duración).
- Algoritmo: K-Means (selección de k basada en curva de codo y coeficiente de silhouette) y DBSCAN como verificación de densidad.
- Evaluación: Silhouette Score, Davies–Bouldin Index y análisis de cohesión vs. separación para validar calidad de clusters.
- Interpretación: asignación de etiquetas descriptivas a cada cluster (p.ej. “videos cortos de trivia”, “quizzes extensos de temática X”) para guiar la estrategia de contenido.
Tecnologías utilizadas
- Visualización: Tableau Desktop & Tableau Public
- Análisis & Modelado:
- Python 3
- Jupyter Notebook
- Pandas, NumPy
- Scikit-Learn (K-Means, DBSCAN, métricas de clustering)
- NLTK (tokenización, lematización, stopwords)
- Documentación: Markdown en
README.md
describiendo flujo de ETL, decisiones de modelado y hallazgos.
Desarrollo del proyecto
Exploración de datos
- Carga de CSVs originales y revisión de calidad de datos.
- Identificación de métricas faltantes y normalización de formatos de fecha.
Preparación y ETL en Tableau Prep
- Unión de fuentes, limpieza y creación de campos (cuartiles, grupos horarios).
- Exportación de extractos
.hyper
para conexión en Tableau Desktop.
Modelado en Jupyter Notebook
- Preprocesamiento de texto con NLTK y vectorización TF-IDF.
- Ejecución de K-Means y análisis de métricas para elegir k.
- Visualización de clusters en 2D con PCA para ver separabilidad.
Creación del dashboard
- Conexión a los datos modelados (incluyendo etiqueta de cluster) en Tableau Desktop.
- Diseño de hojas y dashboard final con acciones de filtro y resaltado.
- Publicación en Tableau Public para acceso público, con credenciales de visualización.
El proyecto fue desarrollado en conjunto con Natasha López.
Dashboard Interactivo
Listado de tecnologías utilizadas
Repositorio de GitHub
El proyecto final de la asignatura de Inteligencia de Negocios se corresponde con el desarrollo de un dashboard interactivo y la construcción de un modelo de minería de datos descriptivo, para ayudar al canal de Youtube The Quiz Challenge.
The Quiz Challenge
https://vladimircuriel-v2.netlify.app/posts/the-quiz-challange/