CodeIA Logo
Inicio
¿Qué es la Ingeniería de Contexto?ExperienciaProyectos realizados
Comunidad
FeedMiembrosCuadro de HonorCalendarioBolsa de trabajoEncuestasProyectos de la Comunidad
NoticiasPrecios
Formación
CursosLecciones
Co-Projects
Propuestas de proyectosEnviar propuesta de proyecto
RoadmapGlosarioContacto
Iniciar Sesión
CodeIA Logo

Transformando ideas en software profesional con IA. La nueva era del desarrollo ágil.

Legal

Política de PrivacidadTérminos de ServicioTérminos de SuscripciónAviso LegalCookies

Sígueme

Contactar

© 2026 CodeIA. Todos los derechos reservados.

Hecho con♥por sn4p.dev

Volver al catálogo
Vista previa bloqueada

Solo para Founders

Este contenido es exclusivo para miembros Founder.

Iniciar sesiónCrear cuenta

CodeIA2025 - Sesión 2 – Data Scraper

Esta sesión consolida principios de prompting efectivo aplicados a la extracción de datos (scraping) usando BeautifulSoup + Requests como stack conceptual. Trabajaremos sin escribir código: generaremos artefactos (plan de scraping, contrato de datos, mapa de selectores, estrategia de paginación y riesgos anti-bot), listos para que la IA produzca o ejecute código en sesiones posteriores.

SesiónPrincipiante
Hace 6 meses2h 29m 21s248 visualizaciones5.0(4 reviews)

Tecnologías

PythonAsistente IA para código

Herramientas IA utilizadas

GitHub CopilotCursorClaude CodeClaude
Iniciar sesión para comenzarCrear cuenta

Sesión 2 – Data Scraper


🔍 Descripción general

Esta sesión consolida principios de prompting efectivo aplicados a la extracción de datos (scraping) usando BeautifulSoup + Requests como stack conceptual. Trabajaremos sin escribir código: generaremos artefactos (plan de scraping, contrato de datos, mapa de selectores, estrategia de paginación y riesgos anti-bot), listos para que la IA produzca o ejecute código en sesiones posteriores.

Duración: 2 horas\

Tipo de sesión: teórico-práctica (sin codificación directa)\

Rol del estudiante: Arquitecto de Datos con IA / Ingeniero de Contexto\

Proyecto asociado:</

Contenido Protegido

Inicia sesión para acceder al contenido completo.

Iniciar SesiónCrear Cuenta

Índice de la sesión

00:005:26
Revisión de Proyectos de Filtros y Búsqueda

Se inicia la sesión revisando el proyecto de José, quien ha implementado filtros por rating y categorías, y una funcionalidad de búsqueda. Se discuten mejoras en la búsqueda y la interfaz de usuario para los filtros.

05:264:13
Presentación del Proyecto de Dani: Loader y Ficha de Actor

Dani presenta su proyecto, destacando un loader al cambiar de slide, un filtro de búsqueda mejorado, y la adición de una ficha de actor con sus películas y series, además de un efecto de desenfoque en la interfaz.

09:393:10
Discusión sobre el Efecto Gramorfismo y Accesibilidad

Se explica el efecto 'gramorfismo' en la interfaz de Dani, que crea un desenfoque en el fondo para centrar la atención del usuario en el contenido principal, mejorando la accesibilidad y la experiencia.

12:495:01
Reflexión sobre el Aprendizaje Acelerado y la Práctica

El instructor enfatiza la importancia de la práctica y la experimentación para aprender rápidamente, contrastando el ritmo de aprendizaje en el curso con la formación tradicional y animando a los estudiantes a participar activamente.

17:505:36
Introducción a la Arquitectura de Datos y Scrapping Ético

Se introduce el concepto de arquitectos de datos y la necesidad de extraer información. Se aborda el 'scrapping ético' y la importancia de entender los robots.txt, sitemaps, rate limits y la legalidad.

23:265:12
Conceptos Clave para el Scrapping: JSON, CSV y Selectores

Se explican los formatos de datos JSON y CSV como estándares para la extracción, y la importancia de los selectores CSS, IDs y atributos para identificar elementos en el DOM. Se muestra una herramienta para capturar CSS.

28:386:52
Configuración del Repositorio y Monorepos

Se procede a la creación de un repositorio en GitHub y se explica el concepto de 'monorepo' para organizar proyectos con backend y frontend en un solo lugar. Se discute la protección de ramas en GitHub.

35:306:00
Instalación de Dependencias y Preparación del Entorno

Se detallan las dependencias necesarias para el scrapping en Python (requests, Beautiful Soup, LXML, Pandas) y se explica el proceso de instalación y configuración del entorno virtual de Python.

41:306:30
Ejecución del Scrapper y Análisis de Resultados

Se ejecuta el scrapper en la página de Codella para extraer precios y lecciones. Se analizan los resultados, identificando la falta de algunos datos y la necesidad de refinar el prompt para obtener la información deseada.

48:005:50
Refinando el Prompt y Extracción de Títulos

Se modifica el prompt para especificar la extracción de títulos de las lecciones, demostrando cómo la precisión en las instrucciones a la IA es crucial para obtener los datos correctos.

53:507:10
Scrapping de Imágenes y Consideraciones Éticas

Se verifica la extracción de imágenes y se discuten las capacidades de la IA para manipular el tamaño y la organización de los archivos. Se reitera la importancia de la ética en el scrapping y las implicaciones legales.

01:01:0088:17
Reflexión Final y Próximos Pasos

Se cierra la sesión con una reflexión sobre el potencial del scrapping para el trabajo diario y la diferenciación profesional. Se anima a los estudiantes a practicar y explorar las posibilidades de esta herramienta.

Lecciones relacionadas

  • CodeIA2025 - Sesión 1 – Inducción y Mentalidad

    CodeIA2025 - Sesión 1 – Inducción y Mentalidad

    2h 34m 43s

  • Git y Copilot en Visual Studio Code

    Git y Copilot en Visual Studio Code

    12m 43s

  • Cómo configurar z.ai con tu cuenta de Claude paso a paso

    Cómo configurar z.ai con tu cuenta de Claude paso a paso

    41m 13s

  • CodeIA2026 - Sesión 16 – Documentación Unificada de APIs con Swagger y Postman

    CodeIA2026 - Sesión 16 – Documentación Unificada de APIs con Swagger y Postman

    2h 0m