Capítulo 1

Para quién es este taller

Perfiles, expectativas y punto de partida

No se requiere ser experto en programación. Se requiere curiosidad, disposición para trabajar y una laptop con batería.

El Dataller está diseñado para seis perfiles complementarios. Cada módulo tiene bifurcaciones — caminos alternativos según tu nivel técnico — para que nadie se quede atrás y nadie se aburra.

Estudiantes

De ingeniería, ciencias, diseño o cualquier disciplina. El taller asume que estás aprendiendo y te da estructura para avanzar rápido.

Desarrolladores

Si ya escribes código, aquí vas a integrar modelos de IA en arquitecturas reales — no tutoriales de "Hello World" con GPT.

Diseñadores

La IA no reemplaza el diseño. Lo amplifica. Vas a explorar cómo los modelos generativos se integran en flujos de trabajo creativos reales.

Emprendedores

La diferencia entre una idea y un producto es la ejecución técnica. Aquí aprendes a evaluar qué es viable y qué es humo.

Profesionistas de salud

Expedientes, diagnósticos, datos clínicos — la IA ya está en tu campo. Mejor entenderla que depender de quien la venda.

Gobierno e industria

Políticas públicas basadas en datos, automatización de procesos, gobernanza algorítmica. La IA no es opcional, es infraestructura.

“El mejor momento para aprender a construir con IA fue hace un año. El segundo mejor momento es este sábado.”

Capítulo 2

Fundamentos para construir con IA

9:00 – 10:00 · Bloque 01

Cómo funciona realmente la inteligencia artificial por dentro. Lógica de modelos, estructuras de datos y por qué las decisiones de diseño importan más que la herramienta de moda.

Lo que un modelo realmente hace

Un modelo de lenguaje no "piensa". Calcula la siguiente palabra más probable dado un contexto4. Eso no lo hace menos útil — lo hace predecible, auditable y, si sabes cómo, dirigible.

En este bloque se trabaja con Python y también con plataformas accesibles — GitHub Copilot, Gemini — según el perfil de cada participante. La idea no es aprender Python en una hora; es entender qué hay detrás de la interfaz amigable.

Conceptos clave

Tokenización
Cómo un modelo convierte texto en números. Por qué "Hermosillo" y "hermosillo" pueden ser tokens diferentes y qué implica eso para tus resultados.
Embeddings
Vectores numéricos que representan el significado de palabras y frases. La base de toda búsqueda semántica5.
Temperatura y top-p
Los parámetros que controlan la creatividad vs. precisión del modelo. No son magia — son estadística.
Prompt engineering
Diseñar instrucciones efectivas para modelos. Más oficio que ciencia, pero con principios claros.
Herramientas del bloque
Python GitHub Copilot Gemini
Capítulo 3

Modelos y datos

10:00 – 11:00 · Bloque 02

Cómo los modelos aprenden de tablas, textos, imágenes y documentos. Cuándo usar un modelo grande y cuándo uno pequeño. Cómo evaluar si realmente funciona o solo parece que funciona.

La trampa de la precisión aparente

Un modelo que responde con confianza no es un modelo que responde correctamente. El fenómeno de alucinación6 es la demostración más clara: el modelo genera texto plausible que es factualmente incorrecto.

En este bloque se enseña a evaluar modelos con métricas reales — no con vibes. Se trabaja con bases de datos vectoriales usando Neon y pgvector sobre PostgreSQL, el stack que escala de prototipo a producción sin cambiar de tecnología.

Grande vs. pequeño

La decisión entre un modelo de 70B parámetros y uno de 8B no es solo de costo. Es de latencia, privacidad, control y adecuación al problema7. Un modelo grande que necesita 4 segundos para responder es inútil para una interfaz en tiempo real. Un modelo pequeño que corre localmente puede ser la diferencia entre soberanía de datos y dependencia de una API externa.

“No necesitas el modelo más grande. Necesitas el modelo correcto para tu problema, tu presupuesto y tus restricciones de privacidad.”

Herramientas del bloque
Neon pgvector PostgreSQL
Capítulo 4

Sistemas que buscan y razonan

11:00 – 12:00 · Bloque 03

Cómo construir aplicaciones que consultan bases de conocimiento propias: desde un catálogo de productos hasta documentos de gobierno o expedientes de salud.

RAG: Retrieval-Augmented Generation

La idea es simple8: en vez de pedirle al modelo que recuerde todo, le das acceso a documentos relevantes en el momento de la consulta. El modelo genera respuestas fundamentadas en fuentes específicas, no en su entrenamiento general.

El patrón se aplica a cualquier dominio donde haya documentos:

  • Gobierno: Normativas, planes de desarrollo, datos abiertos municipales
  • Salud: Guías clínicas, expedientes (con las restricciones de privacidad correspondientes)
  • Educación: Acervos bibliográficos, materiales de curso
  • Industria: Manuales técnicos, especificaciones de producto, registros de calidad

Búsqueda semántica vs. búsqueda por palabras

La búsqueda tradicional (keyword search) encuentra documentos que contienen las palabras exactas de tu consulta. La búsqueda semántica encuentra documentos que significan lo que buscas9, aunque usen palabras completamente diferentes.

“Un sistema RAG bien construido no inventa respuestas. Cita sus fuentes. Y cuando no encuentra nada relevante, dice que no sabe.”

Herramientas del bloque
RAG Búsqueda semántica Gemini
Capítulo 5

Desarrollo con agentes y asistentes

12:00 – 13:00 · Bloque 04

Cómo trabajar con herramientas como GitHub Copilot, Cursor o Claude para construir más rápido sin perder el control. El desarrollador como guía de arquitectura cuando la IA escribe código.

El humano como arquitecto

Los asistentes de código no reemplazan al desarrollador. Cambian su rol10. En vez de escribir cada línea, el desarrollador diseña la estructura, define las restricciones y revisa el resultado. Es la diferencia entre albañil y arquitecto — ambos son necesarios, pero el valor está en saber qué construir, no solo cómo pegar ladrillos.

Agentes vs. asistentes

Asistente
Responde cuando le preguntas. Genera código línea por línea. Necesita dirección constante. Ejemplos: autocompletado de Copilot, chat de Claude.
Agente
Recibe un objetivo y ejecuta pasos intermedios de forma autónoma11. Puede leer archivos, ejecutar comandos, iterar sobre errores. Ejemplos: Claude Code, Cursor Composer, Devin.

“Un agente de IA sin supervisión humana es como un coche autónomo sin frenos. Impresionante hasta que necesitas detenerte.”

Herramientas del bloque
Copilot Cursor Claude
Capítulo 6

Integración y despliegue

13:00 – 14:00 · Bloque 05

Cómo conectar un modelo con una API, una base de datos o una interfaz real. De la notebook al producto que usa gente real.

El valle de la muerte técnico

El 90% de los proyectos de IA nunca salen de la notebook12. No porque la IA no funcione, sino porque integrarla en un sistema real requiere decisiones de infraestructura que los tutoriales no cubren: autenticación, rate limiting, manejo de errores, monitoreo, costos.

En este bloque se construye un producto real end-to-end: un modelo conectado a una API, servido por una interfaz web, desplegado en infraestructura que escala.

El stack moderno

La combinación de Vercel AI SDK + Next.js + APIs de modelos permite construir aplicaciones de IA con la misma ergonomía que una app web tradicional. El streaming de respuestas, la gestión de estado del chat y la integración con herramientas ya están resueltos en librerías maduras13.

Herramientas del bloque
Vercel AI SDK Next.js APIs
Capítulo 7

Datos, ciudad, gobernanza

14:00 – 15:00 · Bloque 06

Cómo todo esto aplica a los problemas de Hermosillo y Sonora: agua, salud, calor, industria. Por qué saber qué hay detrás de una decisión de IA importa. Qué significa soberanía de datos en la práctica cotidiana.

El contexto no es opcional

50.5°C Temperatura récord histórico en Hermosillo (julio 2021)
18% De metas ODS va en camino de cumplirse
Último Lugar en crecimiento de empleo vs ciudades comparativas

Hermosillo enfrenta una convergencia de crisis que no se resuelve con tecnología sola — pero que no se resuelve sin ella. El calor extremo14, la escasez de agua, el rezago en metas de desarrollo sostenible y la dependencia económica de sectores vulnerables a la automatización forman un sistema complejo.

Soberanía de datos

Soberanía de datos no es un concepto abstracto15. Es la capacidad de una ciudad, una institución o una comunidad de:

  • Generar sus propios datos en formatos abiertos y documentados
  • Almacenarlos en infraestructura que controla (no en la nube de otra jurisdicción)
  • Analizarlos con capacidad técnica propia (no depender de consultoras externas)
  • Gobernarlos con reglas claras de acceso, privacidad y uso ético

“Una ciudad que no puede leer sus propios datos es una ciudad que gobierna a ciegas. La infraestructura de datos es tan crítica como la de agua o electricidad.”

Herramientas del bloque
Hermosillo Datos abiertos Gobernanza