Ir al contenido
Tecnología · 3o de Preparatoria · Análisis de Datos e Inteligencia Artificial · IV Bimestre

Diseño de Bases de Datos Relacionales y Normalización

Los estudiantes aplican los principios de normalización (1FN, 2FN, 3FN) para diseñar bases de datos relacionales robustas y sin redundancia.

Aprendizajes Esperados SEPSEP EMS: Sistemas de Gestión de Bases de DatosSEP EMS: Lenguaje de Consulta Estructurado

Acerca de este tema

El Machine Learning (ML) introduce a los estudiantes en el paradigma donde las computadoras aprenden de los datos en lugar de seguir instrucciones explícitas. En este nivel, se exploran los fundamentos de cómo los algoritmos identifican patrones para realizar predicciones o clasificaciones. Este tema es central en la formación tecnológica actual y se alinea con los estándares de la SEP sobre inteligencia artificial y análisis de datos.

Los alumnos comprenden la importancia crítica de los datos de entrenamiento y cómo los sesgos en estos datos pueden afectar los resultados. No se trata solo de matemáticas, sino de entender el flujo: recolección, limpieza, entrenamiento y evaluación. El aprendizaje activo es vital aquí para desmitificar la IA y verla como una herramienta estadística avanzada y no como 'magia'.

Preguntas Clave

  1. ¿Cómo la normalización reduce la redundancia y mejora la integridad de los datos?
  2. ¿De qué manera cada forma normal aborda problemas específicos en el diseño de bases de datos?
  3. ¿Por qué la desnormalización puede ser útil en ciertos escenarios de rendimiento?

Objetivos de Aprendizaje

  • Analizar tablas de datos para identificar redundancias y anomalías en esquemas de bases de datos no normalizadas.
  • Comparar las ventajas y desventajas de la Primera, Segunda y Tercera Forma Normal (1FN, 2FN, 3FN) en el diseño de bases de datos relacionales.
  • Diseñar un esquema de base de datos relacional normalizado hasta 3FN para un sistema de gestión de inventario o de biblioteca.
  • Evaluar la efectividad de la normalización en la reducción de la inconsistencia y la mejora de la integridad de los datos.

Antes de Empezar

Conceptos Básicos de Bases de Datos Relacionales

Por qué: Los estudiantes necesitan comprender qué son las tablas, filas, columnas y las relaciones básicas entre tablas antes de aplicar técnicas de normalización.

Identificación de Datos y Atributos

Por qué: Es fundamental que los alumnos puedan distinguir entre entidades y sus propiedades para poder diseñar esquemas de bases de datos.

Vocabulario Clave

EntidadUn objeto o concepto del mundo real sobre el cual se almacena información, como 'Cliente' o 'Producto'.
AtributoUna propiedad o característica de una entidad, como 'Nombre' o 'Precio' para la entidad 'Producto'.
Clave PrimariaUno o más atributos que identifican de manera única cada registro (fila) en una tabla.
Dependencia FuncionalLa relación entre dos atributos donde el valor de un atributo determina el valor de otro.
RedundanciaLa repetición innecesaria de datos en una base de datos, lo que puede llevar a inconsistencias.

Cuidado con estas ideas erróneas

Idea errónea comúnCreer que la IA tiene conciencia o 'entiende' como un humano.

Qué enseñar en su lugar

Es fundamental explicar que son modelos matemáticos de probabilidad. Comparar una calculadora avanzada con un modelo de ML ayuda a aterrizar el concepto de procesamiento numérico.

Idea errónea comúnPensar que más datos siempre significan mejores predicciones.

Qué enseñar en su lugar

Se debe enseñar que la calidad es más importante que la cantidad. Datos 'sucios' o irrelevantes llevan a conclusiones erróneas, concepto que se refuerza con ejercicios de limpieza de datos.

Ideas de aprendizaje activo

Ver todas las actividades

Conexiones con el Mundo Real

  • Los administradores de bases de datos en empresas como Mercado Libre utilizan principios de normalización para diseñar sistemas eficientes que manejen millones de transacciones de productos y usuarios, asegurando que la información del cliente y del pedido sea precisa y fácil de consultar.
  • Los desarrolladores de software para sistemas de gestión hospitalaria aplican la normalización para organizar datos de pacientes, citas y tratamientos. Esto es crucial para evitar errores en historiales médicos y garantizar la privacidad de la información sensible.
  • Las plataformas de streaming como Netflix emplean bases de datos relacionales normalizadas para gestionar catálogos de películas, perfiles de usuario y preferencias de visualización, permitiendo búsquedas rápidas y recomendaciones personalizadas.

Ideas de Evaluación

Verificación Rápida

Presentar a los estudiantes una tabla de datos simple con redundancias evidentes (ej. información de cliente repetida en cada registro de pedido). Pedirles que identifiquen las redundancias y expliquen por qué son problemáticas, sugiriendo cómo podrían eliminarse mediante la normalización.

Boleto de Salida

Entregar a cada estudiante una tarjeta con el nombre de una Forma Normal (1FN, 2FN, 3FN). Deben escribir una breve explicación de qué problema específico de diseño de bases de datos resuelve esa forma normal y dar un ejemplo simple.

Pregunta para Discusión

Plantear la siguiente pregunta para debate en pequeños grupos: '¿Cuándo podría ser aceptable desnormalizar una base de datos a pesar de los riesgos de redundancia?'. Los grupos deben justificar su respuesta basándose en escenarios de rendimiento o análisis específicos.

Preguntas frecuentes

¿Cuál es la diferencia entre IA y Machine Learning?
La IA es el concepto amplio de máquinas que imitan la inteligencia humana. El Machine Learning es una rama específica de la IA que se enfoca en que las máquinas aprendan solas a partir de datos.
¿Se necesita mucha matemática para entender ML?
Para los fundamentos, basta con entender conceptos básicos de estadística y lógica. En preparatoria nos enfocamos más en la lógica del proceso y el impacto social que en las fórmulas complejas.
¿Cómo beneficia el aprendizaje activo al estudio del Machine Learning?
El aprendizaje activo ayuda a desmitificar la IA. Al participar en simulaciones donde los mismos estudiantes actúan como el algoritmo, comprenden que el aprendizaje automático es un proceso de prueba y error basado en datos, lo que elimina el miedo a la tecnología y fomenta una actitud crítica ante sus resultados.
¿Qué es un sesgo algorítmico?
Es cuando un modelo de IA da resultados injustos o prejuiciosos porque fue entrenado con datos que no representaban bien a toda la población o que contenían prejuicios humanos previos.