La Inteligencia Artificial Generativa en la Evaluación Académica
15 de mayo, 2024
Sobre el autor

El Maestro Raúl González López es Ingeniero en Computación egresado de la UNAM con más de 30 años de experiencia en el mundo de las tecnologías de información. Su formación incluye desde certificaciones como DBA al inicio de su carrera, pasando por la administración de proyectos, gestión y gobierno de tecnologías de información, hasta las prácticas ágiles de desarrollo y agilidad empresarial. También es Maestro en Calidad de la Educación por la Universidad de las Américas Puebla. Actualmente es director de Servicios de Tecnologías de la Información al Cliente en la UDLAP. Es entusiasta estudioso del fenómeno humano–tecnología, de sus interacciones, y de cómo se definen y transforman mutuamente.

Introducción

La inteligencia artificial (IA) está transformando diversas áreas de la sociedad, incluyendo la educación. Entre las tecnologías emergentes, la Inteligencia Artificial Generativa (IAG) destaca por su capacidad para generar contenido original a partir de datos existentes. Esta tecnología tiene el potencial de revolucionar la manera en que los docentes evalúan los trabajos de sus estudiantes, especialmente mediante el uso de rúbricas de evaluación. En este ensayo, exploraremos cómo la IAG puede asistir a los docentes en la calificación de trabajos académicos, proporcionando ejemplos prácticos, así como una evaluación de sus ventajas y desventajas. Finalmente, se ofrecerá una conclusión sobre el impacto potencial de esta tecnología en el ámbito educativo.

Uso de la IAG en la Calificación con Rúbricas de Evaluación

En la UDLAP, utilizamos las rúbricas de evaluación para establecer criterios claros y específicos al momento de evaluar los trabajos estudiantiles. Estas rúbricas definen los niveles de desempeño esperados en diferentes aspectos del trabajo, como la claridad, la precisión, la creatividad y la adherencia a las instrucciones.

La IAG puede asistir en la calificación con rúbricas de varias maneras:

  1. Análisis de Texto: La IAG puede analizar los trabajos escritos de los estudiantes para evaluar la coherencia, gramática, y estructura del texto. Herramientas como GPT-4 pueden comparar el trabajo con los criterios de la rúbrica y asignar una puntuación basada en el análisis de texto.

  2. Evaluación de Contenido: Utilizando algoritmos de aprendizaje profundo, la IAG puede comparar el contenido del trabajo con bases de datos de conocimiento para verificar la exactitud y profundidad de la información presentada. Esto es particularmente útil en asignaturas que requieren precisión factual, como ciencias y estudios sociales.

  3. Retroalimentación Personalizada: Además de calificar, la IAG puede generar retroalimentación detallada y específica para cada criterio de la rúbrica. Esta retroalimentación puede incluir sugerencias para mejorar futuras entregas, ofreciendo a los estudiantes una guía clara para su desarrollo académico.

Proceso para Evaluar Tareas Usando una Rúbrica
  1. Los docentes deben proporcionar la Rúbrica y las Tareas:

    • Copiar y pegar, o adjuntar el archivo de la rúbrica de evaluación que se utilice para las tareas. Esto puede ser, dependiendo de las capacidades de cada IAG, en formato de texto, hoja de cálculo, PDF, etc.

    • Copiar y pegar el texto o adjuntar el archivo de las tareas de los estudiantes en el formato que prefiera y dependiendo de las capacidades de cada IAG (documentos de texto, archivos PDF, presentaciones, etc.).

  2. Análisis de la Rúbrica:

    • La IAG revisará la rúbrica para entender los criterios de evaluación y los niveles de desempeño que se deben aplicar a las tareas.

    • Si es necesario, el docente podría discutir y clarificar cualquier detalle sobre los criterios de evaluación con la IAG.

  3. Aplicación de la Rúbrica a las Tareas:

    • La IAG evaluará cada tarea de acuerdo con los criterios especificados en la rúbrica.

    • Asignará una puntuación para cada criterio basándose en la calidad del trabajo presentado.

    • Proporcionará comentarios específicos para cada criterio cuando sea necesario, destacando los puntos fuertes y las áreas de mejora.

  4. Reporte de Evaluación:

    • La IAG compilará los resultados de la evaluación en un formato claro y organizado.

    • Creará un reporte detallado que incluya las puntuaciones y los comentarios para cada tarea y cada criterio de la rúbrica.

  5. Retroalimentación Adicional:

    • De ser necesario el docente puede tener una sesión de retroalimentación con la IAG donde se discutan los resultados y posibles mejoras para futuras tareas.

Ejemplo de Evaluación con una Rúbrica

Imaginemos una rúbrica simplificada con los siguientes criterios y niveles de desempeño para una tarea escrita:

Criterio

Excelente
(5 puntos)

Bueno
(4 puntos)

Regular
(3 puntos)

Insuficiente
(2 puntos)

Muy Insuficiente
(1 punto)

Contenido Información clara y precisa, bien desarrollada Información clara y precisa, desarrollo adecuado Información mayormente clara, desarrollo regular Información poco clara, desarrollo insuficiente Información confusa, muy mal desarrollada
Organización Estructura lógica y coherente Buena estructura, algunos errores menores Estructura adecuada, algunos errores Estructura desorganizada Sin estructura clara
Gramática y Ortografía Sin errores Pocos errores Algunos errores Muchos errores Errores graves y frecuentes
Creatividad e Innovación Ideas muy originales e innovadoras Algunas ideas originales e innovadoras Pocas ideas originales Falta de originalidad Sin originalidad

Ejemplo de reporte generado por la IAG aplicando la rúbrica para cada tarea:

Estudiante A:

Estudiante B:

Ventajas de Utilizar IAG en la Calificación
Desventajas de Utilizar IAG en la Calificación
Conclusión

La Inteligencia Artificial Generativa ofrece oportunidades significativas para mejorar el proceso de calificación de tareas y exámenes en el ámbito educativo mediante el uso de rúbricas de evaluación. Sus capacidades para analizar texto, evaluar contenido, y proporcionar retroalimentación detallada pueden transformar la manera en que los docentes evalúan el desempeño de sus estudiantes, haciendo el proceso más eficiente y consistente. Sin embargo, es crucial considerar las limitaciones y desafíos asociados con esta tecnología, incluyendo la falta de contexto, la dependencia tecnológica. Al integrar cuidadosamente la IAG en el proceso educativo, se puede aprovechar su potencial para mejorar la calidad de la enseñanza y el aprendizaje, mientras se mitigan sus posibles desventajas.

Referencias

Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?. *Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency*.

Knox, J. (2020). Artificial Intelligence and Education in China. *Learning, Media and Technology*, 45(3), 304-317.

Liu, Q., Wu, Y., & Zhou, Y. (2018). Evaluating the Effectiveness of Automated Essay Scoring in a Classroom Setting. *Journal of Educational Computing Research*, 56(1), 45-67.

Luckin, R., Holmes, W., Griffiths, M., & Forcier, L. B. (2016). Intelligence Unleashed: An Argument for AI in Education. *Pearson Education*.

Williamson, B. (2019). Policy Networks, Performance Metrics, and Platform Markets: Charting the Expanding Data Infrastructure of Higher Education. *British Journal of Educational Technology*, 50(6), 3162-3175.