Noticias - News365

¿Puede la IA evaluar ensayos universitarios? Un estudio encontró que modelos de ChatGPT, Gemini y Claude favorecen textos largos y “bien escritos” sobre ideas brillantes. La IA puede ayudar, pero aún está lejos de reemplazar el juicio docente.

Javier CarbajalSoftware y Cómputo24 de mayo de 2026este enlace.

¿Qué pasó aquí? Los sistemas de IA mostraron sesgos sistemáticos al evaluar los textos. Por ejemplo, tendían a favorecer ensayos largos, con vocabulario más amplio, oraciones complejas y muchos conectores lógicos. En otras palabras, parecían reaccionar más a la forma del lenguaje que a la calidad real de las ideas. Style over substance.

Además, los LLM exhibieron una “tendencia central” que otorgaba calificaciones medias incluso cuando los trabajos eran excepcionalmente buenos. Eso significa que los mejores ensayos recibían notas más bajas de las que merecían, mientras que los peores eran evaluados con demasiada benevolencia.

“Hemos constatado que depender en gran medida de los mejores modelos de IA actuales daría como resultado una calificación de los estudiantes homogeneizada, que subestimaría la brillantez y favorecería el estilo lingüístico por encima del contenido de un juicio académico sólido”, dijo Deborah Talmi.

Paradójicamente, aunque los LLM no coincidían del todo con los humanos, sí coincidían mucho entre ellos. Los tres modelos produjeron resultados notablemente consistentes cuando se les pidió recalificar los mismos ensayos varios días después. También mostraron altos niveles de acuerdo mutuo. Para los investigadores, esto sugiere que los sistemas comparten patrones similares de razonamiento, o de error, incluso cuando pertenecen a empresas distintas.

los abucheos a Eric Schmidt).

La preocupación, por supuesto, va más allá de las notas. Varios participantes temían que una dependencia excesiva de estas herramientas termine debilitando el aprendizaje. “Es muy fácil completar un ensayo con IA; ya casi no necesitas pensar”, comentó un estudiante citado en el informe. Otros señalaron que la automatización podría erosionar las habilidades fundamentales como la lectura crítica o la argumentación.

Maestros pueden dar un respiro de alivio (o de frustración): la IA todavía es mala para calificar ensayos

Compartir

Noticias Relacionadas

CriteriaCaixa y Bankinter entran en la 'start up' de ciberseguridad 8Layers

Llega a Movistar Plus+ la criticada película de Almodóvar que sedujo a los fans

Los gadget más novedosos para disfrutar este verano en la playa (y más allá)

Dabiz Muñoz: "Estoy en mi mejor momento profesional y personal"