Noticias - News365

¿Puede la IA evaluar ensayos universitarios? Un estudio encontró que modelos de ChatGPT, Gemini y Claude favorecen textos largos y “bien escritos” sobre ideas brillantes. La IA puede ayudar, pero aún está lejos de reemplazar el juicio docente.

Javier CarbajalSoftware y Cómputo24 de mayo de 2026este enlace.

¿Qué pasó aquí? Los sistemas de IA mostraron sesgos sistemáticos al evaluar los textos. Por ejemplo, tendían a favorecer ensayos largos, con vocabulario más amplio, oraciones complejas y muchos conectores lógicos. En otras palabras, parecían reaccionar más a la forma del lenguaje que a la calidad real de las ideas. Style over substance.

Además, los LLM exhibieron una “tendencia central” que otorgaba calificaciones medias incluso cuando los trabajos eran excepcionalmente buenos. Eso significa que los mejores ensayos recibían notas más bajas de las que merecían, mientras que los peores eran evaluados con demasiada benevolencia.

“Hemos constatado que depender en gran medida de los mejores modelos de IA actuales daría como resultado una calificación de los estudiantes homogeneizada, que subestimaría la brillantez y favorecería el estilo lingüístico por encima del contenido de un juicio académico sólido”, dijo Deborah Talmi.

Paradójicamente, aunque los LLM no coincidían del todo con los humanos, sí coincidían mucho entre ellos. Los tres modelos produjeron resultados notablemente consistentes cuando se les pidió recalificar los mismos ensayos varios días después. También mostraron altos niveles de acuerdo mutuo. Para los investigadores, esto sugiere que los sistemas comparten patrones similares de razonamiento, o de error, incluso cuando pertenecen a empresas distintas.

los abucheos a Eric Schmidt).

La preocupación, por supuesto, va más allá de las notas. Varios participantes temían que una dependencia excesiva de estas herramientas termine debilitando el aprendizaje. “Es muy fácil completar un ensayo con IA; ya casi no necesitas pensar”, comentó un estudiante citado en el informe. Otros señalaron que la automatización podría erosionar las habilidades fundamentales como la lectura crítica o la argumentación.

Maestros pueden dar un respiro de alivio (o de frustración): la IA todavía es mala para calificar ensayos

Compartir

Noticias Relacionadas

Super Typhoon Bavi

Students Connect NASA Science With Indigenous Knowledge to Study Coastal Erosion

La calidad del semen varía entre regiones de España. Un estudio investigó el motivo y hay una posible causa responsable

Esto es lo que ver una final de futbol le hace a tu cuerpo, según la ciencia