26.2.20

Cómo interpretar un informe de Turnitin (I)

Así se ve un informe de similitud en Turnitin. Resaltado en rojo, el texto "fusilado" sin piedad

Bien, ya tengo mi informe de similitud de Turnitin. ¿Y ahora qué? Tengo un porcentaje, unas partes del texto marcadas con colorines... ¿Qué hago con todo esto? Ahí es donde está lo más arduo de un control de plagio, en la interpretación de los informes.

En un informe de Turnitin lo primero que siempre vemos es el porcentaje de coincidencia. Tienen un código de colores que van del azul (que correspondería a una coincidencia del 0 %; no os creáis que eso no existe, esta misma semana he obtenido una cosa así) al rojo.


¿Con esto ya nos vale? Sí y no. Sí, si obtuviésemos ese rarísimo 0 % o si el porcentaje es excesivamente elevado (¡ese 88 %...!), lo cual da para pocas dudas. Sin embargo, en la enorme escala de grises que hay entre uno y otro caso la cuestión se complica un poco.

Hace un tiempo me pidieron que buscase revistas que utilizaran por norma el control antiplagio para ver si tenían establecido un porcentaje por encima del cual rechazarían (o devolverían para corrección) los artículos que se les enviasen. No encontré prácticamente nada. Y esto es así porque solo el porcentaje (salvo en los casos que os he mencionado en el párrafo anterior) no tiene por qué ser un indicador de plagio flagrante. Dicho de otro modo, un feo resultado de un 35 % tal vez no suponga plagio mientras que uno de un angelical 8 % sí que lo puede ser. Tened en cuenta que esos porcentajes lo que nos indican es el número de palabras coincidentes que ha encontrado el programa. Pensad en una tesis doctoral de 800 páginas con 200 000 palabras (que las hay, ¿verdad, amiguis de Derecho?); un 8 % de 200 000 son 16 000 palabras, esto es, varios artículos completos que podrían haber sido "fusilados" sin contemplaciones.

En el otro caso, el del 35 %, nos podemos encontrar, por ejemplo, con tesis doctorales que sean recopilaciones de artículos que ha tenido que publicar previamente, como requisito para llegar a la defensa, su autor o autora. En ocasiones se trata incluso de reproducciones exactas del artículo tal y como apareció en su momento. Es un caso que se nos ha dado aquí, en la UC3M y que se ha resuelto estableciendo que en tesis de este tipo haya que indicar, al comienzo de la memoria, en qué artículos se basan total o parcialmente los diferentes capítulos del texto.

Otra situación relacionada con este segundo caso es la de las citas literales. No siempre se cita bien, se respeta el entrecomillado o el resaltado tipográfico, aunque luego la cita esté reflejada en el texto mediante el sistema Harvard -ya sabéis, eso de (Wilson, 2017)-, el numérico (utilizado, por ejemplo, en el estilo IEEE, donde las citas se señalan con un número encerrado entre corchetes [2]) o mediante una nota al pie, como en el estilo Chicago. En principio Turnitin está preparado para excluir las citas literales, pero otra cosa es que sea capaz de detectarlas:


Como veis en la imagen anterior, no solo se pueden excluir las citas, sino también las referencias bibliográficas, que, como es lógico, aparecerán en otros muchos textos y no son plagio. Además, tenemos la opción de no tener en cuenta un número determinado de grupos de palabras (ya se sabe que hay modismos del idioma que se repiten mucho y siempre aparecerían resaltados en los informes) o un porcentaje mínimo de coincidencia. En este segundo caso os comento como ejemplo que en la UC3M solo se consideran las fuentes de coincidencia que tienen más de un 1 % de similitud.

(Una curiosidad: sobre todo en artículos cortos que tienen mucha bibliografía, muchas veces Turnitin nos lo indica -si la bibliografía supone más del 15 % del texto del artículo- por si queremos desactivar esa opción.)

Para otro mensaje dejo cómo acceder a las fuentes originales para comparar los textos e indagar si en realidad ha habido "fusilamiento", vamos a repartir un poco la caridad...