Antes, aclaro que con estos cálculos no quiero demostrar que alguien actuó de mala fe ni ninguna de esas cosas. Sólo estoy intentando evaluar un sistema de evaluación, valga la frase curiosa.
Imaginemos 23 murgas. Es de esperar que algunas tengan buen vestuario, otras buen coro, otras buenos textos, etc. Puede darse (cualquiera puede obsevarlo) que no haya una relación clara etre la calidad de unos y otros rubros, es decir, los buenos textos no siempre acompañan a los buenos coros, etc. Si se midiera cómo varía cada rubro, conjuntamente con los demás, al pasar de una murga a la otra, esperaríamos ver que cuando un rubro sube el otro baja, éste cambia y aquél se mantiene. ¿Se entiende? Si sólo fueran dos murgas, por ejemplo, nada impide que una tenga un bello vestuario y excelentes letras, y la otra tremendo coro y una notable puesta en escena. No hay un motivo para que los rubros varíen conjuntamente de una murga a la otra, y de hecho, de la observación directa (subjetividades mediante, pero subjetividades también bastante aleatorias), se desprende eso. Puede haber factores como el dinero, la experiencia, etc, que hagan que una murga tienda a tener todo alto, y otra todo bajo, pero aún así no tendría por qué haber una variación conjunta. Sin embargo, cuado se mide estadísticamente esa variación, resulta sorpredentemente armonizada. Existe un coeficiente llamado "de correlación" que mide eso. Se abrevia r. Los valores de r van de -1 a 1. Si ambas variables son iguales (por ejemplo, si comparo una murga consigo misma) el valor será uno. Si son inversas (en los rubros en que una está bien la otra está mal) me va a dar valores negativos, y si no hay ningun criterio (varían al azar) el valor se va a acercar a 0. Hice dos pruebas. La primera es para ver si sirvió de algo tener dos jurados independientes por rubro. Para ello se correlaciona la variable rubro1 para un jurado, y la variable rubro1 para el otro, y así con los demás rubros. Los resultados muestran que hay muy pocas diferencias en lo global. Los valores de r son todos positivos, y para los que junan algo de estadística, altamente significativos. En otras palabras, si en vez de haber dos jurados hubiera puntuado uno en las dos rondas, el resultado final habría sido prácticamente igual. Lo cual es muy sorprendente si se tiene en cuenta cuánto varían los gustos personales en la gente que uno conoce.
Por otro lado, al correlacionar todos contra todos vemos que se mantiene exactamente lo mismo. No importa quién puntúe ni en qué rubro: cuando paso a tal murga, todo tiende a subir, y cuando paso a tal otra, todo tiende a bajar. Hay pequeñas variaciones que son las responsables de que los coeficientes no sean todos = 1, por supuesto. Los valores 1 de la diagonal se deben a que ahí sí estoy comparando cada rubro consigo mismo.
En esta tabla usé un coeficiente distito que no toma en cuenta el puntaje exacto, sino la ubicación de ese conjunto entre los demás si sólo se tuviera en cuenta ese rubro. El resultado con el otro coeficiente es muy similar. Cada una de estas "similitudes" tiene una probabilidad menor al 1% de deberse al azar. La probabilidad de que todas se deban al azar es tan baja que para escribirla tendría que poner cero y 59 ceros después de la coma; una probabilidad similar a la que hay de que tirando 200 veces una moneda salga siempre cara. Por lo tanto, hay que buscarle una explicación a esto. Se escuchan ofertas; "pad" ya tiró alguna. Una cosa nueva: si hago las correlaciones dejando afuera a la visión global que puso cada jurado, muchos coeficientes bajan. Esto indica que lo que está correlacionado es el puntaje puesto por cada persona, no importa en qué casillero de su planilla lo haya puesto. No es un detalle menor; la visión global, más que como eso, funciona como una especie de ajuste para mantener a los conjuntos en su lugar, sea alto o bajo. Una especie de corrector del puntaje otorgado en el rubro, que disimula un poco la pegajosidad. Si yo me fijo sólo en los puntajes de los rubros (sin visión global) puedo no darme cuenta de dicha pegajosidad. Pero claro, lo que cuenta al final es el puntaje total, no importa de dónde venga. El razonamiento sería "a éste que está abajo le puese mucho en el rubro, le voy a bajar en VG", o al revés. Voy a ver qué pasa sólo con la VG; debería tener también correlaciones más bajas que la suma rubro+VG. Otro razonamiento podria ser: hay conjuntos buenos y malos. Si uno bueno, por casualidad, está bien en un rubro, igual va a tener VG baja, porque es malo, y viceversa. Aunque eso no explica por qué la correlaci´n de las sumas VG*rubro es tan alta. Me estoy poniendo denso, ya sé, pero esto es importante para entender como funciona el concurso.
Para la anécdota, o no tanto...
Teniendo en cuenta el orden de los conjuntos en las dos primeras ruedas (y no las diferencias que marcan en los puntajes), el jurado que más "le embocó" al resultado final fue Iván Solarich, y el que más discrepó, Juan Shellemberg. Los dos jurados más parecidos (entre sí) fueron De Enriquez y Peyrou, y los dos más distintos , Ramírez y Espondaburu. En cuanto a los rubros (sumando ambos jurados e incluyendo la visión global), el mejor predictor es el el rubro 4 (puesta e escena) y el peor, el rubro 1 (coros). Esto último es asombroso ¿no? Aunque sospecho que en rubro 4 hay algo mal en el orden en que vienen los rubros en la planilla. Habrá que cotejar. Después lo haré incluyendo la liguilla, para lo cual hay que hacer unos revalúos con los que no entraron. También hay que discriminar la visión global como rubro aparte. Y antes de que vengan las interpretaciones, me gustaría plantear esta preguta: el "errarle" o "embocarle" con tus putajes al resultado global ¿es positivo, negativo, neutro, o depende -en caso de errarle- de para dónde le erres?
Deberían unirse los directores de conjuntos de carnaval, nuclearse en una asociación y elegir delegados para reunirse con las autoridades que hacen el carnaval, sea IMM, Tenfield o wherever, y plantear esas inquietudes.
¿Tas jodiendo? Esa asociación existe y se llama DAECPU. De hecho, todos los años se intenta mejorar el sistema de puntuación, y en mi opinión la última reforma, la que establece factores para diferenciar rubros (en lugar de los distintos máximos que antes había según el rubro y la categoría) es altamente positiva, si bien después cuesta un poco entender la planilla. Sin embargo, que yo sepa, nadie hizo nunca un análisis de este tipo, y por eso lo hago. Alguien que sepa más que yo de estas cosas lo podría hacer mejor. Es contratar a un estadístico y ponerle al lado a alguien que le explique cosas del carnaval.
Habia escrito una reflexion fabulosa sobre los jurados, el sistema de calificacion, el carnaval, la murga, un duende, barny, y los agujeros negros, pero por alguna inexplicable razon se borró todo al carajo. Que alegria que alegria, ole ole olá.
Por eso te decía, corazón. Todos los años cambian, o sea que no dan resultado, y espero que estos puntos que estas ampliamente mostrando ante la generación webnautas pueda llegar a esa asociación e ir mejorando la cosa. O talvez ellos entran y toman nota de lo que aquí se plantea. En realidad con mi sarcástico comentario quería saber si lo estabas planteando en DAECPU o si solo eran charlas en las madrugadas frente a un monitor. No era para que te enojaras tampoco.
No me enojé, darling, sólo me reí. Pero te contesto: ni una cosa ni la otra. A esta página entra más gente de la que parece, sólo que la inmensa mayoría no escribe. Y no es cuestión de plantear reformas, si lo que se desprende hasta ahora de esos números es que... bueno, no quiero adelantarme. Pero digamos que después veremos qué es mejor, si aplicar a rajatabla un reglamento malo (lo de los rubros), o finjir que se lo aplica pero en realidad actuar más o menos por concenso. Evidentemente, una solución, de confirmarse tal hipótesis, es eliminar los rubros y seguir actuado como hasta ahora, para evitar esas calenturas de "¡Cómo tal murga me ganó en coros!", y cosas así. Pero ¿te imaginás qué aburrido que la noche de los fallos se limite a "Ganó Fulano"?
Deberías hacer los cálculos necesarios para obtener los coeficientes de asociación entre la visión global que califica cada jurado y su rubro puntual. Allí encontraremos un razonamiento similar al que haces vos, o al menos eso preveo. ¿Cual sería la teoría general? Hay factores que no hacen a lo que evalúa cada rubro, leáse tanto "hipotesis de la pegajosidad" como cualquier otro factor, que sin embargo influyen de manera decisiva en las calificaciones que se reflejan en cada rubro.
Probablemente tenga cierta lógica que un gran vestuario haga a una mejor visión global, y asi con cada rubro. Pero es asombroso ver como siempre las altas visiones globales van asociadas a altos puntajes de ese rubro. Esto sigue la misma lógica que planteas vos. ¿No es posible que un jurado aplique un 12 a vestuarios y se despache con un 5 en VG? Y viceversa. (Que buen nombre para una murga...) En este sentido también hay un condicionamiento externo de los parámetros utilizados para juzgar cada rubro.
Me olvidaba. Todo esto, y otras consideraciones mas interesantes, pero mas largas, me surgen de la actuacion de La Mojigata.
He visto con asombro, y con alegría, la nueva escala social caranvalera que adquirió esta murga. Un sexto puesto es básicamente como que Rampla salga campeón de la libertadores. Aunque probablemente sea una porquería al lado de los espectáculos que nos entregan año a año. En fin, estuve pensando, ¿que tanto tuvo que variar LM para llegar a esta posición? Realmente no le encuentro explicación a que este año LM salga sexta y, por ejemplo, el año 2006 no hay salido primera, o al menos octava al menos... O el 2004. Es decir, yendo rubro por rubro, salvo voces, un subrurbro por otra parte, no hay lugar donde LM naya hecho una mejora tan notoria. Sin dudas el texto no esta por encima de 2004 o 2006, tampoco el vestuario, tampoco la puesta en escena. Pueden estar por arriba o por abajo, nada que amerite aumentar 10 posiciones de escala murguera. Y esto solo se puede comprender por que hay factores extra rubros que condicionaron, negativamente, a la murga en su momento, y otros que lo hicieron, positivamente, en este caso. No estoy seguro cuales son ellos, probablemente una especia de presión popular, tal vez la ausencia del año pasado. No lo se.
Por lo visto totod esto se aplica también a LGS, aunque siento que el Carnaval ha sido un tanto más benevolente con ustdes otros años (aunque siempre injusto creo) y esperaba que teniendo en cuenta eso quedaran un poco más arriba.
Todo esto trata de seguir línea por la cual es indiferente, cuantos son los jurados, cuantos los coeficientes, cuantas las ruedas, dado que los resultados están prácticamente resueltos de antemano.
Si no, no explico como habiendo visto apenas 5 conjuntos carnavaleros, y escuchado otro tanto, se pueda predecir la ubicación casi perfecta de todas las murgas liguilleras, y los ganadores de las otras categorías.
Lo que pasa es que si esto es realmente un concurso habría que darle la característica de tal.
Cuando uno postula para un artículo en una revista académica, los jurados de esa revista reciben todo a sobre cerrado, leen los artículos y opinan sin saber quien es el autor.
Igual los concursos de literatura, donde uno no sabe a quien está calificando hasta que no están los resultados.
En fin, si bien el jurado puede imaginar por el estilo de la escritura quien es el autor, no sabe efectivamente a quien está calificando. Lo cual genera que puedan estar leyendo a García Marquez y a mi con la misma imparcialidad, y esto hace que gane García Marquez, con toda justeza pero luego de batallar. No previamente a la lectura como sería el resultado de que se sepa que por un lado está el colombiano y del otro lado yo.
Es cierto eso. Está bueno el anonimato. Los textos se podrían puntuar perfectamente antes que comience el carnaval.
También es medio raro lo de las ternas en el rubro. ¡La mojigata y la catalina! Es como que el jurado de un concurso literario premie a García Márquez y a Jorge Bucay. No es coherente y me parece muy ambiguo. Si el jurado terna a la catalina me parece más lógico que la acompañen el tuleque o la margarita. Y si le gusta la mojigata, la gran siete, queso magro, que se yo. Seguir una línea. ¿Qué buscan? ¿Qué están premiando? No encuentro nada de Pallares para leer en Internet, ¿publicó algo? ¿Qué escribe?
No se, puntuar los textos fuera del contexto no me parece bien, creo que leer el libreto de LM o LGS o cualquier otra sin verlas es muy dificil. Pero habria que implementar algo en ese sentido...
Leí todo medio por arriba (no tengo tiempo ahora) pero va un pequeño aporte (?!?!).
Lo que creo bastante inútil son los coeficientes (encima con decimales). Si sumás los puntajes sin aplicar los coefs. da "casi" igual (sólo queda intercambiada la posición de dos murgas, creo que los diablos y todavía no se sabe).
Estuve analizando las visiones globales, hice algunas gráficas ... después las mando. No llegué a ninguna conclusión, no está muy atado los puntajes individuales con la VG (por ej. en algún rubro creo recordar que la mojigata puntúa muy bien en VG y no por rubro individual).
Por último, quizá sería aburrido que la noche de los fallos se limitara a "ganó fulano", pero sería mucho más sano. De a ratos me siento entrando en un juego del que no quiero ser parte (algo así como votar en las elecciones). Te dan la planilla sólo para que te distraigas, porque los puntos no tienen ni ton ni son y por más que analices, nada cambia nada, va a seguir ganando quien tenga que ganar. Perdón si esto resulta un bajón, pero 'ta ... ... ¿es lo que hay?
Lo de los coeficientes es para ver cómo varía cada rubro al pasar por las distintas murgas. Paso a la demi, bajo 4 puntos, voy a la moji, subo 2, llego a los curti, subo tres, paso a la gran siete, me voy a la pgran puta. Eso es lo que es uimposible que ocurra espontáneamente. La suma no te habla de eso. Creo, si te entendí bien.
Si me estabas hablando a mí, me refería a los coeficientes con que se ponderan los puntajes de cada rubro (del 1 al 12, calificación escuela). Era un comentario a algo que decía mucho más arriba, sobre modificaciones del sistema en los últimos años. Creo que está bueno puntuar todo del 1 al 12, y las multiplicaciones siguientes me da la impresión que no aportan nada. Saludos, Ana
Anónimo, ó Ana, ó Anánima: si se punteara todos los rubros del 1 al 12 valdría lo mismo un 10 en maquillaje que un 10 en musicalidad, y eso es una idea tan loca que PODRIA FUNCIONAR!! (no mentira). No creo que haya sido eso lo que quisiste decir, probablemente yo te haya mal interpretado, es que son las 11 de la noche, y eso de madrugar a uno le estropea la capacidad de comprension. Saludos, marcelónimo... o_O
Encontré la explicación a la probabilidad de que las similitudes sean tan pero tan bajas, si las comparamos como bien dijiste con la probabilidad de que tirando una moneda 200 veces salga siempre cara, es muy simple: la moneda está cargada, no hay vuelta que darle.
Buenisimo post. Estoy seguro que se le pueden sacar mucho mas jugos a la data. Los modelos de regresion logistica dictomizan la variable dependiente, estimando la probabilidad de tener determinado resultado dada ciertas condiciones. (Se podria utilizar como variables independientes la posicion del año anterior, la posicion en la primera rueda, así como alguna codificacion de murga grande/chica a partir de un estimativo de las posiciones en los ultimos 6-10 diez años ponele). Que delirio. Pero ta, como estaría...
Seria bueno hacer una predicción antes de ver los conjuntos y embocarle bastante. Aunque creo que para eso no se precisa un modelo. El año que viene la moji y LG7 bajan dos puestos, El tuleque sube, la catalina baja, gana la murga donde salga el pitufo, ¿sigo? Je je.
Anánima ... me encantó :-) Es lo bueno de internet, pero nada de múlptiple personalidad (ana=analía=anánima).
Lo que planteaba quizá es ridículo (que pese todo igual), pero me parece que la ponderación no tiene efectos prácticos (demostración empírica trucha).
Venía pensando (en el ómnibus?!) que pasa porque los rubros no son variables independientes (deberían quizá, pero no lo son). Las murgas puntúan más o menos parejo en todos los rubros (que creo que es algo de lo que vienen diciendo, porque gl me marea un poco intentando demostrar algo que todavía no se especificó que es ... pero este delirio lo sigo en otro momento).
Y esto no me resulta tan antojadizo, la experiencia y otros factores influyen y mucho. O quizá no se llame experiencia, sino expectativa generada o algo así.
Igual habría que entrar a clasificar las murgas. Hay murgas que por tener un buen ¿coro? ¿marketing? ¿figuras? ¿pronóstico? consiguen auspiciantes, figuras, buenos trajes, alguien que escriba ... (no sé cuales variables son independientes y cuales dependientes). Es decir, hay murgas que pueden "comprar" un buen espectáculo (uhhh suena medio fuerte ¿no?). Y hay murgas que pueden ser buenas y pobres (y este es el único caso que se me ocurrió para que una murga puntue "desparejo").
En realidad ahora que me puse a mirar un poco cambié de hipótesis de trabajo. Me parece que el concurso premia la "parejitud". Ahora va la explicación que viene ¿medio? entreverada.
Si sacás por cada rubro y cada murga, el total de visión general entre las tres ruedas, y lo graficás ... ves que las murgas más parejas en puntuación entre los rubros son las que salen más arriba, las de más abajo son más desparejas (hay una excepción, el queso tiene visiones generales parejas y resultados malos). Es algo así como que la desviación de esa serie indica el puesto de la murga (me faltan herramientas estadísticas ... help!). Con las gráficas se entendería mucho más (una imagen vale más que mil palabras), pero no sé si se puede mandar acá ni como.
Bueno, paro por acá. Voy a seguir leyendo vuestros aportes del día de hoy (la telenovela viene muy apurada para mis tiempos), y está muy complicada.
Recién ahora leí todo y entendí (¿creo?) lo que están planteando. A la vez me di cuenta que me estaba mandando cualquiera (conceptos errados varios). Pa' la próxima prometo pensar más antes de abrir la boca :-) Saludos, Ana
Vale depende de por qué no te den las bolas... si es porque sí, no, no vale... ya hace mucho que no actuan... piénsenlo... Y cuando sientas que tenés ganas me avisás ¿Ta'? F.
Analía dice que el desvío estándar de los puntajes es directamente proporcional a la ubicación de un conjunto. ("Directa" si consideramos que el número 15 es mayor que el número uno, aunque se diga que está "más abajo".) Para eso tenés que tener una hipótesis que lo justifique -lo cual es medio complicado-, y además, demostrarlo, lo cual es mucho más sencillo. Para anonimo: Los Mareados van a estar 6 veces en Guambia en abril, para despedir al Rafa y recibir a su sustituto. En mayo volvemos a tocar para recibir al Rafa y despedir a su sustituto; je je. No, es una broma. El Rafa dice que se va pa' no volver.
Eso de la relacion entre desviacion de los puntajes y las posiciones no lo habi visto. Puede ser interpretado de otra forma: hay murgas "grandes" (yo las llamos murgas con el certificado para ganar CPG, una certificado que esta en manos de tres o cuatros grupos-colectivos o personas. La catalina lo saco en el 2005) que tienen minimos mas altos que el resto de las murgas, y maximos mas altos, y a su vez esa franja de movilidad es bastante mas pequeña que las murgas que no tienen el CPG.
Me explico. Si curtidores hubiese tenido el texto de lg7 seguramente hubiese ganado; la mojigata teniendo un espectaculo cargado de tristeza como la catalina hubiese quedado en la cola. Cada murga tiene como un franja de oscilaciones de puntajes posibles en razon de haber sacado el certifaco CPG. Esto se puede graficar es claro, aunque a mi no me dan las bolas. Pero estoy seguro a olfato nomas que lo que tendriamos es algo asi como franjas anchas de oscilacion de murgas "pequeñas", y franjas mas reducidas de ciertas murgas "grandes". Aunque en la mayoría de los casos los minimos de las murgas con CPG se tocan con los maximos al que pueden aspirar las murgas sin CPG.
Ejemplos: Queso Magro, mojigata y la gran siete. Sextos o septimos como mejores posiciones. El grupo Tuleque-diablos (Preziosi-Atay) tuvo como peor posicion creo un septimo puesto; Contrafarsa-Asaltantes (grupo Marcel-Pitufo) tuvo como peor posicion un septimo puesto con la matinee. Todo estos en los ultimos diez años, mas o menos. Creo que la catalina logro a presion popular el certificado CEP, por lo que dificilmente baje del quinto puesto de aca a que se jubilen.
Pad, ¿Vos decís que si por ejemplo la catalina hubiera hecho el espectáculo de lg7 hubiera ganado igual??? No creo que la catalina no baje de los primeros cinco hasta que se jubilen. Quizá sea mi ilusión, pero no sé ... es un fenómeno raro ... tiene mucho apoyo, pero también mucha gente que no la quiere en lo más mínimo (entre los que me cuento) y no es por querer a una murga rival (lo que podría tacharse de comportamiento "futbolero"). Pero más allá de la susodicha, que no sé como hacen para permanecer ahí arriba, el ejemplo más curioso e inexplicable me resulta la margarita. Saludos, Ana
Hay pegotines, el Nueva Palmira queda en Nueva Palmira y Defensa Esta noche estaremos por ahi degustando algo que preparara la gente del club en nuestro honor. Os esperamos.
Sí, sí, sí, definitivamente me cuento entre los hinchas palurdos e ignorantes de La Gran 7, puesto que no entiendo nada de coeficientes ni variables (incluso tuve que buscar la palabra "palurdo" en el diccionario), y como si fuera poco sin un mango para pagarse nada. De todas formas, la murga me parece genial, tan infeliz soy? Y si este comentario les pareció al pedo ni se imaginan lo que van a ser los siguientes. Arriba, La Mari.
Arriba la Mari! A mi me encantan ese tipo de comentarios. Ya me estaba aburriendo con los números. Aguanten los platos de melamina, las tortas de atún y lg7.
¿Los resultados de la prueba de admisión no influyen? Es decir, ¿habrá gente que parte de la prueba de admisión a evaluar? Una cosa curiosa, pero que puede no pasar de ser una gansada, es que debajo de un pelotón de la categoría "puede ganar", vinieron las 3 primeras de la prueba de admisión: queso magro, lg7 y la moji, aunque en diferente orden.
Che ¿y tienen remeras chicas? (... todavía no he podido convencer a ninguna murga que saque una línea de "musculosas", cuando es claro que es el negocio del siglo).
No sé lo que es palurdo y no lo busqué en el diccionario ¿estoy mal?
esto ya parece el código da vinci, para una hinchada palurda es demasiado.
Ana, te pongo el significado así lo pispeas acá. palurdo, da: (del fr. balourd) dicho por lo común de la gente del campo y de las aldeas: Tosca, grosera. Saludos.
Pero la esencia de un "palurdo" va más allá de se definición.
Hablando de esencia, todavia tengo esencia a atún en mi. La pasta colgate es una cagada...eso diria si me hubiese lavado los dientes...eso diria si tuviese dientes...eso diria si tuviese cuerdas vocales... -""- pulmones... -""- caja toraxica... -""- organos vitales... -""- cerebro... -""- capacidad de comprension...
¿y como hace un dedo para comer una torta de atún? mucha propaganda de coca-cola ... saludos, ana pd. no te distraigas y seguí con la esencia de palurdo
Agregue un parrafo, para los amantes de los números, que puede resumirse asi: los sub-rubros por separado se correlacionan mucho menos entre si (por ejemplo, los "arreglos corales" con el "movimiento escenico") que los totales de cada jurado (el total que Aldado le dio a cada murga con el total dado por Solarich). Esto refuerza la idea de que la pegajosidad radica en las personas y no en los rubros.
En la página de carnaval de futuro hay unos comentarios sobre una mesa redonda con los jurados ... hay alguna cosa interesante (más bien poco, pero buehhhh).
Por cierto ¿hoy no daban las menciones o entendí cualquier cosa?
Y ni hablar de usar "machine learning", que es un método (varios) de clasificar cosas y predecir que está muy en boga. Con eso se pueden saber los primeros premios de aquí al 2015. No habría necesidad de escribir, ensayar, conseguir plata, nada. Un gran avance en el sistema de puntuación.
Resupesta a comentario que lei por ahi y me olvidé dónde: siempre creí que "la griega" era la más alta, porque hablaba más. Se ve que una habla y la otra escribe.
Largá algún tema nuevo Flaco... Me estoy muriendo con tantos cálculos y cosas similares... F. P.D.: pa'l 2015 si, no está la Catalina... gana LG7, la esperanza es lo último que se pierde!