Saptamana trecuta am aflat ca Diana Coman a reusit sa centralizeze datele de pe situl ministerului intr-o baza de date. Acest lucru nu a fost usor si o felicit atat pe ea, cat si pe cei care au ajutat-o ca au avut rabdarea sa adune aceste date intr-un fisier unic, relativ usor de folosit apoi pentru analiza de mai jos.
Saptamana trecuta cei de la Freakonomics au publicat un articol referitor la niste caracteristici observate in examenul polonez echivalent Bacalaureatului. Titlul articolului este “Another case of teacher cheating, or is it just altruism?”. Intrebarea mea e daca vom regasi aceleasi efect in notele de la Bacalaureat 2011.
Cateva precizari: In histogramele de mai jos am inclus notele tuturor candidatiilor care au sustinut o anumita proba, indiferent daca acestia au promovat sau nu Bacalaureatul. Notele considerate sunt notele finale.
Sa aruncam prima privire la subiectul de examen sustinut de toti candidatii: Limba romana.
Distributia notelor o putem vedea in histograma de mai jos:

Axa Ox reprezinta notele si are o rezoltie de 0.2. Pe axa Oy regasim numarul de note care se inscriu in intervalul [X,X+0.2]. Ceea ce frapeaza in aceasta imagine este numarul mare de note intre 5.0 si 5.2 si o penurie de note intre 4.2 si 5.0. Din acest grafic putem concluziona ca exista o tendita a corectorilor de a acorda cateva zecimi de punct (pana la jumatate de punct) celor care sunt chiar sub nota de trecere (5). Este altruism sau este vorba de un oarecare efect al notei intregi ? Nu pot sa ma pronunt! Voi semnala insa faptul ca aceeasi tendinta de asimetrie puternica intre binul [N-0.2,N] si binul [N,N+0.2], in favoarea celui din urma, exista si pentru N=6,8,9 (dar este putin pronuntat pentru N=7).
Intrebare: Este acest efect un efect general?
Mai jos puteti vedea distributia 2D a notelor la Limba romana. Pe o axa gasiti indicativul judetului (greu vizibil in acest plot, mai bine vizibil in urmatoarele histograme. Daca dati click pe plot accesati varianta PDF), pe alta axa nota, iar culoarea reprezinta frecventa de aparitie a notelor. Frecventa este normalizata in fiecare judet astfel incat in fiecare bin putem citi direct procentul unei anumite note. Am ales normalizarea in fiecare judet pentru a putea compara judetele intre ele.
In aceasta imagine este vizibil ca acest prag, la nota 5, este un fenomen general in toate judetele, iar marimea efectului este similara in toate judetele. In aceasta histograma se pot observa si crestele de la 6,8 si 9.
In imaginea de mai jos puteti vedea mai bine distributia notelor in fiecare judet.

Intrebare: Este acest efect prezent doar in cazul probei la Romana?
Nu! Acest efect l-am observat la toate probele pentru care am avut histograme.
De exemplu, mai jos, distributiile pentru proba Matematica T1:

Identic si in cazul probei Matematica T2:

In ultimul grafic mi-a atras atentia judetul Salaj care are peste 20% din notele la proba Matematica T2 undeva in jurul notei 5. Iata histograma pentru acest judet la proba Matematica T2:

Distributia arata in mod sigur ciudat. Ar fi interesant de aflat ce s-a intamplat in acel judet unde din 1551 de candidati ~360 de candidati (23%) au luat note intre 5 si 5.2.
Acum sa aruncam o privire si la proba de profil Istorie. (La Matematica T3 au fost 8 candidati si am decis sa ignor aceasta proba). Distributia nationala o puteti vedea mai jos:
La proba Istorie e evidenta penuria de note sub 5. Probabil ca subiectele au fost asa de usoare ca era aproape imposibil de luat o nota mai mica decat 4.5-4.75. Si aici sunt evidente efectele la 5,8 si 9.
Astazi ne vom opri aici! In zilele urmatoare urmeaza sa mai public anumite histograme referitoare la proba la alegere si limba materna.
Cateva concluzii intermediare:
Pe aceeasi tema:
Daca va intereseaza asemenea statistici va recomand si urmatoarele postari care au “canibalizat” datele obtinute de Diana:
Topul liceelor la Bacalaureat 2011
Despre Bacalaureat, cu cifrele pe masa
Clasificarea liceelor dupa media de la Bac 2011
Cele mai bune specializari pe blogul lui Adrian Mihalcioiu




