Noile modele

Astazi seara m-am uitat (nu ma intrebati motivele! ) la Antena3 in intervalul orar 22-23.

La emisiune a fost invitat Matei Stefanescu, un tinar prezentat drept unul dintre cei care a luat o nota foarte mare la Bacalaureatul de anul acesta.

Am fost socat de modul in care se exprima tanarul. Aducea atat de mult cu vedetele omnisciente de la TV incat m-am ingrozit.

Romania de maine este televiziunea de astazi. Si cum televiziunea de astazi e mai prejos decat Romania de astazi…. alunecam alert pe toboganul imbecilitatii nationale.

La trecutu-ti mare, mare viitor !

Bacalaureat 2011 -(III)- medii si corelatii – cosmetizare de cancelarie ?

Astazi, foarte scurt, niste medii si corelatii:

Intrebare: care este media notelor candidatilor care s-au prezentat la toate materiile? (Legenda: in rosu media finala, in negru media inainte de contestatii.)

Distributia are doua varfuri. Cel de la nota 5 poate fi inteles din prisma efectului de la nota 5 de care vorbeam in prima postare. Dar varful de la nota 6? Acesta nu cred ca poate fi explicat decat prin un bias similar celui de la nota 5 dar in cazul mediei. Sa fie acesta un semn de re-corectare dupa calcularea mediilor ?

Intrebare: care este media notelor candidatilor care au trecut fiecare proba in parte?

In acest plot se vede ca varful de la nota 5 dispare dar cel de la nota 6 ramane…. si este mult mai pronuntat dupa contestatii.

Am decis sa ma uit mai aproape la acest efect. In unele judete am vazut o astfel de distributie (judetul A)

pe cand in alte judete avem urmatoarea distributie (judetul B):

Aceste grafice de mai sus m-au impins sa fac niste simulari ale acestor medii. Am generat distributii similare cu cele observate la materiile individuale pentru patru valori folosind metoda Monte Carlo si am calculat distributia mediei celor patru valori. Pentru corelatii foarte mari intre notele la cele 4 materii (factor de corelatie peste 0.95) in cazul considerarii unui numar de 1000 experimente se poate observa un varf care ar putea fi asimilat cu varful vazut in distributia judetului B de mai sus. Dar acest varf este mult mai putin pronuntat. In cazul simularii rezultatelor nationale (200 000 de experimente ) media urmeaza o distributie continuua si apropiata de distributia normala.

Avand in vedere acest studiu inclin sa cred ca in unele centre de corectare a existat o cosmetizare a mediilor imediat sub 6, cosmetizare ce a avut loc cel mai probabil dupa centralizarea locala a rezultatelor.

Intrebare: exista o corelatie intre nota la limba romana si matematica ?

Dar intre limba romana si istorie ?

In general nota la matematica este mai mica decat nota la limba romana. Pe de alta parte nota la istorie este in general aceeasi cu nota de la romana.

Bacalaureat 2011 -(II)

Asa cum am promis continui analiza referitoare la Bacalaureatul din acest an.

Astazi discutam despre proba la limba materna si proba la alegere.

Limba materna
In cazul probei la limba materna exista o variatie mare intre numarul de candidati in functie de limba. Unele limbi materne ma gandesc ca pot avea o multime relativ mica de corectori, propunatori de subiecte, profesori la clasa, multime corelata cu numarul de candidati.

Mai jos distributia pe judete a rezultatelor de la limba materna:

si distributia la fiecare limba materna in parte

Mi se pare interesant faptul ca media notelor este aproximativ proportionala cu numarul de participanti la proba. Doresc sa ma marginesc la puncta acest efect fara a face supozitii referitoare la provenienta acestuia.

In ceea ce priveste materia la alegere am considerat doar Fizica, Geografia si Biologia. Mai jos sunt distributiile acestora.

Mi se pare ingrijoratoare situatia de la Fizica. Mi se pare ca numarul candidatilor de sub 5 este mai mare decat numarul candidatilor de peste 5.2. Nu stiu daca e din cauza dificultatii subiectelor sau pur si simplu provine din predarea defectuoasa a fizicii ( trebuie sa spun ca predarea fizicii e in corelatie cu matematica. Cum in ultimul timp la matematica s-au scos din programa o serie de notiuni absolut necesare in fizica, sau au fost mutate foarte tarziu in ciclul de studii, se poate ca fizica sa simta efectul acestor modificari. )

Astazi Diana a publicat si un articol “Ce s-a aflat din datele de la BAC (vedere de ansamblu)” articol “culegere” care sumarizeaza discutiile avute in blogosfera pe marginea analizei datelor de la bacalaureat.

Bacalaureat 2011 – Nota 5 cel mai usor de luat!

Saptamana trecuta am aflat ca Diana Coman a reusit sa centralizeze datele de pe situl ministerului intr-o baza de date. Acest lucru nu a fost usor si o felicit atat pe ea, cat si pe cei care au ajutat-o ca au avut rabdarea sa adune aceste date intr-un fisier unic, relativ usor de folosit apoi pentru analiza de mai jos.

Saptamana trecuta cei de la Freakonomics au publicat un articol referitor la niste caracteristici observate in examenul polonez echivalent Bacalaureatului. Titlul articolului este “Another case of teacher cheating, or is it just altruism?”. Intrebarea mea e daca vom regasi aceleasi efect in notele de la Bacalaureat 2011.

Cateva precizari: In histogramele de mai jos am inclus notele tuturor candidatiilor care au sustinut o anumita proba, indiferent daca acestia au promovat sau nu Bacalaureatul. Notele considerate sunt notele finale.

Sa aruncam prima privire la subiectul de examen sustinut de toti candidatii: Limba romana.
Distributia notelor o putem vedea in histograma de mai jos:

Axa Ox reprezinta notele si are o rezoltie de 0.2. Pe axa Oy regasim numarul de note care se inscriu in intervalul [X,X+0.2]. Ceea ce frapeaza in aceasta imagine este numarul mare de note intre 5.0 si 5.2 si o penurie de note intre 4.2 si 5.0. Din acest grafic putem concluziona ca exista o tendita a corectorilor de a acorda cateva zecimi de punct (pana la jumatate de punct) celor care sunt chiar sub nota de trecere (5). Este altruism sau este vorba de un oarecare efect al notei intregi ? Nu pot sa ma pronunt! Voi semnala insa faptul ca aceeasi tendinta de asimetrie puternica intre binul [N-0.2,N] si binul [N,N+0.2], in favoarea celui din urma, exista si pentru N=6,8,9 (dar este putin pronuntat pentru N=7).

Intrebare: Este acest efect un efect general?

Mai jos puteti vedea distributia 2D a notelor la Limba romana. Pe o axa gasiti indicativul judetului (greu vizibil in acest plot, mai bine vizibil in urmatoarele histograme. Daca dati click pe plot accesati varianta PDF), pe alta axa nota, iar culoarea reprezinta frecventa de aparitie a notelor. Frecventa este normalizata in fiecare judet astfel incat in fiecare bin putem citi direct procentul unei anumite note. Am ales normalizarea in fiecare judet pentru a putea compara judetele intre ele.

In aceasta imagine este vizibil ca acest prag, la nota 5, este un fenomen general in toate judetele, iar marimea efectului este similara in toate judetele. In aceasta histograma se pot observa si crestele de la 6,8 si 9.

In imaginea de mai jos puteti vedea mai bine distributia notelor in fiecare judet.

Intrebare: Este acest efect prezent doar in cazul probei la Romana?
Nu! Acest efect l-am observat la toate probele pentru care am avut histograme.
De exemplu, mai jos, distributiile pentru proba Matematica T1:

si pe judete:

Identic si in cazul probei Matematica T2:

In ultimul grafic mi-a atras atentia judetul Salaj care are peste 20% din notele la proba Matematica T2 undeva in jurul notei 5. Iata histograma pentru acest judet la proba Matematica T2:

Distributia arata in mod sigur ciudat. Ar fi interesant de aflat ce s-a intamplat in acel judet unde din 1551 de candidati ~360 de candidati (23%) au luat note intre 5 si 5.2.

Acum sa aruncam o privire si la proba de profil Istorie. (La Matematica T3 au fost 8 candidati si am decis sa ignor aceasta proba). Distributia nationala o puteti vedea mai jos:

Iar pe judete:

La proba Istorie e evidenta penuria de note sub 5. Probabil ca subiectele au fost asa de usoare ca era aproape imposibil de luat o nota mai mica decat 4.5-4.75. Si aici sunt evidente efectele la 5,8 si 9.

Astazi ne vom opri aici! In zilele urmatoare urmeaza sa mai public anumite histograme referitoare la proba la alegere si limba materna.

Cateva concluzii intermediare:

  • distributiile obtinute au o abatere destul de mare de la distributia normala (Gauss). In aceste conditii gasesc ca este greu de efectuat o analiza mai exacta a datelor.
  • s-a discutat ca rata de esec la BAC 2011 a fost mare. Daca e sa readucem distributia spre o gaussiana ar trebui sa consideram o parte din candidatii care au note intre 5-5.2 picati. Ori asta ar insemna o crestere a numarului de respinsi in ordinul a 10%.
  • probabil este necesara introducerii corectarii pe subiecte (la fel ca la olimpiade). In felul acesta s-ar evita efectele din jurul notelor intregi.
  • ar fi fost frumos sa avem aceste analize prezentate e minister sau de media in valtoarea discutiilor despre Bacalaureat. Eu nu am vazut nici o analiza detaliata asupra examenului de Bacalaureat atat din acest an cat si din anii precedenti. In plus, din cele mentionate de Diana, datele apar pe situl edu.ro intr-o forma care face extrem de grea analiza lor de catre parti independente.(Daca exista aceste analize detaliate va rog sa mi le semnalati!) In orice caz astfel de analize ar trebui publicate constant de MEN si sper sa o faca mai ales ca are baza de date in ograda.
  • conform datelor prezentate “cinciul” e nota cel mai usor de luat.
  • Pe aceeasi tema:

  • Bacalaureat 2011 -(II)
  • Bacalaureat 2011 -(III)- medii si corelatii – cosmetizare de cancelarie ?
  • Daca va intereseaza asemenea statistici va recomand si urmatoarele postari care au “canibalizat” datele obtinute de Diana:
    Topul liceelor la Bacalaureat 2011
    Despre Bacalaureat, cu cifrele pe masa
    Clasificarea liceelor dupa media de la Bac 2011
    Cele mai bune specializari pe blogul lui Adrian Mihalcioiu

    BAC’ul in ziua lui Caragiale

    In cartea Ioanei Parvulescu “Lumea ca ziar – A patra putere: Caragiale” la pagina 58 avem o taietura dintr-un ziar al vremii cu rezultatele Bacalaureatului. Astfel, citim:

    Iata resultatul examenelor de Bacalaureat:

  • 60 de studenti inscrisi
  • 25 au reusit
  • 13 au fost respinsi la inscris, iar 22 la oral
  • Comisia in anul acesta a fost cat se poate de riguroasa.

    Daca facem calculul dam de o promovabilitate de 42%.
    Traim in vremea lui Caragiale! Curat murdar !