You are on page 1of 7

STATISTICĂ - NOȚIUNI DE BAZĂ

Ce este statistica? Ce este biostatistica?

Studierea unor fenomene în care intervin factori sau mărimi complexe care nu pot descrise
satisfăcător prin ecuații sau formule se face cu ajutorul statisticii. Statistica se ocupă cu prelucrarea
informațiilor din lumea înconjurătoare: clasifică datele, descoperă legături între date, grupează
informații, centralizează datele în tabele etc. Statistica face și generalizări ale unor ipoteze
descoperite de obicei empiric. Statistica este știința care prelucrează informații care se referă la un
număr mare de entități cum ar fi pacienți sau indivizi sănătoși sau plante sau obiecte de altă natură.
Fenomenele din lumea înconjurătoare, condițiile în care au loc aceste fenomene dar și relațiile
dintre acestea reprezintă unul din obiectele de studiu ale statisticii.
Definitie: Statistica este știința colectării, clasificării, prezentării, interpretării datelor numerice și
a folosirii acestora pentru a formula concluzii și a lua decizii.
Există un mare număr de definiții ale statisticii fapt care are mai multe explicații; istorice
– statistica s-a constituit la confluența mai multor orientări şi discipline, dar având la origine un
caracter social; metodologice – statistica încorporează o serie de metode în care predomină cele
cantitative, cu fundamentarea epistemologică corespunzătoare; aplicative – prin generalitatea
metodelor sale, statistica se aplică în cele mai variate domenii, de la astronomie la societate, de la
microcosmos la macrocosmos în natură şi societate, de la fizica statistică până la statistica socială.
Pentru obținerea unor rezultate consistente și relevante în cadrul unui studiu statistic este necesară
utilizarea a două abordări complementare:

➢ Statistica descriptivă se ocupă cu colectarea, clasificarea, prezentarea datelor numerice și


descrierea fenomenelor sau a unor părţi ale acestora fără a se ocupa însă și de regularitatea
cu care se manifestă acestea, a legilor care guvernează aceste fenomene.
➢ Statistica inferențială se ocupă cu interpretarea datelor oferite de statistica descriptivă și
cu folosirea acestora pentru a formula concluzii și pentru a lua decizii. Ea face trecerea de
la statistica descriptivă a unui eșantion la descrierea întregii populații care este caracterizată
de fenomenul respectiv. Altfel spus, statistica inferențială presupune metode pentru
inferența asupra populației generale având la bază informații ale eșantionului desprins din
colectivitatea generală. Inferenţa statistică reprezintă o generalizare, o estimare care se
referă la o populație și care se bazează pe informațiile statistice obținute pe un eșantion
extras din populația respectivă.

Biostatistica este ramură a statisticii care se ocupă cu studiul fenomenelor biologice şi medicale,
al eficacităţii metodelor de profilaxie şi tratament, biostatistica aplică metodele specifice statisticii
problemelor biologice și medicale permițând găsirea unor răspunsuri pentru întrebări ca:

➢ Un tratament nou este mai bun/eficient decât cel clasic?


➢ Care sunt riscurile când se alege un nou tratament?
➢ Care sunt valorile normale pentru un anumit proces biologic?

Concepte de bază utilizate în statistică

Populaţia (colectivitatea statistică) reprezintă totalitatea elementelor de aceeaşi natură, care au


trăsături comune şi sunt supuse unui studiu statistic într-o anumită perioadă de timp și spațiu.
Noțiunea de populație nu se referă neapărat la grupe de indivizi, ci la o caracteristică comună
tuturor indivizilor care urmează a fi studiată.

Exemple de populații:

➢ populaţia României la recensământul din anul 2011,


➢ opiniile părinţilor cu privire la sistemul de învăţământ din România, 2010,
➢ totalitatea vaccinurilor antigripale produse într-o perioadă de timp la un institut.

Realizarea unei cercetări pe o colectivitate numeroasă poate fi foarte costisitoare și consumatoare


de timp, soluţia fiind extragerea unei părți din colectivitatea generală, denumită eşantion.

Eşantionul reprezintă o submulțime a unei populații selectată prin tehnici şi metode specifice, care
urmează a fi studiată pentru a obține informații cu privire la întreaga populație.

Eroarea standard este indicatorul care arată precizia cu care este aproximată media unei populații
din care s-a extras eșantionul pe care s-au făcut măsurătorile. Eroarea standard (SEM=standard
error of the mean), după cum se vede din formulă, va fi totdeauna mai mică decât dispersia selcției.

Ea se calculează cu formula:
Err =
 , unde  = deviația standard a populației,
n

n = volumul eșantionului
și este influențată de numărul de valori din serie: cu cât n este mai mare Err este mai mică dacă
 rămâne neschimbată. SEM este un indicator foarte important pentru estimarea mediei unei
populații, bazată pe rezultatele obținute pe eșantioane. Prin convenție, termenul de eroare
standard, se referă la variabilitatea distribuției de eșantionare. Mulți autori folosesc eroarea
standard pentru a prezenta distribuția unei selecții/eșantion deoarece eroarea standard fiind mai
mică decât dispersia prezintă o variație mai mică a rezultatelor.

Studiul statistic confirmă sau infirmă anumite rezultate sau păreri cunoscute. El cuprinde:

➢ descrierea detaliată a modului de recrutare a subiecților,


➢ caracteristicile eșantionului,
➢ gradul de reprezentativitate al eșantionului,
➢ metodele statistice utilizate,
➢ rezultatele statistice complete.

Studiile realizate doar pe un eșantion oferă rezultate îndoielnice în ceea ce privește populația
din care a fost extras eșantionul, cu un grad de incertitudine unitar (1 sau 100%), în timp ce studiile
complete (exhaustive) realizate asupra unei populații statistice produc rezultate certe în privința
populației respective, gradul de incertitudine asupra populației studiate fiind strict subunitar.
Elementul distinct al unei populații statistice care oferă informații despre aceasta se numește
unitate statistică.

Unităţile statistice pot fi:

• Simple: persoana fizică, angajatul, produsul etc.


• Complexe: familia, unitatea economică etc

Variabila statistică (caracteristica statistică) reprezintă trăsătura, proprietatea, însuşirea


comună tuturor unităţilor unei colectivităţi, care variază ca valoare, de la o unitate a colectivităţii
la alta. Trăsăturile sau proprietățile organismului uman sunt denumite în statistică caracteristici.
Astfel prelucrarea datelor se referă la prelucrarea informațiilor despre populația la care se face
referire.

Datele statistice sunt acele caracteristici numerice sau nenumerice (purtătoare de informații) care
descriu obiectele/ subiecții și se obţin din experimente, observaţii, numărare, măsurare sau calcule
statistice. Astfel, greutatea, numele, afecțiunea, sexul, vârsta pacienților reprezintă informații
despre pacienți, informații care sunt cuprinse în categoria generală de date.

Datele statistice pot fi:

• Cantitative (numerice), se exprimă numeric prin valoarea măsurată sau dedusă


experimental: înălțime, greutate, puls, tensiune arterială etc. Ele sunt măsurabile prin natura
lor, pentru ele existând unități de masură și o convenție de măsurare general acceptată.
Acestea, la rândul lor, în funcție de natura variației caracteristicilor sunt:
➢ variabile discrete – pot lua numai valori întregi și pot fi doar în număr finit - Ex:
numărul de nou născuţi pe zi la o anumită maternitate, pulsul.
➢ variabile continue – sunt exprimate prin numere reale (orice număr cuprins între
două limite date). Ex: temperatura, înălțimea, greutatea.
• Calitative (atributive) se pot exprima prin aprecieri (cuvinte) ca mic, mare, mijlociu şi li se
pot echivala valori numerice. Acestea nu au unități de măsură general acceptate.

Parametrul statistic este valoarea reprezentativă, dedusă dintr-un calcul numeric aplicat unei
repartiţii statistice (adică din legea de repartiţie).

Indicatorul statistic reprezintă expresia numerică a unor date statistice, care sintetizează o
parte a informației conținută de o serie de valori. Cu ajutorul acestora se cercetează un fenomen
bio- sau socio-medical etc obținându-se astfel o apreciere globală asupra întregii serii.

Variabilitatea datelor înseamnă orice fel de modificare, fluctuație care are loc într-o mulțime
de date (observații) indiferent de tipul lor (biologice, medicale etc). O caracteristică care se
schimbă de la individ la individ sau la același individ în timp sau ca răspuns la condițiile de mediu,
de boală, de medicație etc, se numește variabilă. O valoare numerică care se obține printr-o
măsurătoare pe un individ statistic în general, se numește variabilă având valori cuprinse între
anumite limite naturale.
“Variabilitatea” este proprietatea caracteristică tuturor fenomenelor care determină împrăştierea
sau dispersia indicatorilor de tendinţă centrală în caracterizarea seriei de variaţie şi se bazează pe
noţiunea de abatere. Este necesar ca datele să prezinte variabilitate deoarece nu se poate face
analiză statistică pe variabile care sunt constante. Cu cât variabilitatea datelor este mai mare cu
atât analiza statistică va fi mai bogată în rezultate consistente.
Seria statistică (repartiţia statistică) reprezintă un şir de valori numerice ale unei variabile
(rezultate din datele culese), ordonate după un anumit criteriu, în funcţie de şirul valorilor ale altei
caracteristici, reprezentând corespondenţa dintre două şiruri de date. O serie statistică se obține
prin analiza unui fenomen în raport cu o singura caracteristică.
Histograma

Histograma, cunoscută şi sub numele de reprezentare grafică cu dreptunghiuri a unei


distribuții de frecvențe, este unul din cele mai populare moduri de reprezentare şi rezumare a
datelor. Un dreptunghi reprezintă frecvenţele sau proporţiile observaţiilor pentru fiecare interval
de grupare, aria dreptunghiului fiind proporţională cu frecvenţa (sau proporţia) observaţiilor dintr-
un interval de grupare. Pe axa orizontală (axa Ox) sunt reprezentate intervale de valori iar pe axa
verticală (axa Oy) sunt reprezentate valorile frecvențelor corespunzătoare intervalelor de valori.
Intervalele de grupare trebuie să fie de lăţime egală, înălţimea dreptunghiului fiind proporţională
cu frecvenţa observaţiilor din interval.

Un exemplu de histogramă este dat în figura următoare:

Dacă intervalele de grupare nu au lăţimi egale, histograma nu mai este evidentă și nici uşor de
interpretat, după cum este arătat în figura următoare:
Alegerea intervalelor de grupare pentru o histogramă depinde de natura datelor, repartiţia datelor
şi scopul urmărit în reprezentare.
Histograme [7]

Prelucrarea numerică a datelor - indicatori statistici

Pentru caracterizarea unei populații este necesară o prelucrare a datelor observate sau
adunate, acestea referidu-se la fiecare element al populației. Parametrii care descriu populația și
oferă o imagine mai completă asupra populației sunt:
➢ Parametrii care descriu tendinţa centrală a fenomenului (media, mediana, modala) –
indicatori de poziţie evidențiază poziția în jurul căreia se grupează valorile unei variabile.
➢ parametrii care descriu variaţia sau abaterea valorilor din populaţie faţă de valoarea medie
(abaterea standard, variaţia sau dispersia) - indicatori de variaţie
BIBLIOGRAFIE
1. Prasacu Irina, „Notiuni pentru studentii facultatii de Farmacie”, Ed. Universitara Carol Davila,
Bucuresti, 2019
2. Dragomirescu L., Petrisor A. I. „Elemente de ecologie numerica si modelare”, Ars Docendi,
Bucuresti, 2009.
3. N. Breaz, L. Cabulea, “Probabilitati si statistica.” Ed. StudIS, Iasi, 2013.
4. Florin Gorunescu, Smaranda Belciug, “Incursiune în biostatistică”, ed. Albastră, Cluj Napoca,
2014
5. Marius Mãrușteri, Noțiuni fundamentale de biostatisticã, 2006
6. Gheorghe-Ioan Mihalaş, Diana Lungeanu, Informatică medicală şi biostatistică, Editura Victor
Babeş, 2009
7. Sanford Bolton, Charles Bon, “Pharmaceutical Statistics. Practical and Clinical Applications”,
Fourth Editions, Revised and Expended
8. Gorunescu M., Gorunescu F., Prodan A., “Matematici superioare, Biostatistică și
Informatică”, ed. Cartea Albastră, Cluj Napoca, 2002
9. Teach yourself Statistics, https://stattrek.com/

You might also like