Professional Documents
Culture Documents
Основи на статистиката
Основи на статистиката
ВОВЕД
• ДЕФИНИЦИЈА: Статистиката е гранка на математиката која вклучува собирање, анализа,толкување и
презентирање на податоците и правење предвидувања врз основа на нивподатоци.
• Како гранка на математиката, планирањето и статистиката се од големо значење во користењето на
статистикатаспроведување на експерименти, т.е. собирање податоци што треба да се анализираат
(негативнипример: студија на Хоторн), но и толкување на добиените резултати (лажна корелација)!
• Наводно, првите статистички методи биле користени уште во 5 век п.н.е.
• Најстарите записи за употребата на статистиката потекнуваат од 9 век (арапски научник Ал-Киндизаради
проучување на кодирани пораки).
• Во 14 век се создадени записите Nuova Cronica (Историја на Фиренца) кои содржат голем број статистички
податоциподатоци за населението, образованието и сл.
• Математичкиот развој оди рака под рака со развојот на теоријата на веројатност
ПОДЕЛБА НА СТАТИСТИКА
• Описната статистика се занимава со организацијата на собраните податоциподатоци и нивен
сумарен опис со помош на нумерички и графички прикази.
• Индуктивната статистика (анг. инференцијална статистика) се занимава со извлекување заклучоци
зана популацијата врз основа на карактеристиките на примерокот.
• Математичка статистика е проучување на статистиката од математичка гледна точкаупотреба на
теорија на веројатност, математичка анализа и линеарна алгебра.
• Точната статистика е гранка на статистиката која дава точни резултати за соодветната
статистикатестови.
• Поддисциплини на статистика кои се користат во природните науки: биостатистика, хемометрија…
ОСНОВНИ ПОИМИ
• Популацијата може да има конечно или бесконечно многу објекти. На пример.популацијата на сите
студенти по хемија во втора година од до дипломскиот курс по хемија или популација на
експериментални мерења кои би ги содржеле сите резултати кои би може да се набљудува ако
мерењата се вршат бесконечен број пати под исти услови.
• Променливата е својство на секој член на популацијата(континуирани и дискретни променливи;
димензионалност).
• Примерок е збир на набљудувани резултати.
• -Ако ги погледнеме емпириските податоци, често меѓу нив ќе има еднакви мерења вредности
• Фреквенција (f i) ни кажува колку пати се појавила вредноста на променливата во примерокот или
популација.
• Релативна фреквенција (f i /N)
• кумулативни фреквенции
• кумулативни релативни фреквенции
• фреквентна дистрибуција: фреквентен полигон и хистограм,
Хистограм
Кумулативни релативни фреквенции
МЕРКИ НА ЦЕНТРАЛНА (ЦЕНТРАЛНА)
ТЕНДЕНЦИЈА
1. Средна вредност
2. Медијана
3. Мод
СРЕДНА ВРЕДНОСТ
41 11 29 7 37 1013 17 1009 5 23 31 13 2 19 3
Најдете ја медијаната.
Решение: Податоците прво мора да се подредат по големина2 3 5 7 11 13 17 19 23 29 31 37 41 1009
1013
Бидејќи бројот на податоците е непарен, медијаната е вредноста на централниот податок – 19
.Ако бројот на податоци е парен, медијаната ќе биде средната вредност од двацентрални податоци2 3 5
7 11 13 17 19 23 29 31 37 41 1009 Во овој случај, средната вредност е 18,0.Повторете ја претходната
пресметка без вредноста 1013 за која подоцна утврдивме дека е несигурна медијаната е значително
помалку под влијание на големите или малите оддалечени отколку што е случајот сосредни вредности!
МОД
• Мод е најчесто повторуваната вредност на податоците.
• ПРИМЕР
• Нека следните податоци ги претставуваат резултатите од некое мерење11 11 3 7 13 11 17 11 5 23 13
13 2 19 11
• Најдете го модот.
• Решение:Сортирањето на податоците по големина е корисно (но не е потребно) 2 3 5 7 11 11 11 11
11 13 13 13 17 19 23
• Режимот е 11.
МЕРКИ НА ЦЕНТРАЛНИ (ЦЕНТРАЛНИ)
ТЕНДЕНЦИИ
МЕРКИ НА ВАРИЈАБИЛНОСТ
• Опсегот на податоци е разликата помеѓу максимумот и минимумот вредности на
податоци
Варијација
• Варијацијата на примерокот е збир на квадратните отстапувања на сите податоци од нивната
средна вредност поделена со n − 1