You are on page 1of 18

Основи на статистиката

ВОВЕД
• ДЕФИНИЦИЈА: Статистиката е гранка на математиката која вклучува собирање, анализа,толкување и
презентирање на податоците и правење предвидувања врз основа на нивподатоци.
• Како гранка на математиката, планирањето и статистиката се од големо значење во користењето на
статистикатаспроведување на експерименти, т.е. собирање податоци што треба да се анализираат
(негативнипример: студија на Хоторн), но и толкување на добиените резултати (лажна корелација)!
• Наводно, првите статистички методи биле користени уште во 5 век п.н.е.
• Најстарите записи за употребата на статистиката потекнуваат од 9 век (арапски научник Ал-Киндизаради
проучување на кодирани пораки).
• Во 14 век се создадени записите Nuova Cronica (Историја на Фиренца) кои содржат голем број статистички
податоциподатоци за населението, образованието и сл.
• Математичкиот развој оди рака под рака со развојот на теоријата на веројатност
ПОДЕЛБА НА СТАТИСТИКА
• Описната статистика се занимава со организацијата на собраните податоциподатоци и нивен
сумарен опис со помош на нумерички и графички прикази.
• Индуктивната статистика (анг. инференцијална статистика) се занимава со извлекување заклучоци
зана популацијата врз основа на карактеристиките на примерокот.
• Математичка статистика е проучување на статистиката од математичка гледна точкаупотреба на
теорија на веројатност, математичка анализа и линеарна алгебра.
• Точната статистика е гранка на статистиката која дава точни резултати за соодветната
статистикатестови.
• Поддисциплини на статистика кои се користат во природните науки: биостатистика, хемометрија…
ОСНОВНИ ПОИМИ
• Популацијата може да има конечно или бесконечно многу објекти. На пример.популацијата на сите
студенти по хемија во втора година од до дипломскиот курс по хемија или популација на
експериментални мерења кои би ги содржеле сите резултати кои би може да се набљудува ако
мерењата се вршат бесконечен број пати под исти услови.
• Променливата е својство на секој член на популацијата(континуирани и дискретни променливи;
димензионалност).
• Примерок е збир на набљудувани резултати.
• -Ако ги погледнеме емпириските податоци, често меѓу нив ќе има еднакви мерења вредности
• Фреквенција (f i) ни кажува колку пати се појавила вредноста на променливата во примерокот или
популација.
• Релативна фреквенција (f i /N)
• кумулативни фреквенции
• кумулативни релативни фреквенции
• фреквентна дистрибуција: фреквентен полигон и хистограм,
Хистограм
Кумулативни релативни фреквенции
МЕРКИ НА ЦЕНТРАЛНА (ЦЕНТРАЛНА)
ТЕНДЕНЦИЈА

1. Средна вредност
2. Медијана
3. Мод
СРЕДНА ВРЕДНОСТ

• Просечна вредност или аритметичка средина го претставува збирот на сите податоци


поделен со вкупниот број на податоци.
• Средната вредност на примерокот се дефинира со

каде што n го претставува вкупниот број на податоци во примерокот.


Средната вредност на популацијата μ се дефинира со

каде N го претставува вкупниот број на податоци во популацијата.


- извод - средна вредност е онаа околу која збирот на отстапувањата е нула
ПРИМЕР
• Нека следните податоци ги претставуваат резултатите од некое мерење:
• 41 11 29 7 37 1013 17 1009 5 23 31 13 2 19 3
• Пресметајте ја средната вредност.
• Решение: Средната вредност на овие податоци е 150,7.(Емпириското правило е да се изрази
средната вредност со уште едно децимално местово однос на оригиналните податоци.)
• Повторете ја претходната пресметка без вредноста 1013 за која подоцна утврдивме дека е
несигурно
• Решение: 89.1
• На средната вредност значително влијаат големи или мали гранични податоци!
МЕДЈАНА
• Медијаната е вредноста на централните податоци што ги рангираат податоцитепо големина се
дели на два подеднакво бројни дела. Ако бројот на податоци е непарна медијанае вредноста на
централниот податок, а ако бројот на податоците е парен, тој ја претставува медијанатасредната
вредност на двата централни податоци.
• Разликуваме и медијана на примерокот и медијана на популацијата
• Ова значи дека во подредена низа податоци, 50% од елементите имаат вредност помала од
илиеднаква на медијаната и дека 50% од елементите имаат вредност поголема или еднаква на
медијаната.
ПРИМЕР
• Нека следните податоци ги претставуваат резултатите од некое мерење:

41 11 29 7 37 1013 17 1009 5 23 31 13 2 19 3
Најдете ја медијаната.
Решение: Податоците прво мора да се подредат по големина2 3 5 7 11 13 17 19 23 29 31 37 41 1009
1013
Бидејќи бројот на податоците е непарен, медијаната е вредноста на централниот податок – 19
.Ако бројот на податоци е парен, медијаната ќе биде средната вредност од двацентрални податоци2 3 5
7 11 13 17 19 23 29 31 37 41 1009 Во овој случај, средната вредност е 18,0.Повторете ја претходната
пресметка без вредноста 1013 за која подоцна утврдивме дека е несигурна медијаната е значително
помалку под влијание на големите или малите оддалечени отколку што е случајот сосредни вредности!
МОД
• Мод е најчесто повторуваната вредност на податоците.

• ПРИМЕР
• Нека следните податоци ги претставуваат резултатите од некое мерење11 11 3 7 13 11 17 11 5 23 13
13 2 19 11
• Најдете го модот.
• Решение:Сортирањето на податоците по големина е корисно (но не е потребно) 2 3 5 7 11 11 11 11
11 13 13 13 17 19 23
• Режимот е 11.
МЕРКИ НА ЦЕНТРАЛНИ (ЦЕНТРАЛНИ)
ТЕНДЕНЦИИ
МЕРКИ НА ВАРИЈАБИЛНОСТ
• Опсегот на податоци е разликата помеѓу максимумот и минимумот вредности на
податоци
Варијација
• Варијацијата на примерокот е збир на квадратните отстапувања на сите податоци од нивната
средна вредност поделена со n − 1

• каде што n го претставува вкупниот број на податоци во примерокот.


• Варијација на популацијата е вредноста на збирот на квадратиотстапувањата на сите податоци од
нивната средна вредност поделена со N.

• Каде што n го претставува вкупниот број на податоци во примерокот.каде N го претставува


вкупниот број на податоци во популацијата.
СТАНДАРДНА ДЕВИЈАЦИЈА

• Стандардната девијација на примерокот е позитивна вредноста на квадратниот корен на варијацијата на


примерокот

• каде што n го претставува вкупниот број на податоци во примерокот.

• Стандардното отстапување на населението е позитивно вредноста на квадратниот корен на варијансата


на популацијата каде N го претставува вкупниот број на податоци во популацијата.
КОЕФИЦИЕНТ НА ​ВАРИЈАЦИЈА
• Коефициентот на варијација на примерокот е соодносвредностите на стандардното
отстапување на примерокот со средната вредност на податоците во пример

• Коефициентот на варијација на населението еодносот на вредноста на стандардното


отстапување на населението со средната вредностподатоци во населението

• нормализирана мерка на дисперзија - таа е посоодветна за споредба од стандардната


девијација,бидејќи стандардното отстапување зависи од средната вредност, CVar е
бездимензионална количина,може да се изрази во проценти, често се користи во
хроматографијата, проблемот настанува кога средна вредност околу нула.

You might also like