You are on page 1of 13

Тема

Проста праволиниска регресија и корелација

Ментор Изработил

Мај 2017
Содржина
Кратка содржина.............................................................................................................2

Abstract............................................................................................................................ 3

Вовед...............................................................................................................................4

1. Праволиниска регресија..........................................................................................5

2. Проста праволиниска регресија.............................................................................7

3. Прост праволиниски регресионен модел...............................................................8

4. Корелација................................................................................................................9

5. Тестирање на значајноста на оцената на коефициентот на простата


праволиниска корелација............................................................................................ 11

Заклучок........................................................................................................................ 11

Користена литература................................................................................................. 12

2
Кратка содржина

Во статистиката при истражување на квантитативно сложување на


варијациите помеѓу две или повеќе појави се применуваат методи на регресиона и
корелациона анализа. Кај регресиона анализа потребно е однапред да се одреди
која појава ќе има улога на зависна променлива, а која на независна променлива.
Ова се утврдува врз основа на теориски или емпириски сознанија, или
претпоставки за природата на анализираните појави.

Клучни зборови
Регресија, корелација, анализа, метод

3
Abstract

In statistic during quantitative research alignment of variations between two or


more acts to apply methods of regression and correlation analysis. In regression
analysis is required in advance to determine which event will act as a dependent
variable, and that the independent variable. This is determined based on theoretical or
empirical knowledge or assumptions about the nature of the analyzed phenomena.

Keywords
Regression, correlation, analysis, method

4
Вовед

Зборот регресија почнал да се употребува во статистиката кога во 1855


година Франсис Галтон објавил публикавија во која ја анализирал висината на
синовите во зависност од висината на татковците. Заклучокот од ова истражување
бил дека синовите на екстремно високи татковци не се толку високи, значи
регресирааат.

Промената на една карактеристика на статистички збирчесто влијае на


промена на други карактеристики поради меѓусебната поврзаност. Поврзаноста
помеѓу карактеристиките може да се разликува по насоката и по јачината на
поврзаноста. Најсилна и најтесна врска помеѓу карактеристиките е
функционалната врска, односно таква врска што секоја вредност на една
карактеристика одговара на точно одредена вредност на друга.

Полабава врска помеѓу обележјата, кои се подложни на помали или


поголеми отстапки, се нарекува корелативна врска. Обично една случајна
променлива се идентификува како независна, а друга како зависна случајно
променлива.

Збирот на статистички методи со кои се проучуваат заемните врски на


статистичките обележја и појави се нарекува теорија на корелација, а основните
показатели на корелациони врски се равенки на регресија и корефициент на
корелација.

5
1. Праволиниска регресија

Линеарната регресија е најкористена од сите статистички техники. Таа ги


проучува линеарните (праволиниските) врски помеѓу варијаблите,обично под
претпоставка на нормално распределени грешки.

Поимот регресија станал применуван како предмет на моделите на


линеарната статистика кога бил најпрвин проучуван при крајот на 19 век од страна
на научникот Францис Галтон. Галтон бил самоук природонаучник, антрополог,
астроном и статистичар. Бил познат по неговите изтражувања и по неговата книга,
бестселер, за тоа како да преживееш во дивината. Тој бил пионер во примената
на статистичките методи за мерење1.

За прв пат го споменал поимот регресија како „регресија кон просечност“


при објаснувањето неговиот феномен за „ таткото и синот’’ (ако височината на
таткото е Х стандардни отстапувања од средната вредност во популацијата ,
тогаш треба да се предвиди дека висината на синот ќе биде rх(r по х) стандардни
отстапувања на популација).

Во статистиката, линеарната регресија представува пристап за


моделирање на врската меѓу променливата y и една или повеќе промелниви х.
Кога имаме една променлива х тогаш станва збор за проста линеарна регресија.
Ако има повеќе од една променлива тогаш станува збор за повеќекратна
регресија. Во линеарната регресија, податоците се моделирани користејќи
различни линеарни функции, преку кои се проценуваат непознатите параметри на
некој модел. Ваквите модели се нарекуваат Линеарни модели. Најчесто ,
линеарната регресија се однесува на модел каде што очекуваната вредност на y,
дадена преку Х , представува линеарна функција на Х. Поретко, линеарната
регресија може да се однесува на модел каде што медијаната , или некој друг

1
www.psych.utah.edu/gordon/Classes/Psy4905Docs/PsychHistory/Cards/Galton.html, посетено мај 2017

6
квантил на очекуваната y ,дадена преку Х , представува линеарна функција на Х.
Како и сите форми на линеарна анализа, и линеарната регресија се фокусира на
условната веројатност на y за дадена х, наместо за заедничката веројатност на y
и х што представува област на мултиваријабилната анализа. Линеарната
регресија беше првиот вид на регресивна анализа која беше ригорозно проучена,
и која беше опширно користена во практиката. Тоа е поради тоа што моделите кои
линеарно зависат од непознатите параметри се полесни отколку моделите кои не
се линеарно поврзани со нивните параметри и поради тоа што статистичките
својства на добиените пресметки полесно се детерминираат.

Слика 1. Проста праволиниска регресија

7
2. Проста праволиниска регресија

Проста линеарна регресија е статистички метод со чија употреба се


предвидува и оценува една појава врз основа на вредноста на друга појава.
Терминот регресиона линија прв го употребил англискиот научник Франсис
Галтон2. Кај регресионата анализа потребно е однапред да се одреди која појава
ќе има улога на зависна променлива, а која на независна променлива3.

Тоа го утврдуваме врз основа на теориски, или емпириски сознанија, или


врз основа на претпоставки за природата на анализираните појави. Целта на
регресијата е да се одреди природата на врската, односно обликот на зависност
помеѓу набљудуваните појави. Тоа го постигнуваме со помош на соодветен
регресионен модел. Регресиониот модел е статистички модел кој со помош на
математички формули и соодветни претпоставки најдобро ја опишува
квантитативната зависност помеѓу варијациите на набљудуваните појави во
реалноста.

Регресиониот модел покажува просечно сложување на варијациите на


испитуваните појави. Тој сам по себе не е цел, туку тој е само средство со чија
помош сме во состојба да го оцениме и предвидиме однесувањето на зависната
променлива за саканата вредност на независната променлива. При
истражувањето на меѓусебните врски помеѓу две променливи се применуваат
прости (линеарни и нелинеарни) регресиони модели. За проста линеарна
регресија станува збор тогаш кога имаме две појави помеѓу кои постои
праволиниска зависност.

2
Ристески, Славе (2003), Статистика за бизнис и економија, второ издание, Економски факултет, Скопје
3
Wiley Freund, J., Perles, B. (2007) Modern Elementary Statistics. Pearson

8
3. Прост праволиниски регресионен модел

Линеарни равенки и равенки на линеарни врски, во овој случај:

yi’ = b0 + b1x:

x е независна променлива, y е зависна променлива, b0 e константа во линеарната


равенка во еден сегмент на y-оска, b1 е коефициент на нагиб на правата. Целта на
регресијата е да се предвиди вредноста на y за некои вредности на x. Бидејки се
зборува за стохастички врски, помеѓу x и y не може точно да се предвиди
вредноста на y за одредената вредност на x.

Затоа како можно решение се бара регресионата права ( крива ) која


најмалку ќе отстапува од емпириските податоци. Одредувањето на коефициенти
на линеарната равенка ни овозможува да го вршиме бараното предвидување.
Таквото предвидување нема да биде егзактно бидејќи мора да да се земе во
предвид грешката која се должи на стохастичката природа на врската. Модел на
проста линеарна регресија во општ облик

Yi = β0 + β1xi + εi, i = 1, 2,…, N

каде што: Yi – i-та зависна променлива, xi – i-та вредност на независна


променлива, β0 и β1 – непознати константи, регресиони параметри, ε i - стохастички
член или случајна грешка, N – величина на основната група. Независната
променлива X се нарекува објаснувачка променлива, бидејќи со нејзина помош се
обидуваме да ги објасниме варијациите на променливата.

9
4. Корелација

Целта на корелација се состои во утврдување дали помеѓу варијациите на


набљудуваните појави постои квантитативно слагање (корелациона врска) и ако
постои во кој степен или интензитет. Притоа ако се набљудуваат две појави се
зборува за проста корелација, а при анализа на повеќе појави за повеќекратна
корелација. Кај простата корелација можно е да се испитува дали помеѓу појавите
постои праволиниска или криволиниска корелација.

Кај простата праволиниска корелација двете набљудувани појави се


третираат како случајни променливи. Двете појави имаат подеднаков статус, т.е
не се прави разлика помеѓу зависната и независната променлива. Тоа значи, дека
сосема сеедно која појава ќе ја означиме како X, а која како Y, бидејќи се добиваат
идентични резултати. Задачата на простата праволиниска корелација се состои во
тоа што со неа се сака да се покаже дали помеѓу варијациите на две појави постои
праволиниска врска.

Како мерка за квантифицирање на интензитетот односно јачината на


простата праволиниска корелациона врска во примерокот се користи релативната
мерка која се нарекува Pearson-ов коефициент на проста праволиниска
корелација, или само коефициент на проста праволиниска корелација. Тој го
покажува степенот на праволиниското квантитативно слагање на две појави X и Y.
Коефициентот на простата праволиниска корелација се означува со r.

Како релативна мерка, коефициентот на простата праволиниска корелација


ги зема вредностите од -1 до +1. Доколку r > 0 тоа значи дека корелацијата помеѓу
појавите е директна или позитивна (двете појави покажуваат исто насочни
варијации). Во случај коа r < 0 врската е инверзна или негативна (кога едната
расте другата опаѓа). Во случај кога помеѓу појавите постои функционална врска
(тоа значи сите емпириски точки се наоѓаат точно на правата линија) зборуваме за
совршена или перфектна корелација4.

4
https://mk.wikipedia.org/wiki/%D0%9A%D0%BE%D1%80%D0%B5%D0%BB
%D0%B0%D1%86%D0%B8%D1%98%D0%B0, посетено мај 2017

10
Тогаш коефициентот на корелацијата зема вредност -1 (ако врската е
инверзна) или +1 (ако врската е директна). Кога r = 0, се заклучува дека помеѓу
појавите не постои праволиниска врска. Во тој случај помеѓу појавите може да
постои некој облик на криволиниско слагање или воопшто нема никаква
квантитативна врска.

5. Тестирање на значајноста на оцената на коефициентот на простата


праволиниска корелација

За пресметување на коефициентот на корелација ги користевме податоците


од примерокот и поради тоа е многу важно да се сфати дека тој укажува само на
постоење на корелација во примерокот. Меѓутоа, нас не интересира дали во
основната маса од која е избран примерокот постои корелациона врска. Тоа значи
дека r претставува оцена на непознатиот коефициент на корелација на основната
маса или популација која се означува со ρ. Овој коефициент го покажува степенот
на праволиниска врска помеѓу две набљудувани појави во популацијата. Поради
тоа, се наложува потребата од тестирање на значајноста на добиената оцена. При
тестирање на значајноста на оцената на коефициентот,r,се воведува уште една
дополнителна претпоствка, дека заедничкиот распоред на X и Y е нормален. Во
таа смисла нултата хипотеза се поставува во следниот облик :

Ho : ρ = 0 Што значи дека во основната маса не постои праволиниска корелација.

Алтернативната хипотеза се поставува во следниот облик :

H1 : ρ ≠ 0 Што укажува на постоење на праволиниска врска

Заклучок

Во статистиката се применуваат методи на регресиона и корелациона


анализа. Кај регресиона анализа потребно е однспред да се одреди која појава ќе
има улога на зависна променлива, а која независна променлива. Тоа се

11
постигнува врз основа на теориски или емпириски сознанија, или претпоставки за
природата на анализираните појави.

Цел на регресијата е да се утврди природата на врската, односно обликот


на зависност помеѓу посматраните појави. Тоа се постигнива со помош на
соодветен регресионен модел. Регресиониот модел е таков статистички модел кој
преку математички формули и со соодветни претпоставки најдобро ја опишува
квантитативната зависност помеѓу варијациите на надгледуваните појави во
реалноста.

Целта на корелационата анализа е да се испита дали помеѓу варијациите


на набљудуваните појави постои согласување и ако постои во кој степен е. Важно
е да се напомене дека со регресија и корелација не сме во состојба да откриеме
постоење на причинско последична врска помеѓу испитуваните појави во смисла
дека една појава е причина а другата е последица.

Користена литература

1. Ристески, Славе (2003), Статистика за бизнис и економија, второ издание,


Економски факултет, Скопје

12
2. Wiley Freund, J., Perles, B. (2007) Modern Elementary Statistics. Pearson
3. https://mk.wikipedia.org/wiki/%D0%9A%D0%BE%D1%80%D0%B5%D0%BB
%D0%B0%D1%86%D0%B8%D1%98%D0%B0, посетено мај 2017
4. www.psych.utah.edu/gordon/Classes/Psy4905Docs/PsychHistory/Cards/
Galton.html, посетено мај 2017

13

You might also like