You are on page 1of 56

Методи за изследване в УЧР

д-р Александър Пожарлиев

Анализ на
количествени данни
Цели
 Да се предвидят основните въпроси,
които могат да възникнат при работа с
количествени данни
 Да се разпознават видовете данни и
влиянието им върху последващ анализ
 Да се подготвят данните за компютърен
анализ
 Да се разберат основните статистики за
оценка на данните
 Да се разбере представянето на данните
чрез таблици и схеми
Суровите данни изискват обработка, за
да имат смисъл

Прости Статистически
таблици за връзки между
честоти променливи,
сложни модели
Подготовка, вкарване и проверка
на данните

Необходимост да се помисли за:


 Вида на данните (скала за измерване)
 Формат, в който ще се вкарват
 Въздействие от кодиране върху последващ
анализ
 Нужда от претегляне на изследваните
случаи
 Методи за проверка на грешки
Подготовка, вкарване и проверка
на данните
Вид на данните:
 Категориални (categorical)
◦ Номинални (nominal) – не може да се определи категорията
с цифрова оценка, брой или ранг
◦ Ординални (ordinal, ranked) – може да се ранжират
 Цифрови (numerical)
◦ Интервални (interval) – могат да се определят различия
между всеки две стойности на променлива
◦ Отношения (ratio) – може да се оцени относителното
различие между всеки две стойности
◦ Непрекъснати, постоянни (continuous) – може да приеме
всякаква стойност от непрекъсната скала
◦ Отделни, несвързани (discrete) – може да приеме
определена изброима стойност от възможен брой
стойности
Видове
данни:

Mark Saunders, Philip Lewis, Adrian Thornhill (2016). Research Methods


for Business Students.Pearson Education.
Вид на данните:
 Категориални (categorical)

◦ Номинални (nominal)
– приписване на
числа, кодове –
например ЕГН, пол и пр.
Вид на данните:

 Категориални (categorical)
◦ Ординални (ordinal, ranked)
подредени по ранг, приоритет, ред
Вид на данните:

 Цифрови (numerical)
◦ Отношения (ratio) – има абсолютна нула (кг, см,
време, доходи)
Вид на данните:

 Цифрови (numerical)
◦ Интервални (interval)
Вид на данните:

 Цифрови (numerical)
◦ Непрекъснати, постоянни (continuous)
Вид на данните:
 Цифрови (numerical)
◦ Отделни, несвързани (discrete)
Подготовка, вкарване и проверка
на данните
Формат на данните:
Variables Променлива Променлива Променлива
1 2 3
Cases
Иван 13 20 1

Драган 11 18 1

Петкан 15 17 1
Подготовка, вкарване и проверка
на данните

Кодиране на данните:
 Категориални данни
 Цифрови данни
 Липсващи данни
Проучване и представяне на
данните
Проучване и представяне на индивидуални
променливи
 Индивидуални променливи и техните
компоненти:
◦ Конкретни стойности
◦ Най-високи и най-ниски стойности
◦ Трендове
◦ Пропорции
◦ Разпределения на стойностите
Проучване и представяне на
данните
Сравняване на променливи:
◦ Показване на конкретни стойности и
зависимости
◦ Сравняване на най-високи и ниски стойности
◦ Сравняване на пропорции
◦ Сравняване на трендове
◦ Сравняване на пропорции и суми
◦ Сравняване на разпределения на стойности
◦ Показване на отношения между случаите
спрямо променливите
Визуализиране на резултатите
Визуализиране и представяне на
данните
Проектиране на схеми и таблици
И за двете:

✔ Има ли кратко, ясно и същевременно даващо


нужната информация заглавие?
✔ Използваните единици на измерване зададени ли са
ясно?
✔ Представени ли са ясно източниците на данните?
✔ Има ли бележки, които обясняват абревиатури,
съкращения или специфична терминология?
✔ Указан ли е размерът на извадката, върху който се
основават данните на схемата/ таблицата?
Визуализиране и представяне на
данните
Проектиране на схеми и таблици
За схемите:
✔ Има ли ясно определени оси/ измерения?
✔ Хистограмите и техните елементи представени ли са в
една и съща логическа последователност?
✔ Подчертани ли са различията в областите с помощта на
цвят или различна плътност?
✔ Държи ли се сметка за евентуално субективно
представяне или изкривяване на данните?
✔ Има ли включена легенда (ако е необходимо)?
За таблиците:
✔ Има ли ясни заглавия на редовете и колоните?
✔ Колоните и редовете представени ли са в логическа
последователност?
Хистограма
Хистограма
Графика 1:
Процент използващи наркотици (prevalence rate) сред учениците в 10-12 клас,
Португалия за 2001г. и 2006г. след декриминализиране на наркотиците

Източник: Instituto da Droga e da Toxicodependкncia de Portugal


Хистограма
Проучване на възрастта на читателите на блогове сред 1038 и.л.

Източник: http://unwincingly1.rssing.com/chan-1886550/all_p137.html
Bar chart
Хистограма с натрупване
Stacked bar chart
Stacked bar chart
Оценки

1,00
1,50
2,00
2,50
3,00
3,50
4,00
4,50
5,00

1
Семинарът беше добре организиран и структуриран
5,00

2
Целите на семинара бяха ясни
4,94

3
Целите на семинара бяха изпълнени
4,94

4
Наученото би ми послужило в бъдещ ата работа
5,00

Семинарът беше информативен и разнообразен


4,94

Въпроси
6

Бях окуражаван/а да участвам активно


4,94
Количествени оценки (5 макс.)
11-13 декември 2015 г., Боровец, N=16,

Стилът на водене ми допадна


5,00

Като цяло бих оценил/а семинара като


5,00
Зимно училище на МП МОС “Лидерство за организационно съвършенство”

Учебните материали са
5,00
Пиктограма
Pictogram
Линейна графика
Линейна графика

Източник: EMI
Линейна графика

и хистограма
Line graph
Честотен полигон
Честотен полигон
Сравнителна оценка на
елементите на екипната работа
Сравнение спрямо най-високи и най-ниски оценки
20.00

19.00

18.00

17.00

16.00
Оценка

15.00

14.00

13.00

12.00

11.00
Споделено Умения за Принос на
Климат Сплотеност
10.00 лидерство работа в група членовете
1 2 3 4 5

Елементи на екипната работа


Сравнителна оценка на
елементите на екипната работа
Средни оценки на отделните твърдения (N=4) в сравнение със
средните оценки на 16 различни екипа (N=183)
4.00 4.00
3.80
3.75 3.75
3.60
3.50 3.50 3.50 3.50
3.40
3.20 3.25 3.25

3.00
2.88
2.80
2.75 2.75
2.75
Оценки

2.60
2.50 2.50 2.50 2.50 2.50 2.50 2.50
2.40
2.20 2.25 2.25

2.00 2.00 2.00


1.80
1.75
1.60
1.40
1.20
1.00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Твърдения
Кръгова диаграма
Pie chart
Contingency table
Описание на данните чрез
статистика
Описателна статистика:
◦ Централна тенденция
 Мода – стойността, която се среща с най-голяма
честота
 Медиана – средната, която се получава след
ранжиране на стойностите – разделя извадката
на две равни части по обем
 Средна аритметична – сумата на всички
стойности, разделена на броя им (обема на
извадката). Това е центърът на
разпределението на стойностите, около който
са групирани всички вариации (само за числови
данни)
Нормалност на разпределението
Описание на данните чрез
статистика
Описателна статистика:
◦ Дисперсия – мярка за вариране на
стойностите около средната аритметична
(разпределение на стойностите около
централната тенденция)
◦ Стандартно отклонение от средната – оценка
за вариацията (разпръснатостта) на
наблюденията
◦ Обхват на различията (range) – в интервали от
по 10%
◦ Коефициент на вариация - процент на
стандартното отклонение от средната
аритметична
Стил на учене - норми

LSI 3 Средни (Х) и Основни скали Композитни


средни скали
станд.
отклон. (σ) CE RO AC AE AC-CE AE-RO

Общо Х 25,59 27,37 33,30 33,64 7,67 6,33


(n=725)
σ 6,86 6,30 6,56 6,78 11,69 11,36

Мъже Х 24,27 27,51 34,56 33,62 10,24 6,17


(n=341)
47,03% σ 6,43 6,10 6,39 6,72 11,30 11,35

Жени Х 26,77 27,25 32,19 33,67 5,40 6,46


(n=384)
52,97% σ 7,02 6,47 6,51 6,84 11,57 11,38
Изследване на взаимовръзки,
различия и трендове чрез
статистика
Видове анализи:
◦ Хи квадрат – проверка дали две променливи са свързани или
независими
◦ Т-тестове – проверка дали две групи/ категории са различни
one-sample t test; independent-samples t test; paired-samples t test
◦ ANOVA – проверка дали три или повече групи/ категории са
различни
◦ Корелационен анализ – оценка на силата на взаимовръзките
между две променливи
◦ Регресионен анализ – оценка на силата на взаимовръзките
между една зависима и една независима променлива/
причинно-следствена връзка
◦ Факторен анализ – оценка на връзките между множество
променливи
Изследване на взаимовръзки, различия и
трендове чрез статистика
◦ Тест дали две променливи са свързани– Chi
square
Изследване на взаимовръзки, различия и
трендове чрез статистика
◦ Тест дали две групи са различни
Изследване на взаимовръзки, различия и
трендове чрез статистика
Изследване на взаимовръзки, различия и
трендове чрез статистика
◦ Тест дали три или повече групи са различни
- ANOVA
Корелации
Scatter plot
Интеркорелации между скалите на LSP
Събиране Анализира
на не на Количест
Взаимоот Подпомага информац информац вен Технолог Целепола Действен Инициат
N=514 и.л. Лидерство ношения не Осмисляне ия ия Теория анализ ии гане ост ивност
Лидерство Pearson
1 ,539** ,533** ,559** ,446** ,415** ,440** ,273** ,059 ,550** ,497** ,649**
Correlation
p= ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,183 ,000 ,000 ,000
Взаимоотношения Pearson
,539** 1 ,642** ,439** ,500** ,289** ,236** ,055 -,070 ,410** ,490** ,428**
Correlation
p= ,000 ,000 ,000 ,000 ,000 ,000 ,217 ,111 ,000 ,000 ,000
Подпомагане Pearson
,533** ,642** 1 ,472** ,480** ,311** ,262** ,063 -,057 ,367** ,385** ,423**
Correlation
p= ,000 ,000 ,000 ,000 ,000 ,000 ,151 ,196 ,000 ,000 ,000
Осмисляне Pearson
,559** ,439** ,472** 1 ,521** ,434** ,558** ,363** ,066 ,621** ,452** ,639**
Correlation
p= ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,137 ,000 ,000 ,000
Събиране на Pearson
,446** ,500** ,480** ,521** 1 ,567** ,479** ,308** ,253** ,459** ,417** ,441**
информация Correlation
p= ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Анализиране на Pearson
,415** ,289** ,311** ,434** ,567** 1 ,597** ,537** ,381** ,499** ,373** ,426**
информация Correlation
p= ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Теория Pearson
,440** ,236** ,262** ,558** ,479** ,597** 1 ,632** ,289** ,568** ,367** ,490**
Correlation
p= ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Количествен анализ Pearson
,273** ,055 ,063 ,363** ,308** ,537** ,632** 1 ,379** ,473** ,265** ,308**
Correlation
p= ,000 ,217 ,151 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Технологии Pearson
,059 -,070 -,057 ,066 ,253** ,371** ,289** ,379** 1 ,166** ,080 ,122**
Correlation
p= ,183 ,111 ,196 ,137 ,000 ,000 ,000 ,000 ,000 ,069 ,006
Целеполагане Pearson
,550** ,410** ,367** ,621** ,459** ,499** ,568** ,473** ,166** 1 ,600** ,655**
Correlation
p= ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Действеност Pearson
,497** ,490** ,385** ,452** ,417** ,373** ,367** ,265** ,080 ,600** 1 ,595**
Correlation
p= ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,069 ,000 ,000
Инициативност Pearson
,649** ,428** ,423** ,639** ,441** ,426** ,490** ,308** ,122** ,655** ,595** 1
Correlation
p= ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,006 ,000 ,000
**. Корелациите са значими при р=0.01.
*. Корелациите са значими при р=0.05.
Регресия
Регресия

You might also like