You are on page 1of 5

Завдання 10.

Визначити коефіцієнт рангової кореляції Спірмена в межах


обраного прикладу з галузі інформаційних технологій засобами
програмування мови Python.

Опис системи:
Для дослідження обрано програмну реалізацію алгоритму кодування
«BKR»(стара назва «Ceasar_B»). «BKR» - це алгоритм кодування інформації,
який був розроблений у 2022 році. Базою для розробки алгоритму став Шифр
Віженера.
Для початку введемо відому нам з дисципліни «Теорія прийняття
рішень» формулу, завдяки якій ми можемо оцінити ризики безпеки та
побачити їх чисельний результат.
R=P ∙ H ,

Де R – оцінки ризиків інформаційної безпеки,


P – вірогідність реалізації загрози,
H – наслідки реалізації загрози.
Для прикладу візьмемо результати роботи на тему «Оцінка ризиків
безпеки програмної реалізації алгоритму кодування «BKR» методом
«Матриця «Наслідки – вірогідність»» з дисципліни «Теорії прийняття
рішень».

Інформаційні Загрози Вірогідність Наслідки Оцінка ризиків


активи Реалізації реалізації інформаційної
загрози Загроз безпеки

Слабкий Видання 1 8 8
логін/пароль себе за
когось
іншого
За інформаційний актив виступає слабка система захисту облікового
запису користувача, який розділяється на два типи: розробник та користувач.
Дана проблема являється основною загрозою, тому що у разі отримання
зловмисником пароля та логіну розробника, він може отримати
несанкціонований доступ до конфігураційних файлів та до бази даних, де
зберігаються дані про користувачів, алгоритм кодування та про закодовану
інформацію. Така атака може покласти кінець всій праці розробника, тому
цього всіма силами треба уникнути та запобігти.
Оцінювання наслідків реалізації загрози: 0-10
Оцінювання вірогідності реалізації загрози: 0-1
Дане рівняння можна інтерпретувати до лінійного рівняння регресії, але з
новий елементом, тобто b.
Y = A ∙ X + B,

Де A*X – оцінка ризику інформаційної безпеки


B – кількість бюджету та часу, який виділено на покращення програмної
реалізації.
Шкала для визначення кількості бюджету та часу:
Максимально 5
Достатньо 3-4
Мала кількість 1-2
Відсутні 0

1) 0 – виділено нуль ресурсів


2) 1-2 – виділено малу кількість ресурсів
3) 3-4 – виділено достатню кількість ресурсів
4) 5 – виділено максимально можливу кількість ресурсів
У роботі ми будемо досліджувати дві вибірки за допомогою коефіцієнту
рангової кореляції Спірмена, які описують кількість атак на систему
протягом 20 днів, але у різний проміжок часу(ніч/день).

Коефіцієнт рангової кореляції r-Спірмена – це непараметричний метод,


який застосовується для дослідження кореляційного взаємозв'язку між двома
ранговими змінними.
На відміну від коефіцієнта Пірсона, цей варіант коефіцієнта кореляції
працює не з вихідними значеннями змінних, а з їх рангами.

Коефіцієнт кореляції Спірмена має такі властивості:


Коефіцієнт кореляції може набувати значень від -1 до 1, причому при r=1
має місце строго прямий зв'язок, а при r= -1 – строго зворотній зв'язок.

День:
x 7 1 4 6 7 2 3 0 3 2 1 5 6 7 4 4 4 8 8 7

Ніч:
x 5 1 8 6 7 8 3 8 8 2 1 5 6 7 4 4 4 8 0 6

Гіпотеза: Кількість атак на систему однакова, незалежно від періоду доби.

Numpy/Sklearn :

import numpy as np
from sklearn.isotonic import spearmanr

data1 = np.array([7, 1, 4, 6, 7, 2, 3, 0, 3, 2, 1, 5, 6, 7, 4, 4, 4, 8, 8, 7])

data2 = np.array([5, 1, 8, 6, 7, 8, 3, 8, 8, 2, 1, 5, 6, 7, 4, 4, 4, 8, 0, 6])

coef, p = spearmanr(data1, data2)


print('Spearmans correlation coefficient: %.3f' % coef)

alpha = 0.05

if p > alpha:
print('Samples are uncorrelated (fail to reject H0) p=%.3f' % p)
else:
print('Samples are correlated (reject H0) p=%.3f' % p)

Результат:

Отже, гіпотезу відхилено.

Pandas:

from pandas import Series

data1 = [7, 1, 4, 6, 7, 2, 3, 0, 3, 2, 1, 5, 6, 7, 4, 4, 4, 8, 8, 7]
data2 = [5, 1, 8, 6, 7, 8, 3, 8, 8, 2, 1, 5, 6, 7, 4, 4, 4, 8, 0, 6]

print(Series(data1).corr(Series(data2), method="spearman"))

Результат:
Висновок:

Отже, можемо дійти висновку, що коефіцієнт кореляції між двома


вибірками приймає невелике значення(майже мінімальне), а також
розрахунки показують, що нульова гіпотеза являється невірною, тому
можемо дійти висновку, що кількість атак на систему все ж таки залежить від
періоду доби.

You might also like