Professional Documents
Culture Documents
00 Asks
00 Asks
Лекція 1
Комп’ютерні системи
множення
ділення
Модель (modulus – міра, аналог, зразок) – спрощений матеріальний, або уявний образ
об’єкта, який дозволяє досліджувати властивості та характеристики об’єкта достатнього для
експериментатора точністю, опускаючи несуттєві особливості.
Схема розроблення алгоритму
параметри
Синтез Аналіз
х-ки х-ки’
Оптимізація
Рис.1
Універсальні:швидкодія,надійність.
1) Продуктивність
2)Об’єм обладнання
Характеристики СКС:
Ці 4 характеристики які ми заводимо на початок схеми яка зображено на рис.1 так далі в нас
іде синтез і після синтезу ми отримуємо деякі параметри .Після аналізу чи відповідають ці
параметри дійсності по такій формулі :
= | х-ки – х-ки’|
C1 C2
RG1 RG2
C3
&
∑
C4
RG3
C5
Рис 2
C1
C2
Мікропограма
Мікронаказ
n
C3
C4
C5
m
1 2 3 4 5 6 7 8 9 10 t
Наприклад:
1101
1011
1101
0000
1101
1101
10001111
Опис множення в перемножувачі.
Цей пристрій був популярним в часи, коли апаратна складність у порівнянні з іншими
характеристиками мала найбільшу вартісну вагу. Тепер його конфігурація збереглася у
контролерах, у вбудованих процесорах, у багатьох видах спеціалізованих систем. Але в
згаданих схемах замість суматора використовується АЛП – вузол, який реалізує декілька
функцій. Потенційна багатофункціональність у порівнянні з іншими схемами є основною
перевагою перемножувача на багаторозрядному суматорі. Суттєвим недоліком його є те що
він є лише частиною універсальної SH-моделі. Остання містить дві SH-моделі: SH-модель
функціонального вузлу і SH-модель пристрою керування. Характеристики складності
пристрою керування залежать від обрання одного з декількох варіантів його побудови. Тому
оцінка характеристик складності пристрою керування при аналізі алгоритмів множення
недоцільна.
C t
D t
Q t
Q t
Ai Bi Ri
a b r
Pr1, i Pr2, i Ti Pr3, i-1 c
T1 T2 T3
i CM1
e' e
а б в
Рис.3 Схеми конвеєрного пристрою множення (а), комірки систолічної матриці (б),
фрагмента систолічної матриці і характер з’єднання комірок(в):
A = B x R + A0.
Параметрична оптимізація
На першому такті при множенні інверсне значення множеного записується в регістр Рг2,
а множник – в регістр Рг3. Вміст регістру Рг2 (інверсні виходи) першого рівня сумується з
операндом, записаним в регістр Рг1. Множення проводиться по алгоритму молодшими
розрядами вперед. Якщо к-й розряд множника, в регістрі Рг3, рівний 1, тоді вмістиме
регістрів Рг1 і Рг2 сумується на суматорі СМ1, а мультиплексор МХ3 пропускає отриману
суму на входи регістра Рг1 другого рівня, зсуваючи її на один розряд вправо. Якщо перший
розряд множника рівний 0, то мультиплексор МХ3 пропускає вмістиме регістра Рг1 в обхід
суматора першого рівня. На другому такті на перший рівень поступає друга пара операндів і
повторюються описані дії, а на виході другого рівня получають суму, збільшеною на нове
значення частинного добутку і т.д., доки не получимо повний добуток. Для n–розрядних
вхідних операндів результат обчислення для першої пари чисел, получають на виході
суматора n–го рівня через n тактів, а всіх наступних добутків, через кожний такт.
Машина Тюрінга:
Машина Тюрінга є формальною алгоритмічною системою (ФАС) з абстрактним
обчислювачем. Абстрактний обчислювач не враховує технічні засоби виконання
обчислювальних операцій. Ця особливість не дозволяє повністю перенести результати
досліджень математичних моделей на практику досліджень апаратно-програмних
комп’ютерних засобів. Для опису властивостей параметрів та характеристик алгоритму
оберемо абстрактну модель алгоритму – машину Тюрінга - це шістка:
M: < A , Q , q0 , qf , a0 , P >
А-символ зовнішнього алфавіту який нам треба обробляти в двійкові системі задається.
Q – алфавіт станів або множина внутрішнього алфавіту.
q0 – початковий стан .
qf – кінцевий стан.
a0 – штучний об’єкт його треба щоб позначити пусту комірку.
Р- програма яка задається програмістом.
Можна навести такий приклад програми:
А\Q Q0 Q1 Q2 ……….. Qn
A0
A1
………
An
a0
1 2 3 4 @ … … … … … …
SH – модель алгоритму :
SH-модель є фіксованою для деякого класу задач конфігурацією апаратно-програмних
засобів перетворення, передавання і зберігання даних, що задає обчислювальний процес,
який починається з деякої системи початкових даних і скерований на отримання результату,
повністю визначеного цими початковими даними.
Універсальні комп’ютери
→ CKC
< A, Q, q0 , qf , G, P >
Елементарний перетворювач
Поняття “елементарний перетворювач” має принципово важливе значення. Воно дозволяє
уникнути нестрогості визначення властивості “елементарність”, розширити список
властивостей і характеристик комп’ютерного алгоритму. Елементарний перетворювач
перетворює деяку сукупність початкових даних в сукупність вихідних даних.
I O I O
Ф Ф
Властивості SH – моделей:
1) Детермінованість – Кожний крок алгоритму визначений функцією елементарного
перетворювача і командою програми. Напрямок передачі даних від одного елементарного
перетворювача до іншого точно визначений напрямком, що задають з’єднання або команди
програми.
2) Дискретність – Робота SH-моделі здійснюється множиною обмежених у часі кроків.
Кожний крок може включати елементарні операції перетворення, передачу даних від одного
елементарного перетворювача до іншого, а також операцію запису даних в елементи пам’яті.
3) Масовість – Одна і та ж SH-модель може бути застосована для будь-якої кількості задач, які
відрізняються набором вхідних даних при постійному правилі безпосереднього
перероблення.
4) Елементарність – Операції перетворення, передачі і запису даних в елементи пам’яті SH-
моделі є простими і локальними в просторі і часі.
5) Ієрархічність – Кожний елементарний перетворювач може бути представлений SH-моделлю
нижчого ієрархічного рівня. З іншого боку, кожна SH-модель може бути використана як
елементарний перетворювач нижчого ієрархічного рівня.
Ієрархічність поділяється на такі рівні:
А) Булевські команди
Б) Логічні (одно розрядні операційні пристрої)
В)Арифметичні (багато розрядні операційні пристрої)
Г)Вузли(АЛП)
Д)Процесор
Е)Комп’ютер
Ж) Комп’ютерні системи(кластери)
Ієрархічність відіграє дуже важливу роль у проектуванні комп’ютера.
Характеристика SH – моделей:
В процесах синтезу, аналізу і оптимізації SH-моделей пропонується використовувати п’ять
характеристик складності: апаратну, часову, ємнісну програмну і структурну:
L = max X i
,
Де max Xi - певні елементів SH-моделі, що належать до максимального критичного
шляху розповсюдження сигналу, включаючи повторні проходження елементів в циклі.
0001
0000—мінімальний шлях
0001
11111-макс.крит.шлях
1
1< -00000
5) Структурна складність відображає ступінь нерегулярності між зв’язків деякого рівня ієрархії
побудови апартних засобів. Структурна складність SH-моделі визначається аналогічним
способом, що і програмна. Відмінність лише в тому, що об’єктом розрахунків є матриця
інциденцій. Структурна складність алгоритмічного пристрою - це ентропія матриці
інциденцій:
E
S = − E log 2
qr
E - кількість елементів матриці інціденцій системи;
q r - розмір матриці.
Лекція №3
Емністна складність це стільки комірок пам’яті які необхідні для реалізації комп’ютерного
алгоритму.Для часової складності необхідно знати час спрацьовування.
Звя’зок L та T
L-часова складність
Т-час спрацювання
Хі є max Xkp.
H+S H + S
Приклад:
ОЗП РФ АЛП
RISC архітектура
ОЗП РФ АЛП
Переваги RISC перед CISC мала системна складність.RISC буде працювати швидше ніж
CISC тому-що в CISC дуже багато не потрібних команд тому RISC буде працювати швидше.
Intel
Команди
почат
RISC
ковий
F
P = − F log 2 ,
nm
Приклад виконання операції множення
U1 U2 U3
X1 X2 X3
U4 U5
U6
U7
X4
U8 U9 U10
X5
U11
X6
X7
U12
X1 −1 0 0 1 0 0 −1 1 1 0 0 0
X2 0 −1 0 0 1 0 0 0 0 0 0 0
X3 0 0 −1 0 0 1 0 0 0 0 0 0
I = X4 0 0 0 −1 −1 0 0 0 0 1 0 0
X5 0 0 0 0 0 −1 0 0 −1 −1 1 0
X6 0 0 0 0 0 0 1 0 0 0 −1 0
X7 0 0 0 0 0 0 0 −1 0 0 0 0
U 1 U 2 U 3 U 4 U 5 U 6 U 7 U 8 U 9 U 10 U 11 U 12
X 20 −1 0 0 0 0 0 0 0
X 30 0 −1 0 0 0 0 0 0
I = X 40 0 0 −1 0 0 1 0 0
X50 0 0 0 0 0 −1 1 0
X 60 0 0 0 1 0 0 −1 0
X70 0 0 0 0 0 0 0 1
U 1 U 2 U 3 U 4U 7 U 8 U 10U 11U 12
ОП
З регулярною З нерегулярною
структурою структурою
однорідними Багато
комірками розрядним
комірками
комбіновані комбіновані
Асоціативні Асоціативні
систолічні
систолічні
Асц/сист.
Асц/сист.
Приклад:
Лінійні це є суматор
Схема перемножувала на багато розрядному суматорі
C1 C2
RG1 RG2
C3
&
∑
C4
RG3
C5
Матричні
Асоціативні Систолічні
n-2 n-1
S=0 S= 0
U1 U2 U3
X1 X2 X3
U4 U5
U6
U7
X4
U8 U9 U10
X5
U11
X6
X7
U12
X1 −1 0 0 1 0 0 −1 1 1 0 0 0
X2 0 −1 0 0 1 0 0 0 0 0 0 0
X3 0 0 −1 0 0 1 0 0 0 0 0 0
I = X4 0 0 0 −1 −1 0 0 0 0 1 0 0
X5 0 0 0 0 0 −1 0 0 −1 −1 1 0
X6 0 0 0 0 0 0 1 0 0 0 −1 0
X7 0 0 0 0 0 0 0 −1 0 0 0 0
U 1 U 2 U 3 U 4 U 5 U 6 U 7 U 8 U 9 U 10 U 11 U 12
X 20 −1 0 0 0 0 0 0 0
X 30 0 −1 0 0 0 0 0 0
I = X 40 0 0 −1 0 0 1 0 0
X50 0 0 0 0 0 −1 1 0
X 60 0 0 0 1 0 0 −1 0
X70 0 0 0 0 0 0 0 1
U 1 U 2 U 3 U 4U 7 U 8 U 10U 11U 12
101|111|011|111|011|101 - Mal 7
101 Σ Σ Σ Σ
011 Σ Σ Σ Σ S=0
111 ΣΣ ΣΣ ΣΣ ΣΣ
011 Σ Σ Σ Σ
111 ΣΣ ΣΣ ΣΣ ΣΣ
101 Σ Σ Σ Σ
010 Σ Σ Σ Σ
Діагональний переніс
Σ Σ Σ Σ
S!=0
Σ
Σ Σ Σ L2<L1
Σ
ΣΣ Σ ΣΣ ΣΣ
A2=A1
Σ
Σ Σ Σ
Σ
ΣΣ Σ ΣΣ ΣΣ
Σ Σ Σ
Σ
Σ Σ Σ
Σ
Σ Σ Σ Σ
Σ Σ Σ
Σ
Σ Σ Σ
Σ
Зміна часової складності збільшує структурну. В даної схеми ми можемо виконати
паралелізм воно дозволяє ще зменшити часову складність.
Асоціативні матриці:
1 0 1 1
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
Асоціативну матрицю ми отримуємо матрицю памяті і матрицю логіки пошуку.
Лекція №5
4)Правила початку.
Числа Ферма.
F = 22 t +1
А0 А1 А2
За алгоритмом
+ 0111
- 0101
+ 0110
0010
1000
Якщо не вистачає чисел Мерсена і Ферма для знаходження залишків використовують інші
прості числа: 11,13, 19, 23, …
Таблиця 2i mod 11
2i 20 21 22 23 24 25 26 27 28 29 210
+r 1 2 4 8 5 10 9 7 3 6 1
-r -10 -9 -7 -3 -6 -1
Алгоритм будується так як для чисел Ферма, але з більшою розрядною сіткою.
a11 a2 a10 a1 a9 a0 a8 a0
Σ Σ Σ Σ
a7 a6 a5 a4
Σ Σ Σ Σ
a16 a15 a13 a12
Σ Σ Σ Σ
Якщо порівнювати ці дві схеми то перша схема тільки для чисел Мерсена (тріад), а друга
для чисел Ферма (тетрад) і Мерсена.
Таблиця 2i mod 11
2i 20 21 22 23 24 25 26 27 28 29 210
+r 1 2 4 8 5 10 9 7 3 6 1
-r -10 -9 -7 -3 -6 -1
Алгоритм будується так як для чисел Ферма, але з більшою розрядною сіткою.
Лекція 6
"Китайська теорема"
1)Залишки
2)Точне обчислення
3)Використання хеш-функцій
m1 = 7, r1 = < A > m1 = 2
m2 = 8, r2 = < A > m2 = 5
m3 = 9, r3 = < A > m3 = 5
A = Mi Ni ri m
1. i
2. r = A m = A mod m
n
3. M = mi
i =1
4. M i m N i 1 mod mi
M
5. M i =
mi
M = 7 * 8 * 9 * 11 = 5544
M1 = 5544 : 7 =792
M2 = 693
M3 = 616
M4 = 504
m1 = 792 * N1 1 mod 7
1* N1 1 mod 7
N1 1
m2 = 693 * N2 1 mod 8
5 * N2 1 mod 8
5*2 1 mod 8
5*3 1 mod 8
5*4 1 mod 8
5*5 1 mod 8
N2 = 5
N3 = 7, N4 = 9
Пошук по максимуму
• точних обчислень, коли розрядність числа суттєво більша за розрядну сітку комп’ютера,
• в криптографії (кодування, дешифрування)
• в допоміжних операціях комп’ютерних обчислень (контроль по модулю, хешування та
інших).
Lac=O(N)-асоціативні матриці.
0 0 1 0
1 1 0 1
0 0 1
1
1
0 1 1
S=S*a
0
&
1
&
Лекція 7
Матриця сортування
0 1 3 7 2 5 4 6
1 3 2 7 4 5 6
4 7 5 6
a b
Сх.порівняння
c Д
Приклад виконання матриці порівняння.
bi це імпульсна характеристика.
Переваги:
1) Вивід вікна
2) Сортування відліків у вікні
3) Формування вихідного сигналу
CХ.порівняння
CХ.порівняння
CХ.порівняння Вихід
Лекція 8
1) Ознаки
2) Приклад
3) Переваги та Недоліки
Ознаки:
1) Однорідність комірок.
2) Зв’язки.
3) Апаратне виконання спеціальних функцій.
4) Паралелізм.
5) Конверизація.
6) Пульсуючий рух даних у різних напрямках.
7) Вхід та вихід через крайні інтерфейсні елементи.
8) Обробка даних з мінімізованого кількістью звернення до ОЗП.
Типи задач: На матриці головним чином розв’язується системи лінійних задач. Рівняння мат-
фізики, фізичних полів, ядерної фізики і багато таких в яких вимагається безперервна
обробка великих масивів даних за обмеженої кількості даних.
Складність операції:
O(N2), O(N3), O(N4) – це означає що кількість операції дорівнює кількості вхідних даних до
(кубу).
1)Підвищення продуктивності.
2) Простота реалізації.
А) Виклик команди.
Б) Дешифрація команди.
В) Виконання.
Г) Завантаження.
Тап.<< Тпрогр.
Pпрогр.→ велика
Структурна складність функціонального вузла може бути більшою від АЛП або
функціональність процесора.
Аапар.>> Апрогр.
x RG2 x’
×
t7 a44 y‘ y
∑ RG2
t6 a34 a43
t5 a24 a33 a42
t4 a14 a23 a32 a41
t3 a13 a22 a31
t2 a12 a21
t1 a11
y Просторовий паралелізм
x L=N (кількість комірок)
x1 P=0
t1
x2 x1 S=0 (на рівні квадратів)
t2
x3 x2 x1 A=N
t3
t4 x4 x3 x2 x1
t5 x4 x3 x2
t6 x4 x3
t7 x4
Лекція 9
Ефективний конвеєр згортки
1) Формування задач.
2) Структурний синтез.
Ві – імпульсна характеристика.
Структурний синтез.
Сума
накопичувача
Нижче наведений малюнок який може бути переповнений у випадку нагромадження великих
добутків. Щоб уникнути це треба поставити ще 1 регістр та зсувати його.
*
Сума
Рг
RG
Схема з
зсувом
4) Параметрична оптимізація
Вимоги до схеми
Часова складність
1) Апаратна реалізація.
2) Конвеєризація.
3) Паралелізм.
При конвеєризації.
Сума
Рг
RG
Схема з
зсувом
a3 a2 a1 a0
& 0/ 0/ 0/ 0/
& 0/ 0/ 0/ 0/
RG
1) В часовій області .
2) В частотній області.
Метелик ШПФ
В мене перший етап шифрування починається праворуч і ці W обозначає розряд числа
другий ета посередині та третій зліва.Розглянемо реконфігуровану H-модель реалізації двох
функцій – згортки та метелика ШПФ. Будемо користуватися наступними рівняння метелика
ШПФ (Рис. 5.3). До схеми згортки Рис.5.2. додамо нові вузли: два суматора, регістр, 17
мультіплексоров і необхідну систему з’єднань.
A’=A+WC
A A’
C’=A-WC
A=a+jb w
C C’
C=c+jd
W=w+jv
A’=(a+cw-dv)+j(b+vc+dw)
C’=(a-cw+dv)+j(b-vc-dw)
Схема ШПФ.
Лекція 11
1) Спеціальні функції.
2) Логічні функції.
3) Арифметичні функції.
{x} {b}
РГ РГ РГ РГ РГ
* * * *
∑ ∑ ∑ ∑
РГ РГ РГ РГ
A=4(*,+,3 rg)+rg
P= -3lg2 3/5*2
RG RG RG RG RG RG
RG RG RG RG RG RG RG RG
Σ Σ Σ Σ
RG RG RG RG
Σ Σ
RG RG
Σ Σ Σ Σ
RG RG RG RG
Лекція 11
Проти:
1) Зменшується продуктивність
2) Збільшується структурна складність.
3) Неможливо одночасно виконувати операції.
Кеш1 Кеш 2
Сума
RG
Кеш 3
C1
C2
C3
РФ КОП S1 S2 Д
АЛП ПК
В універсальних процесорах адреси виробництва на АЛП в сучасних контролерах
використовується окремі арифметичні блоки адресів і даних.
А1 А3
I >= N
I >= N
А2
РС
Кеш
^А1-лічильник А1
Лекція 12
Багатопроцесорна система із різнорідними процесорами.
ШПФ 20%
Ариф. 8%
Пошукова 2%
Це час викликання цих операцій ШПФ зустрічається найчастіше а згортка на 1 етапах задачі.
ШПФ+ згортка це є спец процесор одночасне використання ШПФ згортки дуже мала.
Потрібен автоматичний вузол генерації адрес. Найкраще не передавати дані а перемикання
між ОЗП.
кеш1
Проц.1 Проц.2
кеш2
Озп Проц.к
команд оманд
Комутатор
Операційні тракти
1) В цього є пара пристрій який добре виконують згортки (суматор , пристрій швидкого
зсуву)
2) Адресний пристрій був відокремлений від пристрою оброблення даних.
1) Відсутність макрокоманд
2) Команди є одно тактові та чотирьох тактові
Позитив:
Пам'ять
Адресний Блок
блок керування
Шина
керування
Пам'ять
Функціональний блок
Шина даних
РК
А Команди
МХ
Д
МХ
РС
Стек
Регістр вер.
Зсув
Стек
R RG 32
МХ 1
Адреса
ОЗП
акумулятор
зсув