You are on page 1of 6

Wizualizacja dużych zbiorów danych

Sylabus modułu zajęć

Informacje podstawowe

Kierunek studiów Cykl dydaktyczny


Informatyka - Data Science 2021/2022

Specjalność Kod przedmiotu


Wszystkie IEiTIDSS.IIi1K.66b59ac52bdc7fdfb84ad02b448ba434.21

Jednostka organizacyjna Języki wykładowe


Wydział Informatyki, Elektroniki i Telekomunikacji Polski

Poziom kształcenia Obligatoryjność


studia magisterskie inżynierskie II stopnia Do wyboru

Forma studiów Blok zajęciowy


Stacjonarne przedmioty kierunkowe

Profil studiów Przedmiot powiązany z badaniami naukowymi


Ogólnoakademicki Tak

Koordynator Witold Dzwinel


przedmiotu

Prowadzący zajęcia Witold Dzwinel, Radosław Łazarz, Rafał Wcisło

Okres Forma weryfikacji uzyskanych efektów uczenia się Liczba


Semestr 1 Zaliczenie punktów ECTS
3.0
Forma prowadzenia i godziny zajęć
Wykład: 14, Ćwiczenia laboratoryjne: 30

Cele kształcenia dla przedmiotu

C1 Zaznajomienie studenta z zaawansowanymi metodami wizualizacji danych wielowymiarowych.

Efekty uczenia się dla przedmiotu

1/6
Kierunkowe efekty
Kod Efekty w zakresie Metody weryfikacji
uczenia się

Wiedzy – Student zna i rozumie:

Student posiada wiedzę związaną z metodami


INF2DS_W02, Wykonanie projektu,
W1 wykorzystywanymi w wizualizacji danych w zależności
INF2DS_W03 Zaliczenie laboratorium
od charakteru tych danych i ich rozmiaru.

Student posiada wiedzę związaną z zastosowaniem


INF2DS_W01, Wykonanie projektu,
W2 algorytmów wizualizacji do analizy wielowymiarowych
INF2DS_W02 Zaliczenie laboratorium
danych oraz grafów

Student posiada wiedzę dotyczącą analizy wielki INF2DS_W02,


W3 Zaliczenie laboratorium
danych (big data) INF2DS_W04

Umiejętności – Student potrafi:

Wykonanie projektu,
Student potrafi dokonać transformacji analizy danych
INF2DS_U04, Wykonanie ćwiczeń
U1 z metod off-line na ich interaktywną eksplorację
INF2DS_U05 laboratoryjnych, Projekt,
wykorzystując ich graficzna reprezentację.
Prezentacja

Wykonanie projektu,
Student potrafi dobrać dla opracowywanych danych INF2DS_U02, Wykonanie ćwiczeń
U2
metody ich wizualizacji oraz analizy. INF2DS_U05 laboratoryjnych, Projekt,
Prezentacja

Kompetencji społecznych – Student jest gotów do:

Student potrafi współdziałać w grupie realizującej


Wykonanie projektu,
K1 zadania związane z celami analizy dużych zbiorów INF2DS_K01
Projekt, Prezentacja
danych

Treści programowe zapewniające uzyskanie efektów uczenia się dla modułu zajęć
Ten specjalistyczny przedmiot zaznajamia studentów z nowoczesnymi metodami osadzania wielowymiarowych danych w
przestrzeniach 2D i 3D.

Bilans punktów ECTS

Średnia liczba godzin* przeznaczonych


Rodzaje zajęć studenta
na zrealizowane aktywności

Wykład 14

Ćwiczenia laboratoryjne 30

Przygotowanie do zajęć 15

Samodzielne studiowanie tematyki zajęć 2

Egzamin lub kolokwium zaliczeniowe 2

Dodatkowe godziny kontaktowe 5

Przygotowanie projektu, prezentacji, pracy pisemnej,


9
sprawozdania

2/6
Liczba godzin
Łączny nakład pracy studenta
77

Liczba godzin
Liczba godzin kontaktowych
44

* godzina (lekcyjna) oznacza 45 minut

Treści programowe

Efekty uczenia się dla Formy prowadzenia


Lp. Treści programowe
przedmiotu zajęć

1. Co to są duże zbiory danych (big data).: Sposoby


1. magazynowania dużych zbiorów danych. W3 Wykład
Hadoop=MapReduce+ HDF5.

2. Podstawowe reprezentacje dużych zbiorów danych.:


Problemy związane z tworzeniem reprezentacji dla
wybranych typów danych.
a. dane strukturalne: np. szeregi czasowe i obrazy,
b. dane niestrukturalne: np. dane tekstowe,
2. W3 Wykład
c. dane mieszane: np. dane biologiczne.

3. Podstawowe systemy wizualizacji danych


naukowych: (PawerWall, CAVE). Budowa i
zastosowania.

4. Przegląd klasycznych metod uczenia maszynowego


wykorzystywanych przy analizie dużych zbiorów
3. danych.: ze szczególnym uwzględnieniem metod W3, U1 Wykład
klasteryzacji, oraz podstawowych metod klasyfikacji
wykorzystywanych do analizy big data.

5. Metody całościowej wizualizacji danych wraz z


oprogramowaniem.: Wizualizacja danych
wielowymiarowych w postaci tzw. scatter plots.
a. Metody klasyczne: PCA oraz MDS.
4. b. Metody nowoczesne bazujące na algorytmie t-SNE W1, W2, U1, U2 Wykład
wraz z pakietami opracowanymi w Katedrze
Informatyki AGH
c. Metody generatywne oparte o koncepcję
autoenkoderów i sieci głębokich

6. Nowoczesne metody wizualizacji grafów w tym sieci


społecznościowych: Zajęcia bazujące na
5. oprogramowaniu Gephi oraz pakietów programowych W2 Wykład
służących do wizualizacji grafów opracowanych w
grupie systemów złożonych (Katedra Informatyki AGH)

7. Koncepcja osadzania (word2vec) paragraph vector


(doc2vec) oraz node2vec a wizualizacja dużych
wielowymiarowych danych.: Omówienie metod
6. osadzania tekstu, dokumentów i grafów bazujących na W1, U1 Wykład
koncepcji Mikulova (word2vec). Przypomnienie
podstawowych pojęć związanych z uczeniem
głębokim.

8. Przegląd metod i koncepcji analizy i wizualizacji


danych niestrukturalnych (tekstu).: 1. Podstawowe
7. metody klasyczne i generatywne analizy tekstu (SVM, W1, U1, U2 Wykład
LDA, Bayesian Conditional fields).
9. Metody wizualizacji danych tekstowych.

3/6
Opanowanie podstawowych technologii związanych z
wizualizacją dużych zbiorów danych:

1) ParaView -- interfejs graficzny o ogromnych


możliwościach.
2) Biblioteki Pythona służące do wizualizacji 2D-3D
oraz wizualizacji danych wielowymiarowych: t-SNE vs
MDS oraz kernel PCA
8. W1, W2, W3, U1, U2, K1 Ćwiczenia laboratoryjne
3) Autoenkodery jako narzędzia do wizualizacji danych
wielowymiarowych (Tensor Flow)
4) Osadzane danych tekstowych i grafów przy pomocy
narzędzi związanych z sieciami głębokimi, technologie
Word2Vec oraz Doc2Vec.
5) GraphViz, Pajek, Gephi -- narzędzia do wizualizacji
grafów.
6) Zadanie projektowe

Informacje rozszerzone

Metody i techniki kształcenia:

Wykład tablicowy, Wykonanie ćwiczeń laboratoryjnych, Prezentacja multimedialna, Dyskusja, Wykonanie projektu

Rodzaj zajęć Sposób weryfikacji i oceny efektów uczenia się Warunki zaliczenia przedmiotu

Warunkiem zaliczenia jest


pozytywna ocena z ćwiczeń
laboratoryjnych oraz wykonanie
Wykład Wykonanie projektu, Prezentacja, Zaliczenie laboratorium
projektu. Może to być też (dla
niektórych studentów) ocena z
prezentacji na wykładzie

Pozytywna ocena ze sprawozdań z


ćwiczeń laboratoryjnych oraz
Ćwiczenia laboratoryjne Wykonanie ćwiczeń laboratoryjnych, Projekt, Prezentacja
projektu. Ocena z jakości
opracowania tutoriala.

Dodatkowy opis

Na ćwiczeniach studenci w grupach przygotowują krótkie tutoriale dla kolegów związane z treścią zajęć laboratoryjnych

Warunki i sposób zaliczenia poszczególnych form zajęć, w tym zasady zaliczeń poprawkowych, a także warunki
dopuszczenia do egzaminu

Warunkiem dopuszczenia do egzaminu jest pozytywna ocena ze wszystkich form zajęć

Sposób obliczania oceny końcowej

1. Aby uzyskać pozytywną ocenę końcową niezbędne jest uzyskanie pozytywnej oceny z laboratorium (kolokwia) oraz
projektu końcowego. 2. Obliczamy średnią ważoną z ocen z ćwiczeń laboratoryjnych (30%) tutoriala (20%), i projektu (50%)
uzyskanych we wszystkich terminach. 3. Wyznaczmy ocenę końcową na podstawie zależności: if sr>4.75 then OK:=5.0 else
if sr>4.25 then OK:=4.5 else if sr>3.75 then OK:=4.0 else if sr>3.25 then OK:=3.5 else OK:=3 4. Jeżeli pozytywną ocenę z
laboratorium i projektu uzyskano w pierwszym terminie oraz ocena końcowa jest mniejsza niż 5.0 to ocena końcowa jest
podnoszona o 0.5

Sposób i tryb wyrównywania zaległości powstałych wskutek nieobecności studenta na zajęciach

Nieobecność na zajęciach student może odrobić przychodząc z inną grupą.

4/6
Wymagania wstępne i dodatkowe
Podstawy uczenia maszynowego, Metody Obliczeniowe w Nauce i Technice

Zasady udziału w poszczególnych zajęciach, ze wskazaniem, czy obecność studenta na zajęciach jest
obowiązkowa

Wykład: Studenci wykonują ćwiczenia laboratoryjne zgodnie z materiałami udostępnionymi przez prowadzącego. Student
jest zobowiązany do przygotowania się w przedmiocie wykonywanego ćwiczenia, co może zostać zweryfikowane kolokwium
w formie ustnej lub pisemnej. Zaliczenie zajęć odbywa się na podstawie zaprezentowania rozwiązania postawionego
problemu. Zaliczenie modułu jest możliwe po zaliczeniu wszystkich zajęć laboratoryjnych. Ćwiczenia laboratoryjne: Studenci
uczestniczą w zajęciach poznając kolejne treści nauczania zgodnie z syllabusem przedmiotu. Studenci winni na bieżąco
zadawać pytania i wyjaśniać wątpliwości. Rejestracja audiowizualna wykładu wymaga zgody prowadzącego.

Literatura
Obowiązkowa

1. 1. Ben Fry, Visualizing Data, O’Reilly, 2008.


2. 2. Mitra, S. and Acharya T., Data Mining: Multimedia, Soft Computing and Bioinformatics, J. Wiley, 2003.
3. 3. Roberto Tomasia, Graph Drawing and Visualization, CRC Press, 2014

Dodatkowa

1. 1. Czasopisma: IEEE Transaction on Data Mining, Computing and Visualization in Science, Scientific Visualization

Badania i publikacje
Publikacje

1. 1. Czech, W., Mielczarek, W., Dzwinel, W., Distance-based graph invariants for analysis and visualization of complex
networks, Concurrency and Computation: Practice and Experience, 29(9):e4054, 2017 IF =1.133 2. Dzwinel, W., Wcisło,
R., Czech,W., ivga: A fast force-directed method for interactive visualization of complex networks, Journal of
Computational Science, 21C (2017) pp. 448-459 IF=1.748 3. Pawliczek P, Dzwinel W, Yuen DA, Visual exploration of data
by using multidimensional scaling on multi-core CPU, GPU and MPI cluster, Concurrency and Computation: Practice and
Experience, 26(3): 662-682, 2014. IF =0.997 4. Kurdziel M, Boryczko K, Dzwinel W, Procrustes analysis of truncated least
squares multidimensional scaling, Computing and Informatics, 31 (6), 1417-1440, 2012. IF =0.254 5. Czech, W., Dzwinel,
W., Goryczka S., Arodź, T., Dudek, A.Z., Exploring biological networks with Graph Investigator research application,
Computing and Informatics, 30, 1001–1031, 2011 IF =0.239 KONFERENCJE 1. Dzwinel, W., Wcisło, R., ivhd: A robust
linear-time and memory efficient method for visual exploratory data analysis, 13thConference on Machine Learning and
Data Mining, MLDM, New York , July 15-20, 2017, Lecture Notes of Artificial Intelligence, LNAI, 10358, 345-360, 2017 2.
Czech, W., Mielczarek, W., Dzwinel, W., Comparison of Large Graphs Using Distance Information, 11th International
Conference, PPAM 2015, Lecture Notes of Computer Science, LNCS 9573, 195-206, 2016 3. Dzwinel, W., Wcisło, R., Very
fast interactive visualization of large sets of high-dimensional data, 2015 International Conference of Computational
Science, ICCS 2015, Reykjavik, 1-3.06.2015. Procedia of Computer Science, 51, 572-581, 2015. 4. Pawliczek, P., Dzwinel,
W., Yuen, DA, Visual Exploration of Data with Multi-thread MIC Computer Architectures, in Rutkowski et al. (Eds.): ICAISC
2015, Part II, Lecture Notes of Artificial Intelligence, LNAI 9120, 25–35, 2015.

5/6
Kierunkowe efekty uczenia się

Kod Treść

Ma świadomość odpowiedzialności za własną pracę oraz za wspólnie realizowane zadania; potrafi myśleć i
INF2DS_K01
działać w sposób kreatywny i przedsiębiorczy

Potrafi wykorzystać znane algorytmy, metody obliczeniowe i struktury danych w budowie systemu
INF2DS_U02
informatycznego

Potrafi ocenić przydatność i korzystać z dostępnych bibliotek, komponentów oprogramowania i narzędzi z


uwzględnieniem wymagań systemów opartych na danych oraz systemów wykorzystujących metody uczenia
INF2DS_U04 maszynowego i sztucznej inteligencji; potrafi porównać istniejące rozwiązania ze względu na zadane
kryteria użytkowe i ekonomiczne oraz wskazać możliwości ich ulepszenia; potrafi ocenić przydatność i
możliwość wykorzystania nowych osiągnięć w zakresie informatyki

Potrafi formułować i testować hipotezy związane z problemami inżynierskimi i prostymi problemami


badawczymi, w szczególności potrafi opracować specyfikację projektową złożonego oprogramowania, z
uwzględnieniem aspektów prawnych oraz innych aspektów pozatechnicznych, z uwzględnieniem norm i
INF2DS_U05
standardów, zaprojektować oprogramowanie adekwatnie do specyfikacji wymagań, opracować szczegółową
dokumentację wyników, a także przygotować i przedstawić prezentację oraz przeprowadzić dyskusję
wyników

Ma pogłębioną wiedzę w zakresie przedmiotów ścisłych, pozwalającą na formułowanie i rozwiązywanie


INF2DS_W01 złożonych zadań z zakresu informatyki, analizy danych oraz metod uczenia maszynowego i sztucznej
inteligencji

Ma pogłębioną wiedzę w zakresie rozwiązań algorytmicznych, struktur danych i metod obliczeniowych


INF2DS_W02
związanych z analizą danych, uczeniem maszynowym i metodami sztucznej inteligencji

Ma szczegółową wiedzę w zakresie wybranych języków, paradygmatów i technik programowania oraz


INF2DS_W03 rozwiązań systemowych w zagadnieniach analizy danych, uczenia maszynowego i metod sztucznej
inteligencji

Orientuje się w obecnym stanie oraz najnowszych osiągnięciach i trendach rozwojowych informatyki i
INF2DS_W04 dziedzin pokrewnych oraz ma wiedzę niezbędną do rozumienia pozatechnicznych uwarunkowań działalności
inżynierskiej

6/6

You might also like