You are on page 1of 6

Nama : Dinda Ardhia Ramadhani Kusuma

NIM : 21611116
RESPONSI 1 PRAK KOMSTAT
1. Gunakan Orange dataset pada R dan ujilah normalitas pada variabel Age.
a. Statistika deskriptif, Skewnes, Kurtosis
library(datasets)
data("Orange")
no1 <- Orange
#a. Statistika Deskriptif
install.packages("summarytools")
library(summarytools)
descr(no1)

Berdasarkan hasil di atas didapatkan dari dataset orange untuk variabel age,dimana
variabel age ini merupakan umur pohon jeruk. Untuk rata-rata umur pohon jeruk
adalah 922.14, dengan umur pohon jeruk yang paling rendah adalah 118 dan umur
pohon jeruk yang paling tinggi adalah 1582. Didapatkan juga untuk dataset orange
pada variabel circumference atau lingkar pohon jeruk, rata-rata lingkar pohonnya
adalah 115.86, dengan lingkar pohon jeruk yang paling kecil adalah 30 dan lingkar
pohon jeruk yang paling besar adalah 214.
Selanjutnya dari dataset orange untuk variabel age, nilai skewnessnya adalah -0.26,
yang dapat diartikan nahwa ekor distribusi berada di sebelah kiri dan menunjukkan
bahwa sebagian besar nilai berada di sisi kanan kurva, untuk dataset orange untuk
variabel circumference, nilai skewnessnya adalah 0, yang dapat diartikan bahwa nilai
terdistribusi secara simetris, dengan jarak antara ekor distribusi sebelah kanan dan
kiri sama besar. Selanjutnya, dari dataset orange pada kedua variabel, kurtosisnya
bernilai negative, yang berarti bahwa distribusi kurang memuncak daripada
distribusi normal.
b. Histogram
hist(no1$age,
main = "Histogram Age in Orange dataset",
xlab = "Age",
col = "seashell2")

Berdasarkan hasil di atas, didapatkan rentang umur pohon jeruk adalah 0 sampai lebih
dari 1500. Didapatkan juga untuk pohon jeruk yang paling banyak terdapat pada
rentang umur 1000 sampai dengan 1500. Dari histogram di atas dapat dilihat bahwa
histogram tidak mengikuti distribusi normal, dimana pada distribusi normal bentuk
histogramnya simetris sedangkan dari hasil yang didapatkan histogramnya tidak
simetris.
c. Stem and Leaf
stem(no1$age)
Berdasarkan hasil di atas didapatkan bahwa stem and leaf plot untuk variabel age dari
dataset orange tidak mengikuti distribusi normal karena plotnya tidak simetris.
d. Normal Q-Q Plot
qqnorm(no1$age)
qqline(no1$age)

Berdasarkan hasil di atas didapatkan bahwa pada variabel age titik – titik yang
terdapat pada Normal Q-Q Plot menyimpang dari garis, sehingga dapat dikatakan
bahwa variabel age tidak mengikuti distribusi normal.
e. Boxplot
boxplot(no1$age,
main= "Boxplot Age of Tree",
xlab= "Age",
col = "lavender")
Berdasarkan hasil di atas didapatkan bahwa median pada variabel age tidak berada di
tengah kotak, pada kedua whisker juga tidak memiliki panjang yang sama, sehingga
dapat dikatakan bahwa variabel age tidak mengikuti distribusi normal.
f. Shapiro-Wilk Test
shapiro.test(no1$age)

• Hipotesis
H0 = Variabel age berdistribusi normal
H1 = Variabel age tidak berdistribusi normal
• Taraf Signifikansi : 𝛼=0.05
• Daerah Kritis
Tolak H0 jika P-Value < 𝛼=0.05
• Keputusan dan Kesimpulan
Berdasarkan hasil di atas didapatkan bahwa data yang ada menolak H0
dikarenakan nilai P-value untuk uji Shapiro-Wilk adalah 0.007118 yang
dimana lebih lebih kecil dari 𝛼=0.05. Maka dapat disimpulkan bahwa variabel
age tidak berdistribusi normal.
Dapat disimpulkan untuk dataset orange pada variabel age, dari semua uji asumsi
yang telah dilakukan dengan menggunakan statistika deskriptif, skewness, kurtosis,
histogram, stem and leaf plot, Normal Q-Q Plot, boxplot, dan shapiro-wilk test, dapat
dikatakan tidak berdistribusi normal.
2. Membuat fungsi dengan menggunakan R sesuai soal yang diberikan :
#Turunan pertama f'(x)
T1 <- function(x) {
(((-2*x^2)/10) + 1) * exp(-(x^2)/10)
}
T1(116)

Berdasarkan hasil di atas dengan menggunakan nilai x = 116 (3 angka nim terakhir
praktikan), didapatkan turunan pertama dari soal yang telah diberikan adalah 0.
#Turunan kedua f''(x)
T2 <- function(x) {
((4*x^3)/100 - (6*x)/10) * exp(-(x^2)/10)
}
T2(116)

Berdasarkan hasil di atas dengan menggunakan nilai x = 116 (3 angka nim terakhir
praktikan), didapatkan turunan kedua dari soal yang telah diberikan adalah 0.
3. Membuat visualisasi yang menunjukan nama-nama primata yang merupakan lima
primata terbesar berdasarkan ukuran tubuhnya.
library(ggplot2)
library(dplyr)
library(scales)
library(rlang)
no3 <- read.csv(file.choose(), header=TRUE, sep = ";")
filter_data <- arrange(no3, desc(body))
lima <- head(filter_data, 5)
plot <- ggplot(lima, aes(x = reorder(name, body), y = body, fill =
name)) +
geom_bar(stat = 'identity') +
coord_flip() +
labs(x = 'Species', y = 'Body weight (kg)', title = 'Top Five Largest
Primates') +
theme_minimal() +
scale_fill_manual(values = c("honeydew", "lemonchiffon1",
"mistyrose", "lightcyan", "lavender"),
labels = c("Gorilla_Beringei", "Gorilla_gorilla",
"homo_sapiens", "Pongo_abeliis", "Pongo_pygmaeus"),
name = "Primate Name")
print(plot)

Berdasarkan hasil di atas didapatkan untuk primata dengan ukuran ukuran 5 terbesar
adalah Trachypithecus auratus, pygathtrix nemaeus, lepilemur microdon, callicebus
moloch dan aotus trivirgatus. Dari ke lima primata tersebut mempunyai rentang berat 958
Kg sampai dengan 989 Kg.

You might also like