You are on page 1of 1

Not: İndirdiginiz datasetleri önce Excel’de açın daha sonra açtığınız dosyayı .

xlsx uzantılı olacak


şekilde kaydedin. En son Python’da açın.

0 nolu Veri Seti:


İndirme Linki: https://www.kaggle.com/datasets/fedesoriano/stroke-prediction-dataset
Not: Bu veri setinde smoking_status özelliğinde çok fazla ‘unknown’ yani bilinmeyen var.
smoking_status’u unknown olan satırları veriden silin.

1 nolu Veri Seti:


İndirme Linki: https://www.kaggle.com/datasets/shrutimechlearn/churn-modelling
Not: Bu veri setinde kayıp (missing) değer yok. O2 görevini yerine getirebilmek için veriyi Python’da
işlemeye başlamadan önce veriden bazı yerleri rastgele silin. Daha sonra sildiniz yerleri O2’deki gibi
doldurun.

2 nolu Veri Seti:


İndirme Linki: https://www.kaggle.com/datasets/iamsouravbanerjee/heart-attack-prediction-
dataset

Not 1: Bu veri setinde kayıp (missing) değer yok. O2 görevini yerine getirebilmek için veriyi Python’da
işlemeye başlamadan önce veriden bazı yerleri rastgele silin. Daha sonra sildiniz yerleri O2’deki gibi
doldurun.

Not 2: O3 görevini yaparken, bu veri setinden Country kolonunu da silin.

Not 3: Buradaki Blood Pressure özelliğinde büyük tansiyon ve küçük tansiyon “/” ile ayrılmış.
Aşağıdaki kod yardımıyla Blood Pressure özelliğini biri büyük tansiyonu diğeri küçük tansiyonu içeren
iki özellik haline getirin:
import re
bp = veri['Blood Pressure ']
b1=np.zeros((veri.shape[0],1))
b2=np.zeros((veri.shape[0],1))
for i in range(veri.shape[0]):
b1[i]=int(re.split("/",bp.loc[i])[0])
b2[i]=int(re.split("/",bp.loc[i])[1])
b1=pd.DataFrame(b1,columns=["b1"])
b2=pd.DataFrame(b2,columns=["b2"])

(Burda veri, veri setini okuyup üzerine kaydettiğiniz değişken)

You might also like