Professional Documents
Culture Documents
DEEPFAKE
SAFA DEMIRHAN
TASNİF DIŞI
TASNİF DIŞI
KONU BAŞLIKLARI
1. Deepfake Definition
2. Dataset Creation
3. Deepfake Creation
4. Deepfake Detection
1. Detection In Images
2. Detection In Videos
TASNİF DIŞI
TASNİF DIŞI
WHAT IS DEEPFAKE
• In a narrow definition, deepfakes are created by techniques that can superimpose face
images of a target person onto a video of a source person to make a video of the target
person doing or saying things the source person does.
• In a broader definition, deepfakes are AI-synthesized content that can also fall into two
other categories, lip-sync and puppet-master.
TASNİF DIŞI
TASNİF DIŞI
SHORT HISTORY
• Deepfake videos are manipulated videoclips which were first created by a Reddit user,
deepfake, who used TensorFlow, image search engines, social media websites and
public video footage to insert someone else’s face onto pre-existing videos frame by
frame.
TASNİF DIŞI
TASNİF DIŞI
SHORT HISTORY
A worrying reminder is the example of Gabon’s president Ali Bongo: In late 2018, the
president fell ill, not appearing in public for months. As the public grew weary, the
government released a video of the president, only to be immediately labeled as a deep
fake.
TASNİF DIŞI
TASNİF DIŞI
SHORT HISTORY
Albeit never to be confirmed as such, one week later the military launched an
unsuccessful coup, citing the video as part of the motivation
TASNİF DIŞI
TASNİF DIŞI
• The realistic nature of deepfake videos also makes them a target for generation of fake
news, fake surveillance videos, and malicious hoaxes. These fake videos have already
been used to create political tensions and they are being taken into account by
governmental entities.
TASNİF DIŞI
TASNİF DIŞI
There is also positive use of deepfakes such as their applications in visual effects, digital
avatars, snapchat filters, creating voices of those who have lost theirs or updating
episodes of movies without reshooting them.
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
1. DATASET
CREATION
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
DFDC DATASET
• DFDC veri seti ise 3. nesil bir veri seti ve hem daha iyi çözünürlükte veri sunmakla
kalmıyor, hem de görüntüleri kullanılan bireylerin hepsinden onay alınmış durumda.
• 25 TB’lık ham veri içermekte, 3426 kişi tarafından, kişi başı ortalama 14.4 video
1080p çözünürlüğünde çekilmiş ve 48190 adet, toplamda 38 gün uzunluğunda video
mevcut.
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
2. DEEPFAKE
CREATION
TASNİF DIŞI
TASNİF DIŞI
USING GANS
The GAN architecture consisting of a generator and a
discriminator, and each can be implemented by a neural
network. The entire system can be trained with
backpropagation that allows both networks to improve
their capabilities.
TASNİF DIŞI
TASNİF DIŞI
USING AUTOENCODERS
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
3. DEEPFAKE
DETECTION
TASNİF DIŞI
TASNİF DIŞI
• Frequency Artifacts.
• Görsellerde Deepfake tespitinde frekans kullanılabilir.
• GAN yapısı gereği “upsampling” işlemi yapar ve bu işlem oluşturulan sahte görselde
bazı izler bırakır.
• Bunu kullanarak Deepfake tespiti yapmak mümkündür.
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
DETECTION IN IMAGES
TASNİF DIŞI
TASNİF DIŞI
The spectra of images generated by different neural networks trained on the Stanford
dog data set. The left-most heatmap depicts the mean spectrum of the Stanford dog
data set. The rest depicts the mean spectra of images generated by different GANs.
We plot the mean of the DCT spectra by averaging over 10,000 images.
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
Görseldeki surat tespit edilir ve haricindeki yerler çıkarılır. Yüzler birden çok ölçeğe
hizalanır ve rastgele bir ölçek seçilir. Bu ölçek Gauss bulanıklığı ile yumuşatılır. Bu
süreç, yüz çarpıtmada ortaya çıkan farklı çözünürlük tutarsızlıklarını daha iyi simüle
edebilmeyi amaçlar. Düzleştirilmiş yüz, Deepfake üretim hattındaki hataları ortaya
çıkarmak için, aynı boyutlardaki orijinal yüzlerle karşılaştırılır.
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
Overview of our LRCN method. (a) is the original sequence. (b) is the sequence after
face alignment. We crop out eye region of each frame based on eye landmarks p1 ∼6 in
(b) and pass it to (c) LRCN, which consists of three parts: feature extraction, sequence
learning and state prediction.
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
5. CODE REVIEW
AND DEMOS
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
TASNİF DIŞI
The motion extractor utilizes an autoencoder to detect keypoints and extracts first-order
motion representation that consists of sparse keypoints and local affine transformations.
TASNİF DIŞI
TASNİF DIŞI
MY DEEPFAKE ATTEMPTS
TASNİF DIŞI
TASNİF DIŞI
MY DEEPFAKE ATTEMPTS
TASNİF DIŞI