You are on page 1of 1

‫ تحويل الصوت الغير المتوازي عبر التعلم العميق‬:‫العنوان‬

‫مل ّخص‬
،‫ في هذا المشروع‬.‫الهدف من أساليب تحويل الصوت هو تغيير خصائص صوت الشخص بحيث يكون مثل صوت آخر‬
‫ التعلم العميق هو مجال الذكاء االصطناعي‬.‫نركز بشكل أساسي على أساليب التعلم العميق غير المتوازية لتحويل الصوت‬
‫ والروبوتات وخاصة‬،‫ من المجاالت مثل معالجة الصور‬D‫الذي اكتسب شعبية في السنوات األخيرة بفضل نجاحه في العديد‬
‫معالجة الكالم‬.
‫ نوضح الطريقة المقترحة باستخدام خوارزمية المصنف‬،‫ بعد ذلك‬.‫سنشرح أوالً التحويل عبر نموذج العالم مع ذكر قيوده‬
‫ نقوم بالتحقق من الطريقة المقترحة دون أن ننسى‬،‫ بفضل تجاربنا‬.‫المساعد استنادًا إلى برامج الترميز التلقائي المتغير‬
‫إضافة التوقعات المناسبة‬

‫ المفاتيح‬:‫قاعدة بيانات غير متوازية_ نموذج العالم _ التعلم العميق_ تحويل الصوت‬

Titre : Conversion non-parallèle de la voix avec apprentissage profond


Résumé :
Les méthodes de conversion de la voix visent à modifier les caractéristiques de la voix d'un
locuteur pour qu'il soit comme un autre. Dans ce projet, nous concentrons principalement sur
des méthodes d'apprentissage profond non-parallèles pour transformer la voix.
L'apprentissage profond est un domaine de l'intelligence artificielle qui a gagné une popularité
ces dernières années grâce à son succès dans nombreux domaines comme le traitement
d'images, la robotique et particulièrement le traitement de la parole.
Nous expliquons tout d'abord la fonction de transformation introduite par le modèle du
monde, en énumérant ses limitations. Ensuite, nous expliquons la méthode proposée en
utilisant un algorithme classificateur auxiliaire à base des autocodeurs variationnels. Grâce à
nos expériences, nous validons la méthode proposée en ajoutant des prospectives appropriées.

Mots-clés : Conversion de la voix, apprentissage profond, base de données non-parallèle, modèle


du monde.

Title: Non-parallel voice conversion using deep learning


Abstract :
Voice conversion methods aims to alter a subject’s voice characteristics to be like someone
else voice. In this project, we mainly focus on non-parallel deep learning methods to
transform the voice. Deep learning is an artificial intelligence field which gains wild
popularity in recent years, thanks to his success in many domains like image processing,
robotics and specifically speech processing .We do initially explain the transformation
function of the common state-of-the-art voice conversion system, the Gaussian Mixture
Universal Background Model (GMM-UBM) and to enumerate its limitations. Then, we
explain our proposed method using Auxiliary Classifier Variational Autoencoders (ACVAE)
algorithm. Thanks to experiments, we finally validate our proposed method without forgetting
to add a suitable prospective.

Key Word: Voice Conversion, deep learning, non-parallel corpus, GMM-UBM

Réalisé à :
Entreprise : Laboratoire informatique d'Avignon
Adresse : 301 Rue Baruch de Spinoza, 84140 Avignon, France
Tél : 33 4 90 84 35 00

You might also like