التعرف على الصوت باستخدام MFCC و Vector Quantization

محتوى المقالة الرئيسي

Bassel Alkhatib
Mohammad Madian Waleed Kamal Eddin
https://orcid.org/0000-0003-3806-2920

الملخص

يعد التعرف على المتحدث أحد المشكلات الأساسية في معالجة الكلام ونمذجة الصوت. تتضمن تطبيقات التعرف على المتحدث المصادقة في أنظمة الأمان ودقة الاختيار. تشكل تطبيقات التعرف على الصوت تحديًا كبيرًا على نطاق واسع حيث يتطلب البحث السريع في قاعدة بيانات الاصوات تقنيات حديثة سريعة وتعتمد على الذكاء الاصطناعي لتحقيق النتائج المرجوة من النظام. تم بذل العديد من الجهود لتحقيق ذلك من خلال إنشاء أنظمة قائمة على المتغيرات وتطوير منهجيات جديدة لتحديد المتحدثين. التعرف على المتحدث هو عملية التعرف على من يتحدث باستخدام الخصائص المستخرجة من موجات الكلام الخاصة به مثل درجة الصوت والنغمة والتردد ويتم إنشاء نماذج المتكلم وحفظها في بيئة النظام وتستخدم لاحقا للتحقق من الهوية المطلوبة من قبل الأشخاص الذين يصلون إلى النظام، والذي يسمح بالوصول إلى الخدمات المختلفة التي يتم التحكم بها عن طريق الصوت، ويشمل تحديد المتحدث جزأين رئيسيين: الجزء الأول هو استخراج الميزات الصوتية أما الجزء الثاني فهو مطابقة ومقارنة هذه الميزات.

تفاصيل المقالة

كيفية الاقتباس
1.
التعرف على الصوت باستخدام MFCC و Vector Quantization. Baghdad Sci.J [انترنت]. 8 سبتمبر، 2020 [وثق 22 يناير، 2025];17(3(Suppl.):1019. موجود في: https://bsj.uobaghdad.edu.iq/index.php/BSJ/article/view/3715
القسم
article

كيفية الاقتباس

1.
التعرف على الصوت باستخدام MFCC و Vector Quantization. Baghdad Sci.J [انترنت]. 8 سبتمبر، 2020 [وثق 22 يناير، 2025];17(3(Suppl.):1019. موجود في: https://bsj.uobaghdad.edu.iq/index.php/BSJ/article/view/3715