التعرف على الصوت باستخدام MFCC و Vector Quantization
محتوى المقالة الرئيسي
الملخص
يعد التعرف على المتحدث أحد المشكلات الأساسية في معالجة الكلام ونمذجة الصوت. تتضمن تطبيقات التعرف على المتحدث المصادقة في أنظمة الأمان ودقة الاختيار. تشكل تطبيقات التعرف على الصوت تحديًا كبيرًا على نطاق واسع حيث يتطلب البحث السريع في قاعدة بيانات الاصوات تقنيات حديثة سريعة وتعتمد على الذكاء الاصطناعي لتحقيق النتائج المرجوة من النظام. تم بذل العديد من الجهود لتحقيق ذلك من خلال إنشاء أنظمة قائمة على المتغيرات وتطوير منهجيات جديدة لتحديد المتحدثين. التعرف على المتحدث هو عملية التعرف على من يتحدث باستخدام الخصائص المستخرجة من موجات الكلام الخاصة به مثل درجة الصوت والنغمة والتردد ويتم إنشاء نماذج المتكلم وحفظها في بيئة النظام وتستخدم لاحقا للتحقق من الهوية المطلوبة من قبل الأشخاص الذين يصلون إلى النظام، والذي يسمح بالوصول إلى الخدمات المختلفة التي يتم التحكم بها عن طريق الصوت، ويشمل تحديد المتحدث جزأين رئيسيين: الجزء الأول هو استخراج الميزات الصوتية أما الجزء الثاني فهو مطابقة ومقارنة هذه الميزات.