أقوى خدمات الذكاء الاصطناعي للتلاعب بالصوت و تجسيده (Voice AI)

أقوى خدمات الذكاء الاصطناعي للتلاعب بالصوت و تجسيده (Voice AI)

الظاهر أن سنة 2023 ستكون سنة الذكاء الاصطناعي بامتياز، والفضل يعود لشركة OpenAI وخدمتها ChatGPT التي أطلقت العنان للكثير من الخدمات الأخرى التي ترتكز على مزايا الذكاء الاصطناعي. ولا ننسى قبلًا خدمات التعديل على الصور بالذكاء الاصطناعي مثل Midjourney التي فتحت الباب على مصراعيه لهذه الفئة من الأشخاص. 

وحين يتعلق الأمر بخدمات تحويل النصوص إلى أصوات، أو التعديل على الأصوات أيضا ومحاكاتها بشكل حي، فلا يوجد الكثير من الخدمات المعروفة سابقًا، لكنها اليوم تملأ الإنترنت عن آخره، وبعضها قد يقلب الموازين في عالم الذكاء الاصطناعي. في هذا المقال سنراجع وإياك أيها المتابع اللطيف حزمة من أكثر خدمات الذكاء الاصطناعي للتلاعب بالأصوات شهرة في العالم. مع ذكر كافة المعلومات حول كل خدمة على حدة. 

أقوى خدمات الذكاء الاصطناعي للتلاعب بالصوت و تجسيده (Voice AI)

ما معنى خدمات التلاعب الصوت وتجسيده وما الهدف من استخدامها؟ 

يمكن تتخذ خدمات التلاعب بالصوت أو تجسيده أشكالًا كثيرة، إلا أنه يوجد شكلين فقط هما الأكثر شهرة: أولًا خدمات تحويل النصوص إلى صوت (Text To Speech). وهي خدمات موجودة منذ الأزل، لكن الفكرة هنا أنها الآن تبدو أكثر آدمية وبصوت يحاكي صوت البشر بفضل الذكاء الاصطناعي. ثم خدمات الـ Deep Voice، وهي خدمات تحاكي أصوات أشخاص آخرين، مثل الـ Deep Fake التي تحاكي وجوههم. 

كل ما تحتاج معرفته حول الـ DeepFake و DeepVoice

أما الهدف منها فيختلف حسب المستخدم، هناك من يفضل إنشاء فيديوهات على يوتيوب بالصوت لكنه لا يملك القدرة على تسجيل المحتوى الصوتي، وهناك من يريد تحويل صوته إلى صوت قابل للاستخدام في حالات خاصة، والمزيد. رهاننا الأكبر سيكون حول الأشخاص الذين يريدون تغيير أصواتهم أثناء اللعب أونلاين أو عند اجراء اتصالات صوتية عبر الحاسوب أو الهاتف الذكي. 

أقوى خدمات الذكاء الاصطناعي للتلاعب بالصوت

خدمة VALL-E 

مايكروسوفت ستدخل المنافسة من أوسع أبوابها فيما يخص بخدمات الذكاء الاصطناعي في مجال الصوتيات، وذلك عبر خدمتها VALL-E. لازالت غير متاحة في وجه الجميع، لكن طرحت مايكروسوفت إصدار تجريبي (ديمو) من الخدمة لإظهار مدى براعتها. 

الهدف من مشروع Vall-E من مايكروسوفت هو تحويل النصوص إلى كلام بصيغة أقرب إلى الصوت الآدمي. يوجد الكثير من الخدمات الحالية التي تسمح لك بتحويل النصوص إلى صوت لكن النتيجة تكون قريبة لصوت الكمبيوتر أو الصوت الآلي. بالاعتماد على تدريب الذكاء على صوت محدد، يمكن تحويل أي نص إلى بنفس الصوت الذي تدرب عليه الذكاء الاصطناعي. 

للإطلاع على خدمة VALL-E أكثر واستكشافها عن قرب يمكنك زيارة مشروعها على جيتهاب عبر الرابط التالي .

خدمة Voice AI 

تقدم لك Voice AI بريمج يمكنك استخدامه لتعديل صوتك وتغييره لأكثر من 1000 صوت مختلف بشكل يشبه الصوت الحقيقي. الهدف منها هو مساعدة المستخدمين على الإنترنت خصوصا مجتمع اللاعبين على تغيير أصواتهم أثناء لعب ألعاب الفيديو أونلاين. لازالت الخدمة في وضع البيتا الكلي لكنها جديرة بالاستخدام. 

الخدمة متاحة على تطبيقات عديدة كالأندرويد و iOS، ومدرجة في بعض خدمات ألعاب الفيديو كذلك. وقد تم تدريب البرمجية على ملايين الأصوات المختلفة حتى تصل إلى مستوى يمكن البرمجية من محاكاة أصوات واقعية عبر الذكاء الاصطناعي. 

استكشفها عن قرب وجربها من خلال الرابط التالي .

خدمة Murf AI 

تسمح لك خدمة Murf AI بإنشاء محتوى صوتي بالاعتماد على نصوص فقط وبطريقة آدمية يصعب على الأذن المجردة التفريق إذا ما كان قد تجسيدها باستخدام الذكاء الاصطناعي أو من أشخاص عاديين. 

تسمح لك منصة Murf AI بكتابة نصوص طويلة، ثم اختيار صوت من بين 120 صوت مختلف يضم أطفال، نساء، شيوخ، رجال وغيرهم. بعدها ستقوم المنصة بتحويل ذلك النص الذي كتبته إلى نص صوتي متقن واحترافي. 

خدمة Murf AI ليست مجانية، لحسن الحظ أن الإصدار المجاني منها يسمح لك بتجسيد الصوت حتى 10 دقائق، والاختيار بين كافة الأصوات المتاحة في الخدمة. 

يمكنك الإطلاع عليها أكثر من خلال الرابط التالي .

خدمة Typecast 

خدمة أخرى مميزة خاصة تدمج بين ميزات الذكاء الاصطناعي والتلاعب الصوتي. قبل كل شيئ هذه الخدمة ليست مجانية لكن الإصدار المجاني منها يتيح لك تحميل تقريبا 3 دقائق من الصوت الذي تجسده، وإن أعجبتك الخدمة وكنت بحاجة لها أكثر، فأسعارهم لا بأس بها. 

إذن ما هي خدمة Typecast؟ عبر هذه المنصة، يمكنك كتابة محتوى طويل بلغات مختلفة، ثم اختيار شخصية من بين الشخصيات كثيرة متاحة على المنصة، ابحث عن الصوت والشخصية المثالية التي تجسد النص الذي كتبته، يمكنك الاستماع إلى صوتهم، ويمكنك الاختيار من بين اللكنات المتاحة لكل شخصية. بعد اختيار شخصيتك سيأخذك إلى الاستوديو لتحويل النص إلى صوت. فيه ذه المرحلة يوجد الكثير من التعديلات لإضافتها، مثل تسريع الصوت، إبطائه، تغيير اللكنة، تغيير نبرة الصوت، والمزيد. 

ميزة إضافية أخرى في المنصة هو تجسيد آفاتار (Avatar) ملائمة للصوت، بحيث تبدو مثلها، ولا نرى مثل هذه الميزات الإضافية إلا قليلًا. 

اطلع عليها أكثر من خلال الرابط التالي .

خدمة Resemble AI 

خدمة Resemble AI أيضا خدمة مدفوعة، ولكنها تقدم تجربة مجانية في البداية لاستكشافها واستكشاف خدماتها. لهذه المنصة الكثير من الميزات المختلفة، كالتحكم في مشاعر الصوت ونبرته، وهي ميزة رائعة لجلب مشاعر مثل الحزن، البكاء، الضحك وغيرها على النصوص التي تحولها إلى صوت. 

تقدم المنصة خدمة مميزة أيضا وهي إنشاء محادثات صوتية بين الشخصيات، عبر اختيار شخصيتين مختلفتين وإعطاء لكل شخصية نص مختلف. لإنشاء محادثة بين الطرفين. 

أو يمكنك كمستخدم عادي فقط كتابة نص، والاختيار بين مئات الأصوات المختلفة الصوت الذي تريده أن يتحدث بكلماتك. مع ميزات كثيرة لتغيير النبرات وسرعة تقديم الصوت، ثم في الأخير استخراجه. 

لسوء الحظ أن المنصة مدفوعة، وتتقاضى بالثانية ( قرابة 0.006$ للثانية) لكنها تبقى منصة تستحق التجريب لما تقدمه من خدمات متقدمة. 

اطلع عليها أكثر من خلال الرابط التالي .

برنامج VoiceMod 

الكثير من الخدمات التي اقترحناها اليوم عبارة عن منصات Text-to-Speech، التي تقوم بتحويل النصوص إلى صوت. لكن برنامج VoiceMod يقوم بتغيير الصوت بشكل حي أثناء المحادثات أو أثناء اللعب أونلاين. يوجد الكثير من البرامج من نفس الفئة في الحقيقة لكن هذا البرنامج يستخدم بعض ميزات الذكاء الاصطناعي لجعل الصوت أكثر واقعية، ثم بعدها يمكنك استخدام البرنامج بشكل واقعي أفضل. 

للبرنامج استخدامات كثيرة الذي يعود القرار للمستخدم لطريقة استخدامه. لكن بالنسبة لنا أفضل طريقة لاستخدام البرنامج هو تحسين الصوت بشكل أفضل أثناء تسجيل الفيديوهات والشروحات عبر الإنترنت بشكل أفضل وصوت واضح أيضا. 

يمكنك الإطلاع على البرنامج من خلال الرابط التالي .

وفي الختام 

يوجد الكثير من الخدمات الأخرى، فقد بدأت خدمات الذكاء الاصطناعي تتفشى في العالم الرقمي الآن. وقد اخترنا لك خيرتها في هذا المقال، فاستخدمها كما يحلو لك عزيزي المتابع. 

شاركه على :