أصوات احترافية في جيبك: ElevenLabs تطلق تطبيقها لتحويل النص إلى كلام بالذكاء الاصطناعي
أعلنت شركة ElevenLabs، الرائدة في مجال الذكاء الاصطناعي الصوتي، عن إطلاق تطبيقها المستقل على هواتف iOS وأندرويد، في خطوة تجعل تقنياتها المتقدمة لتوليد واستنساخ الأصوات في متناول يد المبدعين والمستخدمين أثناء تنقلهم، بعد أن كانت مقتصرة على استخدام متصفح الويب.
هذا الإطلاق لا يمثل مجرد توفير أداة جديدة، بل هو مؤشر على الانتشار الهائل لتقنيات "الذكاء الاصطناعي الصوتي" وتحولها من أداة متخصصة إلى جزء أساسي من صناعة المحتوى على منصات مثل تيك توك وإنستغرام.
كيف يعمل التطبيق الجديد؟
التطبيق مصمم ليكون بسيطًا وسهل الاستخدام. كل ما عليك فعله هو كتابة أو لصق النص الذي تريد تحويله إلى كلام، ثم اختيار صوت مناسب من مكتبة الأصوات الواسعة التي توفرها ElevenLabs لتوليد المقطع الصوتي.
الخطة المجانية: تمنح المستخدمين الجدد رصيدًا يسمح بتوليد حوالي 10 دقائق من الصوت شهريًا.
رصيد مشترك: يتم مشاركة رصيد الاستخدام بين تطبيق الهاتف والويب، مما يوفر تجربة موحدة.
نماذج متعددة: يمكنك الاختيار بين نماذج صوتية مختلفة لتحقيق التوازن بين الجودة والتكلفة (استهلاك الرصيد).
ليس مجرد كلام: التحكم في المشاعر ونبرة الصوت
القوة الحقيقية للتطبيق تكمن في وصوله إلى أحدث نماذج الشركة "v3 alpha"، والتي تسمح للمستخدم بالتحكم الدقيق في نبرة الصوت وتعبيرات الأداء باستخدام "علامات" (tags) بسيطة داخل النص. هذا يعني أنه يمكنك توجيه الذكاء الاصطناعي ليتحدث بنبرة حزينة، أو متحمسة، أو حتى يهمس، مما ينقل الصوت من مجرد كلام آلي إلى أداء صوتي بشري ومعبر.
استجابة لطلب المبدعين
أوضح جاك ماكديرموت، مسؤول نمو تطبيقات الهاتف في الشركة، أن إطلاق التطبيق جاء استجابة لطلب هائل من مجتمع المبدعين. فقد لاحظت الشركة أن عددًا كبيرًا من المستخدمين كانوا يعتمدون على متصفح الويب في هواتفهم لإنشاء مقاطع صوتية لاستخدامها في تطبيقات تحرير الفيديو مثل CapCut و InShot و Instagram. لذلك، كان من المنطقي توفير تجربة أسرع وأكثر سلاسة وقوة مصممة خصيصًا للهواتف.
سيف ذو حدين: بين الإبداع ومخاطر التزييف العميق
يمثل انتشار هذه التقنية سيفًا ذا حدين. فمن ناحية، هي تفتح آفاقًا إبداعية لا محدودة للمبدعين، وتساعد في مجالات التعليم، وتقدم حلولاً للأشخاص الذين يعانون من صعوبات في القراءة (كما يفعل تطبيق "Reader" الآخر من الشركة).
ولكن من ناحية أخرى، تثير سهولة استنساخ الأصوات بهذه الدقة مخاوف أخلاقية جدية تتعلق بالتزييف العميق (deepfakes)، وإمكانية استخدامها في نشر معلومات مضللة، أو انتحال شخصية الآخرين دون إذنهم.
ومع استمرار الشركة في التوسع والتخطيط لإضافة ميزات جديدة مثل تحويل الكلام إلى نص ووكيل ذكاء اصطناعي محادثاتي، فإن النقاش حول الاستخدام المسؤول والأخلاقي لهذه الأدوات القوية سيصبح أكثر إلحاحًا من أي وقت مضى.
ما رأيك في انتشار أدوات الذكاء الاصطناعي الصوتي؟ وهل ترى أن فوائدها الإبداعية تفوق مخاطرها المحتملة؟
شاركنا وجهة نظرك في التعليقات!