آسیاتکین | دفتر مرکزی پشتیبانی و فروش آسیاتک تبریز

ElevenLabs امکان ساخت عوامل مکالمه‌ای هوش مصنوعی با تنظیمات سفارشی را فراهم کرد

ElevenLabs، استارتاپ پیشرو در زمینه شبیه‌سازی صدای هوش مصنوعی و خدمات متنی به گفتار (Text-to-Speech)، روز دوشنبه اعلام کرد که کاربران اکنون می‌توانند با استفاده از پلتفرم توسعه‌دهندگان این شرکت، عوامل مکالمه‌ای هوش مصنوعی بسازند. این قابلیت شامل تنظیمات سفارشی همچون لحن صدا و طول پاسخ‌ها می‌شود. ㅤ

ویژگی‌های کلیدی قابلیت جدید ElevenLabs

ElevenLabs که بیشتر به خاطر ارائه ابزارهای تبدیل متن به گفتار شناخته می‌شود، اکنون پا را فراتر گذاشته و یک پایپ‌لاین کامل برای ساخت ربات‌های مکالمه‌ای ارائه کرده است. این شرکت برای حل چالش‌هایی مانند ادغام پایگاه‌های دانش و مدیریت قطع مکالمات توسط کاربران، این محصول را توسعه داده است. ㅤ کاربران می‌توانند با ورود به حساب ElevenLabs خود، یک عامل مکالمه‌ای جدید بسازند. این فرآیند شامل مراحل زیر است:

انتخاب قالب یا ایجاد پروژه جدید.
تعیین زبان اصلی عامل، پیام آغازین و شخصیت‌پردازی عامل از طریق سیستم پرامپت‌ها.
انتخاب مدل زبانی (مانند Gemini، GPT، یا Claude).
تنظیم درجه خلاقیت پاسخ‌ها (Temperature) و محدودیت تعداد توکن‌ها.
پیکربندی ویژگی‌هایی همچون صدا، تأخیر، پایداری، معیارهای احراز هویت و طول مکالمه. ㅤ علاوه بر این، کاربران می‌توانند با افزودن پایگاه دانش شخصی (فایل، URL یا متن)، منابع اطلاعاتی دلخواه خود را به ربات مکالمه‌ای اضافه کنند. همچنین، قابلیت ادغام مدل‌های زبانی سفارشی (Custom LLM) در این پلتفرم وجود دارد.

پلتفرم توسعه‌دهنده سازگار با زبان‌های محبوب برنامه‌نویسی

ElevenLabs SDK از زبان‌های برنامه‌نویسی متعددی مانند Python، JavaScript، React و Swift پشتیبانی می‌کند. همچنین، API WebSocket برای سفارشی‌سازی‌های بیشتر ارائه شده است. شرکت‌ها می‌توانند داده‌های کاربران مانند نام و ایمیل را از طریق این پلتفرم جمع‌آوری کرده و با استفاده از معیارهای ارزیابی مبتنی بر زبان طبیعی، موفقیت یا شکست مکالمات را تعریف کنند. ㅤ

رقابت در بازار هوش مصنوعی مکالمه‌ای

ElevenLabs که ارزش‌گذاری آن به بیش از ۳ میلیارد دلار رسیده و به دنبال جذب سرمایه است، اکنون رقبای سرسختی همچون OpenAI، Vapi و Retell دارد. این شرکت معتقد است که قابلیت‌های سفارشی‌سازی و امکان تغییر مدل‌های زبانی در حین کار، به آن مزیت رقابتی قابل‌توجهی نسبت به OpenAI و سایر رقبا می‌دهد. ㅤ این شرکت در حال حاضر از پایپ‌لاین متن به گفتار خود برای این محصول جدید استفاده می‌کند، اما برای توسعه آن، نیاز به ارائه قابلیت گفتار به متن (Speech-to-Text) دارد. هرچند این API هنوز به‌عنوان یک محصول مستقل عرضه نشده، اما در آینده ممکن است رقیب جدی برای APIهای مطرحی مانند Google، Microsoft، Amazon، OpenAI Whisper، AssemblyAI، و دیگران باشد. ㅤ نظر شما درباره این قابلیت جدید چیست؟ آیا این محصول می‌تواند رقبای بزرگی مانند OpenAI را به چالش بکشد؟