ElevenLabs امکان ساخت عوامل مکالمهای هوش مصنوعی با تنظیمات سفارشی را فراهم کرد
ElevenLabs، استارتاپ پیشرو در زمینه شبیهسازی صدای هوش مصنوعی و خدمات متنی به گفتار (Text-to-Speech)، روز دوشنبه اعلام کرد که کاربران اکنون میتوانند با استفاده از پلتفرم توسعهدهندگان این شرکت، عوامل مکالمهای هوش مصنوعی بسازند. این قابلیت شامل تنظیمات سفارشی همچون لحن صدا و طول پاسخها میشود. ㅤ
ویژگیهای کلیدی قابلیت جدید ElevenLabs
ElevenLabs که بیشتر به خاطر ارائه ابزارهای تبدیل متن به گفتار شناخته میشود، اکنون پا را فراتر گذاشته و یک پایپلاین کامل برای ساخت رباتهای مکالمهای ارائه کرده است. این شرکت برای حل چالشهایی مانند ادغام پایگاههای دانش و مدیریت قطع مکالمات توسط کاربران، این محصول را توسعه داده است. ㅤ کاربران میتوانند با ورود به حساب ElevenLabs خود، یک عامل مکالمهای جدید بسازند. این فرآیند شامل مراحل زیر است:
- انتخاب قالب یا ایجاد پروژه جدید.
- تعیین زبان اصلی عامل، پیام آغازین و شخصیتپردازی عامل از طریق سیستم پرامپتها.
- انتخاب مدل زبانی (مانند Gemini، GPT، یا Claude).
- تنظیم درجه خلاقیت پاسخها (Temperature) و محدودیت تعداد توکنها.
- پیکربندی ویژگیهایی همچون صدا، تأخیر، پایداری، معیارهای احراز هویت و طول مکالمه. ㅤ علاوه بر این، کاربران میتوانند با افزودن پایگاه دانش شخصی (فایل، URL یا متن)، منابع اطلاعاتی دلخواه خود را به ربات مکالمهای اضافه کنند. همچنین، قابلیت ادغام مدلهای زبانی سفارشی (Custom LLM) در این پلتفرم وجود دارد.
پلتفرم توسعهدهنده سازگار با زبانهای محبوب برنامهنویسی
ElevenLabs SDK از زبانهای برنامهنویسی متعددی مانند Python، JavaScript، React و Swift پشتیبانی میکند. همچنین، API WebSocket برای سفارشیسازیهای بیشتر ارائه شده است. شرکتها میتوانند دادههای کاربران مانند نام و ایمیل را از طریق این پلتفرم جمعآوری کرده و با استفاده از معیارهای ارزیابی مبتنی بر زبان طبیعی، موفقیت یا شکست مکالمات را تعریف کنند. ㅤ
رقابت در بازار هوش مصنوعی مکالمهای
ElevenLabs که ارزشگذاری آن به بیش از ۳ میلیارد دلار رسیده و به دنبال جذب سرمایه است، اکنون رقبای سرسختی همچون OpenAI، Vapi و Retell دارد. این شرکت معتقد است که قابلیتهای سفارشیسازی و امکان تغییر مدلهای زبانی در حین کار، به آن مزیت رقابتی قابلتوجهی نسبت به OpenAI و سایر رقبا میدهد. ㅤ این شرکت در حال حاضر از پایپلاین متن به گفتار خود برای این محصول جدید استفاده میکند، اما برای توسعه آن، نیاز به ارائه قابلیت گفتار به متن (Speech-to-Text) دارد. هرچند این API هنوز بهعنوان یک محصول مستقل عرضه نشده، اما در آینده ممکن است رقیب جدی برای APIهای مطرحی مانند Google، Microsoft، Amazon، OpenAI Whisper، AssemblyAI، و دیگران باشد. ㅤ نظر شما درباره این قابلیت جدید چیست؟ آیا این محصول میتواند رقبای بزرگی مانند OpenAI را به چالش بکشد؟