راهکارها

نویکس: تبدیل صوت به متن

این سرویس به صورت اختصاصی برای مراکز تماس طراحی شده است که با تلفن به مشتریان پاسخ می‌دهند. با توجه به وجود نویز در خطوط تلفن، دقت مدل‌های معمولی کاهش پیدا می‌کند. اما مدل‌های ما به‌صورت ویژه برای شرایط تلفنی بهینه شده‌اند تا بتوانند با دقت بالا حتی در شرایط نویز عمل کنند.
محصول تبدیل صوت به متن سخن می‌تواند بر اساس نیازمندی‌های منحصربفرد شما شخصی سازی شود. موتور شخصی سازی شده اصطلاحات تخصصی حرفه شما را متوجه خواهد شد و دقتی بالاتر از نسخه عادی در تبدیل گفتار به متن خواهد داشت.

تست برخط تبدیل صوت به متن

کاربر گرامی

شما می‌توانید برای تست نویکس، از صوت نمونه استفاده کنید، یا یک صوت بارگذاری کنید و یا با میکروفون خود صوت مورد نظر را ایجاد کنید. پس از پردازش صوت نتیجه در این قسمت قابل نمایش خواهد بودبرای تغییر این متن بر روی دکمه ویرایش کلیک کنید.

نویکس چگونه کار می‌کند

تعرفه‌های نویکس

تست رایگان

یک ساعت

رایگان

پلن پایه

10 ساعت

200000 تومان

180000 تومان

پلن استاندارد

30 ساعت

600000 تومان

480000 تومان

پلن نهایی

100 ساعت

1200000 تومان

نویکس: تبدیل صوت به متن

امکان تفکیک گویندگان

این محصول امکان تفکیک گویندگان مختلف را دارد و می‌تواند گفتار هر گوینده را بصورت مجزا به متن تبدیل نماید.

کاهش نویط صوت

بمنظور بهبود دقت تبدیل صوت به متن، این محصول، نویز موجود در محیط یا بر روی داده‌های صوتی را به حداقل می‌رساند.

امکان تفکیک موسیقی

با کمک این محصول، می‌توان موسیقی را از گفتار تفکیک کرد تا موسیقی، اختلالی در تبدیل گفتار به متن ایجاد نکند.

3500 گوینده

پایگاه داده صوتی این مجموعه شامل ۳۵۰۰ گوینده از سراسر ایران و نیز شامل لهجه های مختلف می‌باشد.

10000000 کلمه

مدل زبانی این محصول از روی یک پیکره‌ی متنی شامل ۱۰ میلیون کلمه ساخته شده و واژگان آن حدود ۵۰۰ هزار کلمه پرکاربرد در فارسی است.

رسمی و نیمه عامیانه

محصول تبدیل صوت به متن سخن می‌تواند گفتار رسمی یا نیمه عامیانه را به متن تبدیل کند.

دقت 90 درصدی

دقت اولیه این محصول حدود ۹۰درصد است. با استفاده از پایگاه داده صوتی بیشتر و مدل زبانی کاربردی و بزرگتر، این دقت درحال افزایش است.

مشاوره در مورد سرویس نویکس

اگر هنوز سوالی دارید، تیم مشاوران سخن آماده پاسخ به نیازها و ارائه راهکار به شما هستند.

نویکس برای چه کسانی کاربرد دارد؟

برای کاربران

راهکاری ساده برای افراد و کسب‌وکارهای کوچک

با استفاده از پنل نویکس، کاربران می‌توانند به راحتی صوت خود را از طریق پیام‌رسان‌هایی مانند واتساپ، تلگرام، بله و اینستاگرام به متن تبدیل کنند.
تمام امکانات مورد نیاز تبدیل صوت به متن و مدیریت محتوای صوتی در یک محیط ساده و در دسترس قرار گرفته است. مناسب برای افرادی که دنبال راهی سریع و دقیق برای برداشت و آرشیو صحبت‌های خود یا گروه‌شان هستند

برای توسعه دهندگان

دسترسی مستقیم به API و سرویس‌های هوشمند گفتار به متن

مناسب برای تیم‌ها و شرکت‌هایی که می‌خواهند مستقیماً سرویس‌های پردازش صوت (مانند سخن Google، OpenAI، و…) را به محصولات یا سیستم‌های خود متصل کنند.
صفحه تست آنلاین API برای بررسی و تست قابلیت‌ها پس از ورود به حساب کاربری در دسترس است. توسعه‌دهندگان می‌توانند به راحتی سرویس‌ها را ادغام و آزمایش کنند.

برای مراکز تماس

راهکار یکپارچه برای مراکز تماس

امکان اتصال پنل به سرور VoIP مراکز تماس و تبدیل صوت به متن برای تحلیل دقیق تماس‌ها. ارائه دستیارهای پیشرفته و آماده،جهت مدیریت مکالمات و بهبود تجربه مشتری.
در نسخه‌های پیشرفته‌تر، امکان ارسال پاسخ اولیه به مشتری، از طریق پیام‌رسان‌هایی مانند واتساپ نیز فراهم است تا کارایی تیم پشتیبانی افزایش یابد.

سرویس تبدیل صوت به متن (ASR) شما چه تفاوتی با سایر سرویس‌های موجود در بازار دارد؟

در حالی که بسیاری از سرویس‌های عمومی برای تبدیل صدای باکیفیت (مانند فایل پادکست یا سخنرانی) ساخته شده‌اند، سرویس ASR سخن به طور تخصصی برای تحلیل مکالمات تلفنی در مراکز تماس فارسی‌زبان بهینه‌سازی شده است.

مدل پایه ما که با بیش از ۱۰۰۰ ساعت داده‌ تلفنی عمومی و تخصصی آموزش دیده است، در حوزه‌هایی مانند خدمات مالی، بانکی و بورسی به دقت تقریبی ۸۵٪ دست می‌یابد. این دقت در حوزه‌هایی که مدل برای آن آموزش اختصاصی ندیده (مانند پزشکی)، ممکن است متفاوت باشد. برای مقایسه، در نظر داشته باشید که دقت یک انسان متخصص در پیاده‌سازی مکالمات تلفنی نیز معمولاً در حدود ۹۵٪ است.

سرویس ASR سخن قابلیت سفارشی‌سازی برای حوزه تخصصی کسب‌وکار شما را دارد. برای این کار، ما می‌توانیم یک مدل اختصاصی بر اساس مکالمات واقعی مرکز تماس شما آموزش دهیم.عت چاپ و با استفاده از طراحان گرافیک است.

بله، این قابلیت وجود دارد. بهترین و دقیق‌ترین روش، تنظیم سرور VoIP شما برای ضبط مکالمات به صورت دو کاناله (استریو) است. اگر امکان ضبط استریو وجود نداشته باشد، مدل هوش مصنوعی ما همچنان می‌تواند تفکیک گویندگان را انجام دهد، اما ممکن است با خطای بیشتری همراه باشد.

در حال حاضر، اتصال مستقیم و کامل به سرورهای تلفنی مبتنی بر ایزابل (Issabel) و استریسک (Asterisk) فراهم شده است. برای اتصال به مراکز تلفن غیر اپن‌سورس مانند پاناسونیک، سیسکو یا گرنداستریم، نیاز به استفاده از یک واسط نرم‌افزاری یا سخت‌افزاری (پراکسی) خواهد بود.صل می‌شود؟

بله، در صورتی که ارائه‌دهنده سرویس تلفن ابری شما، API یا راهکار مناسبی برای دسترسی و دریافت فایل‌های صوتی مکالمات در اختیار قرار دهد، امکان اتصال و یکپارچه‌سازی کامل وجود خواهد داشت.

شما می‌توانید فایل‌های صوتی با فرمت‌های رایج مانند WAV, MP3, M4A, OGG و AAC را برای تبدیل به متن استفاده کنید.

سرعت پردازش به سخت‌افزار مورد استفاده بستگی دارد. پردازش یک ساعت فایل صوتی با استفاده از پردازنده گرافیکی (GPU) حدود ۳ دقیقه و با استفاده از پردازنده مرکزی (CPU) حدود ۲۰ دقیقه زمان می‌برد.

 بله، شما با ثبت‌نام در وب‌سایت سخن، یک اعتبار رایگان یک ساعته برای تست و ارزیابی کیفیت سرویس دریافت خواهید کرد.

با تبدیل مکالمات به متن، شما می‌توانید فرآیندهای مهمی مانند کنترل کیفیت اپراتورها، تحلیل نیازهای مشتریان و آموزش نیروهای جدید را به شکل چشمگیری بهبود دهید.

هر دو گزینه امکان‌پذیر است. اگر ملاحظات امنیتی و حفظ حریم خصوصی داده‌ها برای شما اولویت دارد، می‌توانیم سرویس را روی سرورهای داخلی شما نصب کنیم. در غیر این صورت، می‌توانید به راحتی از طریق API به سرویس ابری ما متصل شوید.

پیمایش به بالا