درصد خطای سیستم تشخیص گفتار گوگل ۴٫۹ درصد شد

pouyan_i777

9 سال پیش

در Google I/O مدیر شرکت گوگل اعلام کرد که ضریب خطا در تکنولوژی تشخیص گفتار این کمپانی به ۴.۹ درصد کاهش یافته است. یعنی این که بین هر ۲۰ کلمه فقط یکی درست تشخیص داده نمی شود که این رقم به مراتب بهتر از آماری است که در سال ۲۰۱۳ اعلام شد. در سال ۲۰۱۳ ضریب خطای گوگل ۲۳ درصد بود.
هوش مصنوعی یکی از مواردی بود که گوگل در Google I/O بسیار بر آن تاکیید داشت. یادگیری عمیق، گونه‌ای از هوش مصنوعی است که برای تشخیص دقیق‌تر تصاویر و گفتار می‌توان از آن بهره برد. در این روش اطلاعات زیادی به سیستم آموزشی به نام شبکه عصبی داده می‌شود و با تحلیل آن‌ها کامپیوتر می‌تواند حدس بزند. مدیریت گوگل در کنفرانس گفت:
ما به‌وسیله فرامین صوتی از محصولات مختلفی استفاده می‌کنیم. به همین علت است که کامپیوترها در درک گفتار پیشرفت می‌کنند. ما دستاوردهای شگرفی در این زمینه داشته‌ایم؛ اما از سال گذشته با پیشرفت‌های محسوسی مواجه شده‌ایم. میزان خطای ما حتی در محیط‌های شلوغ و پر سر و صدا در حال کاهش است. به همین علت است که اگر با گوگل از طریق تلفن هوشمند یا گوگل هوم صحبت کنید ما می‌توانیم با دقت بسیار بالایی صدای شما را تشخیص دهیم.
مایکروسافت نیز شدیدا با گوگل در این زمینه در رقابت است و طبق آنچه در اکتبر سال ۲۰۱۶ اعلام کرده است، ضریب خطایش به ۵.۹ درصد رسیده است. البته باید گفت که مشخص نیست آیا هر دو کمپانی از یک استاندارد استفاده می‌کنند یا خیر.
کمپانی گوگل از سال ۲۰۱۲ تاکنون توانسته است ضریب خطا در تشخیص گفتار را از ۳۰ درصد به ۴.۹ درصد برساند که موفقیت بزرگی محسوب می‌شود. مسئولان این کمپانی، استفاده از شبکه‌های عصبی را دلیل پیشرفتشان می‌دانند.