در Google I/O مدیر شرکت گوگل اعلام کرد که ضریب خطا در تکنولوژی تشخیص گفتار این کمپانی به ۴.۹ درصد کاهش یافته است. یعنی این که بین هر ۲۰ کلمه فقط یکی درست تشخیص داده نمی شود که این رقم به مراتب بهتر از آماری است که در سال ۲۰۱۳ اعلام شد. در سال ۲۰۱۳ ضریب خطای گوگل ۲۳ درصد بود.
هوش مصنوعی یکی از مواردی بود که گوگل در Google I/O بسیار بر آن تاکیید داشت. یادگیری عمیق، گونهای از هوش مصنوعی است که برای تشخیص دقیقتر تصاویر و گفتار میتوان از آن بهره برد. در این روش اطلاعات زیادی به سیستم آموزشی به نام شبکه عصبی داده میشود و با تحلیل آنها کامپیوتر میتواند حدس بزند. مدیریت گوگل در کنفرانس گفت:
ما بهوسیله فرامین صوتی از محصولات مختلفی استفاده میکنیم. به همین علت است که کامپیوترها در درک گفتار پیشرفت میکنند. ما دستاوردهای شگرفی در این زمینه داشتهایم؛ اما از سال گذشته با پیشرفتهای محسوسی مواجه شدهایم. میزان خطای ما حتی در محیطهای شلوغ و پر سر و صدا در حال کاهش است. به همین علت است که اگر با گوگل از طریق تلفن هوشمند یا گوگل هوم صحبت کنید ما میتوانیم با دقت بسیار بالایی صدای شما را تشخیص دهیم.
مایکروسافت نیز شدیدا با گوگل در این زمینه در رقابت است و طبق آنچه در اکتبر سال ۲۰۱۶ اعلام کرده است، ضریب خطایش به ۵.۹ درصد رسیده است. البته باید گفت که مشخص نیست آیا هر دو کمپانی از یک استاندارد استفاده میکنند یا خیر.
کمپانی گوگل از سال ۲۰۱۲ تاکنون توانسته است ضریب خطا در تشخیص گفتار را از ۳۰ درصد به ۴.۹ درصد برساند که موفقیت بزرگی محسوب میشود. مسئولان این کمپانی، استفاده از شبکههای عصبی را دلیل پیشرفتشان میدانند.