نماد سایت موبایلستان

هوش مصنوعی WaveNet گوگل می‌تواند کاملا طبیعی و با لحن انسان‌ها صحبت کند

در حال حاضر خیلی راحت می‌توانیم صحبت کردن یک انسان واقعی را از صحبت کردن یک ربات که تنها متن‌های از پیش تعیین شده را با لحنی مصنوعی تکرار میکند، تشخیص دهیم. اما این موضوع در حال تغییر است و شاید در یکی دو سال آینده شما ندانید که در حال مکالمه‌ی تلفنی با یک مسئول روابط عمومی هستید و یا با یک ربات فوق هوشمند!
تیم DeepMind گوگل که بر روی هوش مصنوعی و توسعه‌ی رشته‌های عصبی الکترونیکی فعالیت می‌کند، به تازگی از قابلیت‌های سیستم هوش مصنوعی WaveNet پرده برداشته است. این هوش مصنوعی قادر است که مشابه یک انسان و با لحنی کاملا طبیعی با شما صحبت کند و سخنرانی‌های کوتاه انجام دهد؛ تیم DeepMind چندی پیش سیستم هوشمندی به نام AlphaGo را توسعه داده بودند که توانست یکی از بازیکنان افسانه‌ای بازی تخته‌ای Go را شکست دهد و درجه‌ی استادی این بازی را از کشور کره‌ی جنوبی دریافت کند!
در حال حاضر توسعه دهندگان از دو روش برای توسعه و ساخت نرم افزارهای گفتاری و سخنگو استفاده می‌کنند. اولین روش این است که مجموعه‌ی بسیار بزرگی از کلمات و جملاتی که توسط یک انسان تلفظ شده است، در اختیار آن نرم افزار قرار بگیرد. این روش باعث می‌شود که قابلیت تغییر و دستکاری لحن جملات به هیچ وجه وجود نداشته باشد و یا این کار خیلی سخت باشد.
روش دوم این است که ربات بر مبنای آنالیز خود، کلمات را بسازد و تلفظ کند و آنها را بر مبنای این که هر حرف چه تلفظی دارد، برای کاربر تکرار کند. این روش امکان تغییرپذیری بسیار بیشتری دارد، اما مطمئنا نتیجه‌ی کار کاملا مصنوعی خواهد شد و از فرسنگ‌ها دورتر مشخص است که یک ربات دارد این کلمات را ادا می‌کند.
حالا برای این که هوش مصنوعی WaveNet بتواند مانند یک انسان و با لحنی طبیعی صحبت کند، محققان گوگل مجموعه‌ای از امواج صوتی را در اختیار آن گذاشته اند. این امواج صوتی در واقع همان اشکالی هستند که در برخی از پلیرهای موسیقی دیده‌اید و با تغییر بخش‌های مختلف صدا، بالا و پایین می‌شوند و رنگ آنها تغییر می‌کند و البته تمام آنها نیز توسط سخنرانان واقعی ادا شده‌اند.
حالا WaveNet قادر است که با تشکیل این امواج صوتی، کلمات را بسازد و آنها را تلفظی بسیار دقیق و مشابه لحن انسانی، ادا کند. گفتنی است که تست‌هایی بر مبنای زبان انگلیسی و زبان چینی بر روی این سیستم هوش مصنوعی انجام شده است و اکثر شنوندگان معتقد بوده‌اند که WaveNet قادر است بسیار طبیعی‌تر از دیگر نرم افزارهای صوتی، صحبت کند و کلمات مختلف را ادا کند. گفتنی است که احتمالا فاصله‌ی بسیار زیادی از عرضه‌ی یک اپلیکیشن قدرت گرفته از این سیستم هوشمند داشته باشیم، اما با مراجعه به این لینک در سایت رسمی تیم DeepMind گوگل می‌توانید نمونه‌هایی از اصوات تلفظ شده توسط هوش مصنوعی WaveNet را بشنوید.
 
خروج از نسخه موبایل