Pengenalan Suara adalah sesuatu hal familiar yang dimemiliki pada smartphone hari ini dan untuk meningkatkan lebih lanjut untuk penggunaan yang lebih baik, Google kini telah memperkenalkan all-neutral, pengenalan suara pada perangkat sistem pada Gboard.
Hingga saat ini, Google telah menggunakan pemrosesan berbasis cloud. Ini menggunakan “grafik decoder” – komponen dari algoritma yang cocok dengan kata-kata yang diucapkan dengan kata-kata tertulis dan mengkonsumsi 2GB penyimpanan.
Selain itu, proses pengenalan suara cukup lama (pengguna mengatakan sesuatu dan perlu waktu untuk mencapai server dan akhirnya memprosesnya), dan tingkat latensi cukup tinggi.
Pengenal ucapan yang baru menjadikan seluruh proses offline , artinya pengenalan suara akan terjadi pada perangkat Anda, dan karenanya, jauh lebih cepat .
Dengan menggunakan teknologi transduser RNN (RNN-T), Google dapat memampatkan algoritma wicara yang cukup kecil agar muat dengan mudah di smartphone, dengan ukuran kecil 80MB.
Bagi mereka yang tidak tahu, RNN-T adalah jenis model urutan-ke-urutan yang memproses seluruh urutan input dengan terus bekerja pada sampel input untuk menghasilkan output.
Karena hal ini, teknologi yang ditingkatkan mengenali karakter bicara per karakter (yang ditranskripsi saat Anda berbicara) dengan lebih akurat untuk konversi suara ke teks yang lebih baik dan cepat.
Namun, fungsi ini saat ini tersedia di Gboard untuk pengguna Pixel saja dan mendukung Bahasa Inggris Amerika .
Google pada akhirnya diharapkan membuat sistem pengenalan suara baru tersedia dalam lebih banyak bahasa untuk smartphone non-Pixel lainnya.
Leave a Reply
Your email address will not be published. Required fields are marked *