Sebelum wabak ini, lebih daripada 40% pengguna internet baru adalah kanak-kanak. Anggaran sekarang menunjukkan bahawa masa skrin kanak-kanak telah meningkat 60% atau lebih dengan kanak-kanak 12 tahun dan di bawah menghabiskan lima jam sehari di skrin (dengan semua faedah dan bahaya yang berkaitan ).
Walaupun mudah mengagumi kehebatan teknologi orang asli digital, pendidik (dan ibu bapa) sangat menyedari bahawa “pelajar terpencil” muda sering berjuang untuk menavigasi papan kekunci, menu dan antara muka yang diperlukan untuk memenuhi janji teknologi pendidikan.
Dengan latar belakang itu, pembantu digital yang bersuara menggunakan harapan untuk berinteraksi dengan teknologi tanpa gesekan. Tetapi semasa kanak-kanak gemar bertanya kepada Alexa atau Siri ke beatbox, bercerita atau membuat suara haiwan, ibu bapa dan guru tahu bahawa sistem ini menghadapi masalah untuk memahami pengguna termuda mereka setelah mereka menyimpang dari permintaan yang dapat diramalkan.
Tantangannya berpunca dari kenyataan bahawa perisian pengecaman pertuturan yang memberi kuasa kepada pembantu suara yang popular seperti Alexa, Siri dan Google tidak pernah dirancang untuk digunakan dengan kanak-kanak, yang suara, bahasa dan tingkah laku mereka jauh lebih kompleks daripada orang dewasa.
Bukan hanya suara kanak-kanak yang lebih kuat, saluran vokalnya lebih tipis dan pendek, lipatan vokalnya lebih kecil dan laring mereka belum berkembang sepenuhnya. Ini menghasilkan corak pertuturan yang sangat berbeza daripada corak kanak-kanak yang lebih tua atau orang dewasa.
Dari grafik di bawah ini dapat dilihat dengan mudah bahawa hanya mengubah nada suara orang dewasa yang digunakan untuk melatih pengecaman pertuturan gagal menghasilkan semula kerumitan maklumat yang diperlukan untuk memahami ucapan anak. Struktur dan corak bahasa kanak-kanak sangat berbeza. Mereka membuat lompatan dalam sintaksis, pengucapan dan tata bahasa yang perlu dipertimbangkan oleh komponen pemrosesan bahasa semula jadi dari sistem pengenalan pertuturan. Kerumitan itu ditambah dengan kebolehubahan interspeaker di kalangan kanak-kanak pada pelbagai peringkat perkembangan yang berbeza yang tidak perlu dipertanggungjawabkan dengan pertuturan orang dewasa.
Tingkah laku pertuturan kanak-kanak tidak hanya lebih berubah daripada orang dewasa, tetapi sangat tidak menentu. Anak-anak terlalu banyak menyebut perkataan, memanjangkan suku kata tertentu, membunyikan setiap perkataan ketika mereka berfikir dengan lantang atau melangkau sebilangan perkataan. Corak pertuturan mereka tidak dapat dilihat pada irama biasa yang biasa dilakukan oleh sistem yang dibina untuk pengguna dewasa. Sebagai orang dewasa, kami telah belajar bagaimana berinteraksi dengan peranti ini dengan sebaik-baiknya, bagaimana mendapatkan respons terbaik. Kami meluruskan diri, kami merumuskan permintaan di kepala kami, mengubahnya berdasarkan tingkah laku yang dipelajari dan kami mengucapkan permintaan kami dengan kuat, menarik nafas dalam-dalam … “Alexa …” Anak-anak hanya mengeluarkan permintaan mereka yang tidak dipikirkan seolah-olah Siri atau Alexa manusia, dan lebih kerap daripada tidak mendapat tindak balas yang salah atau tersekat.
Dalam suasana pendidikan, cabaran ini diburukkan lagi oleh kenyataan bahawa pengecaman pertuturan mesti berlaku bukan hanya dengan kebisingan persekitaran dan ketidakpastian bilik darjah, tetapi perubahan dalam pertuturan anak sepanjang tahun, dan banyaknya loghat dan dialek dalam dasar biasa sekolah. Perbezaan fizikal, bahasa dan tingkah laku antara kanak-kanak dan orang dewasa juga meningkat secara mendadak semakin muda anak. Ini bererti bahawa pelajar muda, yang paling banyak mendapat manfaat daripada pengecaman pertuturan, adalah yang paling sukar untuk dibangunkan oleh pemaju.
Untuk menjelaskan dan memahami kebiasaan bahasa kanak-kanak yang sangat bervariasi memerlukan sistem pengecaman pertuturan yang dibina untuk belajar dengan sengaja dari cara anak-anak bercakap. Pertuturan anak-anak tidak boleh diperlakukan hanya sebagai aksen atau dialek lain untuk mengakomodasi pertuturan pertuturan; ini pada asasnya dan praktikal berbeza, dan ia berubah ketika kanak-kanak membesar dan berkembang secara fizikal dan juga dalam kemahiran berbahasa.
Tidak seperti kebanyakan konteks pengguna, ketepatan mempunyai implikasi yang mendalam bagi kanak-kanak. Sistem yang memberitahu kanak-kanak bahawa mereka salah semasa mereka betul (negatif palsu) merosakkan keyakinan mereka; yang memberitahu mereka betul apabila mereka salah (positif palsu) berisiko merosakkan sosioemosi (dan psikometrik). Dalam suasana hiburan, dalam aplikasi, permainan, robotik dan mainan pintar, negatif atau positif palsu ini menimbulkan pengalaman yang mengecewakan. Di sekolah, kesilapan, kesalahpahaman atau tindak balas tersusun boleh membawa implikasi pendidikan – dan ekuiti yang jauh lebih mendalam.
Didokumentasikan dengan baik berat sebelah dalam pengecaman pertuturan, misalnya, boleh memberi kesan buruk kepada anak-anak. Produk tidak boleh berfungsi dengan ketepatan yang lebih buruk – tidak memberikan positif dan negatif palsu – untuk kanak-kanak dengan latar belakang demografi atau sosioekonomi tertentu. Penelitian yang semakin meningkat menunjukkan bahawa suara boleh menjadi antara muka yang sangat berharga bagi anak-anak tetapi kita tidak boleh membiarkan atau mengabaikan potensi untuk meningkatkan bias dan ketidakadilan yang sudah ada di sekolah kita.
Pengecaman pertuturan berpotensi menjadi alat yang ampuh untuk anak-anak di rumah dan di kelas. Ia dapat mengisi jurang kritikal dalam menyokong anak-anak melalui tahap literasi dan pembelajaran bahasa, membantu anak-anak lebih memahami – dan difahami oleh – dunia di sekitar mereka. Ini dapat membuka jalan bagi era baru langkah-langkah pengamatan ” tak terlihat ” yang dapat diandalkan, bahkan dalam lingkungan yang jauh. Tetapi kebanyakan alat pengecaman pertuturan hari ini tidak sesuai dengan tujuan ini. Teknologi yang terdapat di Siri, Alexa dan pembantu suara lain mempunyai tugas yang harus dilakukan – untuk memahami orang dewasa yang bercakap dengan jelas dan dapat diramalkan – dan, sebahagian besarnya, mereka melakukan pekerjaan itu dengan baik. Sekiranya pengecaman pertuturan berfungsi untuk anak-anak, ia harus dimodelkan, dan ditanggapi, suara, bahasa dan tingkah laku mereka yang unik.