PENGERTIAN
SPEECH RECOGNITION
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi_KeiZK82FpVACllucXq8rRG72okZ_dcdJuQXyCwDte-w8bi4dncaU52FtEu_BYPoBJpN_164x9Z_eixNxZyYg5CiPCjJ6dmFWaIQCyFO-jc6L3EyoPo4iaLPrY17MPoZrPPd-802SZ6w/s320/we-put-siri-alexa-google-assistant-and-cortana-through-a-marathon-of-tests-to-see-whos-winning-the-virtual-assistant-race--heres-what-we-found.jpg)
Oke kalian pasti tau kan,
apa itu robot? Secara umum kalau ada pertanyaan singkat seperti itu, kita pasti
akan menjawabnya iya, robot adalah benda besi yang bisa bergerak-gerak yang
tertanam mesin didalamnya. Oke itu betul, robot merupakan salah satu contoh kecerdasan buatan yang umum kita semua ketahui. Tapi, Apakah ada kecerdasan buatan
lainnya selain robot? Jawabannya tentu saja ada. Nahh, kali ini kita akan
membahas salah satu kecerdasan buatan lainnya yaitu Speech Recognition atau Bahasa
Indonesianya "Pengenalan Ucapan". Jadi pernakah kalian mendengar kata atau istilah Speech Recognition? apa sih Speech Recognition itu? Nahh sebelum
pengertian lengkapnya, kalian yang GadgetMania
pasti tau kan Google Voice di HP Android?atau Cortana di Windows?ataupun Siri
di Apple? Nahh itulah contoh umum speech recognition modern atau "kekinian
banget" yang sering kita jumpai dan gunakan sehari-hari. Gak nyangka kan kalian atau belum tahu kan kalian? , ternyata aplikasi-aplikasi tersebut namanya speech recognition. Fungsional banget kan? Kita
hanya bicara apa yang kita mau, nanti para “asisten” di gadget kita itu akan
mencarinya. Hebat yaaa. Itulah kecerdesan buatan, fungsinya membantu kita agar lebih mudah lagi melakukan tugas yang kita kerjakan. Oke sekarang kita bahas nihh pengertian komplitnya.
Bagaimana cara kerja
pengenalan ucapan?
Pengenalan ucapan
atau Speech Recognition (SR) adalah proses identifikasi suara
berdasarkan kata yang diucapkan dengan melakukan konversi sebuah sinyal
akustik, yang ditangkap oleh audio device (perangkat input suara). Speech
Recognition juga merupakan sistem yang digunakan untuk mengenali perintah kata
dari suara manusia dan kemudian diterjemahkan menjadi suatu data yang
dimengerti oleh komputer. Pada saat ini, sistem ini digunakan untuk menggantikan
peranan input dari keyboard dan mouse.
![](https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEj4M3UiKS8QhDM4qoWQ2t8F8CIFWp5A2kXqERZVnJprRcyIAfwixe1nxJWhXS5jYthSbFAm7vLDdUrGLMIIhvxrpaYCVf-NNABiD04_wKMn2J0ybSirPpCmxCDjyEQG8NAD1Dy2No8iBDY/s1600/1.jpg)
Teknologi ini
memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang
diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal
digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu
perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital
dengan cara mengubah gelombang suara menjadi sekumpulan angka yang
kemudian disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan
kata-kata tersebut. Hasil dari identifikasi kata yang diucapkan dapat
ditampilkan dalam bentuk tulisan atau dapat dibaca oleh perangkat teknologi
sebagai sebuah komando untuk melakukan suatu pekerjaan, misalnya penekanan
tombol pada telepon genggam yang dilakukan secara otomatis dengan
komando suara.
Alat pengenal ucapan,
yang sering disebut dengan speech recognizer, membutuhkan sampel
kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi,
disimpan dalam komputer, dan kemudian digunakan sebagai basis data dalam
mencocokkan kata yang diucapkan selanjutnya.
Pengenalan ucapan dalam
perkembangan teknologinya merupakan bagian dari pengenalan suara (proses
identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi
menjadi dua, yaitu pengenalan pembicara (identifikasi suara berdasarkan orang
yang berbicara) dan pengenalan ucapan (identifikasi suara berdasarkan kata yang
diucapkan).
Jenis-jenis pengenalan
ucapan
Berdasarkan kemampuan
dalam mengenal kata yang diucapkan, terdapat 5 jenis pengenalan kata, yaitu:
- Kata-kata yang terisolasi
Proses pengidentifikasian
kata yang hanya dapat mengenal kata yang diucapkan jika kata tersebut memiliki
jeda waktu pengucapan antar kata.
- Kata-kata yang berhubungan
Proses pengidentifikasian
kata yang mirip dengan kata-kata terisolasi, namun membutuhkan jeda waktu
pengucapan antar kata yang lebih singkat.
- Kata-kata yang berkelanjutan
Proses pengidentifikasian
kata yang sudah lebih maju karena dapat mengenal kata-kata yang diucapkan
secara berkesinambungan dengan jeda waktu yang sangat sedikit, sehingga
pengguna perangkat ini dapat mengucapkan kata-kata secara natural.
Proses pengidentifikasian
kata yang dapat mengenal kata/kalimat yang diucapkan secara spontan.
- Verifikasi atau identifikasi suara
Proses pengidentifikasian
kata yang tidak hanya mampu mengenal kata, namun juga mengidentifikasi siapa
yang berbicara.
Perangkat keras yang
dibutuhkan
1. Sound
Card
2. Microphone
3. Computer/processor
Proses kerja alat
pengenalan ucapan
Alat pengenal ucapan
memiliki enam tahapan dalam prosesnya, yaitu:
1. Tahap penerimaan
masukan: Masukan berupa kata-kata yang diucapkan lewat
mikrofon.
2. Tahap Pre-filtering: pre-emphasis,
normalization, banding, dsb.
3. Framing
and Windowing: Merubah data ke format yang dapat
diproses, yaitu dari gelombang kontinuspektrum suara ke dalam bentuk
diskrit.
4. Filtering: memfilter
sinyal masukan dari setiap window/ frame/ frequency band
5. Comparison and
Matching : Proses ini dilakukan berdasarkan
metode Model Markov Tersembunyi atau Hidden Markov Model (HMM). Setiap elemen dari data
yang terurut dikonversi ke dalam bentuk bilangan biner. Data biner tersebut
nantinya akan dibandingkan dengan pola data suara dan kemudian diterjemahkan
sebagai keluaran yang dapat berbentuk tulisan ataupun perintah pada perangkat.
6. Action: Alat
pengenal ucapan yang sudah memiliki sistem verifikasi/identifikasi suara akan
menerjemahkan suara tersebut menjadi tulisan atau komando.
Tahapan ekstraksi
pengenalan ucapan berdasarkan Hidden Markov Model (HMM) :
a. Tahap
ekstraksi tampilan: Penyaringan sinyal suara dan pengubahan sinyal suara
analog ke digital
b. Tahap
pemodelan: Pembuatan suatu model HMM dari data-data yang berupa sampel
ucapan sebuah kata yang sudah berupa data digital
c. Tahap sistem
pengenalan HMM: Penemuan parameter-parameter yang dapat merepresentasikan
sinyal suara untuk analisis lebih lanjut.
d. Tahap
pembandingan: Tahap ini merupakan tahap pencocokan data baru dengan data
suara (pencocokan tata bahasa) pada pola. Tahap ini dimulai dengan proses
konversi sinyal suara digital hasil dari proses ekstraksi ke dalam bentuk spektrum
suara yang akan dianalisa dengan membandingkannya dengan pola suara pada
basis data.
Aplikasi alat pengenalan
ucapan
a. Perintah Suara
Perintah Suara adalah
suatu program pada komputer yang melakukan perintah berdasarkan komando suara
dari pengguna. Contohnya pada aplikasi Microsoft Voice yang berbasis bahasa
Inggris. Atau yang terbaru ada Cortana milik Microsoft yang lebih advance, seperti
asisten yang membantu kita melakukan tugas apapun hanya dengan berbicara, dan
juga Google Voice milik Google dan Siri milik Apple,yang memiliki fungsi yang
sama.
b. Pendiktean
Pendiktean adalah sebuah proses mendikte yang sekarang ini banyak dimanfaatkan
dalam pembuatan laporan atau penelitian. Contohnya pada aplikasi Microsoft
Dictation yang merupakan aplikasi yang dapat menuliskan apa yang diucapkan oleh
pengguna secara otomatis.
c. Telepon
Pada telepon, teknologi pengenal ucapan digunakan pada proses penekanan tombol
otomatis yang dapat menelpon nomor tujuan dengan komando suara.
Alat pengenal ucapan
banyak digunakan dalam bidang kesehatan untuk membantu para penyandang cacat
dalam beraktivitas. Contohnya pada aplikasi Antarmuka Suara Pengguna atau Voice
User Interface (VUI) yang menggunakan teknologi pengenal ucapan.
a. Pelatihan
Penerbangan
Aplikasi alat pengenal
ucapan dalam bidang militer adalah pada pengatur lalu-lintas udaraatau
yang dikenal dengan Air Traffic Controllers (ATC) yang dipakai
oleh para pilot untuk mendapatkan keterangan mengenai keadaan lalu-lintas udara
seperti radar, cuaca, dan navigasi. Alat pengenal ucapan digunakan sebagai
pengganti operator yang memberikan informasi kepada pilot.
b. Helikopter
Aplikasi alat pengenal ucapan pada helikopter digunakan untuk berkomunikasi
lewat radio dan menyesuaikan sistem navigasi.
Kelebihan dan kekurangan
Kelebihan:
- Cepat: Teknologi
ini mempercepat transmisi informasi dan umpan balik dari transmisi tersebut.
- Mudah digunakan: Perintah suara dapat dilakukan tanpa perangkat
keras.
Kekurangan:
- Rawan
terhadap gangguan: Karena proses ini masih berbasis frekuensi, sulit untuk
memisahkan gangguan/noise dari sinyal suara
- Jumlah kata
yang dapat dikenal terbatas: Hal ini disebabkan pengenal ucapan bekerja
dengan cara mencari kemiripan dengan basis data yang dimiliki.
Sumber :