Voice Recognition
Speech recognizer pertama kali muncul di tahun 1952 dan terdiri dari device untuk pengenalan satu digit yang diucapkan. Kemudian pada tahun 1964, muncul IBM Shoebox. Salah satu teknologi yang cukup terkenal di Amerika dalam bidang kesehatan adalah Medical Transcriptionist (MT) merupakan aplikasi komersial yang menggunakan speech recognizer. Dan sampai sekarang banyak aplikasi yang dikembangkan menggunakan speech recognizer, antara lain di bidang kesehatan terdapat MT, di bidang militer terdapat High-performance fighter aircraft, Speech recognizer pertama kali muncul di tahun 1952 dan terdiri dari device untuk pengenalan satu digit yang diucapkan. Kemudian pada tahun 1964, muncul IBM Shoebox.
Salah satu teknologi yang cukup terkenal di Amerika dalam bidang kesehatan adalah Medical Transcriptionist (MT) merupakan aplikasi komersial yang menggunakan speech recognizer. Dan sampai sekarang banyak aplikasi yang dikembangkan menggunakan speech recognizer, antara lain di bidang kesehatan terdapat MT, di bidang militer terdapat High-performance fighter aircraft,Training air traffic controllers, sampai pada alat yang membantu orang-orang yang memiliki kesulitan dalam menggunakan tangan, maka diciptakannya komputer yang dapat dioperasikan menggunakan deteksi pengucapan user.
Sebenarnya ada dua pemodelan dasar untuk speech recognition ini yaitu Hidden Markov model (HMM)-based speech recognition dan Dynamic time warping (DTW)- based speech recognition.
Modern general-purpose speech recognition system umumnya menggunakan model Hidden Markov. Model ini merupakan model yang statistikal dimana output adalah sekuens dari simbol atau kuantitas. Satu alasan yang mengapa model Hidden Markov digunakan, karena sebuah sinyal dari pengucapan bisa dilihat seperti piecewise stationary signal atau short-time stationary signal. Alasan lainnya mengapa metode ini populer, sederhana dan secara komputasional bisa digunakan.
Dynamic time warping adalah pendekatan yang pernah sejarahnya digunakan untuk speech recognition yang sekarang sudah digantikan oleh model Hidden Markov. Pada pengembangannya maka alat speech recognizer diimplementasikan menggunakan Dynamic Time Wraping Algorithm (DTW). DTW pertama kali dikenalkan pada tahun 60an dan dieksplorasi sampai tahun 70an yang menghasilkan alat speech recognizer. DTW sering digunakan dalam area: handwriting and online signature matching, sign language recognition and gestures recognition, data mining and time series clustering, computer vision and computer animation, surveillance, protein sequence alignment and chemical engineering, dan music and signal processing.
Currently have 0 komentar: