![The mind behind Linux | Linus Torvalds](https://i.ytimg.com/vi/o8NPllzkFhE/hqdefault.jpg)
Isi
- Teknologi transkripsi lebih baik daripada perintah suara
- Pengenalan Pidato Linux Asli
- Opsi untuk Pidato Linux ke Teks
Teknologi transkripsi lebih baik daripada perintah suara
Pengenalan ucapan di Linux mengikuti platform Windows dan Mac karena Microsoft dan Apple telah menginvestasikan waktu dan biaya yang cukup besar untuk menambahkan perangkat lunak perintah suara atau asisten suara ke dalam sistem operasi inti mereka.
Meskipun situasinya tidak suram untuk Linux, seperti halnya dengan banyak teknologi mutakhir, alam semesta bebas dan open-source tetap selangkah di belakang, terutama dengan alat perintah suara.
Pengenalan Pidato Linux Asli
Tidak ada distribusi Linux yang berfokus pada pengenalan suara. Namun, aplikasi yang mendukung kemampuan pengenalan suara bergantung pada beberapa perpustakaan open-source termasuk Sphinx, Kaldi, Julius, dan Mozilla Deepspeech.
Pustaka-pustaka ini mengandalkan corpus ucapan untuk menawarkan variasi suara untuk melatih AI dan oleh karena itu menerjemahkan pidato dengan benar ke teks. Namun, proyek open-source kurang canggih (karena mereka menikmati kontribusi yang lebih kecil untuk melatih AI), yang berarti bahwa sebagian besar aplikasi text-to-speech untuk Linux sering merusak konversi. Biasanya, mereka merusaknya secara menyeluruh sehingga tidak jelas apa pidato aslinya.
Opsi untuk Pidato Linux ke Teks
Gunakan salah satu dari lima jalur solusi.
- Andalkan aplikasi-aplikasi Linux asli yang tersedia di repositori distribusi Anda — jika ada.
- Amazon membuat Alexa tersedia untuk Linux, termasuk untuk Raspberry Pi. Anda harus melakukan banyak penyesuaian kustom untuk membuat pengaturan ini berfungsi, tetapi itu akan berhasil.
- Akses Google Speech API di browser Anda melalui DictationIO. Layanan ini hanya berfungsi untuk dikte; Anda tidak dapat menggunakannya untuk perintah suara. Ini didukung oleh AI Google sehingga kualitasnya baik.
- Gunakan layanan seperti Alexa atau Google Assistant sebagai utilitas perintah suara untuk Linux melalui layanan Triggercmd. Triggercmd berjalan di komputer Anda; gunakan itu untuk memanggil Alexa atau Google Assistant dan minta alat itu mengeksekusi skrip Bash spesifik berdasarkan perintah Anda. Katakan sesuatu seperti, "OK Google, minta perintah pemicu untuk membuka kalkulator." Google Assistant berfungsi sebagai perantara dengan Triggercmd untuk menjalankan skrip Bash yang ditentukan oleh frasa "buka kalkulator."
- Gunakan Wine atau mesin virtual dengan perangkat lunak untuk Windows seperti Dragon NaturallySpeaking. Dengan penyesuaian yang tepat, Anda dapat menggunakan mesin Dragon untuk transkripsi, meskipun solusi ini tidak berfungsi untuk aplikasi perintah suara.