Perangkat Lunak

Keadaan Pengenalan Suara Linux

Pengarang: Monica Porter
Tanggal Pembuatan: 14 Berbaris 2021
Tanggal Pembaruan: 13 Juni 2024
Anonim
The mind behind Linux | Linus Torvalds
Video: The mind behind Linux | Linus Torvalds

Isi

Teknologi transkripsi lebih baik daripada perintah suara

Pengenalan ucapan di Linux mengikuti platform Windows dan Mac karena Microsoft dan Apple telah menginvestasikan waktu dan biaya yang cukup besar untuk menambahkan perangkat lunak perintah suara atau asisten suara ke dalam sistem operasi inti mereka.

Meskipun situasinya tidak suram untuk Linux, seperti halnya dengan banyak teknologi mutakhir, alam semesta bebas dan open-source tetap selangkah di belakang, terutama dengan alat perintah suara.

Pengenalan Pidato Linux Asli

Tidak ada distribusi Linux yang berfokus pada pengenalan suara. Namun, aplikasi yang mendukung kemampuan pengenalan suara bergantung pada beberapa perpustakaan open-source termasuk Sphinx, Kaldi, Julius, dan Mozilla Deepspeech.


Pustaka-pustaka ini mengandalkan corpus ucapan untuk menawarkan variasi suara untuk melatih AI dan oleh karena itu menerjemahkan pidato dengan benar ke teks. Namun, proyek open-source kurang canggih (karena mereka menikmati kontribusi yang lebih kecil untuk melatih AI), yang berarti bahwa sebagian besar aplikasi text-to-speech untuk Linux sering merusak konversi. Biasanya, mereka merusaknya secara menyeluruh sehingga tidak jelas apa pidato aslinya.

Opsi untuk Pidato Linux ke Teks

Gunakan salah satu dari lima jalur solusi.

  • Andalkan aplikasi-aplikasi Linux asli yang tersedia di repositori distribusi Anda — jika ada.
  • Amazon membuat Alexa tersedia untuk Linux, termasuk untuk Raspberry Pi. Anda harus melakukan banyak penyesuaian kustom untuk membuat pengaturan ini berfungsi, tetapi itu akan berhasil.
  • Akses Google Speech API di browser Anda melalui DictationIO. Layanan ini hanya berfungsi untuk dikte; Anda tidak dapat menggunakannya untuk perintah suara. Ini didukung oleh AI Google sehingga kualitasnya baik.


  • Gunakan layanan seperti Alexa atau Google Assistant sebagai utilitas perintah suara untuk Linux melalui layanan Triggercmd. Triggercmd berjalan di komputer Anda; gunakan itu untuk memanggil Alexa atau Google Assistant dan minta alat itu mengeksekusi skrip Bash spesifik berdasarkan perintah Anda. Katakan sesuatu seperti, "OK Google, minta perintah pemicu untuk membuka kalkulator." Google Assistant berfungsi sebagai perantara dengan Triggercmd untuk menjalankan skrip Bash yang ditentukan oleh frasa "buka kalkulator."
  • Gunakan Wine atau mesin virtual dengan perangkat lunak untuk Windows seperti Dragon NaturallySpeaking. Dengan penyesuaian yang tepat, Anda dapat menggunakan mesin Dragon untuk transkripsi, meskipun solusi ini tidak berfungsi untuk aplikasi perintah suara.

Direkomendasikan

Pilihan Editor

Apakah UMADBRO Sama Seperti Anda Gila dan Gila?
Internet

Apakah UMADBRO Sama Seperti Anda Gila dan Gila?

'U mad bro', adalah ekprei internet yang patut diperhatikan karena ecara beramaan meme, bentuk trolling, dan bentuk nyala ekaligu. eiring dengan varian umum 'u mad', 'you mad'...
Haruskah Anda Menggunakan iPhone SE untuk Permainan?
Tehnologies

Haruskah Anda Menggunakan iPhone SE untuk Permainan?

etelah peluncuran iPhone 6 pada eptember 2014, tampak cukup jela bahwa Apple bermakud untuk condong ke arah ukuran handet yang lebih bear untuk iterai di maa depan. IPhone 6, dirili etahun kemudian d...