Spraakherkenning via Python
Zoals eerder vermeld, draait Whisper als een Python script. Al vrij snel na de lancering van Whisper is er een C++ versie gemaakt die ook vrij gebruikt kan worden, maar die laten we hier buiten beschouwing. Voor meer informatie hierover, zie de Github pagina.
Installeren van OpenAI's Whisper
Op de Github repository van OpenAI staat het allemaal redelijk goed beschreven. Wat je moet doen, is het volgende:
- Installer eerst Python (versie 3.7 t/m 3.10)
- Installeer vervolgens FFMPEG
- Installeer tenslotte PyTorch 1.10.1
Als dat allemaal gelukt is, installeer je tenslotte Whisper via:
pip install git+https://github.com/openai/whisper.git
Werkt dit, dan is het verstandig om ook WhisperX te installeren. Dat doe je via:
Video's
Een duidelijke video van de installatie onder Windows van Whisper is de Engelstalige video van Kevin Stratvert. Die laat goed zien hoe je Whisper op je Windows machine installeert.
Hardwarevereisten
Zoals we hierboven zagen, is Whisper vrij eenvoudig te installeren. Het vereist echter redelijk geavanceerde hardware en onder Windows wordt een GPU sterk aanbevolen. Met gebruik van zo'n GPU wordt de herkenning ong 10x sneller dan de duur van de AV-file terwijl zonder de GPU het juist 10x langzamer kan worden.
Draaien van Whisper
Als Whisper eenmaal geïnstalleerd is, kun je het als volgt draaien.
Windows
Open een DOS of PowerShell scherm. Dat doe je door op Startmenu te klikken en dan PowerShell in te typen. Klik vervolgens met de rechtermuisknop op het resultaat en kies Als administrator uitvoeren.
Meld je aan om deze inhoud te zien.
MacOS
Op een moderne Apple machine zit de GPU ingebouwd. Hoewel niet hetzelfde als de GPU-kaarten van NVIDIA, werkt de ASR ook hier erg goed mee. Voor het scherm kies je eenvoudig het programma Terminal.

Hier komt nog wat meer!!