Spraakherkenning via Python
Zoals eerder vermeld, draait Whisper als een Python script. Al vrij snel na de lancering van Whisper is er een C++ versie gemaakt die ook vrij gebruikt kan worden, maar die laten we hier buiten beschouwing. Voor informatie hierover, zie de Github pagina.
Installeren van OpenAI Whisper
Op de Github repository van OpenAI staat het redelijk goed beschreven. Wat je moet doen, is het volgende:
- Installer eerst Python (3.7 tot 3.10)
- Installeer vervolgens FFMPEG
- Installeer tenslotte PyTorch 1.10.1
Als dat allemaal gelukt is, installeer je tenslotte Whisper via:
pip install git+https://github.com/openai/whisper.git
Video's
Een duidelijke video van de installatie onder Windows van Whisper is de video van Kevin Stratvert. Die laat goed zien hoe je Whisper op je Windows machine installeert.
Daarna een video van Felipe Baez waarin hij laat zien hoe je Whisper installeert op een moderne Apple machine.
Hardwarevereisten
Zoals we hierboven zagen, is Whisper vrij eenvoudig te installeren. Het vereist echter redelijk geavanceerde hardware en onder Windows wordt een GPU sterk aanbevolen. Moderne Apple M-computers hebben de GPU al ingebouwd.
Draaien van Whisper
Als Whisper eenmaal geïnstalleerd is, kun je het als volgt draaien.
Windows
Open een DOS of PowerShell scherm. Dat doe je door op Startmenu te klikken en dan PowerShell in te typen. Klik vervolgens met de rechtermuisknop op het resultaat en kies Als administrator uitvoeren.
