Woordenlijst
Hier staat een (niet volledige) lijst met gebruikte termen en hun betekenis. Het staat iedereen vrij om mij woorden toe te sturen waarvan de betekenis toegevoegd kan worden.
Woord |
Verklaring |
---|---|
POS-tagging |
Part of Speech tagging. |
Syntactische-tagging | ?? |
Diarizatie | Diarizatie kan het best vertaald worden in spreker-onderscheiding. Vaak wordt sprekerherkenning gebruikt maar dat is feitelijk onjuist. Bij Diarizatie wordt geen spreker herkend, maar wordt aangegeven welke spreker er op dat moment aan het woord is. Stel je hebt een opname met drie verschillende sprekers dan probeert de software zo goed mogelijk aan te geven welk van de drie sprekers (SPEAKER_0, SPEAKER_1 of SPEAKER_2) er op een bepaald moment spreekt. |
Sprekerherkenning | Bij sprekerherkenning moet je eerst de verschillende sprekers in de database hebben staan en vervolgens probeert de software om te bepalen wanneer welk van die bekende sprekers er op een bepaald moment spreekt. Dat is dus een stuk lastiger dan Diarzatie! |
Orthografische transcriptie |
Transcriptie waarbij het resultaat in "gewone" letters staat. |
Fonetische |
Transcriptie waarbij het resultaat in "fonetisch schrift" staat. Meestal is dit IPA of XSAMPA |
ASR | Automatic Speech Recognition of wel Automatische Spraakherkenning is het proces waarbij software de gesproken spraak zo goed mogelijk probeert om te zetten in een geschreven versie daarvan. Het is dus van handig dat je bij het omzetten weet in welke taal er wordt gesproken hoewel veel moderne spraakherkenners dit ook goed zelf kunnen bepalen. |
Metadata | Data van of over een hoeveelheid data. Het zijn gegevens die de karakteristieken van "informatieobjecten" beschrijven. Voorbeelden van karakteristieken zijn bijvoorbeeld de naam, het moment van creatie, de gebruikte taal en het bestandsformaat. Metadata beschrijven niet alleen de informatieobjecten zelf, maar ook de context waarbinnen de informatieobjecten zijn ontstaan of ontvangen. En soms ook wat er vanaf het moment van ontstaan of ontvangst met die informatieobjecten is gebeurd. |