6 - Segmentation automatique de la parole : pourquoi? Quels segments?

Show full item record

Files in this item

PDF 006.PDF TEXTE.pdf 1.226Mb

Pour citer ce document :
URI: http://hdl.handle.net/2042/1732
Title: 6 - Segmentation automatique de la parole : pourquoi? Quels segments?
Author: ROSSI (M.)
Abstract: Nous présentons et discutons le modèle SAPHO (segmentation par les connaissances acoustico-phonétiques) mis en ouvre en langage AWK sous UNIX, sur une station de travail Masscomp . Ce système est conçu comme une procédure de segmentation indépendante du locuteur fondée sur une reconnaissance préalable du mode d'articulation phonétique . Dans la plupart des modèles RAP, les connaissances phonétiques sont toujours utilisées, au moins de façon implicite . Elles doivent l'être de façon explicite. Les unités phonémiques ne peuvent pas être directement construites à partir du signal acoustique ; elles ne sont pas encore disponibles à la sortie de SAPHO . Suivant le modèle de Construction de Niveaux (Level Building), SAPHO fournit un ensemble hiérarchisé de propriétés et de segments acoustiques, de propriétés et de segments phonétiques congruents avec les unités phonétiques et leur structure interne . La souplesse de ce système est assurée par sa modularité . La fiabilité de SAPHO est corroborée par l'exactitude des résultats .
Description: I present and discuss the SAPHO (Segmentation by Acoustico-Phonetic knowledge) model implemented in Awk language under the Unix system on a MASSCOMP computer. The system is devised as a speaker independent ASS (automatic speech segmentation), by a previous recognition of the phonetic articulation manner. In ail the ASR systems the phonetic knowledge is at least implicitely used . Il has to be explicitely referred to . The phonemic units cannot be directly built from the acoustic signal and are not available at the output of SAPHO . According to the Level Building procedure SAPHO supplies a hierarchized set of acoustic properties and segments, and phonetic properties and segments which fit the phonetic parsing of the acoustic wave . The amenability of this system is entailed by ils modularity which allows a possible further architecture as distributed tasks.The processors are concieved either as data driven with numeric computalion or as expectation driven activities with symbolic computation . The recursivity in the acoustic and the phonetic supervisors at each step of the parsing ensures the likelihood of the décisions . The suitability and the reliability of SAPHO are corroborated by the accuracy of the results .
Subject: Reconnaissance parole; Acoustique; Segmentation; Connaissance; Phonétique; Articulation parole
Publisher: GRETSI, Saint Martin d'Hères, France
Date: 1990

This item appears in the following Collection(s)

Show full item record





Advanced Search