Les Formats

Le matériel, les logiciels et la littérature liés à l’ambisonie font souvent références aux formats A, B ou encore C. Au début de l’ambisonie, sous l’influence notable de Gerzon [Gerzon, 1974][Gerzon, 1975], il parut nécessaire d’établir des normes autour des techniques ambisoniques pour répondre, en autre, à des contraintes commerciales et matérielles. Sans revenir sur les causes, l’ambisonie n’a pas eu le succès escompté sur un plan commercial, mais a eu un fort impact sur le plan de la recherche notamment publique et universitaire (Université de York, Université des arts de Zurich, Université Queen Mary, IRCAM, Université Paris 8). Les formats liés aux normes ont donc perduré car loin d’être basés sur de simples contraintes commerciales, elles offrent de fortes optimisations logicielles en prédéterminant l’ordre ambisonique et les configurations du système de restitution. Bien que toujours utilisées [Wakefield, 2006][Neukom, 2009b], aujourd’hui, ces optimisations ne sont plus nécessaires et les formats peuvent restreindre les recherches; cependant il paraît nécessaire de revenir sur les principaux formats afin d’offrir une certaine compatibilité et pérennité aux différents projets liés à l’ambisonie.

Le format B et les conventions d’encodage

Le format B (ou B-format), apparu au cours des années 70, est la norme originale établie pour l’encodage de champs sonores au format ambisonique. Il repose sur une décomposition en harmoniques sphériques d’ordre 1. Pour un signal S, les harmoniques sphériques sont définies tels que présenté dans le Tableau 1.

hoa3-1

Tableau 1 : Normes du format B.

Aujourd’hui, le format B est augmenté jusqu’à l’ordre 3 (pour un tableau récapitulatif des normes jusqu’à l’ordre 3, se référer à Neukom [Neukom, 2009b] et Daniel [Daniel, 2001]). Bien que cette norme possède de nombreux atouts liés à l’optimisation informatique, le format B atteint ses limites. Il existe de nombreuses conventions d’encodage plus ou moins liées au format B tels que Semi-Normalisation, Normalisation, Max-Normalisation et Furse-Malham set [Daniel, 2001][Malham, 2003]. Elles permettent de simplifier l’écriture de l’encodage, de faciliter le décodage en fonction de l’ordre ambisonique et du nombre de dimensions. Ces normes possèdent en général leurs propres normalisations et peuvent limiter l’ordre donc le nombre d’harmoniques sphériques. Pour de plus amples informations se référer à Daniel [Daniel, 2001].

Le Format A et le microphone soundfield

Le format A a été développé afin de pouvoir enregistrer des champs sonores 3D. Il est difficile d’enregistrer directement les composantes W, X, Y, Z d’un champ sonore à l’aide de microphones omnidirectionnels et en figure de 8. Grâce à un microphone SoundField, composé d’une série de capteurs cardioïdes placé sur les faces d’un tétraèdre, nous obtenons les quatre canaux LF, LB, RL, RB qui définissent le format A. Cette approche revient à discrétiser la sphère et permet par la suite de recomposer les canaux ambisoniques au format B [Craven, 1977] d’après les relations présentées dans le Tableau 2.

hoa3-2

Tableau 2 : Relations entre le format A et le format B.

Restreint à l’ordre 1, le format A peut être envisagé aux ordres supérieurs, pour de plus amples informations se référer à Colafrancesco [Colafrancesco, 2012]. Cette norme peut être transposée en deux dimensions en décomposant un cercle en trois points ou plus (Figure 1), elle permet d’éviter l’utilisation d’un microphone ambisonique, notamment pour l’enregistrement de réponses impulsionnelles « surround » et offre de nouvelles possibilités musicales.

hoa3-3

Figure 1 : Représentation des figures directives des trois microphones qui discrétisent un cercle en trois points.

Le format c et les systèmes standardisés

Le format C, souvent appelé UHJ, comprend une série de normes qui permettent de rendre compatible l’ambisonie pour des systèmes de restitution standardisés et plus rependus dans le commerce tels que la stéréo, le 5.1 et le 7.1 et des outils de stockages tels que le CD ou le DVD. Les canaux perdent immanquablement une partie de l’information liée aux champs sonores et la restitution subit une perte de qualité sur de nombreux aspects. Ces opérations relèvent souvent de « fine-tuning » et fonctionnent donc pour des ordres et des systèmes de restitution prédéterminés. Bien qu’envisageable, aucune généralisation de ces processus n’a encore été établie. Pour plus d’informations, se réferrer à Gerzon, Daniel, [Gerzon, 1975][Daniel, 2006]. Afin de répondre aux même types de contraintes sont apparus d’autres formats tel que la SuperStereo et le format G [1].

Références pour citer cet article :

“Documentation de la bibliothèque Hoa : Les formats”, Auteur : Pierre Guillot, Année : 2012­ – 2013, © Pierre Guillot, CICM,­ Université Paris 8, Labex Arts H2H.