post-doctorant compression de l'audio immersif pour les services conversationnels- f/h- 12 mois
Detail de l'annonce :
Votre rôle est d’effectuer un travail de recherche sur les
méthodes avancées de compression de l’audio immersif pour les
applications conversationnelles (par exemple des appels sur
téléphones 5G équipés de multiples microphones ou des lunettes de
réalité augmentée).
L’audio immersif englobe plusieurs types de format audio ayant
différents degrés de spatialisation et d’interactivité, tels que:
* stéréo et multicanal (ex : 5.1, 7.1.4)
* binaural
* ambisonique
* objets audio (avec métadonnées décrivant en particulier la
spatialisation)
La compression de l’audio immersif est un domaine de recherche qui a
été largement étudié et l’état de l’art pour les applications
non conversationnelles (streaming, stockage...) est représenté par
les codecs MPEG-H 3D Audio, Dolby Atmos ou DTS-UHD ou dans une moindre
mesure Opus.
Il existe actuellement des travaux en normalisation (MPEG, 3GPP) qui
conduisent à étudier de nouvelles problématiques de recherche et
visent à définir des nouveaux standards :
* MPEG-I Audio, où l’on cherche à représenter et reproduire des
scènes audio 3D, tout en autorisant une navigation dans la scène
selon 6 degrés de liberté (6DoF).
* 3GPP IVAS (Immersive Voice and Audio Services), où l’objectif
est de définir un codec pour l’audio immersif adapté aux
contraintes des applications conversationnelles sur mobile
Le sujet du postdoc s’inscrit en particulier sur ce dernier axe.
ABOUT YOU
Doctorant-e en capacité d'effectuer un travail de recherche sur les
méthodes avancées de compression de l’audio immersif pour les
applications conversationnelles (par exemple des appels sur
téléphones 5G équipés de multiples microphones ou des lunettes de
réalité augmentée).
La compression de l’audio immersif est un domaine de recherche qui a
été largement étudié et l’état de l’art pour les applications
non conversationnelles (streaming, stockage...) est représenté par
les codecs MPEG-H 3D Audio, Dolby Atmos ou DTS-UHD ou dans une moindre
mesure Opus.
Il existe actuellement des travaux en normalisation (MPEG, 3GPP) qui
conduisent à étudier de nouvelles problématiques de recherche et
visent à définir des nouveaux standards :
* MPEG-I Audio, où l’on cherche à représenter et reproduire des
scènes audio 3D, tout en autorisant une navigation dans la scène
selon 6 degrés de liberté (6DoF).
* 3GPP IVAS (Immersive Voice and Audio Services), où l’objectif
est de définir un codec pour l’audio immersif adapté aux
contraintes des applications conversationnelles sur mobile
Le sujet du postdoc s’inscrit en particulier sur ce dernier axe.
ADDITIONAL INFORMATION
L’objectif scientifique du postdoc est de concevoir et développer
de nouvelles méthodes de compression audio 3D, en particulier pour
les contenus de type ambisonique, afin d’obtenir la meilleure
qualité possible à bas débit (avec des contraintes sur la
complexité, le retard).
Les travaux du postdoc proposé viendront renforcer l’activité de
recherche d’Orange, en particulier sur la problématique de la
compression de signaux au format ambisonique avec des contributions
sur la décorrélation des signaux ambisoniques ou le codage
d’images sonores spatiales. Il s’agira en particulier de définir
des méthodes de compression innovantes selon des approches
paramétriques
Ils seront articulés selon l’approche méthodologique suivante :
Etude des travaux réalisés et en cours à Orange et revue de
l’état de l’art, pré-expérimentations (T0->T0+1 mois)
Conception de méthodes de compression audio avec développement
Python/C (T0+1->T0+10 mois)
Evaluation des méthodes développées et comparaison avec l’état
de l’art (tests subjectifs validant la qualité et estimation de
complexité) (T0+4->T0+12 mois)
Documentation, publications (selon l’avancement)
DEPARTMENT
Au sein de la direction Home Services d'Orange Innovation IT-S,
'équipe Content Video & Audio (CVA), développe une expertise dans
l'étude et la mise en œuvre de formats audio et vidéo immersifs
innovants, en particulier pour la réalité virtuelle ou augmentée.
Pour la partie audio, l’équipe conduit des travaux de recherche sur
les algorithmes de traitement audio, tels que les codecs voix/audio,
les algorithmes d'amélioration de qualité vocale (annulation
d'écho, séparation de sources...), le son 3D (conception de
microphones ambisoniques, localisation et tracking de sources
audio…) et leur intégration dans des services innovants. Elle
contribue également à la normalisation des technologies et services.
CONTRACT
Temporary