Une technique de tatouage " haute-capacité " pour signaux musicaux au format CD-audio
Résumé
Le tatouage d'un signal (watermarking en anglais) consiste à insérer/cacher une information binaire dans un signal de façon imperceptible. Dans le cas audio qui nous intéresse, ce procédé doit être inaudible. Le tatouage a été initialement proposé et conçu au début des années 1990 pour des applications de protection des droits des œuvres numériques (DRM pour Digital Rights Management en anglais). Dans ce cas, l'effort s'est porté sur la robustesse du procédé vis-à-vis d'attaques potentielles visant à le neutraliser, au dépend du débit d'informations insérées (de l'ordre de la dizaine de bits/s pour l'audio). Depuis, le tatouage audio est utilisé pour d'autres applications, comme le transport de métadonnées liées au signal porteur. Cependant, les débits restent généralement assez faibles, et dans cette étude nous proposons une technique de tatouage audionumérique " haute-capacité " pour des signaux au format CD-audio. La technique proposée repose sur une quantification QIM (Quantization Index Modulation) des coefficients MDCT (Modified Discrete Cosine Transform) du signal avec prise en compte de contrainte perceptive par un modèle psycho-acoustique pour assurer l'inaudibilité du tatouage. Nos expérimentations montrent que cette technique peut atteindre des débits de l'ordre de 200kbits/s par canal (selon le type de signal audio porteur), au détriment de la robustesse : elle peut être utilisé dans des applications " non-sécuritaires " où on suppose que le signal ne va pas subir d'attaques intentionnelles (autres que la conversion au format CD-audio dont l'effet sur le débit est explicitement présenté dans l'étude). En l'occurrence, nous utilisons cette technique dans un système de séparation de source informée présenté dans ce même congrès.
Origine | Accord explicite pour ce dépôt |
---|
Loading...