Stable Audio Open : un modèle open source pour générer des échantillons audio

Par:

fredericmazue

ven, 07/06/2024 - 13:17

La société Stability AI a présenté Stable Audio Open, un modèle open source optimisé pour générer de courts échantillons audio, des effets sonores et des éléments de production à l'aide d'invites textuelles.

Stability AI explique que Stable Audio Open permet à quiconque de générer jusqu'à 47 secondes de données audio de haute qualité à partir d'une simple invite de texte. Sa formation spécialisée le rend idéal pour créer des rythmes de batterie, des riffs d'instruments, des sons ambiants, des enregistrements de bruitage et d'autres échantillons audio pour la production musicale et la conception sonore.

Toujours selon Stability Ai, l'un des principaux avantages de cette version open source est que les utilisateurs peuvent affiner le modèle sur leurs propres données audio personnalisées. Par exemple, un batteur pourrait affiner des échantillons de ses propres enregistrements de batterie pour générer de nouveaux rythmes.

Stable Audio Open se différencie du modèle commercial de la société Stable Audio qui produit des pistes complètes avec une structure musicale cohérente d'une durée maximale de trois minutes, ainsi que des fonctionnalités avancées telles que la génération audio-audio et des compositions musicales cohérentes en plusieurs parties.

Stable Audio Open, quant à lui, est spécialisé dans les échantillons audio, les effets sonores et les éléments de production. Bien qu'il puisse générer de courts clips musicaux, il n'est pas optimisé pour les chansons, mélodies ou voix complètes.

Les modèles Stable Audio Open sont disponibles sur Hugging Face.

Ajouter un commentaire