En savoir plus
Une application musicale innovante
Google a récemment intégré un studio musical dans son application Gemini. Cette nouvelle fonctionnalité permet aux utilisateurs de créer des morceaux de musique de 30 secondes à la demande, transformant des idées simples en véritables chansons.
Intégration du modèle Lyria 3
Avec cette mise à jour, le modèle Lyria 3 de DeepMind est désormais directement intégré à Gemini, offrant la possibilité de transformer des textes ou des photos en musique personnalisée. Les paroles et l’AUDIO peuvent être générés de façon à rendre le résultat partageable.
De l’idée à la composition musicale
Les utilisateurs ont la possibilité de spécifier un genre, une ambiance, un souvenir ou même une blague. Basé sur ces indications, le système compose une chanson originale, accompagnée de chants ou d’une instrumentation. Les utilisateurs n’ont pas besoin de fournir des paroles, celles-ci étant automatiquement créées en fonction de leurs instructions.
En ajoutant des éléments multimedia, comme une photo ou une vidéo courte, l’application crée une bande sonore qui s’accorde avec le ton de la scène. De plus, il est possible de préciser des variables telles que le tempo ou le style vocal, offrant ainsi un contrôle accru sur le rendu final.
Partage instantané
Chaque morceau généré est accompagné d’une jaquette personnalisée, offrant une représentation visuelle qui s’harmonise avec l’audio. Les utilisateurs peuvent télécharger leurs créations directement ou les partager via un lien, rendant le processus rapide et pratique.
Le déploiement de cette fonctionnalité commence sur desktop et sera disponible sur mobile dans les prochains jours. Les utilisateurs âgés de 18 ans et plus, dans des langues prises en charge, pourront y accéder. Les abonnés à Google AI Plus, Pro et Ultra bénéficieront de limites de génération plus élevées.
Une portée mondiale
Actuellement disponible aux États-Unis, cette fonctionnalité est en train de s’étendre à d’autres pays, permettant ainsi à un plus grand nombre de créateurs d’explorer la génération musicale au-delà de l’application Gemini, notamment dans les outils de création de YouTube.
Détection d’audio généré par IA
Tous les morceaux créés dans l’application incluent SynthID, la technologie de watermarking de Google, qui permet d’identifier le contenu généré par IA. Ce marquage est intégré directement dans l’audio au moment de sa création, garantissant qu’il puisse être détecté ultérieurement sans impacter la qualité sonore.
Lien entre Gemini et Shorts
Le modèle Lyria 3 alimente également la fonctionnalité Dream Track de YouTube, permettant aux créateurs de produire des bandes sonores personnalisées pour les Shorts. Cette amélioration permet d’augmenter la qualité audio tout en offrant des couplets lyriques ou un accompagnement instrumental plus adapté aux vidéos courtes. Grâce à l’IA de Google, le système vérifie également la présence de SynthID tout en effectuant sa propre analyse avant de fournir un résultat.
Créativité sans imitation
La génération musicale vise à créer des œuvres originales et non à reproduire celles d’autres artistes. Lorsque le système est commandé à l’aide du nom d’un artiste spécifique, il se base sur des indices stylistiques larges au lieu de copier une voix ou un catalogue.
Google a précisé que le modèle Lyria 3 a été développé dans le respect des enjeux de droits d’auteur et d’accords avec ses partenaires, incluant des filtres pour vérifier les résultats par rapport à ceux existants. Les utilisateurs peuvent signaler d’éventuelles violations des droits, et cette fonctionnalité est régie par les Conditions de Service et les politiques d’IA générative de l’entreprise.
Note : Certaines institutions ne s’engagent pas dans l’adoption de l’IA intégrée, à l’exemple du Parlement européen qui oeuvre à sa restriction sur le matériel utilisé par le personnel.
FAQ
Quelles langues sont prises en charge ?
L’application Gemini prend en charge plusieurs langues, mais l’accès peut varier selon les pays.
Est-ce que je peux utiliser Gemini sur mobile ?
Oui, l’application sera bientôt disponible sur mobile après son lancement initial sur desktop.
Comment fonctionne la détection d’audio généré par IA ?
La détection se fait grâce à SynthID, un système d’authentification qui marque le contenu à sa création, permettant une identification sans affecter le son.
Quels sont les abonnements nécessaires pour bénéficier de limites de génération plus élevées ?
Les abonnés aux niveaux Google AI Plus, Pro et Ultra auront accès à des limites de génération définies.
Quelles mesures sont prises pour respecter les droits d’auteur ?
Le système inclut des filtres et des mécanismes de signalement pour garantir que les créations respectent les droits d’auteur des œuvres existantes.
