Tendances émergentes dans le secteur du DAM

16 octobre

2024

Rédigé par

Ralph Windsor

Durée

x

min

Tendances émergentes dans le secteur du DAM
LIENS RAPIDES
Mode sombre
Mode sombre
Passer en mode lumière
Passer en mode sombre

Alors que le nombre de sources en amont et de canaux en aval pour les ressources numériques atteint un niveau record, l'idée que les systèmes de gestion des actifs numériques (Digital Asset Management, DAM) détiennent la source unique de vérité devient un concept de plus en plus complexe à gérer, tant pour les utilisateurs que pour les fournisseurs de DAM.

Pour que le DAM puisse garder le contrôle sur un éventail toujours plus large d'actifs numériques, son rôle de référentiel centralisé, à partir duquel tout le contenu circule, doit évoluer en conséquence. Il est désormais presque universellement admis que les systèmes de DAM ne sont pas de simples entrepôts numériques. Depuis peu, les fournisseurs de DAM se montrent plus disposés à assurer l'interopérabilité entre des systèmes autrefois isolés et à intégrer une nouvelle vague de technologies émergentes dans leurs plateformes.

L'IA arrive à maturité

L'introduction de l'intelligence artificielle constitue l'une des avancées potentielles les plus significatives dans le domaine de la gestion des actifs numériques. Le niveau d'innovation et la vitesse à laquelle la technologie progresse sont réellement impressionnants. Parallèlement, la mise en œuvre de l'IA dans les flux de travail de base des DAM reste assez basique et superficielle. De nombreux fournisseurs désireux de profiter de la manne de l'IA se sont empressés d'intégrer le taggage automatique, mais les résultats ont été décevants et très peu de systèmes de DAM ont dépassé les offres intégrant l'IA les plus basiques.

Toutefois, à mesure que la technologie progresse, un certain nombre de fonctionnalités améliorées du DAM assistées par l'IA commencent à apparaître.

Taggage automatique par reconnaissance d'objets, de scènes et de visages

Les systèmes de taggage alimentés par l'IA utilisent la compréhension du contexte pour améliorer la précision des tags. Par exemple, le fait de comprendre qu'une photo de "plage" comprend souvent des mots tels que "sable", "eau" et "soleil" peut aider l'IA à générer des tags plus complets et plus pertinents.

Les modèles d'apprentissage profond (Deep Learning), entraînés à partir de vastes ensembles de données d'images et de vidéos étiquetées, peuvent reconnaître tout un ensemble d'objets, de scènes et d'activités. Lorsqu'une ressource est traitée, le modèle identifie et taggue les composants qu'il contient.

La question des métadonnées spécifiques à un sujet (qui est le pilier de la plupart des mises en application commerciales) continue d'être traitée de manière non optimale, mais des progrès graduels sont réalisés. De plus, grâce à un entraînement contextuel approprié, à l'accès aux métadonnées tout au long de la chaîne d'approvisionnement des ressources numériques et à la mise en place de stratégies efficaces de gestion des métadonnées par les utilisateurs de DAM, ce problème de longue date pourrait bien commencer à être enfin résolu.

Recherche visuelle

Grâce à l'IA générative, la recherche visuelle permet aux utilisateurs de découvrir des ressources en se basant sur des éléments visuels plutôt que sur des métadonnées textuelles. Un nombre croissant de fournisseurs de DAM propose désormais des fonctionnalités de recherche visuelle, développées en interne ou utilisant des technologies tierces.

Recadrage intelligent

Cette fonction, qui nécessite traditionnellement un œil humain avisé, utilise l'intelligence artificielle pour recadrer automatiquement les images tout en se concentrant sur les éléments ou les sujets clés afin de préserver la pertinence visuelle. Cela permet d'automatiser l'édition d'images pour différents canaux, plateformes et appareils.

Extraction de caractéristiques et de sentiments

Les algorithmes d'IA, en particulier ceux basés sur le Deep Learning, extraient des caractéristiques à partir de l'asset numérique. Dans le cas des images et des vidéos, il peut s'agir d'identifier des formes, des couleurs, des objets et des scènes. Pour les documents textuels, des techniques de traitement du langage naturel (NLP) sont utilisées pour extraire des phrases clés, des entités et des concepts.

Transcription vidéo/audio automatique

L'IA et la reconnaissance vocale sont désormais capables de générer les transcriptions précises de dialogues et de sous-titres dans les fichiers vidéo et audio. Ce texte descriptif peut à son tour être utilisé pour fournir des métadonnées et ainsi améliorer le contexte et la découverte des contenus.

Modèles multimodaux et LLM personnalisés

Avec l'avènement des grands modèles linguistiques (LLM) multimodaux qui peuvent être entraînés à l'aide de plusieurs types de données, les systèmes de DAM sont désormais prêts à tirer parti d'une forme d'IA plus personnalisée. Cette dernière peut être entraînée à l'aide des actifs numériques, des documents, des produits, des données analytiques, des ressources marketing et même des lignes directrices de la marque d'une entreprise. Les ressources numériques ne sont pas les seules sources potentielles d'apprentissage, les métadonnées générées par la chaîne d'approvisionnement des actifs numériques en amont, telles que les documents d'information, les emails et même les transcriptions audio des réunions sur les campagnes de marketing, sont également des sources potentielles d'apprentissage.

Un tel modèle d'IA, à la fois large et ajusté, pourrait reconnaître, cataloguer, tagguer et appliquer des métadonnées hautement descriptives aux ressources numériques. Il pourrait aussi récupérer des ressources en fonction de leur signification et générer un contenu entièrement nouveau sur la base d'invites en langage naturel telles que "montrez-moi des images d'entreprise contenant le bâtiment de la société" ou "créez une bannière de marketing conforme à la marque et adaptée à un public familial pour promouvoir notre dernier produit".

Gouvernance des métadonnées

Remplir des formulaires de métadonnées peut être un processus long et laborieux, qui conduit souvent à des erreurs et à des champs vides. En fin de compte, cela se traduit par une impossibilité à trouver des ressources et leur sous-utilisation. Compte tenu des technologies disponibles, il peut être tentant de confier à l'IA le soin de générer automatiquement des métadonnées.

Cependant, comme des métadonnées précises, concises et pertinentes sont essentielles au bon fonctionnement d'un DAM, il est judicieux d'intégrer un niveau de supervision et de gouvernance humaine. L'avènement de l'IA et la tendance à manquer de contexte ont rendu les métadonnées vérifiées par l'homme encore plus importantes.

L'IA générative dans le DAM

Bien que la popularité des plateformes d'IA générative (GenAI) telles que DALL-E, Midjourney et Stable Diffusion puisse suggérer une adoption généralisée, seul un nombre étonnamment réduit de fournisseurs de DAM offrent à leurs utilisateurs la possibilité de créer des actifs visuels à partir de zéro. Cette hésitation peut s'expliquer par un certain nombre d'obstacles immédiats : les implications éthiques et juridiques liées à la propriété et aux droits d'auteur, la complexité technique et le risque de perturbation de services ainsi que le coût supplémentaire lié à la fourniture de services gourmande en ressources. Cela dit, on voit maintenant apparaître des fournisseurs d'outils tiers qui proposent une IA générative formée sur des sources qui n'enfreignent pas les droits d'auteur ou n'utilisent pas de sources biométriques non autorisées.

Une autre application intéressante de la technologie d'IA générative pourrait être l'adaptation d'images existantes à des contextes différents, par exemple à l'aide de caractéristiques locales. L'adaptation conserverait le style visuel et la composition de l'élément visuel d'origine, ce qui permettrait d'obtenir un résultat fidèle à la marque.

Images de produits et graphiques marketing à la volée

Outre les défis décrits ci-dessus, la perspective d'offrir aux utilisateurs de DAM la possibilité de générer ou de modifier à la volée des images de marque, des supports de marketing ou des photos de produits en saisissant simplement des descriptions par écrit est clairement intéressante.

L'émergence de ces jeunes pousses numériques s'accompagne d'une augmentation du nombre d'entreprises qui proposent de les aider dans leur croissance. Notamment au moyen de formations personnalisées et de grands modèles linguistiques spécifiques à l'entreprise, adaptés à la marque et libres de toute restriction en matière de droits d'auteur.

Une fois ces modèles entraînés, le temps et le coût de la génération instantanée d'une image de produit à l'aide de l'IA générative seront nettement inférieurs aux ressources nécessaires pour organiser une séance photo, louer du matériel de photographie et d'éclairage, organiser les lieux, la logistique et le transport, et assurer la liaison avec de nombreux membres du personnel.

La technologie permettant de créer de nouvelles images et vidéos ultra-réalistes existe déjà, tout comme la possibilité de remplacer ou de générer des arrière-plans, des visages, des objets, des éclairages, des ombres, des reflets et des matières. De nombreux DAM peuvent déjà redimensionner et reformater les images pour différentes destinations de sortie, et avec cela, la boîte à outils est presque complète. Le dernier élément est peut-être le plus important : il s'agit d'incorporer un peu de chaleur au cœur de la froideur de notre stack de technologies d'IA. Pour cela, nous avons besoin d'humains.

Esquiver le caractère insipide de l'IA avec nuance, style et personnalité

Pour que l'IA générative soit en mesure de dépeindre avec précision la personnalité visuelle d'une marque et ne se contente pas de produire des imitations fades, les utilisateurs devront maîtriser l'art de l'ingénierie des messages-guides. Ces messages, aussi appelés "prompts", sont la construction d'instructions par écrit ciblées, pertinentes et souvent très précises. Pour être efficaces, les prompts devront guider le modèle en lui fournissant un ensemble plus détaillé de coups de pinceau sous la forme de conseils sur le sentiment, la photographie, la pellicule et les techniques d'éclairage, les palettes de couleurs, la composition et les exigences stylistiques.

Cette touche humaine, combinée à un LLM personnalisé et à un modèle multimodal formé à partir des données de l'entreprise, est susceptible de devenir la prochaine grande tendance en matière de création de contenu numérique sur mesure.

Prompt : "Un flacon de parfum en verre, orné, de couleur verte, placé devant des plis de soie violette, éclairage mystérieux, 35 mm, flou d'arrière plan, faible profondeur de champ."  Modèle de diffusion stable : Absolute Reality version 1.8.1.

L'IA pour une recherche avancée et multilingue

En combinant la puissance de l'IA et des API de traduction, les systèmes de DAM sont désormais en mesure de générer et de rechercher des métadonnées, des descriptions et des mots-clés pertinents, très précis et multilingues.

Voici quelques-unes des meilleures API de traduction adaptées à l'intégration des DAM :

API de traduction dans Google Cloud

Le service de traduction dans le cloud de Google prend en charge plus de 100 langues et offre des fonctions de détection de la langue, de traduction et de traitement par lots en temps réel. Comme pour la plupart des intégrations de services tiers, l'interaction se fait via leur API.

DeepL

Lancée en 2017, la société allemande DeepL est reconnue comme l'une des plateformes de traduction les plus précises qui soient et figure sur la liste de Forbes des 100 meilleures entreprises dans le cloud. Avec des traductions assistées par l'IA proposées dans plus de 30 langues, une API robuste et de nombreuses options d'intégration, il s'agit d'une solution flexible, sécurisée et évolutive au niveau de l'entreprise.

Microsoft Translator Text API

La plateforme de traduction de Microsoft s'intègre de manière fluide à Microsoft Azure, déjà utilisé par un certain nombre de fournisseurs de DAM à des fins de stockage. La plateforme de traduction prend en charge les fonctions d'intelligence artificielle et d'apprentissage automatique et offre également un modèle d'utilisation flexible de l'API.

Amazon Translate

Les services de traduction d'Amazon, tout comme ceux de Microsoft, offrent déjà une intégration étroite avec AWS (Amazon Web Services), une autre plateforme couramment utilisée par les fournisseurs de DAM pour fournir des services de stockage dans le cloud et des services tiers. Amazon Translate prend en charge plus de 55 langues et propose la traduction en temps réel, le traitement par lots et des taxonomies personnalisées pour les traductions spécifiques à un secteur d'activité.

3D

Avec le croisement de l'impression 3D abordable, de l'IA générative et des capacités des smartphones, les ressources 3D représentent aujourd'hui un pourcentage croissant du contenu numérique. Compte tenu de l'explosion du développement de jeux sur mobiles, de la réalité virtuelle (RV) et de la réalité augmentée (RA), un très petit nombre de fournisseurs répondent à la demande croissante de gestion efficace des actifs numériques 3D.

Comme d'autres technologies relativement nouvelles, telles que l'IA générative, la prise en charge des fichiers 3D dans le cadre de la gestion des documents numériques apporte son propre lot de défis. Les fournisseurs doivent décider des formats à prendre en charge et, au minimum, les utilisateurs s'attendront à pouvoir télécharger, gérer et prévisualiser des objets 3D en temps réel. Les ressources CPU et GPU devront également être prises en compte, de même que le stockage robuste et sécurisé des fichiers volumineux.

Localisation

Aujourd'hui, au-delà d'une source unique de vérité pour leurs actifs numériques, la plupart des marques recherchent un système de DAM pour gérer la localisation de leurs ressources à deux niveaux différents. Le premier consiste à localiser le design global qui diffère d'un pays à l'autre. Les utilisateurs peuvent avoir besoin d'adapter des éléments de marque, de remplacer des actifs ou de personnaliser le texte pour des campagnes de produits spécifiques. Le format des documents peut également nécessiter d'être modifié en fonction du canal de sortie cible, des formats print traditionnels aux bannières numériques pour les médias sociaux et les plateformes d'e-commerce.

Deuxièmement, la gestion des traductions représente une étape clé dans la commercialisation des produits dans différents pays, chaque territoire ayant son propre ensemble de réglementations et de défis uniques, notamment la langue, la mise en page et la taille du texte. Certains systèmes de DAM sont capables de gérer ces questions grâce à des modèles dynamiques contenant des blocs de texte et d'image modifiables. Afin de gérer efficacement l'automatisation, les parties prenantes devraient pouvoir désigner une ressource principale (par exemple InDesign ou Photoshop) qui peut être utilisée comme modèle adaptatif pour la localisation dans différents pays, langues et canaux de sortie. Les nouvelles technologies d'intelligence artificielle pourraient également permettre la traduction directe des bannières sans avoir à gérer des formats de fichiers sources hétérogènes.

Conclusion

Les différentes technologies d'IA qui émergent actuellement deviennent progressivement plus matures et utilisables dans un environnement de production. L'investissement que les fournisseurs de technologies de DAM avant-gardistes ont réalisé dans l'intégration avec des technologies tierces et des chaînes d'approvisionnement en actifs numériques leur permettra de tirer parti de bon nombre de leurs avantages grâce à l'IA.

De plus en plus, les systèmes de DAM seront les coordinateurs ou les médiateurs de l'activité pilotée par l'IA. Les cas d'utilisation classiques du DAM, à savoir le catalogage et la recherche, subsisteront, mais leur importance diminuera. Le rôle des solutions de DAM sera plus stratégique en tant qu'orchestrateur qu'en tant qu'entrepôt d'actifs doté d'une fonction de recherche.

Cela a des conséquences importantes pour les fournisseurs et les utilisateurs finaux de la technologie de DAM, qui doivent abandonner leur perspective centrée sur les fichiers au profit d'une approche holistique de la chaîne d'approvisionnement des actifs numériques.

Articles susceptibles de vous intéresser

Recevez plus de conseils marketing
et des actualités Wedia directement dans votre boîte mail