November 28, 2022

Branches Tech

Engagé pour la qualité technologique

Le faux Joe Rogan interviewe le faux Steve Jobs dans un podcast alimenté par l’IA

3 min read

Illustration générée par l'IA de trois visages de Steve Jobs.
Agrandir / Quel Steve Positions est le vrai ?

Ars Technica

Une société de synthèse vocale basée à Dubaï a publié un job interview podcast fictive entre Joe Rogan et Steve Jobs en utilisant des voix réalistes clonées numériquement des deux hommes. Il se déroule lors du “premier épisode” d’une prétendue série de podcasts appelée “Podcast.ai”, créée par Participate in.ht, qui vend des providers de synthèse vocale.

Dans l’interview, vous entendez d’abord une réplique de la voix de Rogan créée par une technologie de clonage de voix similaire à celle que nous avons déjà couverte sur Ars. La technologie d’apprentissage en profondeur a permis aux modèles d’IA de reproduire des voix distinctives avec un degré élevé de précision, comme dans le cas de Dim Vador dans Disney’s Obi Wan Kenobi Séries Tv set.

Pour obtenir cet effet, quelqu’un doit d’abord entraîner le modèle d’IA sur des échantillons existants de la voix qui sera clonée. Rogan est une cible de choix pour la development vocale de l’IA par des modèles d’apprentissage en profondeur, motor vehicle de grandes quantités de sa voix isolée existent sur ses podcasts. En fait, The Verge couvert un coup de pub par une société d’IA appelée Dessa synthétisant Rogan en 2019.

Là où cet exemple de tromperie de l’IA devient as well as intéressant, c’est que Enjoy.ht a également fait entendre la voix du PDG décédé d’Apple, Steve Careers. Sa voix, parfois saccadée de manière robotique, rappelle ses keynotes Apple et ses interviews All Factors Electronic de la fin des années 2000. Et Perform.ht affirme que le texte de l’interview a également été généré par l’IA, peut-être à partir d’un grand modèle de langage (LLM) similaire à GPT-3.

“Les transcriptions sont générées avec des modèles linguistiques affinés,” écrit Perform.ht sur le site Podcast.ai. “Par exemple, l’épisode de Steve Work opportunities a été formé sur sa biographie et tous les enregistrements de lui que nous avons pu trouver en ligne afin que l’IA puisse le ramener à la vie avec précision.”

Conformément à ses racines LLM, l’interview de 19 minutes n’a pas beaucoup de sens. Au bout d’un minute, certaines get-togethers de l’interview fictive commencent à ressembler à des mashups conceptuels de factors de discussion courants de Work, notamment l’esthétique, des produits révolutionnaires, des concurrents tels que Google, Microsoft et Adobe, et les triomphes du Macintosh d’origine.

Par exemple, au cours d’une partie de l’interview, les faux Jobs se penchent sur des critiques de Microsoft qui sont très similaires à ce que les vrais Jobs ont dit dans une célèbre job interview de 1995 pour Triomphe des nerds, mais ce n’est pas une copie conforme et vous pouvez dire que la voix est synthétisée si vous comparez les deux. “C’est le problème que j’ai toujours eu avec Microsoft”, déclare Fake Positions. “À bien des égards, ce sont des gens intelligents et ils ont fait du bon travail, mais ils n’ont jamais eu de goût. Ils n’ont jamais eu de sens esthétique.”

Reste à savoir s’il est légal d’utiliser les ressemblances vocales de Work opportunities ou de Rogan de cette manière, en particulier pour promouvoir un produit industrial. Et malgré la nature publicitaire du podcast, le idea de podcasts de célébrités entièrement fictifs a retenu notre notice. Alors que la synthèse vocale devient moreover répandue et potentiellement indétectable, nous envisageons un avenir où les artefacts médiatiques de toutes les époques seront probablement complètement fluides et malléables, façonnables pour s’adapter à n’importe quel récit. Dans ce monde fictif particulier, Jobs est un grand fan de Rogan.

“C’est agréable de s’asseoir dans la voiture et de t’écouter fulminer”, dit-il.

Leave a Reply