Découvrez le programme complet des conférences de Laval Virtual

Art / PatrimoineIntelligence artificielleNews

Le machine learning révèle que d’autres auteurs ont écrit une pièce de Shakespeare

Crédits photos : Jessica Pamp (Unsplash)

Les critiques littéraires ont depuis longtemps remarqué la main d’un autre auteur dans la pièce Henry VIII de Shakespeare. Désormais, un réseau neuronal a identifié grâce au machine learning les scènes évoquées . L’objectif est de déterminer qui les a réellement écrites. Rappelons que William Shakespeare a été le dramaturge attitré d’une troupe de théâtre appelée King’s Men. Lorsque Shakespeare mourut en 1616, la compagnie avait besoin d’un remplaçant. Elle se tourna vers l’un des dramaturges les plus prolifiques et célèbres de l’époque : John Fletcher.

John Fletcher, co-auteur de la pièce de Shakespeare

John Fletcher

La gloire de Fletcher s’est atténuée depuis. Mais en 1850, un critique littéraire nommé James Spedding remarqua une similitude entre les pièces de Fletcher et les passages de Henry VIII de Shakespeare. Spedding a conclu que Fletcher et Shakespeare ont dû collaborer sur la pièce.

Les preuves proviennent d’études sur les idiosyncrasies linguistiques de chaque auteur. Tout comme la façon dont elles apparaissent dans Henry VIII. Par exemple, Fletcher avait tendance à ajouter le mot “monsieur” ou “still” à côté d’une ligne pentamétrique standard. Le tout pour créer une sixième syllabe.

Ces caractéristiques ont permis à Spedding de suggérer que Fletcher était impliqué dans la rédaction de l’oeuvre. Mais la manière exacte dont la pièce a été divisée est très controversée. Et d’autres critiques ont suggéré qu’un autre dramaturge anglais, Philip Massinger, était en fait le co-auteur de Shakespeare.

C’est pourquoi les analystes et les historiens aimeraient bien déterminer, une fois pour toutes, qui a écrit quelles parties d’Henry VIII.

Un problème résolu par l’Académie tchèque des sciences

Petr Plecháč de l’Académie tchèque des sciences à Prague, indique qu’il a résolu le problème. Il a utilisé le machine learning pour identifier la paternité de plus ou moins chaque ligne de la pièce.

Nos résultats soutiennent fortement la division canonique de la pièce entre William Shakespeare et John Fletcher proposée par James Spedding.

Petr Plecháč, Académie tchèque des sciences

La nouvelle approche est simple en principe. Les algorithmes de machine learning sont utilisés depuis quelques années pour identifier des modèles distinctifs dans la façon dont les auteurs écrivent.

Crédit : Académie tchèque des sciences

La technique utilise un corps de travail de l’auteur pour former l’algorithme et un corps de travail différent et plus petit pour le tester. Cependant, comme le style littéraire d’un auteur peut changer tout au long de sa vie, il est important de s’assurer que toutes les œuvres ont le même style. Une fois que l’algorithme a appris le style en termes de mots et de rythmes les plus couramment utilisés, il est capable de le reconnaître dans des textes qu’il n’a jamais vus.

Petr Plecháč a suivi cette technique. Il entraîne d’abord l’algorithme à reconnaître le style de Shakespeare en utilisant d’autres pièces écrites en même temps que Henry VIII. Ces pièces sont La Tragédie de Coriolanus, La Tragédie de Cymbeline, Le Conte d’hiver et La Tempête.

Il forme ensuite l’algorithme à reconnaître le travail de John Fletcher à l’aide de pièces de théâtre qu’il a écrites à cette époque : Valentinian, Monsieur Thomas, The Woman’s Prize et Bonduca. Enfin, il utilise l’algorithme pour l’oeuvre Henry VIII et lui demande de déterminer l’auteur du texte. Pour cela, il utilise une technique de fenêtre déroulante pour faire défiler la pièce.

La moitié de la pièce écrite par Fletcher

Les résultats sont intéressants. Ils ont tendance à être d’accord avec l’analyse de Spedding. Celle-ci indique que Fletcher a écrit des scènes représentant presque la moitié de la pièce. Cependant, l’algorithme permet une approche plus fine. Il révèle comment l’auteur change parfois non seulement pour de nouvelles scènes, mais aussi vers la fin des précédentes. Par exemple, dans l’acte 3, scène 2, le modèle suggère une paternité mixte après la ligne 2081 et constate que Shakespeare prend complètement le relais à la ligne 2200, avant le début de l’acte 4, scène 1.

Petr Plecháč a également formé son modèle à reconnaître le travail de Philip Massinger. Mais il trouve peu de preuves de son implication. “La participation de Philip Massinger est plutôt improbable, conclut-il. C’est un travail intéressant qui montre comment les linguistes et les analystes littéraires utilisent le machine learning pour mieux comprendre notre patrimoine littéraire.

Extrait de la pièce Henry VIII, courtesy of Globe Player

Cependant, il reste encore beaucoup de travail à faire. Par exemple, lorsque les algorithmes ont été formés pour reconnaître un style artistique, les informaticiens ont rapidement compris comment extraire un style et l’appliquer à d’autres images. Ils ont utilisé une technique appelée transfert de style neuronal. Du jour au lendemain, il est devenu possible de donner à une photographie ordinaire le style d’un Van Gogh ou d’un Monet.

Cela soulève la question de savoir si une technique similaire est possible pour le texte. Serait-il possible de transformer un essai, ou même un article, dans le style de Shakespeare ou de John Fletcher, par exemple ? Malheureusement, pas encore. Si ce n’est par la façon triviale de remplacer les mots comme eux par “eux et ainsi de suite”. Cela s’explique en grande partie par le fait que la structure de la communication n’est pas suffisamment bien comprise par les linguistes ou leurs charges algorithmiques.

Ref: arxiv.org/abs/1911.05652 : “Relative contributions of Shakespeare and Fletcher in Henry VIII: An Analysis Based on Most Frequent Words and Most Frequent Rhythmic Patterns” / Académie des sciences de Prague
Sources : MIT, article initialement paru dans la revue MIT Technology Review

Laisser un commentaire