Loading...
Please wait, while we are loading the content...
Similar Documents
Analyse des registres manuscrits de la comédie-Italienne au XVIIIe siècle : de l'image au langage
| Content Provider | Semantic Scholar |
|---|---|
| Author | Granet, Adeline Roman-Jimenez, Geoffrey Rubellin, Françoise Quiniou, Solen Morin, Emmanuel Mouchère, Harold Viard-Gaudin, Christian |
| Copyright Year | 2017 |
| Abstract | La Comedie-Italienne et les theâtres de la Foire sont deux formations theâtrales du XVIIIe siecle encore largement sous-etudiees dans le domaines des sciences humaines et sociales. Le projet CIRESFI vise a analyser l'acculturation des italiens dans le contexte politique de l'epoque. Les registres comptables de la Comedie-Italienne sont aujourd'hui disponibles au format numerique et l'extraction automatique de ces informations, encore inexploitees, permettra de faciliter leur analyse. Nos travaux se concentrent sur la transcription des titres des pieces. Celle-ci repose sur deux axes consecutifs : la segmentation automatique des titres et leur transcription par reconnaissance semi-supervisee d'ecriture. Les zones de titres ont ete extraites au travers de l'utilisation de la methode DMOS pour la reconnaissance de structure des documents. La separation entre les lignes de textes est effectuee a l'aide de l'algorithme Seam Carving. La transcription des lignes de titre est realisee a partir d'un reseau de neurones recurrent profond et d'un etiquetage par classification temporelle (BLSTM-CTC). Pour une transcription non-supervisee des titres, ce modele est entraine sur differentes ressources annotees du XVIIIe siecle. Ces premiers travaux bases sur les titres de pieces permettront d'enrichir notre modele en vue de transcrire la totalite des informations disponibles au sein de ces documents. |
| File Format | PDF HTM / HTML |
| Alternate Webpage(s) | https://hal.archives-ouvertes.fr/hal-01757743/file/FJIN_Granet_201702.pdf |
| Language | English |
| Access Restriction | Open |
| Content Type | Text |
| Resource Type | Article |