post-doc in Riconoscimento automatico della scrittura, elaborazione e analisi dei dati

Offerta di un postdoc di 12 mesi che si terrà presso il Servizio Storico della Difesa francese (Vincennes a lato di Parigi) e l’Université de Versailles Saint Quentin en Yvelines.
La conoscenza solida del francese è necessaria per i bisogni del progetto. 

La persona assunta dovrà lavorare alle attività del progetto di ricerca Sur le front (de) la justice. Una lettura digitale della giustizia militare durante la Prima Guerra Mondiale (FRONT_JUSTICE), che è stato finanziato dalla Fondation Sciences du Patrimoine (http://www.sciences-patrimoine.org/). Il/la postdoc sarà responsabile della digitalizzazione, della trascrizione automatizzata (HTR) e dell’analisi dei fondi della giustizia militare del Service Historique de la Défense (SHD) presso il sito di Vincennes.

Il post-doc reclutato sarà responsabile dell’acquisizione automatizzata del testo delle sentenze militari francesi. Inizialmente, si occuperà della fase di acquisizione automatica del testo delle frasi militari, utilizzando i software open source eScriptorium e Kraken. Queste sentenze saranno poi annotate in TEI XML per estrarre i dati sensibili (ad esempio i dati biografici e le imputazioni) e creare dei dataset csv. Questi insiemi di dati saranno poi analizzati utilizzando tre metodi esplorativi: grafici quantitativi, mappe digitali e analisi di rete. Tutte le analisi dei dati digitali saranno effettuate utilizzando i linguaggi di programmazione R e/o Python. L’analisi dei dati mediante visualizzazioni sarà poi contestualizzata nel periodo storico, e più specificamente nel suo contesto marziale del 1914-1918 dal resto del team. Cerchiamo quindi una persona in grado di creare una catena per l’acquisizione e l’elaborazione dei dati testuali dall’HTR fino alla loro analisi. La persona assunta dovrà: (1) occuparsi della digitalizzazione, (2) della trascrizione automatica e (3) dell’estrazione automatica dei dati delle frasi e (4) dell’analisi dei dati utilizzando strumenti di visualizzazione.

Competenze e conoscenze informatiche attese:

– Conoscenza delle basi dell’edizione digitale

– Conoscenza dei principi del machine learning

– Conoscenza di XML-ALTO/TEI (obbligatorio)

– Conoscenza di Python (obbligatoria).

– Conoscenza di XSLT (altamente auspicabile)

– Conoscenza di R (opzionale)

– Conoscenza della scienza del testo (storia/letteratura/linguistica)

– Conoscenza di eScriptorium e Kraken (auspicabile ma da apprendere rapidamente)

Data di inizio: 1 marzo 2024 

Stipendio: 2.900 euro lordi al mese

Contatti: Giovanni Pietro Vitali (giovanni.vitali@uvsq.fr – responsabile scientifico) e Louise Ferrandery (louise.ferrandery@uvsq.fr – gestionale)

Candidature: le candidature (CV e lettera di presentazione) devono essere inviate entro la mezzanotte del 20 gennaio 2024 a Giovanni Pietro Vitali (giovanni.vitali@uvsq.fr – responsabile scientifico) e Louise Ferrandery (louise.ferrandery@uvsq.fr – gestionale).

Per più d’informazioni vi trasmetto in allegato l’offerta (in francese) e vi invito a visitare questo link della Fondazione Scienze del Patrimonio sul quale è uscito il posto: http://www.sciences-patrimoine.org/poste-front_justice/