I modelli realizzati da Mediobanca

Dopo gli ottimi risultati ottenuti con il modello dedicato ai Verbali manoscritti del Novecento, la sperimentazione dell’Archivio Storico si è estesa anche nuove tipologie documentarie.

L’attenzione si è infatti spostata sulla corrispondenza e sui documenti dattiloscritti. Da questo lavoro sono nati due strumenti complementari: un modello di riconoscimento del testo dattiloscritto e un field model progettato per individuare e classificare automaticamente le diverse parti che compongono una lettera, dalla data al mittente, dall’oggetto al corpo del testo. Insieme, questi modelli consentono di combinare la trascrizione automatica con l’estrazione di testo arricchito da elementi che ne raccontano la struttura.

Tutti e tre i modelli creati dall’Archivio sono disponibili pubblicamente su Transkribus, utilizzabile da chiunque volesse trascrivere documenti affini.

Transkribus cartiglio modello Verbali Mediobanca

Italian - 20th Century Minutes of Mediobanca's Board of Directors & Exec. Committee

Questo modello è stato creato per trascrivere i Verbali del Consiglio e del Comitato Esecutivo di Mediobanca, redatti a mano.

È stato addestrato su tredici mani calligrafiche tipiche del Novecento, simili tra loro ma con differenze individuali: ciò lo rende adatto a essere utilizzato per verbali del ‘900 di altre istituzioni.

È in grado di sciogliere le abbreviazioni più comuni nel linguaggio bancario e i titoli onorifici.

20th Century Typewritten Italian

Questo modello è pensato per trascrivere documenti dattiloscritti del Novecento, come corrispondenza, articoli, minute, memorie interne e verbali.

Il set di addestramento comprende documenti provenienti da contesti sia italiani sia internazionali: per questo il modello è in grado di riconoscere con buona affidabilità testi in italiano e brevi passaggi in inglese.

Anche questo modello scioglie i titoli onorifici e le abbreviazioni più comuni nel linguaggio bancario.

Transkribus cartiglio modello Corrispondenza Mediobanca
Transkribus Field Model Mediobanca

20th Century Typewritten Letters - Diplomatics' Elements

Questo modello è progettato per individuare e classificare i principali elementi della corrispondenza dattiloscritta del Novecento, secondo la diplomatica contemporanea.

Riconosce componenti come intestazione, data, mittente, destinatario, oggetto, corpo del testo, note dattiloscritte o manoscritte, firma, allegati.

È stato addestrato su un’ampia selezione di lettere e telegrammi in entrata e in uscita, rappresentativi di formati e strutture diversi.

Consulta l'Archivio Storico