Yandex brachte neuronalen Netzwerken bei, Archivaufzeichnungen mit komplexer Schreibweise zu entschlüsseln
Verschiedenes / / April 03, 2023
Historische Manuskripte, die für eine Person schwer zu analysieren sind, werden von künstlicher Intelligenz fast sofort in gedruckten Text umgewandelt.
Yandex hat einen neuen Dienst namens Archive Search gestartet, der neuronale Netze verwendet, um Archivunterlagen mit komplexer vorrevolutionärer Schreibweise zu entschlüsseln.
Der Dienst bietet Zugriff auf mehr als 2,5 Millionen Seiten historischer Dokumente mit Texttranskriptionen. Sein auf der Basis eines optischen Zeichenerkennungssystems aufgebauter Algorithmus berücksichtigt die Besonderheiten der Handschrift, erkennt Buchstaben, die ihre Relevanz verloren haben, und versteht die besondere Struktur von Archivdokumenten.
Die Spezialisten des Unternehmens trainierten das neuronale Netzwerk mit einem Datenarray aus Hunderttausenden von handschriftlichen Zeilen aus echten Texten des 18. bis 19. Jahrhunderts und zig Millionen generierter Beispiele.
Manuskripte, die für eine unvorbereitete Person schwer zu analysieren sind, die Yandex-Technologie verwandelt sich fast sofort in gedruckten Text. Dank dessen können Sie in der Datenbank des Dienstes schnell Dokumente finden, in denen der Nachname, der Ort oder andere Wörter erwähnt werden.
"Suche in Archiven" wird die Effizienz der Arbeit von Historikern, Soziologen, Demographen, Genealogen steigern und denjenigen helfen, die nach Informationen über ihre Familie suchen.
Der erste im Dienst vorgestellte Fonds war das Hauptarchiv von Moskau - mit seinen Materialien trainierten die Entwickler das neuronale Netzwerk. Die Datenbank enthält auch Dokumente aus den Archiven der Regionen Orenburg und Nowgorod. Im Laufe der Zeit wird die Anzahl der Speicher und verfügbaren gescannten Dateien zunehmen.
Sie können nach Materialien aus dem 18. bis frühen 20. Jahrhundert suchen, die bei den Benutzern am beliebtesten sind. Dies sind Kirchenbücher, Beichtblätter und Revisionsgeschichten mit den Ergebnissen der Volkszählung. Dokumente finden Sie im Katalog oder über die Suchleiste. Es gibt Filter nach Jahren, Archiven, Fonds und Inventaren.
Neben dem Scan jeder Seite wird eine zeilenweise Dekodierung durch neuronale Netze angezeigt. Wenn Sie mit der Maus über das gewünschte Fragment fahren, wird es sofort auf der digitalen Kopie hervorgehoben.