Catégories
Pauline Moirez

Crowdsourcing + Machine Learning: Nicholas Woodward at TCDL

Projet de transcription des archives de la Guatemalan National Police Historical Archives (1882-2005) représentant 8 km linéaires. L…

Projet de transcription des archives de la Guatemalan National Police Historical Archives (1882-2005) représentant 8 km linéaires. La qualité et la nature des documents rendent impossible l'OCR. Approche par crowdsourcing : transcription collaborative, puis propagation automatique des mots transcrits sur l'ensemble du corpus par reconnaissance de similarité d'images ("image matching").

Tags: