Tip | Transkribus – program na přepis kurentu

Každý historik umění, který se zabývá obdobím raného novověku, se dříve či později musí potýkat s aRchiváliemi napsanými obtížně čitelným kurentním písmem, případně s nemalými kvanty tištěných zdrojů. Naštěstí se pomalu začínají objevovat programy, které tuto práci dokáží značně usnadnit. Jedním z nich je Transkribus, s jehož pomocí lze poměrně rychle a bezbolestně staré texty přepisovat či editovat.

Program Transkribus byl vyvinut na univerzitě v Innsbrucku v rámci projektů tranScriptorium (2013–2015) a Recognition and Enrichment of Archival Documents (2016–2019), v dnešní době je navíc komerčně zpřístupněn široké veřejnosti. Využít lze jednoduše k manuálnímu přepisování textu, kdy daný dokument rozčlení na jednotlivé řádky a sloupce a tím umožňuje se při přepisu dobře orientovat a překlikávat z řádku na řádek. Nejzajímavější funkcí je však rozpoznání rukopisného textu (HTR – Handwritten text recognition), ve které program daný text přímo přepíše. Míra úspěšnosti se odvíjí od toho, nakolik podoba písma v daném dokumentu odpovídá dobovému i jazykovému standardu. Tak například u starých tisků jsou po přepsání potřeba jen minimální editorské úpravy. U rukopisných pramenů je přepis samozřejmě méně kvalitní. Je třeba vyzkoušet více různých typů nabízených vhodných modelů, které pro jednotlivé jazyky vytvořili předchozí uživatelé, a i tento text je nutné ještě jednou velmi důkladně projít a opravit chyby. I přesto však hrubý přepis ušetří spoustu času stráveného manuálním přepisováním. Každému uživateli je zpočátku nabídnuto 500 kreditů, které odpovídají 500 stranám rukopisného textu, či 2500 stranám tištěného textu. Zejména pro větší objemy textu a při obtížně čitelném rukopisu existuje možnost vytvořit si vlastní přesnější HTR model. Technologie je na rozdíl od jinde používané Optical Character Recognition (OCR) založena na rozpoznávání jednotlivých řádků písma jako celku a měla by spolehlivě fungovat, pokud je tento model trénován asi na 100 stranách manuálně přepsaného textu. Z hlediska praktického užívání je nejpracnějším procesem odstraňování špatně rozpoznaných řádků, které je poměrně zdlouhavé. Nemá tedy příliš cenu používat tento program, pokud v prameni hledáte nějakou konkrétní informaci. Pokud ale potřebuji mít text přepsaný, je Transkribus velmi užitečným pomocníkem.

Zdroj: Readcoop