Online OCR: Převod textu s pomocí webkamery

cam2txtBěhem čtení zakoupené elektronické knihy jsem na náhodných místech narazil na směsici znaků. Tento hash symbolizuje formu ochrany před neoprávněným kopírováním, které se běžně říká social DRM. Nutno podotknout, že DRM ve spojení s ebookem budí strašidelné pocity, social DRM se však nevydává cestou softwarového omezování. Soubor proto otevřete na každé čtečce, jen v něm bude schovaný vodoznak, který snadno identifikuje kupujícího. Můj hash připomínal base64, a proto mě okamžitě začalo zajímat, co je v něm uloženo.

Protože jsem však v danou chvíli byl líný přepisovat hash ze své čtečky do počítače, začal jsem hledat co nejjednodušší OCR. Narazil jsem na jednoduchý portál cam2txt.com, který však nabízel přesně to, co jsem potřeboval. S pomocí webové kamery služba zachytí obrázek a ten následně dekóduje (vyhledá v něm text). V Chrome jsem měl problémy s povolením webkamery, to však patrně bylo způsobeno tím, že používám Linux. Vše naštěstí vyřešila změna prohlížeče, přičemž věřím, že na Windows vám Chrome potíže nezpůsobí.

Cam2Txt.com dokáže znaky dekódovat, vyžaduje to však chvíli laborování. Úspěch totiž významnou měrou závisí na kvalitě vstupní fotografie. Nejlepší výsledky přináší přímé nahrání souboru s obrázkem v digitální podobě. Věnujte rovněž pozornost správnému nastavení jazyka (volba Czech nechybí). Jak už to u OCR bývá, finální kvalitu výstupu ovlivňuje i použitý font a jeho velikost, roli hrají i rozestupy mezi jednotlivými písmeny. Na rychlý převod krátkého vstupu však může být Cam2Txt.com dostačující, protože uživatele nezdržuje registrací a ihned zobrazí získaný text.

A co vlastně hash obsahoval? Bohužel další, pro mě neznámý hash, tipuji jej na interní řešení daného obchodu. Přesný obsah kódu jsem se tedy nedozvěděl, s největší pravděpodobností však půjde pouze o ID, které v tabulce eshopu identifikuje mě jako kupujícího.

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Můžete používat následující HTML značky a atributy: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>