Archiv pro štítek: zdarma

Online OCR: Převod textu s pomocí webkamery

cam2txtBěhem čtení zakoupené elektronické knihy jsem na náhodných místech narazil na směsici znaků. Tento hash symbolizuje formu ochrany před neoprávněným kopírováním, které se běžně říká social DRM. Nutno podotknout, že DRM ve spojení s ebookem budí strašidelné pocity, social DRM se však nevydává cestou softwarového omezování. Soubor proto otevřete na každé čtečce, jen v něm bude schovaný vodoznak, který snadno identifikuje kupujícího. Můj hash připomínal base64, a proto mě okamžitě začalo zajímat, co je v něm uloženo.

Protože jsem však v danou chvíli byl líný přepisovat hash ze své čtečky do počítače, začal jsem hledat co nejjednodušší OCR. Narazil jsem na jednoduchý portál cam2txt.com, který však nabízel přesně to, co jsem potřeboval. S pomocí webové kamery služba zachytí obrázek a ten následně dekóduje (vyhledá v něm text). V Chrome jsem měl problémy s povolením webkamery, to však patrně bylo způsobeno tím, že používám Linux. Vše naštěstí vyřešila změna prohlížeče, přičemž věřím, že na Windows vám Chrome potíže nezpůsobí.

Cam2Txt.com dokáže znaky dekódovat, vyžaduje to však chvíli laborování. Úspěch totiž významnou měrou závisí na kvalitě vstupní fotografie. Nejlepší výsledky přináší přímé nahrání souboru s obrázkem v digitální podobě. Věnujte rovněž pozornost správnému nastavení jazyka (volba Czech nechybí). Jak už to u OCR bývá, finální kvalitu výstupu ovlivňuje i použitý font a jeho velikost, roli hrají i rozestupy mezi jednotlivými písmeny. Na rychlý převod krátkého vstupu však může být Cam2Txt.com dostačující, protože uživatele nezdržuje registrací a ihned zobrazí získaný text.

A co vlastně hash obsahoval? Bohužel další, pro mě neznámý hash, tipuji jej na interní řešení daného obchodu. Přesný obsah kódu jsem se tedy nedozvěděl, s největší pravděpodobností však půjde pouze o ID, které v tabulce eshopu identifikuje mě jako kupujícího.

VPS s IP zdarma bez háčků a skrytých podmínek

Taková nabídka se jen tak nevidí. Nejrůznějších bezplatných webhostingů naleznete na internetu celou plejádu, když však přijde na řadu VPS, rozhodně se vám jen tak nepoštěstí. Následující virtuální server však můžete mít úplně zdarma. Není třeba ani vkládat údaje o své platební kartě, jak bývá u některých bezplatných služeb zvykem. Sluší se ještě dodat, že o tuto akční nabídku jsem nezakopl já, ale byl jsem na ní upozorněn.

Je libo veřejnou IP?

Podívejme se nejprve na hardwarové parametry samotného VPS. K dispozici je 128 MB RAM, o uložení dat se postará disk o velikosti 10 GB. Potěší neomezený bandwith a především veřejná IP. Bez ní by totiž server rázem neměl tak široké pole působnosti. Virtualizace spoléhá na OpenVZ.

Osobně mívám na levných VPS především problém s nedostatkem volné RAM. Jak však ukazuje následující příkaz, ihned po spuštění serveru má uživatel k dispozici 90 MB.

Volná RAM

Následuje výpis defaultně spuštěných služeb:

Spuštěné služby

Registrace

K získání VPS zavítejte na host1free.com a zvolte Free Cloud VPS. Nejprve budete vyzvání ke stažení aplikace k zabezpečení počítače. Zda přitom program skutečně nainstalujete závisí zcela na vás, není to nutná podmínka k přidělení VPS.

V dalším kroku doporučuji použít email, který se netváří tak, že slouží k ochraně před SPAMem. O povolení účtu totiž rozhodují skuteční lidé. Snažte se proto vytvořit dojem seriózního zájemce, který by v budoucnosti mohl uvažovat o placeném upgrade svého serveru a nevkládejte adresu typu neco@temporaryemail.com.

A tím registrace končí. Nyní již stačí doufat, zda se svého VPS skutečně dočkáte. V mém případě jsem dostal potěšující email s přístupovými údaji již na druhý den.

VPS se pochopitelně pro náročnější projekty nehodí. Osobně server momentálně využívám jen k nastavení CRONu. Mnou dosud preferovaná služba totiž zavedla určitá omezení, jenž nedovolují velmi časté spouštění úloh. Ani jednou jsem prozatím nezaznamenal výpadek, mějte však na paměti, že tak tomu u bezplatného produktu vždy být nemusí.

Online OCR s podporou češtiny

OCRNedávno jsem potřeboval získat text z obrázku ve formátu PNG. Mohl jsem pochopitelně otevřít libovolný textový editor a vše vyřešit pouhým přepsáním. Lidé se však snaží chodit zkratkami, a proto i já začal hledat lepší řešení v podobě technologie OCR sloužící k optickému rozpoznávání znaků. Objev v podobě portálu www.onlineocr.net mě překvapil jednoduchým rozhraním, online dostupností a podporou české diakritiky. Další kladné body projekt získal za možnost využití služeb bez nutnosti registrace.

Vyberte jazyk a výstupní formát

Nahrát lze obrázek o maximální velikosti čtyř megabajtů, i když  web uvádí jako maximální přípustnou hodnotu 4 mb, tedy megabity. Podpory se dočkaly nejběžnější soubory k reprezentaci obrázku (PNG, JPEG, BMP, GIF i TIFF). Uživatel zvolí pouze vstupní jazyk (v našich končinách půjde o Czech) a výstupní soubor (TXT, DOC či XLS). Po nahrání souboru stačí opsat snadno rozluštitelný captcha kód a rázem se zobrazí výsledek. Za hodinu lze takto zkonvertovat až 15 souborů.

Za registraci další funkce

Pakliže vás například limituje velikost nahrávaného souboru, stačí si vytvořit uživatelský účet. Rázem převedete až 100 MB, přičemž jednotlivé obrázky mohou být v jednom ZIP archívu. Výsledek lze dále stáhnout jako HTML, PDF či RTF. Výhody ovšem mají háček v podobě kreditového modelu. Každý kredit slouží k převodu jedné stránky. Po registraci jich obdržíte celkem 20 na vyzkoušení služby. Další lze případně dokoupit. Osobně jsem však vystačil s bezplatným modelem a žádná omezení jsem nezaznamenal.

Příchozí dotazy:

  • ocr czech
  • převod do binární soustavy
  • převod obrázku na čísla