Objavljeno: 29.6.2010

Google Docs zmore tudi OCR

Google je svoji spletni pisarni dodal novo zanimivo zmožnost. Uporabniki imajo od nedavnega v urejevalniku besedil Docs na voljo možnost optične razpoznave znakov (OCR) za dokumente, ki jih naložim v spletni servis. Za uporabo zadostuje, da uvozimo dokument v ustrezni obliki (slike JPEG, GIF, PNG in datoteke PDF), pri čemer odkljukamo novo opcijo OCR. Rezultat je dokument pretvorjen v besedilo, ki ga lahko nato urejamo v storitvi Docs.

Google trdi, da je nova zmožnost eksperimentalna, kar pomeni, da ne jamčijo za zanesljivost rezultatov. Toda kot za večino "poizkusov" Googla tudi za opcijo OCR velja, da je že v prvi različici dokaj zmogljiva. Google trdi, da razpoznavalnik za zdaj podpira angleški, francoski, italijanski, nemški in španski jezik, kasneje pa bodo dodali tud druge. Prvi hitre preizkusi kjub temu kaže, da se do neke mere prebije tudi slovenski jezik, vsaj do nivoja da nadomesti večino truda, ki bi ga imeli, če bi želeli dokumente ročno pretipkati. Nerazpoznani deli besedila so posebej označeni.

Google trdi, da optično razpoznavalnik deluje najbolje za gradivom v visoki ločljivosti. Kjer program še zaostaja je v oblikovanju zajetega besedila, ki se lahko precej razlikuje od originala. Google tudi obljublja, da bo ob razpoznanem besedilu prilagal originale, s čimer bo lažje najti dele, ki jih je funkcija OCR preskočila ali pa narobe tolmačila.

http://www.google.com/docs

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji