131127_magazines_2

Darmowy system rozpoznawania zeskanowanego tekstu

Każdy kto chociaż raz w życiu musiał pracować na scanach dokumentów, wie że to żmudne i niewdzięczne zajęcie. Tym bardziej jeśli zeskanowy tekst trzeba ręcznie przepisać lub opracować, a jeśli dodamy do tego jeszcze konieczność tłumaczenia tekstu, to mamy zajęcie na kilka dobrych godzin lub dni.

Na szczęście dziś możemy się wspomagać techniką, która pozwoli na zamianę zeskanowanego tekstu na format edytowalny np. doc w zaledwie kilka minut. Problem jednak w tym, że narzędzia OCR to wciąż kosztowne oprogramowania, a z ich skutecznością różnie bywa. W zależności bowiem od klasy programu i jakości dokumentu, często trzeba wprowadzić do uzyskanego tekstu dodatkowe poprawki.

A co zrobić jeśli ktoś potrzebuje programu jedynie do doraźnych celów?

W takim przypadku zakup oprogramowania ze względów finansowych mija się z celem. Zdecydowanie lepszym pomysłem będzie poszukanie alternatywnych rozwiązań. Jednym z nich na pewno będzie skorzystanie z pomocy aplikacji OCR działających online. Przykładem takiego systemu jest np. darmowy www.onlineocr.net oferujący:

  • Rozpoznawanie tekstu zapisanego w jednym z 46 języków,
  • Obsługę plików w formatach pdf,itf,jpg,bmp,png,gif,
  • Możliwość eksportu do doc,xls lub text.

Ze względu na jednak na to, że dostępne jest on za darmo to posiada one pewne ograniczenia:

  • Minimalna rozdzielczość zeskanowanego dokumentu przed przetworzeniem to 200 – 400 DPI,
  • Maksymalna wielość zaimportowanego pliku dla niezarejestrowanych użytkowników to 5 MB,
  • Przed otrzymaniem wyniku należy wprowadzić kod zabezpieczający (captcha),
  • W ciągu godziny można przetworzyć do 15 dokumentów.

ocrconvertor

Podsumowanie

Działanie Onlineocr.net testowałem na prostych dokumentach i infografikach zawierających angielski tekst. System poradził sobie z rozpoznaniem tekstu całkiem dobrze. Czas realizacji też był szybki. Jeżeli ktoś potrzebuje narzędzia OCR do użytku domowego, to z pewnością system ten ułatwi mu pracę.

Podziel się