|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Konstantin Tokar 2:5020/400 14 May 2003 12:30:02 To : Valentin Nechayev Subject : Re: OpenOffice --------------------------------------------------------------------------------
> SP> Если бы тебе пришлось обработать им текст страниц так 100, то
> понял бы SP> почему нельзя просто положить на вход графический файл,
> а на выходе получить SP> текстовый.
>
> А ты расскажи. Параметров надо кучу крутить, подбирая так, чтобы он
> на этой отдельно взятой странице опознал русский текст, а не бнопню с
> галамагой? Hу так на это и статистический анализатор способен,
> причём значительно эффективнее, чем человек. Или вставлять одну и ту
> же страницу в сканер 20 раз, чтобы буквы сели на нужные границы
> растра? Ещё что-то?
Если сканируешь толстую книгу, часто средняя часть сканируется плохо,
надо визуально контролировать. Автоматическое определение частей
страницы как картинки и текста работает плохо, тоже ручная работа нужна.
Hеправильно распознанные символы вроде плохо пропечатанных букв или
запятая, распознанная как точка. В общем попробуй пораспознавать, сам
поймёшь.
--- ifmail v.2.15dev5
* Origin: MTU-Intel ISP (2:5020/400)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/280576fd6585.html, оценка из 5, голосов 10
|