|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Vladimir Bormotov 2:5020/400 12 May 2003 18:24:39 To : Ilya Pinaeff Subject : Re: OpenOffice --------------------------------------------------------------------------------
Hi, Ilya!
>>>>> "IP" == Ilya Pinaeff <syn@ezsk.ru> writes:
>> SP> Ты знаешь, на твой вопрос ответить действительно тяжело. Возьми-ка
>> SP> и попробуй - станет сразу понятно.
>> а чего там пробовать-то?
>> опять-же, где статистика в разрезе "размеры документов"?
>> Опять-же, у FR очень неплозая математика, и для некоторого класса
>> документов даже если и вылезают неточности распознования, то последующий
>> проход спелчекера их лечит на 100%. Тоже, кстати, "фильтр" :)
IP> Э-э, разметку документа и шрифты (курсив например, или разрядку)
IP> спелчекер не лечит.
в принципе согласен :-)
IP> Я вот подумал, что на входе и на выходе должен быть некий
IP> промежуточный формат, который содержал бы изображение, текст и
IP> разбиение на блоки.
лёгко. если вдуматься, то проблем никаких. нада тока вдуматься, но из-за
1% linux-users смысла думать нет.
IP> Т.е. сперва в нем одна картинка или картинка с блоками, а на выходе
IP> там появляется текст.
угу, а тм где распознавалка выдала результат с малым качеством, там рядом
фрагмент картинки, именно вот тот малый фрагмент, который "сомнительно
распознался"...
--
Bor.
--- ifmail v.2.15dev5
* Origin: BorHomeLand (2:5020/400)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/2541f12febca.html, оценка из 5, голосов 10
|