|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Victor Wagner 2:5020/400 04 Apr 2002 23:55:20 To : Vitaly Lugovsky Subject : Re: Hужна пpогpамма-говоpилка -------------------------------------------------------------------------------- Vitaly Lugovsky <vsl@ontil.ihep.su> wrote: VL> А вот интересно. Давном давны ещё я в этой вот самой эхе VL> пытался выяснить, какая такая польза от OCR, если 1) VL> OCR-ный текст надо ВHИМАТЕЛЬHО вычитывать, СРАВHИВАЯ С Во-первых, это касается и текста после машинистки. Во-вторых, для некоторых специальных видов текстов существуют и более другие способы проверки. Году в 96, при тогдашнем-то состоянии распознавалок, мы вводили таким образом легенду ландшафтной карты СССР 1:2500000 - это целая книжка. У меня по-моему где-то до сих пор валяется сархивированный тот набор скриптиков на awk и shell, которым ее чистили. (распознавали-то под виндой, а чистили потом под Linux, так как он куда больше приспособлен для работы с текстом). А набор скриптов (преимущественно на tcl) предназначенный для анализа этого текста и построения карт на основании содержащейся в нем информации, опубликован на Web в моем отчете 1997 года. А при нынешнем состоянии распознавалок, сканирование и приведение в публикабельное на вебе состояние цельной книжки - чуть ли не дело одного вечера. А вы думали откуда берутся книги в библиотеке Мошкова? -- Это не романтика, это какая-то некромантика --- ifmail v.2.15dev5 * Origin: Free Net of Leninsky,45 (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/15178e01b9eac.html, оценка из 5, голосов 10
|