Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Serge Shikov                         2:5020/400     05 Feb 2001  21:10:21
 To : All
 Subject : Re: Read PDF
 -------------------------------------------------------------------------------- 
 
 Artem Chuprina wrote:
 
 > 
 > >>> Было тут обсуждение конвертилки PDFа в HTML, а вот мне нужен скриптик,
 > >>> который бы просто из указанной PDFки читал текст и создавал массив или хэш
 > >>> из встреченных слов. Может уже есть готовый ?
 > SS>> Ага. ghostscript называется ;-) Возьми да попользуйся. Hе надо такие
 > SS>> вещи на перле писать, для чего?
 > 
 > >>     Заливает юзер PDFку на сервак, к ней нужно соорудить HTMLку с
 > >>    ссылкой, описанием и ключевыми словами. Описание задает сам юзер,
 > >>    а вот слова нужно из нее выдрать автоматически. Причем очень
 > >>    желательно - все.
 > srr> Hу вот и выдери слова ghostscript-ом, а потом этот текстовый файл перлом
 > srr> обработай - в чем проблема?
 > 
 > Ключевые? Hу-ну...
 
 И что ну-ну? Есть какие-то более разумные предложения? PDF/PS надо
 интерпретировать, чтобы что-то разумное извлечь, и проще всего это
 делается на самом PS. Собственно, у ghosttcript-а выдиралка текста
 представляет из себя программку ps2ascii.ps. И если надо что-то
 нестандартное сделать - проще всего именно ее модифицировать (или другой
 подобный скрипт из комплекта). А писать это на перле самому - маразм.
 --- ifmail v.2.15dev5
  * Origin: home (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Re: Read PDF   Serge Shikov   05 Feb 2001 21:10:21 
Архивное /ru.perl/2825da719f3e.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional