|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Serge Shikov 2:5020/400 05 Feb 2001 21:10:21 To : All Subject : Re: Read PDF --------------------------------------------------------------------------------
Artem Chuprina wrote:
>
> >>> Было тут обсуждение конвертилки PDFа в HTML, а вот мне нужен скриптик,
> >>> который бы просто из указанной PDFки читал текст и создавал массив или хэш
> >>> из встреченных слов. Может уже есть готовый ?
> SS>> Ага. ghostscript называется ;-) Возьми да попользуйся. Hе надо такие
> SS>> вещи на перле писать, для чего?
>
> >> Заливает юзер PDFку на сервак, к ней нужно соорудить HTMLку с
> >> ссылкой, описанием и ключевыми словами. Описание задает сам юзер,
> >> а вот слова нужно из нее выдрать автоматически. Причем очень
> >> желательно - все.
> srr> Hу вот и выдери слова ghostscript-ом, а потом этот текстовый файл перлом
> srr> обработай - в чем проблема?
>
> Ключевые? Hу-ну...
И что ну-ну? Есть какие-то более разумные предложения? PDF/PS надо
интерпретировать, чтобы что-то разумное извлечь, и проще всего это
делается на самом PS. Собственно, у ghosttcript-а выдиралка текста
представляет из себя программку ps2ascii.ps. И если надо что-то
нестандартное сделать - проще всего именно ее модифицировать (или другой
подобный скрипт из комплекта). А писать это на перле самому - маразм.
--- ifmail v.2.15dev5
* Origin: home (2:5020/400)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/2825da719f3e.html, оценка из 5, голосов 10
|