|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Artem Chuprina 2:5020/371.32 06 Oct 2000 12:24:49 To : dmitriy@genphys.phys.msu.su Subject : Re: pdf -------------------------------------------------------------------------------- dgpms> у меня есть pdf файл, как я его могу перегнать в текстовый вид? ps2ascii AKA gs -q -dNODISPLAY -dNOBIND -dWRITESYSTEMDICT -dSIMPLE -c save -f ps2ascii.ps $1 -c quit dgpms> скрипт такой: dgpms> #!/usr/bin/perl -wT dgpms> open PDF "r006c.pdf"; dgpms> @pdf=<PDF>; dgpms> close PDF; dgpms> open TXT ">text.txt"; dgpms> foreach $line(@pdf){ dgpms> $pdfka=~s/?!(\w+)//ig;#что не текст-убираю(чего-то не работает, dgpms> разберусь) Что, и пробелы тоже!? Кстати, конец строки там, похоже, \r... dgpms> print TXT $pdfka; dgpms> } dgpms> } dgpms> close TXT; dgpms> верно ли? Hеверно. БОльшая часть полученного результата - мусор. dgpms> в пдфке вообще может быть _не_текст_?? Легко и непринужденно. -- Счастливо! Ран. --- ifmail v.2.14.os-p7-tma3 * Origin: MemoNet (2:5020/371.32@fidonet) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/1712115cefe71.html, оценка из 5, голосов 10
|