Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Artem Chuprina                       2:5020/371.32  06 Oct 2000  12:24:49
 To : dmitriy@genphys.phys.msu.su
 Subject : Re: pdf
 -------------------------------------------------------------------------------- 
 
 dgpms> у меня есть pdf файл, как я его могу перегнать в текстовый вид?
 
 ps2ascii AKA gs -q -dNODISPLAY -dNOBIND -dWRITESYSTEMDICT -dSIMPLE -c save -f
 ps2ascii.ps $1 -c quit
 
 dgpms> скрипт такой:
 dgpms> #!/usr/bin/perl -wT
 dgpms> open PDF "r006c.pdf";
 dgpms> @pdf=<PDF>;
 dgpms> close PDF;
 dgpms> open TXT ">text.txt";
 dgpms> foreach $line(@pdf){
 dgpms>    $pdfka=~s/?!(\w+)//ig;#что не текст-убираю(чего-то не работает,
 dgpms> разберусь)
 
 Что, и пробелы тоже!? Кстати, конец строки там, похоже, \r...
 
 dgpms>    print TXT $pdfka;
 dgpms>    }
 dgpms> }
 dgpms> close TXT;
 
 dgpms> верно ли?
 
 Hеверно. БОльшая часть полученного результата - мусор.
 
 dgpms> в пдфке вообще может быть _не_текст_?? 
 
 Легко и непринужденно.
 
 -- 
 Счастливо!
   Ран.
 --- ifmail v.2.14.os-p7-tma3
  * Origin: MemoNet (2:5020/371.32@fidonet)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Re: pdf   Artem Chuprina   06 Oct 2000 12:24:49 
Архивное /ru.perl/1712115cefe71.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional