|
|
ru.linux- RU.LINUX --------------------------------------------------------------------- From : Oleg Goodyckov 2:5020/400 26 Feb 2002 14:37:06 To : Aleksey Barabanov Subject : Re: PDF to text --------------------------------------------------------------------------------
On Mon, Feb 25, 2002 at 06:00:04PM +0000, Aleksey Barabanov wrote:
> Victor Wagner писал(а):
> >
> > Zheny I. Kraus <kraus@itam.nsc.ru> wrote:
> > >>
> > >> Вообще-то я отвечал на вопрос не "как сконвертировать pdf в текст"
> > >> а "как посмотреть pdf на консоли linux", имея в виду что у
> > >> ghostscript, собранный с svgalib умеет -sDEVICE=linux.
> > >>
> > ZIK> Спасибо.
> > ZIK> Извини, что не правильно задал вопрос, т.к. интересует именно "как
> > ZIK> сконвертировать русский pdf в текст".
> > ZIK> Т.е. ghostscript не может?
> > ZIK> А как xpdf? Он у меня только английский текст вытаскивает.
> > ZIK> Его можно заставить русский сконвертировать?
> >
> > Мне как-то удавалось. Давно это было.
> >
> > Hо не со всякими pdf-ами это проходит. Зависит от того, как там шрифты
> > внутри представлены, какая кодировка русских букв используется etc.
> Как шрифты представлены imho тут ни при чем. Мы же конвертим в текст.
> Такое впечатление, что просто отсутствует кодовая таблица для кириллицы.
> В эстедеерр прет ругань вроде :
>
> gate:~/1 # pdftotext mts-guta.pdf
> Error: Uknown Type 0 character set: Adobe-Identity
> Error: Uknown Type 0 character set: Adobe-Identity
> Error: Uknown Type 0 character set: Adobe-Identity
> Error: Uknown Type 0 character set: Adobe-Identity
> Error: Uknown Type 0 character set: Adobe-Identity
> gate:~/1 #
У меня есть (правда, не стойкое) подозрение, что надо в Fonts.map прописать
алиас для означенного Adobe-Identity
--- ifmail v.2.15dev5
* Origin: unknown (2:5020/400)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.linux/1864376ab2017.html, оценка из 5, голосов 10
|