|
ru.unix.bsd- RU.UNIX.BSD ------------------------------------------------------------------ From : Roman Krashenko 2:5020/400 15 Apr 2003 03:48:17 To : All Subject : автоматизировать обработку информации DOC -> TXT -------------------------------------------------------------------------------- Добрый вечер, день, ночь! Требуется помощь. Есть реальная задача автоматизировать обработку информации, один из этапов - необходимо конвертировать файл в формате *.doc (word 95/97) в формат *.txt. В инете нашел две программы - catdoc, wvware. Wvware не подходит - необходимо устанавливать много дополнительных пакетов. Поставил catdoc, но желаемого результата не получил - если текст простой, то все ОК, если же в тексте встречаются колонтитулы или куски таблицы, то начинаются проблемы - текст <уродуется> до неузнаваемости. Если кто-то с этим сталкивался, помогите советом или скриптом, нужно из *.doc формата <выдрать> текст, желательно без колонтитулов и таблиц, форматирование вопрос второстепенный, этот текст будет дальше обрабатываться. Методы значения не имеют, главное результат, и возможность организовать обработку без участия человека. Ответ приветствуется мылом. Заранее всем спасибо. --- ifmail v.2.15dev4 * Origin: Technological Systems (2:5020/400) Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.unix.bsd/25155d3e4af5a.html, оценка из 5, голосов 10
|