Главная страница


ru.unix.bsd

 
 - RU.UNIX.BSD ------------------------------------------------------------------
 From : Roman Krashenko                      2:5020/400     15 Apr 2003  03:45:45
 To : All
 Subject : автоматизировать обработку информации DOC -> TXT
 -------------------------------------------------------------------------------- 
 
 Добрый вечер, день, ночь!
 
 Требуется помощь.
 
 Есть реальная задача автоматизировать обработку информации, один из этапов -
 необходимо конвертировать файл в формате *.doc (word 95/97) в формат *.txt.
 В инете нашел две программы - catdoc, wvware.
 Wvware не подходит - необходимо устанавливать много дополнительных пакетов.
 
 Поставил catdoc, но желаемого результата не получил - если текст простой, то
 все ОК, если же в тексте встречаются колонтитулы или куски таблицы, то
 начинаются проблемы - текст <уродуется> до неузнаваемости.
 
 Если кто-то с этим сталкивался, помогите советом или скриптом, нужно из
 *.doc формата <выдрать> текст, желательно без колонтитулов и таблиц,
 форматирование вопрос второстепенный, этот текст будет дальше
 обрабатываться. Методы значения не имеют, главное результат, и возможность
 организовать обработку без участия человека.
 
 Ответ приветствуется мылом.
 Заранее всем спасибо.
 --- ifmail v.2.15dev4
  * Origin: Technological Systems (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 автоматизировать обработку информации DOC -> TXT   Roman Krashenko   15 Apr 2003 03:45:45 
Архивное /ru.unix.bsd/2515583ee31af.html, оценка 2 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional