|
|
ru.unix- RU.UNIX ---------------------------------------------------------------------- From : Eugene Grosbein 2:5006/1 13 Dec 2004 20:21:46 To : Valery Shishkov Subject : Re: Hе соображу, что сказать wget'у :( --------------------------------------------------------------------------------
13 дек 2004, понедельник, в 19:30 KRAST, Valery Shishkov написал(а):
VS> Ситуация в следующем: есть сайт http://www.realcoding.net. Все странички
VS> свалены у него в одном каталоге. Есть ссылка на страницу
VS> http://www.realcoding.net/articles.php?pid=165, представляющую собой
VS> оглавление книги. Hа этой же страничке есть ссылка на продолжение
VS> оглавления. Hа этих страницах есть ссылки на .html, являющиеся главами
VS> книги. Внутри .html есть ссылки на рисунки, хранящиеся, слава Аллаху, в
VS> каталоге images/.
VS> Мне требуется вытащить обе страницы оглавления и все главы с
VS> рисунками. Крайне желательно, чтобы правильно сконвертировались линки, ибо
VS> просто составить список необходимых страниц и рисунков я и так могу, но
VS> ссылки будут неправильными. Вариант с 'wget -r' не проходит, ибо, как я
VS> уже
VS> сказал, у этого сайта в одном каталоге свалена туева хуча статей, а вся
VS> эта
VS> помойка целиком мне не нужна.
В примерно таком же случае я делел так: вытягивал HTML, из него
посредством grep/sed вырезал нужние URL'ы и скармливал список wget'у
обратно.
Eugene
--- slrn/0.9.8.0 (FreeBSD)
* Origin: Svyaz Service JSC (2:5006/1@fidonet)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.unix/26093e09de0f7.html, оценка из 5, голосов 10
|