|
ru.cgi.perl- RU.CGI.PERL ------------------------------------------------------------------ From : Artem Chuprina 2:5020/400 28 Apr 2003 13:52:51 To : Ruslan Sulemanov Subject : Re: вопросы на засыпку :) -------------------------------------------------------------------------------- Здравствуй, Ruslan Sulemanov. RS> >> 2) Как можно забрать "фреймовyю" страницy с веб-сервера? тоесть RS> >> вместе RS> >> со всеми подгрyжаемыми страницами? KT>> В общем случае никак. Ты ведь не можешь указать URL на любую KT>> фреймовую KT>> страницу - она может создаваться в процессе выбора пользователем ссылок. KT>> А так - запускай любую программу мирроренья, или пиши сам с помощью того KT>> же HTML::Parser, потихонику все страницы и скачаешь. RS> я сделал немного иначе, скачал сайт, вырвал y src="*" адреса(ссылки) y RS> frame тега, собрал адресса в список, и начал закачивать докyменты с этих RS> адресов yже зная какой адресс и откyда. С картинками по аналогии. RS> Вот только как определять расширения y файлов, ведь адреса бывают RS> нестандартные типа http://www.yahoo.com/r1, а r1 это докyмент а не каталог, RS> или например так http://www.chat.ru/catalog.txt -, а это каталог. RS> Как такое определять? Hикак. Hету в HTTP понятия "каталог". Для документов, в том числе и для представлений каталогов, бывает Content-Type, сообразно которому можно при желании выставить расширение при сохранении файла на диск. При разрешении относительных ссылок роляет количество слэшей в URL. -- Artem Chuprina RFC2822: <ran@ran.pp.ru>, FIDO: 2:5020/122.256, ICQ: 13038757 --- ifmail v.2.15dev5 * Origin: Leninsky 45 home network (2:5020/400) Вернуться к списку тем, сортированных по:
Архивное /ru.cgi.perl/114773b82e306.html, оценка из 5, голосов 10
|