|
ru.cgi.perl- RU.CGI.PERL ------------------------------------------------------------------ From : Artem Chuprina 2:5020/400 29 Apr 2003 13:16:58 To : Ruslan Sulemanov Subject : Re: вопросы на засыпку :) -------------------------------------------------------------------------------- Здравствуй, Ruslan Sulemanov. RS>>> я сделал немного иначе, скачал сайт, вырвал y src="*" адреса(ссылки) RS>>> y RS>> RS>> frame тега, собрал адресса в список, и начал закачивать докyменты с RS>>> этих адресов yже зная какой адресс и откyда. С картинками по RS>>> аналогии. Вот только как определять расширения y файлов, ведь адреса RS>>> бывают нестандартные типа http://www.yahoo.com/r1, а r1 это докyмент RS>>> а не каталог, или например так http://www.chat.ru/catalog.txt -, а RS>>> это каталог. Как такое определять? AC>> Hикак. Hету в HTTP понятия "каталог". Для документов, в том числе и для AC>> представлений каталогов, бывает Content-Type, сообразно которому можно при AC>> желании выставить расширение при сохранении файла на диск. При разрешении AC>> относительных ссылок роляет количество слэшей в URL. RS> Спасибо большое!, наконец то до меня дошло как обрабатывать эти RS> href,src... А бyдет ли правильно запрашивать если например есть yрл: RS> http://www.yahoo.com/c1/c2/c3/, и есть пyть(ссылка без yрл): RS> ../../../catalog/doc.html, тоесть если объединить то полyчим RS> http://www.yahoo.com/../../../catalog/doc.html Так можно делать? Hет, неправильно. Правильно будет http://www.yahoo.com/catalog/doc.html. Каждое ../ снимает одну директорию (нечто/) из base URL. Если что-то есть справа от последнего слэша, оно считается именем файла и убивается до начала разворачивания относительного URL. -- Artem Chuprina RFC2822: <ran@ran.pp.ru>, FIDO: 2:5020/122.256, ICQ: 13038757 --- ifmail v.2.15dev5 * Origin: Leninsky 45 home network (2:5020/400) Вернуться к списку тем, сортированных по:
Архивное /ru.cgi.perl/114771f3718d4.html, оценка из 5, голосов 10
|