Главная страница


ru.perl

 
 - RU.PERL ----------------------------------------------------------------------
 From : Artem Chuprina                       2:5020/400     10 Jun 2003  17:22:15
 To : "Dmitri A. Martynoff"
 Subject : Re: Поиск неработающих ссылок на сайте
 -------------------------------------------------------------------------------- 
 
 Хмутро.
 
 DAM> 1.  Прочитать заданную страницу вебсайта.
 DAM> 2.  Hайти на ней все ссылки на другие страницы этого сайта.
 DAM> 3.  Для каждой ссылки:
 DAM>     а) Прочитать соответствующую страницу;
 DAM>     б) В случае получения 404-й или 500-й ошибки - записать в лог, на какой
 DAM> странице обнаружена ошибочная ссылка, и какая именно;
 DAM>     в) В случае успешного прочтения, рекурсивно, п.2.
 
 DAM>     В принципе написать не проблема, но, если вдруг есть что-то готовое,
 DAM> зачем изобретать велосипед? Если кто знает, сообщите, пожалуйста, где можно
 DAM> скачать.
 DAM>     И как быть в случае усложненного варианта: если сервер не возвращает
 DAM> код ошибки, а делает редирект на страницу с сообщением об ошибке?
 
 И в том, и в другом случае use LWP::Simple и алгоритм обхода по вкусу. В
 "усложненном" варианте ты просто вместо кода анализируешь, куда тебя
 отредиректили (заголовок Location). Правда, куда редиректит данный конкретный
 сервер, надо знать.
 
 -- 
 Artem Chuprina
 RFC2822: <ran@ran.pp.ru>, FIDO: 2:5020/122.256, ICQ: 13038757
 --- ifmail v.2.15dev5
  * Origin: Leninsky 45 home network (2:5020/400)
 
 

Вернуться к списку тем, сортированных по: возрастание даты  уменьшение даты  тема  автор 

 Тема:    Автор:    Дата:  
 Поиск неработающих ссылок на сайте   Dmitri A. Martynoff   10 Jun 2003 16:38:42 
 Re: Поиск неработающих ссылок на сайте   Artem Chuprina   10 Jun 2003 17:22:15 
Архивное /ru.perl/11477eeee47cb.html, оценка 1 из 5, голосов 10
Яндекс.Метрика
Valid HTML 4.01 Transitional