Здравствуйте!

Проблемка одна имеется!

Как Вы знаете, есть десятки полезных программ, которые анализируют сайт на валидность ссылок - чтобы они вели к существующим локальным файлам или живым ссылкам интернета. Это здорово!

Однако, так случилось, что передо мной стоит задача обратная - проверить, чтобы все файлы сайта имели соответствующую ссылку.
Иными словами, надо очистить сайт от мусора, убрать все файлы, к которым не идут никакие ссылки.

Вы, полагаю, спросите - а нафига это надо? Ну, лежит на хостинге неприкаянный html или php файл, к которому не идет никакая ссылка - ну кому от этого плохо?

Оказалось, плохо

Когда ищешь, например, через тот же яндекс информацию, то поисковик может находить страницы, которые уже устарели, исключены из структуры сайта, но сами файлы которых живы. Пользователь интернета, таким образом, нажимает на ссылку в результатах поиска и попадает на страницу, которая содержит старую, неправильную информацию. А пользователь должен видеть ошибку 404.

Понятное дело, что через навигацию сайта пользователь старый файл не найдет, а вот через поисковики - пожалуйста!


Вот я и ищу какой-нибудь сайт-валидатор, который сравнит ссылки сайта с файлами сайта и покажет неиспользуемые файлы.

Пока поиски ничего не дали.
Если кто видел подобное - подскажите, пожалуйста, реально надо.

Вдогонку.
Одна идейка, как это сделать, вроде у меня есть. Надо мне, наверное, найти программу пакетного поиска.
Должна же существовать программа, которая ищет в содержимом файлов заданную строку текста.
Если такой программе дать скушать список имен файлов, и дать поискать их в html/php файлах,
неудачные результаты поиска приведут меня к цели.
Да, кто-нибудь видел программы пакетного поиска?