Публикация
Слово о ТИЦ
Навеяно этой темой и темой на нулледе.
Что за базы такие «дженах» я не знаю, но подозреваю, что это:
1. Успешные после прогона вот этой программки
2. Сайты с xss
3. ХЗ что – палите, господа, все сделаем
По-быстрому прогнал новый сат, сделал замену {website} на урл, насобирал сайтов с «потенциальным xss», выделил те, которые действительно подвержены (получилось около 500 штук xss – парсил только по 1 запросу, в подробности не вдавался).
Написал простую аддурилку, которая специально обучена добавлять такие линки в яшку (обычные линки тоже запросто добавляет) и собственно потратил примерно 1$ на антикаптче.
Если будут положительные результаты в виде ТИЦ – насобираю базу по-больше.
Скачать мою аддурилку можно тут.
Как работать:
1. Положить в файл to-addurl.txt линки. Положить в файл proxy.txt прокси (socks5).
2. запустить прогу, вставить ключ антигейта и жмакнуть старт.
3. после завершения работы будут сформированы файлы good_l.txt – все успешно добавленные линки, problem.txt – проблемные урлы (сайт является зеркалом, запрещен к индексации и тд – в файле напротив каждого урла будет стоять соответствующее сообщение).
Как говорится, have fun!
вопросы – в комменты.
14 пользователя прокомментировали «Слово о ТИЦ»
Ты очень крут! Спасибо за вещи, которые ты делаешь и рассказываешь!
А ты сам уже использовал? Какой это дает результат по пузомеркам, если гонять по твоей базе?
Хаха, а у многих «оптиммизаторов» мозга как небыло так и нет. Им уже дали рабочий инструмент что да как делать, а они всеравно тупят и делают ногами
Вот к примеру посмотреть на инфу о сайте http://www.buyingbiz.com/value/www.for-ua.com и там справа в колонке «Ukraine Top 40 Sites»
- у кучи сайтов в домене написано {website} ))
http://i9.fastpic.ru/big/2010/0815/f6/c332c17793f3d6e21742203cb7c77ff6.jpeg
Lady BOMZH, не пользовался. В посте же написано, что прогнал 1 сат, дабы посмотреть на резалты
Попробуем. Как я эту новость пропустила? RSS вроде мониторю. Спасибо!
Ещё б прогу для добавления результатов в аддурилку гугла… я для яндекса нашла, а для гугля нету чего-то:(
Да, «дженах» это оно и есть. Только изначально сформированные адреса не в аддурилку пихались, а в контент, подготавливаемый WPT вставлялись.
З.Ы. Google так на этот финт и не повёлся
ага, так и думал
В файле urls заменил {website} на свой сайт,но линки в good шпарит все равно с этим {website}. Как исправить?
xrumer, это ты по какой проге вопрос задал?
что то не пойму.
ну и как, есть ли результат от этой темы?
seoneophyte у меня результатов нет
Подскажите,как собиралась первоначальная база ? Какие использовались признаки для парсинга ?
Подскажите,как собирали базы ? Какие признаки использовали ?