Как собрать большую базу немодерируемых форумов для Xrumer. Part 1 (без парсера).


В этой статье я хотел поделиться небольшим секретом, который при должном подходе поможет вам собрать большу базу форумов для постинга программой Xrumer. В современных реалиях ситуация в поисковый выдаче очень изменчивая и неоднозначная, но вебспам по прежнему дает неплохие результаты.  Итак, как же собрать качественную базу форумов для постинга бесплатно?

Речь пойдет о полностью бесплатном методе для парсинга такой базы, которая принесет существенный результат, но без затрат на парсеры, прокси и.т.д.

Прежде всего убедимся, что базы, которые будут собраны, действительно могут дать эффект, та как у многих может возникнуть сомнение в этом. Посмотрим в топ Гугла https://www.google.fr/ по запросу Acheter propecia.  По данному кею в топе сидит дор на бесплатном хостинге webnode.fr. Давайте посмотрим его беклинки через ahrefs (чтобы понять суть хватит и бесплатной версии). Видим, что беков крайне много, но уникальных доменов всего 2,5K:

1

После тщательного анализа беков можно сказать, что огромное кол-во ссылок проставлено с форумов, а большинство с одного форума, но с разных топиков. Благодаря этим ссылкам дор прочно закрепился в топе.

2

Форумный спам по прежнему дает отличные результаты, но не все знают как собрать свою базу без классических методов парсинга Google или других поисковых системы. Парсинг ПС безусловно может принести гораздо больше «жирных» ресурсов, но для этого дела необходимо иметь необходимые навыки и большой список приватных прокси. Но мы пойдем другим путем в этом нам помогут сами спамеры и софт для сбора исходящих ссылок с сайта. Многие люди, которые спамят форумы очень часто перелинковывают свои топики на разных форумах. Таким образом в одном спамном топике можно встретить до 10 ссылок на другие форумы. Наша задача пройтись по всем страницам форума и собрать все ссылки. Часть из них будет на дорвеи, а часть на другие форумы. Но обо все по порядку.

В первую очередь нам нужно найти форум, с которого мы будем парсить ссылки. Для этого возьмем, какой-нибудь низкочастотный фарма кей. Почему именно фарма? Да потому что это дает 100% гарантию, что этот форум уже давно и полностью обработан нашими коллегами. Итак, идем в гугл и вбивает запрос «best price clozaril in internet priority mail at whitstable». Видим, что на первых 4 позициях сидят топики на форумах. Первые 3 форума не работают на момент публикации, открываем четвертый и видим что в данном топике есть несколько ссылок на другие форумы.

clozaril

Теперь нам нужна программа, которая обойдет все топики на этом форуме и соберет нашу базу из немодерируемых, но отлично пробиваемых ресурсов.  Лично я для этих целей использую Xenu Links — она бесплатная и очень простая в использовании (Скачать с официального сайта). Качаем и устанавливаем.

Далее запускаем программу и открываем Options:

4

Нам интересны только 2 пункта:

— Parallel Threads — во сколько потоков софт будет работать (все зависит от вашего железа, в частности оперативной памяти)

— Maximum depth — максимальная глубина прохода по сайту, то есть на сколько страниц в глубь будет идти парсинг. Чем заспамленней форум, тем больше стоит ставить глубину. Обычно 999 хватает с головой.

Далее нажимаем кнопку «новый проект», вставляем урл найденного спам топика и отмечаем галкой пункт «check external links».

xenu

Начнется проход по форумы и сбор ссылок. Это может занять довольно много времени, поэтому дальше ждем. После окончания парсинга можно сделать экспорт данных и почистить их от мусора.

6

В результате у нас получится база со всеми внутренними и внешними ссылками данного форума. На данном этапе пока их фильтровать не нужно — все получиться дальше само собой.

1. Будем оставлять только ссылки без данных по статистики. Для этого нам понадобиться Notepad ++ и его регулярные выражения (скачать можно здесь — http://notepad-plus-plus.org/). Открываем его, выделяем первый пробел после любой ссылки и жмем CTRL + H, далее используем следующие настройки:

7

Это регулярное выражение уберет весь текст, который идет после пробела, в итоге мы получим чистый файл с одним ссылками.

2. Задача номер два — удалить дубли. Можно воспользоваться встроенным инструментом самого Xrumer’a, а можно использовать бесплатную утилитой ReDoubler (скачать можно на сайте автора — http://solutionfix.org/soft/doublers/ )

8

На выходе имеем только линки с уникальными доменами.

3. И последняя, но самая важная часть — отобрать из всех ссылок только ссылки на форумы.  Для этого необходимо сделать выборку. Ее мы будем производить с помощью программы KeyWordKeeper (качаете на сайте — http://newox.ru/kwk.php ). Делать нужно выборку из ссылок, а за основу выборки берете признаки форумов. То есть те урлы, в которых они будут – останутся. Запускаете софт и выбираете опцию – Создание выборки.

9

Большой список признаков можно скачать здесь.

В итоге, используя всего четыре программы и без прокси, мы получаем отличную базу форумов для Хрумера.

Так же рекомендую вам ознакомиться со второй частью данной статьи, посвященной сборе ссылок с помощью сервиса Google Alerts — Как собрать большую базу немодерируемых форумов для Xrumer. Part 2 (Google Alerts).

Понравилась статья? Подпишитесь на обновления и получайте только интересную информацию о белом и черном SEO, дорвеях, наращивании ссылочной массы, продвижении и зароботке, а также многое другое! Все основано исключительно на собственном опыте и проверено лично.


Обсуждение закрыто.