Поисковый робот

Резюме: Полуавтоматизированная* система сбора информации с web-ресурсов. В основе работы системы - поисковый робот (краулер, паук).

Функционал: Управление событиями по категориям. Управление источниками событий (могут быть html и rss источники). Краулер. Ключевые слова системы. Тематики системы. Типы мероприятий, формы проведения мероприятий. Поиск и расширенный поиск событий. Rss подписка на события, на результат поиска по определенному запросу, на тегированные события. В основе системы — парсер Nokogiri. Также разработан алгоритм посещения краулером страниц в зависимости от частоты их обновления (от 1 до 24 часов)..

Степень участия: 100%

* - Необходимость прописывания правил для каждого источника вручную.

P.S. Система имеет web-интерфейс. Возможна модификация системы под ваши нужды. Стоимость работы начинается от 100 000 руб в зависимости от сложности ваших условий и обсуждается индивидуально.

Работа в портфолио с 23 мая 2011