Datacol — универсальный сетевой парсер. Основным назначением программы является сбор данных о товарах в интернет магазинах, парсинг досок объявлений и прочих подобных ресурсов. Он работается с самыми разными CMS (WordPress, Joomla, DLE итак далее), а также предоставляет подробные отчеты по собранной информация, автоматически сортируя ее в соответствии с заданными параметрами. Отчеты могут формироваться как видео текстовых файлов (XML, CVS? XLS), так и в виде баз данных (SQLite, MySQL) при парсинге изображений и прочей мультимедийной информаций.
Для начала работы с программой необходимо создать новую кампанию, указав перечень используемых ресурсов и типы данных которые будут собраны. Людям, которые не особо разбираются в строении веб-страниц будет полезен визуальный инструмент выбора необходимой информации под названием Datacol Picker. Кроме парсинга содержимого сайта, программа работает также с поисковой выдачей Google и Яндекса. Для выполнения некоторых задач ей может потребоваться подключение сторонних сервисов для распознавания «капчи». Программа может анализировать ресурсы и составлять списки входящих и исходящий ссылок. Из-за этого она может стать отличным помощником не только веб-мастеру, но и SEO-оптимизатору.
Помимо сбора данных, программа выполняет их экспорт на сторонние сайты. Вообще базовый функционал Datacol можно значительно расширить путем использования плагинов. Например, существует огромное количество плагинов для осуществления машинного перевода текста с использование сервисов PROMT и Google Translate, плагины для транслитерации полей, плагины для превращения иконок в SVG, огромный набор SEO-плагинов, расширения для конкретных платформ (вроде того, что предназначено для парсинга записей с форумов vBulletin) или даже для работы с конкертными интернет-площадками (Avito, Яндекс.Маркет и так далее). В общем, библиотека плагинов очень обширная и большинство из них, в отличие от самой Datacol, являются совершенно бесплатными.
Ключевые ососбенности
- сбор самой разной информации из сети, а также ее последующая «упаковка» в текстовые отчеты и в базы данных;
- работа с самыми разными CMS;
- инструмент для визуального выбора данных, которые нужно «парсить»;
- создание нескольких кампаний по сбору информации с указанного перечня веб-ресурсов;
- огромная библиотека плагинов для работы с конкретными интернет-площадками, SEO-анализа и автоматического преобразования собранных данных;
- тонкая настройка каждой запущенной кампании.