УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ
на главную написать письмо карта сайта

Интернет конференция по проблемам теории и практики управления

На этом форуме обсуждаются научные публикации, связанные с применением математических моделей в управлении сложными (большими) системами. Для размещения новой публикации воспользуйтесь ссылкой "Подать статью" сверху. С помощью той же ссылки подаются статьи для публикации в Сборнике "Управление большими системами". Все подаваемые в Сборник статьи автоматически публикуются в этой Интернет-конференции, но можно подать статью в Конференции, не подавая ее в Сборник.

Появление статьи в Интернет-конференции не говорит о том, что она опубликована или будет опубликована в Сборнике "Управление большими системами". Статьи в Интернет-конференции публикуются в первоначальной авторской редакции. Изменения, вносимые в статью редколлегией Сборника в процессе ее рассмотрения, не отображаются автоматически в Интернет-конференции. Авторы статей могут внести соответствующие изменения вручную, разместив ответ на сообщение со своей статьей в Интернет-конференции.

Поиск  Пользователи  Правила 
Закрыть
Логин:
Пароль:
Забыли свой пароль?
Регистрация
Войти  
Выбрать дату в календаре ...  Выбрать дату в календаре

Страницы: 1
Обзор веб-краулеров для решения задачи сбора данных о представительских сайтах заданной предметной области, В данной статье произведен обзор существующих и наиболее используемых, на сегодняшний день, веб-краулеров с открытым исходным кодом или доступных в виде краулер-сервисов, инструментов для сбора и анализа данных, извлекаемых с представительских сайтов зада
Название: Обзор веб-краулеров для решения задачи сбора данных о представительских сайтах заданной предметной области
Автор: Екатерина Михайловна Пудикова
Аннотация:
В данной статье произведен обзор существующих и наиболее используемых, на сегодняшний день, веб-краулеров с открытым исходным кодом или доступных в виде краулер-сервисов, инструментов для сбора и анализа данных, извлекаемых с представительских сайтов заданной предметной области. Рассмотренные инструменты категоризованы согласно набору требований, предъявляемых к ним при решении практических задач, и относительно ограничений, наложенных задачей, рассматриваемой в рамках текущего исследования. Произведенный анализ позволил выявить три наиболее подходящих инструмента сбора данных и остановить выбор на краулере Apache Nutch.
Ключевые слова:
Apache Nutch, веб-краулер, сравнительный анализ краулеров, краулер как сервис
Страницы: 1

ИПУ РАН © 2007. Все права защищены