УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ
на главную написать письмо карта сайта

Интернет конференция по проблемам теории и практики управления

На этом форуме обсуждаются научные публикации, связанные с применением математических моделей в управлении сложными (большими) системами. Для размещения новой публикации воспользуйтесь ссылкой "Подать статью" сверху. С помощью той же ссылки подаются статьи для публикации в Сборнике "Управление большими системами". Все подаваемые в Сборник статьи автоматически публикуются в этой Интернет-конференции, но можно подать статью в Конференции, не подавая ее в Сборник.

Появление статьи в Интернет-конференции не говорит о том, что она опубликована или будет опубликована в Сборнике "Управление большими системами". Статьи в Интернет-конференции публикуются в первоначальной авторской редакции. Изменения, вносимые в статью редколлегией Сборника в процессе ее рассмотрения, не отображаются автоматически в Интернет-конференции. Авторы статей могут внести соответствующие изменения вручную, разместив ответ на сообщение со своей статьей в Интернет-конференции.

Поиск  Пользователи  Правила 
Закрыть
Логин:
Пароль:
Забыли свой пароль?
Регистрация
Войти  
Выбрать дату в календаре ...  Выбрать дату в календаре

Страницы: 1
КЛАСТЕРИЗАЦИЯ ТЕКСТОВ ФИНАНСОВЫХ СООБЩЕНИЙ, Работа посвящена задаче кластеризации текстов финансовых сообщений алгоритмами машинного обучения. С помощью алгоритмов кластеризации можно выделить группы похожих финансовых сообщений, выделить среди них однотипные или подозрительные, а также использоват
Название: КЛАСТЕРИЗАЦИЯ ТЕКСТОВ ФИНАНСОВЫХ СООБЩЕНИЙ
Автор: Антон Александрович Егоркин
Соавторы:
Работа выполнена под руководством научного руководителя - Губанова Д.А.
Аннотация:
Работа посвящена задаче кластеризации текстов финансовых сообщений алгоритмами машинного обучения. С помощью алгоритмов кластеризации можно выделить группы похожих финансовых сообщений, выделить среди них однотипные или подозрительные, а также использовать в дальнейшем анализе найденные кластеры, а не сами тексты сообщений. В работе используются такие алгоритмы кластеризации как: K-means, DBSCAN и Иерархический метод кластеризации.
В качестве текстов финансовых сообщений в работе используется информация о банковских транзакциях. Ввиду того, что банковские проводки подчинены строгим правилам бухгалтерского учета, устанавливаемым Банком России, представляется возможным ввести метрику оценки качества кластеризации. Данная метрика позволяет ранжировать между собой качество кластеризации с помощью алгоритмов машинного обучения, а также подобрать параметры, используемые при обучении данных моделей. Отдельное внимание в статье уделено особенностям используемых данных, и тому, каким образом эти особенности могут быть учтены в практической части.
В практической части работы приводятся результаты применения моделей кластеризации с указанием оптимальных параметров данных алгоритмов. В заключении делается вывод о лучших алгоритмах кластеризации применительной к финансовым текстам.
Ключевые слова:
K-means, DBSCAN, Иерархический метод кластеризации, кластеризация финансовых сообщений.
ОПРЕДЕЛЕНИЕ ЦЕНТРАЛЬНОСТИ ГРАФА АЛГОРИТМОМ PAGERANK С УЧЕТОМ ВЕСОВ СВЯЗЕЙ, Работа посвящена нахождению центральности узлов взвешенных графов с учетом веса связей. Актуальность этой задачи обусловлена тем, что игнорирование весов дуг графа при нахождении центральности его узлов недопустимо для ряда прикладных задач. Предложен мет
Название: ОПРЕДЕЛЕНИЕ ЦЕНТРАЛЬНОСТИ ГРАФА АЛГОРИТМОМ PAGERANK С УЧЕТОМ ВЕСОВ СВЯЗЕЙ
Автор: Антон Александрович Егоркин
Соавторы:
Работа выполнена под руководством научного руководителя - Губанова Д.А.
Аннотация:
Работа посвящена нахождению центральности узлов взвешенных графов с учетом веса связей. Актуальность этой задачи обусловлена тем, что игнорирование весов дуг графа при нахождении центральности его узлов недопустимо для ряда прикладных задач. Предложен метод определения центральности узлов сети, базирующийся на алгоритме PageRank. Проведено сравнение предлагаемой меры с иными мерами центральности.
Ключевые слова:
центральность PageRank, цепи Маркова, взвешенный направленный граф.
Страницы: 1

ИПУ РАН © 2007. Все права защищены