УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ
на главную написать письмо карта сайта

Интернет конференция по проблемам теории и практики управления

На этом форуме обсуждаются научные публикации, связанные с применением математических моделей в управлении сложными (большими) системами. Для размещения новой публикации воспользуйтесь ссылкой "Подать статью" сверху. С помощью той же ссылки подаются статьи для публикации в Сборнике "Управление большими системами". Все подаваемые в Сборник статьи автоматически публикуются в этой Интернет-конференции, но можно подать статью в Конференции, не подавая ее в Сборник.

Появление статьи в Интернет-конференции не говорит о том, что она опубликована или будет опубликована в Сборнике "Управление большими системами". Статьи в Интернет-конференции публикуются в первоначальной авторской редакции. Изменения, вносимые в статью редколлегией Сборника в процессе ее рассмотрения, не отображаются автоматически в Интернет-конференции. Авторы статей могут внести соответствующие изменения вручную, разместив ответ на сообщение со своей статьей в Интернет-конференции.

Поиск  Пользователи  Правила 
Закрыть
Логин:
Пароль:
Забыли свой пароль?
Регистрация
Войти  
Выбрать дату в календаре ...  Выбрать дату в календаре

Страницы: 1
Разработка программного конвейера для автоматизированного анализа текста: извлечение ключевых терминов, тематическая кластеризация и аугментация данных, В статье представлен подход к автоматизированному формированию начального семантического словаря на основе произвольных текстов лю-бой тематики для дальнейшей реализации в системе построения онтологий. Разработанная программа, реализованная в среде Jupyte
Название: Разработка программного конвейера для автоматизированного анализа текста: извлечение ключевых терминов, тематическая кластеризация и аугментация данных
Автор: Оксана Игоревна Захарова
Аннотация:
В статье представлен подход к автоматизированному формированию начального семантического словаря на основе произвольных текстов лю-бой тематики для дальнейшей реализации в системе построения онтологий. Разработанная программа, реализованная в среде Jupyter Notebook, обеспечивает автоматизацию процесса анализа текста, исключая необходимость ручной настройки кода при работе с различными предметными областями. Научная новизна исследования заключается в разработке сквозного, предметно-независимого конвейера для предобработки текста, извлечения ключевых терминов и проведения базового статистического и тематического анализа, реализованного в виде готового к использованию инструмента в Jupyter Notebook. Проведённые эксперименты на текстах различной направленности подтвердили эффективность предложенного подхода. В программе предусмотрены дополнительные функции, такие как перемешивание предложений в случайном порядке для создания вариативных версий текста и расчёт нормализованных, логарифмических и ожидаемых частот символов, что расширяет возможности анализа стилистических особенностей авторского языка. Полученные результаты показали высокую точность и гибкость системы, что открывает перспективы для её применения в различных сферах, включая создание систем рекомендаций, анализ больших данных, предсказательную аналитику и семантические исследования текстов. Разработанный метод отличается от традиционных подходов к созданию семантического словаря своей адаптивностью и универсальностью, позволяя эффективно работать с текстами разных размеров и тематик. Это делает программу ценным инструментом для автоматизации анализа текстовой информации и создания в дальнейшем высокоадаптивных онтологий в условиях растущего объёма цифровых данных.
Ключевые слова:
онтология текста, обработка естественного языка, кластеризация, автоматизация, семантический словарь, аугментация
Разработка программного конвейера для автоматизированного анализа текста: извлечение ключевых терминов, тематическая кластеризация и аугментация данных, В статье представлен подход к автоматизированному формированию начального семантического словаря на основе произвольных текстов лю-бой тематики для дальнейшей реализации в системе построения онтологий. Разработанная программа, реализованная в среде Jupyte
Название: Разработка программного конвейера для автоматизированного анализа текста: извлечение ключевых терминов, тематическая кластеризация и аугментация данных
Автор: Оксана Игоревна Захарова
Аннотация:
В статье представлен подход к автоматизированному формированию начального семантического словаря на основе произвольных текстов лю-бой тематики для дальнейшей реализации в системе построения онтологий. Разработанная программа, реализованная в среде Jupyter Notebook, обеспечивает автоматизацию процесса анализа текста, исключая необходимость ручной настройки кода при работе с различными предметными областями. Научная новизна исследования заключается в разработке сквозного, предметно-независимого конвейера для предобработки текста, извлечения ключевых терминов и проведения базового статистического и тематического анализа, реализованного в виде готового к использованию инструмента в Jupyter Notebook. Проведённые эксперименты на текстах различной направленности подтвердили эффективность предложенного подхода. В программе предусмотрены дополнительные функции, такие как перемешивание предложений в случайном порядке для создания вариативных версий текста и расчёт нормализованных, логарифмических и ожидаемых частот символов, что расширяет возможности анализа стилистических особенностей авторского языка. Полученные результаты показали высокую точность и гибкость системы, что открывает перспективы для её применения в различных сферах, включая создание систем рекомендаций, анализ больших данных, предсказательную аналитику и семантические исследования текстов. Разработанный метод отличается от традиционных подходов к созданию семантического словаря своей адаптивностью и универсальностью, позволяя эффективно работать с текстами разных размеров и тематик. Это делает программу ценным инструментом для автоматизации анализа текстовой информации и создания в дальнейшем высокоадаптивных онтологий в условиях растущего объёма цифровых данных.
Ключевые слова:
онтология текста, обработка естественного языка, кластеризация, автоматизация, семантический словарь, аугментация
Страницы: 1

ИПУ РАН © 2007. Все права защищены