|
|
Интернет конференция по проблемам теории и практики управления
На этом форуме обсуждаются научные публикации, связанные с применением математических моделей в управлении сложными (большими) системами. Для размещения новой публикации воспользуйтесь ссылкой "Подать статью" сверху. С помощью той же ссылки подаются статьи для публикации в Сборнике "Управление большими системами". Все подаваемые в Сборник статьи автоматически публикуются в этой Интернет-конференции, но можно подать статью в Конференции, не подавая ее в Сборник.
Появление статьи в Интернет-конференции не говорит о том, что она опубликована или будет опубликована в Сборнике "Управление большими системами". Статьи в Интернет-конференции публикуются в первоначальной авторской редакции. Изменения, вносимые в статью редколлегией Сборника в процессе ее рассмотрения, не отображаются автоматически в Интернет-конференции. Авторы статей могут внести соответствующие изменения вручную, разместив ответ на сообщение со своей статьей в Интернет-конференции.
Cообщений: 2
Регистрация: 25.02.2026
|
Название: Разработка программного конвейера для автоматизированного анализа текста: извлечение ключевых терминов, тематическая кластеризация и аугментация данных Автор: Оксана Игоревна Захарова Аннотация: В статье представлен подход к автоматизированному формированию начального семантического словаря на основе произвольных текстов лю-бой тематики для дальнейшей реализации в системе построения онтологий. Разработанная программа, реализованная в среде Jupyter Notebook, обеспечивает автоматизацию процесса анализа текста, исключая необходимость ручной настройки кода при работе с различными предметными областями. Научная новизна исследования заключается в разработке сквозного, предметно-независимого конвейера для предобработки текста, извлечения ключевых терминов и проведения базового статистического и тематического анализа, реализованного в виде готового к использованию инструмента в Jupyter Notebook. Проведённые эксперименты на текстах различной направленности подтвердили эффективность предложенного подхода. В программе предусмотрены дополнительные функции, такие как перемешивание предложений в случайном порядке для создания вариативных версий текста и расчёт нормализованных, логарифмических и ожидаемых частот символов, что расширяет возможности анализа стилистических особенностей авторского языка. Полученные результаты показали высокую точность и гибкость системы, что открывает перспективы для её применения в различных сферах, включая создание систем рекомендаций, анализ больших данных, предсказательную аналитику и семантические исследования текстов. Разработанный метод отличается от традиционных подходов к созданию семантического словаря своей адаптивностью и универсальностью, позволяя эффективно работать с текстами разных размеров и тематик. Это делает программу ценным инструментом для автоматизации анализа текстовой информации и создания в дальнейшем высокоадаптивных онтологий в условиях растущего объёма цифровых данных. Ключевые слова: онтология текста, обработка естественного языка, кластеризация, автоматизация, семантический словарь, аугментация
|
|
|
|
Cообщений: 2
Регистрация: 25.02.2026
|
Название: Разработка программного конвейера для автоматизированного анализа текста: извлечение ключевых терминов, тематическая кластеризация и аугментация данных Автор: Оксана Игоревна Захарова Аннотация: В статье представлен подход к автоматизированному формированию начального семантического словаря на основе произвольных текстов лю-бой тематики для дальнейшей реализации в системе построения онтологий. Разработанная программа, реализованная в среде Jupyter Notebook, обеспечивает автоматизацию процесса анализа текста, исключая необходимость ручной настройки кода при работе с различными предметными областями. Научная новизна исследования заключается в разработке сквозного, предметно-независимого конвейера для предобработки текста, извлечения ключевых терминов и проведения базового статистического и тематического анализа, реализованного в виде готового к использованию инструмента в Jupyter Notebook. Проведённые эксперименты на текстах различной направленности подтвердили эффективность предложенного подхода. В программе предусмотрены дополнительные функции, такие как перемешивание предложений в случайном порядке для создания вариативных версий текста и расчёт нормализованных, логарифмических и ожидаемых частот символов, что расширяет возможности анализа стилистических особенностей авторского языка. Полученные результаты показали высокую точность и гибкость системы, что открывает перспективы для её применения в различных сферах, включая создание систем рекомендаций, анализ больших данных, предсказательную аналитику и семантические исследования текстов. Разработанный метод отличается от традиционных подходов к созданию семантического словаря своей адаптивностью и универсальностью, позволяя эффективно работать с текстами разных размеров и тематик. Это делает программу ценным инструментом для автоматизации анализа текстовой информации и создания в дальнейшем высокоадаптивных онтологий в условиях растущего объёма цифровых данных. Ключевые слова: онтология текста, обработка естественного языка, кластеризация, автоматизация, семантический словарь, аугментация
|
|
|
|
|