Название статьи: Обзор современного состояния интеллектуальных систем поиска и обработки научной информации
Библиография: Фархадов М.П., Блинова О.В., Керимов С.С. и др. Обзор современного состояния интеллектуальных систем поиска и обработки научной информации // Управление большими системами. - 2026. - Вып. 121. - С.43-81.
Дата опубликования: 31.05.2026
Ключевые слова: интеллектуальные системы поиска, научная информация, методы машинного обучения, многовекторные модели, индексирование, нейронные сети
Аннотация: Представлен систематический обзор современного состояния и перспектив развития интеллектуальных систем поиска и обработки научной информации. Рассмотрена эволюция методов информационного поиска: от классических статистических моделей (BM25, векторная модель, латентно-семантический анализ) и традиционных подходов машинного обучения (наивный Байес, SVM, обучение ранжированию) до глубоких нейросетевых архитектур, включая трансформеры (BERT, SciBERT), многовекторные модели (ColBERT), плотные би-энкодеры (DPR), генеративные методы на основе больших языковых моделей и графовые нейронные сети. Проанализированы ключевые критерии оценки качества поисковых систем: точность, полнота, NDCG, MAP, MRR. Отдельное внимание уделено математическому аппарату, лежащему в основе современных интеллектуальных систем: от булевой алгебры и теории вероятностей до механизмов внимания и контрастивного обучения. Показаны основные направления практического применения: классификация и кластеризация научных документов, рекомендательные системы, извлечение знаний (NER, суммаризация, построение графов знаний), валидация и поддержка воспроизводимости научных результатов. Сделан вывод о целесообразности комбинирования классических и нейросетевых методов для повышения релевантности, адаптивности и интерпретируемости поиска. Подчёркнута ключевая роль комбинирования статистических и нейросетевых подходов для повышения эффективности поиска.
Author(s): Farhadov M., Blinova O., Kerimov S., Boltachev E.
Article title: Review of the current state of intelligent systems for scientific information search and processing
Keywords: intelligent search systems, scientific information, machine learning methods, multi-vector models, indexing, neural networks
Abstract: The article presents a systematic review of the current state and development prospects of intelligent systems for scientific information search and processing. The evolution of information retrieval methods is considered: from classical statistical models (BM25, vector model, latent semantic analysis) and traditional machine learning approaches (naive Bayes, SVM, learning to rank) to deep neural network architectures, including transformers (BERT, SciBERT), multi-vector models (Col-BERT), dense bi-encoders (DPR), generative methods based on large language models, and graph neural networks. Key criteria for evaluating the quality of search systems — precision, recall, NDCG, MAP, MRR – are analyzed. Special attention is paid to the mathematical apparatus underlying modern intelligent systems: from Boolean algebra and probability theory to attention mechanisms and contrastive learning. The main areas of practical application are shown – classification and clustering of scientific documents, recommender systems, knowledge extraction (NER, summarization, knowledge graph construction), validation and support of reproducibility of scientific results. A conclusion is drawn about the feasibility of combining classical and neural network methods to improve relevance, adaptability, and interpretability of search. The key role of combining statistical and neural network approaches for improving search effectiveness is emphasized.
в формате PDF
Просмотров: 31; загрузок: , за месяц: .
Назад