С ПРЕОБРАЗОВАНИЕМ ДАННЫХ И ИСПОЛЬЗО-ВАНИЕМ МЕТРИКИ L1
Автор: Татьяна Валерьяновна Золотова
Соавторы:
Виктор Александрович Горелик
Аннотация:
Рассматривается линейная задача регрессионного анализа в предположении наличия шумов в выходной и входных переменных, т.е. задача построения аффинной функции, которая в некотором смысле описывает наилучшим образом исходные данные. Геометрическая интерпретация заключается в построении гиперплоскости в (n+1)-мерном пространстве, которая проходит ближе всех к заданным точкам в смысле выбранной меры близости. Эта задача аппроксимации может также интерпретироваться как несобственная (не имеющая решения) задача интерполяции, для которой требуется оптимальным образом изменить (скорректировать) положения точек так, чтобы они все лежали на одной гиперплоскости. Для оценки меры аппроксимации (коррекции) исходных данных использована метрика l1, которая имеет вероятностное обоснование как метод максимального правдоподобия при двустороннем экспоненциальном распределении шумов. Кроме того, рассматривается случай необходимости предварительного линейного преобразования данных, притом, что коррекции подлежит исходная информационная матрица. Поэтому возникающие задачи относятся к новому классу параметрической коррекции. Показано, что эти задачи аппроксимации (коррекции) сводится к совокупности конечного числа задач линейного программирования.
Ключевые слова:
обработка данных, регрессионный анализ, матрица коррекция, метод максимального правдоподобия, экспоненциальное распределение