Содержание
-
Метод главных компонент и его применение
Работу выполнил студент 4 курса 7 группы Стец Вадим
-
Содержание метода главных компонент
Метод главных компонент в настоящее время представляет эффективный аппарат комплексного анализа геоданных, и его программное обеспечение является составной частью многих компьютерных технологий по обработке геофизической информации. Математической моделью метода служит, как и для корреляционно-регрессионного анализа, система случайных величин. При этом каждая случайная величина обычно содержит n – наблюдений, т.е. исходный массив геоданных представлен матрицей X размерностью n * N : В качестве числа N может быть число профилей съемки, и тогда с помощью главных компонент решается задача оценки регионального тренда (региональной составляющей). Если число N представлено совокупностью различных методов и атрибутов, то путем метода главных компонент решается задача комплексного анализа по разделению исследуемой территории на классы. Значение n определяет число точек наблюдений по отдельным профилям съемки. Суть метода главных компонент состоит в переходе от системы случайных величин к новой системе случайных величин , ориентируясь на поведение дисперсий yi. При этом главная компонента определяется как линейнаякомбинация исходных случайных величин xi, (1.1) причем первая главная компонента y1 :, обладает максимальной дисперсией среди всех возможных линейных комбинаций вида (1.1).
-
Величины a ij являются коэффициентами перехода от одной системы случайныхвеличин xi к другой системе случайных величин yi. Дисперсии линейных комбинаций yiрасполагаются в убывающем порядке, т.е.: Переход от системы величин xiк системе yjсопровождается нормировкойкоэффициентов aij в виде: Математически метод главных компонент сводитсялибо к вычислению ковариационной матрицы В системы случайных величин xi, есливсе xiизмерены в одних и тех же единицах, либо к вычислению корреляционнойматрицы R, если случайные величины xiизмерены в разных физических единицах. Первый случай соответствует измерениям одного и того же поля по N-профилямсъемки, второй случай соответствует измерениям N-разных полей и (или) их атрибутов.Далее для матрицы В или матрицы R находятся их собственные значения λ1исоответствующие этим собственным значениям собственные векторы, которымиявляются коэффициенты перехода a ij . Обычно ограничиваются вычислением первых двух-трех главных компонент,поскольку в этих компонентах сосредоточена основная энергия исходных данных. Физическое истолкование главных компонент является весьма неоднозначным.Однако первая главная компонента практически всегда имеет однозначноеистолкование, поскольку ее дисперсия отражает основную энергию поля при обработкеданных по площади или энергию нескольких полей и (или) их атрибутов прикомплексном анализе данных.
-
Метод главных компонент при оценке региональнойсоставляющей поля
Выделение регионального тренда является распространенной процедурой обработки практически для всех методов геофизики. Однако при решении этой задачи приходится задавать те или иные параметры. Так, при осреднении поля в скользящем окне надо задать размеры окна, при пересчете поля на высоту надо задать высоту пересчета, при оценке региональной составляющей путем регрессии надо задать степень полинома регрессии и т.д. Метод главных компонент не требует задания той или иной априорной информации. Единственное предположение, при котором происходит применение метода главных компонент, состоит в том, что региональная составляющая обладает наибольшей дисперсией по сравнению с локальными составляющими, что обычно на практике выполняется. Алгоритм оценки региональной составляющей на основе метода главных компонент сводится к реализации следующих процедур: 1.Вычисление средних значений поля по каждому профилю , где n – число точек наблюдений, i=1,…….N, N – число профилей, и ковариаций данных различных пар профилей : Поскольку система x1,….x N представлена измерениями одного и того же поля, нет необходимости рассчитывать коэффициенты корреляции, которые используются при комплексном анализе данных, измеренных в разных физических единицах.
-
1) Вычисление средних значений поля по каждому профилю , где n – число точек наблюдений, i=1,…….N, N – число профилей, и ковариаций данных различных пар профилей : Поскольку система x1,….x N представлена измерениями одного и того же поля, нет необходимости рассчитывать коэффициенты корреляции, которые используются при комплексном анализе данных, измеренных в разных физических единицах.
-
2) Составление ковариационной матрицы исходных данных по их коэффициентам ковариаций bij: Матрица В симметрична относительно главной диагонали, т.е. , а по диагонали расположены дисперсии значений поля каждого профиля.
-
3) Нахождение максимального собственного значения λmax из уравнения: т.е. после раскрытия определителя из этого уравнения достаточно найти его корень с максимальным значением λmax.
-
4) Вычисление значений собственного вектора матрицы (B-λmax*I), соответствующего максимальномусобственному значениюλmax из системы линейныхуравнений Значения собственного вектораопределяются с учетом нормировки Физический смысл этой нормировки состоит в том, чтобы преобразованные данные, т.е. значения региональной составляющей, не отличались бы по масштабу от исходных значений поля, а физический смысл значенийзаключается в определениивесовых коэффициентов для каждого профиля.
-
5) Нахождение значений первой главной компоненты , то есть Физический смысл значений первой главной компонентысостоит в том, что они определяют весовые коэффициенты для каждого пикета исходных данных, аналогично тому, как значения определяют весовые коэффициенты для каждого профиля съемки.
-
6) Оценка региональной составляющей исходного поля характеризующейся наибольшей дисперсией. Эта оценка равна произведению вектора-столбца на вектор-строку с добавлением к каждому элементу образующейся матрицы среднего значения поля по профилю , то есть Поскольку значения представляют оценку региональной составляющей, то разность оценивает поле локальных составляющих.
-
Эффективность метода главных компонент иллюстрируется на (рис.3.1) , на котором приведены исходное поле силы тяжести (а), оценка региональной составляющей (б) и локальная составляющая (в). Пунктиром на рисунке показана область рудного объекта.
-
Метод главных компонент эффективен при обработке данных на достаточно ограниченных площадях, поскольку не учитывается изменение корреляционных свойств, т.е. структуры корреляционных матриц, по площади. Следует отметить эффективность применения метода главных компонент при решении задач интерполяции. При этом задача интерполяции физического поля, представленного в виде функции двух переменных x и y, сводится к интерполяции функций, зависящих от одного аргумента. Однако чаще всего метод главных компонент используется при решении задач комплексного анализа данных.
-
Ну всё, чё
Нет комментариев для данной презентации
Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.