Применение сингулярной матрицы в химии
· поиск неизмеряемых факторов, отражающих те физико-химические свойства, которые оказываются слишком сложными для точного моделирования, например, таких, как:
а) времена задержки для хроматографии;
б) данные по химическому сдвигу;
в) константы равновесия и кинетические константы;
г) данные по степени превращения и селективности.
Интерпретация этих факторов может высветить новые явления или подчеркнуть те физические свойства, которые помогут объяснить исходные наблюдения:
· сведение наборов химических данных с большим числом переменных (которые часто коррелируют, а иногда и избыточны) к наборам с меньшим числом независимых переменных. Каждая точка будет характеризоваться меньшим числом новых переменных, которые затем могут быть использованы для модельных исследований. Этот метод можно применять для многокомпонентных природных продуктов со сложными физико-химическими свойствами (эфирные масла, продукты из сырой нефти и т. д.), а также для замеренных в ходе процесса наборов данных;
· анализ многомерных наборов химических данных посредством графического представления объектов и переменных в векторном подпространстве с меньшим числом измерений. Подобное представление позволяет осуществить обзор всего набора данных для классификации объектов и объяснения их положения.
Цель данного пункта моего реферата — введение в методы факторного анализа с рассмотрением его теоретических основ и практических приложений.
Факторный анализ (ФА), анализ главных компонент (МГК) и факторный дискриминантный анализ (ФДА) будут представлены на различных специально подобранных примерах, иллюстрирующих множество областей их применения.
2.2. Операции с матрицами и многомерный анализ данных
Применение линейной алгебры в анализе данных будет проиллюстрировано на примере УФ-спектроскопии сложной смеси. В соответствии с законом Ламберта — Бера при данной частоте v полное поглощение образца, состоящего из l поглощающих компонентов, определяется как
, где – молярный коэффициент поглощения компонента j, а – молярная концентрация компонента j.
Если измерение проводится при п различных частотах, тогда единственное уравнение заменяется системой линейных уравнений
С использованием матриц следующую систему линейных уравнений можно записать в виде:
Для дальнейшего упрощения выражения запишем матрицу поглощения (А) как произведение матриц коэффициентов экстинкции () и концентрации (С):
(A) = () (C)
Следует отметить, что матричные расчеты и их компьютерное применение дали толчок быстрому развитию многомерного анализа данных.
2.3. Свойства сингулярной матрицы
Матрица (X—Х)'(Х—) —квадратная, симметричная и положительно определенная. Такие матрицы проявляют некоторые свойства, особенно полезные при анализе данных:
· собственные значения, действительные, а также положительные или равные нулю;
· число ненулевых собственных значений равняется рангу матрицы;
· два собственных вектора, связанные с двумя различными собственными значениями ортогональны.
В качестве иллюстрации этих свойств, а также чтобы показать их важность при анализе данных можно взять матрицу дисперсий-ковариаций и определим собственные значения матрицы методом наименьших квадратов.
Решая уравнение, получаем два собственных значения:
= 0 ,
что дает =1 и =0,6.
Как , так и действительны и положительны. Ранг матрицы должен равняться 2, поскольку в системе существуют два ненулевых собственных значения. Компоненты собственных векторов, связанные с каждым из собственных значений, получаем из определения собственных векторов следующим образом:
для первого собственного значения
для второго собственного значения
Отметим, что два связанных с каждым из собственных значений вектора действительно ортогональны (т. е. их скалярное произведение равно нулю). В этих двух наборах векторов мы можем выбрать два нормированных вектора, которые соответственно составляют ортогональный базис:
Векторы и действительно аналогичны тем, которые определены в разделе 5.2.1, а координаты матрицы данных относительно этой точки отклика уже вычислены:
(Y) = (X-) (U)
Заключение
Факторные методы (в том числе связанные с использованием сингулярных матриц) ныне широко применяются для анализа данных в химии. Они в основном носят описательный характер и позволяют существенно сократить размерность массива данных при минимальной потере информации и возможности их графического представления.
Хотя эти методы и не обладают возможностями моделирования, как регрессионный анализ, их можно применять для идентификации:
· компонентов в многокомпонентных смесях, проанализированных посредством ультрафиолетового, инфракрасного и видимого излучения, флюоресценции, масс-спектрометрии, хроматографии (ФА);
· реальных физических факторов, управляющих экспериментальными данными (целевой факторный анализ):
· группы, к которой можно отнести новый объект в системе исходных групп, на которые был классифицирован первоначальный набор данных (ФДА).