Исследование статистических зависимостей для контактных систем типа W UMa

rев=[]1/2 ,

где Xj, Yj - соответственно значения j-го свойства объектов X и Y. Использование такой меры сходства и обуславливает применимость алгоритма к таблицам данных, представленных в сильных шкалах, для которых операции, использованные в формуле, являются допустимыми преобразованиями. По расстоянию rев выбирается заданное число объектов-аналогов, а для них- свойств-аналогов.

4. В матрице, состоящей из отобранных строк, столбцы нормируются к интервалу [0,1] и выбирается заданное количество столбцов, наиболее сильно связанных с j-м.

5. По исходной таблице формируется "предсказывающая" подматрица, составленная из элементов, находящихся на пересечении i-ой и ближайшей к ней строк с j-м и ближайших к нему столбцами.

6. Столбцы полученной подматрицы нормируются к интервалу [0,1].

7. Из уравнений линейной регрессии для k-го элемента Aij вычисляются "подсказки" Aij от строк и (или) столбцов "предсказывающей" подматрицы.

8. Находится коэффициент а, определяющий степень учета взаимного сходства столбцов (строк) подматрицы при вычислении итогового значения прогнозируемого элемента Aij.

9. Процедура 2-8 повторяется для каждого пробела.

10. Значения, вычисленные в режимах заполнения в зависимости от входных условий, заносятся в таблицу сразу же после вычисления каждого из них или только после окончания прогнозирования значений для всех пробелов таблицы.

11. Пункты 1-10 повторяются. Количество повторений задается во входных условиях.

Когда сформирована группа объектов-аналогов и найдены в этой группе наиболее информативные свойства для интересующего нас объекта, т.е. сформирована "предсказывающая" подматрица, алгоритм переходит к этапу построения формулы для прогнозирования.

Иначе говоря, алгоритм ZET можно разбить на две части:

1. Выбор из исходной таблицы наиболее связанной с интересующим нас объектом Aij информации-построения "предсказывающей" подматрицы.

2. Определения параметров формулы для возможно лучшего предсказания значения рассматриваемого элемента Aij с одновременной оценкой ожидаемой точности прогноза.

В алгоритме ZET, как было отмечено выше, предусмотрен "персональный" подход к прогнозированию каждого интересующего нас элемента таблицы. Для каждого элемента Aij подбирается своя предсказывающая подматрица, в которой содержатся только строки, наиболее похожие на i-ую и столбцы, наиболее связанные с j-м и по этой "персональной" информации подбирается персональная формула для прогнозирования элемента Aij. Для того, чтобы при определении сходства объектов (строк) "вклад" каждого показателя (свойства) не зависел от единиц измерения и был сопоставим с вкладами других показателей, производится нормировка каждого столбца относительно его дисперсии. Если есть необходимость учесть неравнозначность вкладов свойств в меру сходства, т.е. если из каких-либо соображений известны значимости, "веса" свойств, то их можно учесть, умножив отнормированные данные на эти веса.

Если пробелов в данных много, вряд ли можно надеяться заполнить их все сразу с хорошей точностью. Поэтому организуется многоступенчатая процедура заполнения. Она состоит в том, чтобы на первом этапе заполнить при минимальном размере подматриц наиболее надежные элементы, т.е. те, которые удается предсказать с заданной точностью. Затем поставить эти значения в таблицу и, уже считая их известными, вновь обратиться к программе с теми же условиями на требуемую точность и размер подматриц. Добавленная в таблицу информация может дать возможность предсказать еще ряд значений.

Процесс повторяется при одних и тех же условиях до тех пор, пока не прекратится предсказание новых элементов. Тогда можно повторять цикл заполнения.

§ 3 Применение метода ZET для восстановления физических параметров контактных систем.

Для того, чтобы правильно спрогнозировать неизвестные элементы, необходимо решить ряд существенных вопросов:

1. Какие характеристики звезд могут быть наиболее информативны с точки зрения предсказания отношения масс q;

2. Можно ли ожидать достаточно хороших результатов;

3. Если да, то как организовать решение, чтобы заполнить больше пробелов с приемлемой точностью;

4. Можно ли доподлинно проверить "качество" вычисленных значений.

Для решения первой проблемы - отбора наиболее информативных для предсказания q характеристик звезд было выполнено редактирование всех известных значений первого столбца, содержащего отношение масс q контрольной таблицы размерностью 15х14, куда вошли 15 систем типа W UMa и 14 их параметров из [3] (известных абсолютно точно), на предсказывающих подматрицах 6х6, 5х5, 4х4. Объектами в данной таблице были контактные системы типа W UMa, а в качестве свойств были взяты следующие параметры: отношение масс компонент q, спектральный класс главной компоненты Sp1, масса главной компоненты m1, абсолютная болометрическая величина более массивной компоненты M1bol, большая полуось орбиты в долях радиуса Солнца A, угол наклона орбиты i, период затменной системы P, средний радиус главной компоненты в долях большой полуоси орбиты r1, средний радиус второстепенной компоненты в долях большой полуоси орбиты r2, относительный блеск более массивной компоненты L1, отношение поверхностных яркостей более массивной компоненты к менее массивной J1/J2, радиус главной компоненты в долях радиуса Солнца R1, радиус второстепенной компоненты в долях радиуса Солнца R2, абсолютная болометрическая величина менее массивной компоненты M2bol.

По результатам редактирования была составлена таблица, где показано участие отдельных параметров в предсказании отношения масс компонентов q. Из таблицы видно, что параметры P, r1, L1, J1/J2, R1 и M2bol плохо (т.е. редко) участвуют в предсказании и вклад их достаточно мал, поэтому их можно отбросить. Так как параметры r2 и R2 связаны с q эмпирическими формулами: r~rкрит(q) и lg(m)=-0.153+1.56*lg(R), то их также представляется целесообразным отбросить. Таким образом, остается таблица 15х6, в которую входят 15 объектов и 6 параметров: q, Sp1, M1bol, m1, A, i. На этой таблице было выполнено редактирование первого столбца, содержащего отношение масс q и второго столбца, содержащего спектральные классы главных компонент Sp1. Получены средние ошибки редактирования соответственно d=13.555% и d=6.6791%. Поскольку средние ошибки редактирования малы, то можно сделать вывод, что отобранные параметры позволяют с достаточно высокой степенью точности восстановить неизвестные значения q.

Далее, из [2] были взяты 295 систем типа KW, для которых выписаны указанные выше 6 параметров, и составлена рабочая таблица 295х6 , где на месте предсказываемых элементов стоят пробелы. В качестве известных значений q были взяты значения из [3 - 16]. Всего получилось 72 известных значения q, опираясь на которые программа будет предсказывать остальные значения.

Скачать реферат

Страница:

Последние рефераты