Анализ тестовых материалов
Рефераты >> Математика >> Анализ тестовых материалов

Коэффициент надежности теста К определяется следующим соотношением:

Если данное отношение близко к 0, то интерпретация результатов является ненадежной, если коэффициент близок к 1, то он является надежным. Следует отметить, что коэффициент надежности характеризует не только сам тест, но является и критерием оценки выборки испытуемых.

Для вычисления надежности теста используется коэффициент корреляции Пирсона между результатами двух параллельных тестов, что можно продемонстрировать, используя данные представленные в таблице 1.

Таблица 1.

cтудента (i)

Индивидуальный балл по тесту X

Индивидуальный балл по тесту Y

X2

Y2

1

X1

Y1

X1 Y1

X12

Y12

2

X2

Y2

X2 Y2

X22

Y22

….

….

….

….

N

Xn

Yn

Xn Yn

Xn2

Yn2

∑Xi

∑Yi

∑XiYi

∑ Xi2

∑ Yi2

При оценке надежности теста по двум половинам расщепленного теста используется формула Спирмена-Брауна [10]:

,

где К - надежность всего теста, а - надежность, вычисленная по двум половинам теста, причем вычисляется как коэффициент корреляции Пирсона. При этом необходимо подсчитывать баллы испытуемых отдельно для четных и для нечетных заданий теста (табл. 2).

Таблица 2.

(i)

Индивидуальный балл по нечетным

заданиям теста

Индивидуальный

балл по четным

заданиям теста

X2

Y2

1

X1

Y1

X1Y1

X12

Y12

2

X2

Y2

X2Y2

X22

Y22

….

….

….

….

N

Xn

Yn

Xn Yn

Xn2

Yn2

∑Xi

∑Yi

∑ XiYi

∑ Xi2

∑ Yi2

Однако наибольшее распространение на практике получило применение для расчета надежности теста так называемой формулы KR-20 [17]:

,

где К- коэффициент надежности, m- число заданий в тесте, pj - доля правильных ответов на j задание, qj - доля неправильных ответов на j задание. Дисперсия индивидуальных баллов N студентов вычисляется по формуле:

.

Если величина коэффициента надежности К составляет от 0,90 до 0,99, то тест имеет отличную оценку надежности, если от 0,80 до 0,89 то хорошую, от 0,70 до 0,79 – удовлетворительную и менее 0,69 - неудовлетворительную надежность. По формуле KR20 оценивается надежность таких тестов как SAT (K = 0,91) и TOEFL (К = 0,93). По данным для текущего контроля знаний необходимо, чтобы тест имел надежность не менее 0,80, а для итоговой аттестации более 0,90.

При оценке качества заданий важно понять, существует ли тенденция, когда одни и те же ученики добиваются успеха в какой-либо паре заданий теста? Либо, наоборот, такой тенденции, указывающей на связь результатов, нет, и состав учеников, добивающихся успеха, полностью меняется при переходе от одного задания к другому в тесте. Для ответа на поставленные вопросы необходимо провести анализ данных, собрав их в таблицу.


Страница: