Чем тесты отличаются от других методов исследования

Отличие тестов от других форм контроля

date image2015-05-20
views image3680

facebook icon vkontakte icon twitter icon odnoklasniki icon

1. Содержание теста подвергается четкому планированию. На стадии разработки теста происходит отбор содержания, которое будет подвергаться проверке, планируется форма заданий, их количество и расположение.

2. Форма заданий. В тестах форма заданий стандартизирована — по форме предъявления и по форме записи ответов.

3. Наличие статистических характеристик у тестовых заданий. Заранее известно, какова трудность предлагаемого задания, будет ли оно одинаково выполняться слабыми и сильными испытуемыми или нет (дифференцирующая способность) и др.

4. Наличие специальных шкал, которые соотнесены со стандартизированными нормами для подведения результатов тестирования.

5. Наличие оценок точности измерения (ошибки измерения). С помощью статистических методов мы можем оценить ошибку измерения, а по результатам оценки принять или не принять результаты тестирования.

Отличительные особенности теста определяют преимущества теста перед традиционными формами контроля учебных достижений: объективность, надежность, точность, экономичность измерений.

1.3. Тест, предъявляемый испытуемому, состоит из инструкции и тестовых заданий. В инструкции даются указания, из скольких частей состоит тест, какое количество времени дается на его выполнение, какой стратегии должен придерживаться испытуемый (например, если не знаете ответ на задание, приступайте к выполнению следующего), что надо сделать, чтобы записать правильный ответ. Если тест включает различные формы заданий, то при смене форм, перед каждым субтестом дается дополнительная инструкция по выполнению данной формы задания.

Далее, после инструкции располагаются пронумерованные тестовые задания. Задания в тесте (субтесте), в соответствии с теорией тестирования, должны располагаться по нарастанию трудности, то есть в начало теста включаются легкие задания, потом более сложные.

Тест всегда сопровождается подробной инструкцией для организаторов и наблюдателей тестирования. Данная инструкция должна обеспечить равные условия для всех, кто выполняет тест. Поэтому в этой инструкции четко оговариваются условия тестирования (требования, предъявляемые к помещению, где будет проходить тестирование, количество испытуемых в группе, время тестирования), форма заполнения тестовых бланков (данные испытуемого: имя, возраст, пол, школа и др.; как заносить правильные ответы и т. д.).

2. Надёжность и валидность теста

Основными показателями качества теста являются надежность и валидность теста. А так как тест является инструментом педагогического измерения, то эти показатели имеют численное значение и определяются с помощью различных методов как в классической теории тестов, так и в современной теории тестов.

Надежность — это характеристика теста, отражающая точность педагогического измерения, а также устойчивость результатов тестирования к воздействию посторонних (случайных) факторов.

Для оценки надежности нормативно-ориентированного теста используются две группы методов.

1. Двукратное тестирование:

– метод параллельных форм.

2. Однократное тестирование (метод расщепления теста).

Оценка надежности чаще всего строится на подсчете корреляции двух наборов результатов выполнения одного и того же теста или двух его параллельных форм. Чем выше корреляция, тем надежнее тест.

Данный метод оценки надежности предполагает двукратное проведение одного и того же теста в одной группе испытуемых. Повторное тестирование проводится примерно через 2-3 недели, чтобы учащиеся не слишком сильно забыли проверяемый материал и недалеко продвинулись в изучении нового, то есть уровень их учебных достижений остался примерно прежним.

Ретестовый метод основан на подсчете корреляции индивидуальных баллов испытуемых по результатам выполнения первого и второго тестирования.

Коэффициент надежности (коэффициент корреляции Пирсона):

-Хорошим коэффициент надежности теста считается, когда показатель колеблется в пределах 0,8 2 – дисперсия индивидуальных баллов,

N – число студентов.

Критериальная валидность измеряется от –1 до 1, валидность более 0,3 считается удовлетворительной.

Источник

Общая характеристика метода тестирования

Тестирование (англ. test — испытание, проверка) — экспериментальный метод психодиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида [2].

Целью применения тестирования является получение максимально полного представления о личности человека и его проблемах. От других методов исследования тесты отличаются тем, что предполагают четкую процедуру сбора и обработки первичных данных. С помощью тестов можно изучать и сравнивать между собой психологию разных людей, давать дифференцированные и сопоставимые оценки [8].

Тестирование выполняет три основные взаимосвязанные функции: диагностическую, обучающую и воспитательную.

Диагностическая функция заключается в выявлении уровня знаний, умений, навыков учащегося. Это основная, и самая очевидная функция тестирования. По объективности, широте и скорости диагностирования, тестирование превосходит все остальные формы педагогического контроля.

Обучающая функция тестирования состоит в мотивировании учащегося к активизации работы по усвоению учебного материала. Для усиления обучающей функции тестирования, могут быть использованы дополнительные меры стимулирования студентов, такие, как раздача преподавателем примерного перечня вопросов для самостоятельной подготовки, наличие в самом тесте наводящих вопросов и подсказок, совместный разбор результатов теста.

Воспитательная функция проявляется в периодичности и неизбежности тестового контроля. Это дисциплинирует, организует и направляет деятельность учащихся, помогает выявить и устранить пробелы в знаниях, формирует стремление развить свои способности [11].

В настоящее время существует огромное множество тестов. Поэтому для того чтобы дать наиболее полную характеристику тестов и определить их место, значение, взаимосвязи в общей системе тестовых методик, необходимо дать представление о существующих на данный момент видах тестов. Тесты могут быть классифицированы по следующим основаниям с выделением соответствующих видов:

По процедуре могут быть выделены стандартизированные и нестандартизированные тесты. Стандартизация психологами понимается в двух аспектах:

— стандартизация процедуры и условий проведения тестирования, способов обработки и интерпретации результатов, которые должны привести к созданию равных условий для испытуемых и минимизировать случайные ошибки и погрешности, как на этапе проведения, так и на этапе обработки результатов и интерпретации данных;

— стандартизация результатов, то есть получение нормы, шкалы оценки, которая служит основанием для определения уровня овладения тем, что выясняет данный тест, при этом не важно, какого рода нормы получаются и какие шкалы используются.

Многие специалисты-тестологи вообще не считают возможным рассматривать так называемые нестандартизированные тесты как вид тестов, так как на их взгляд, стандартизированность является необходимой особенностью, определяющей сущность теста, как диагностической методики, его характеристикой. Важно разделить эти два понятия. Поэтому тесты нестандартизированные по результатам мы будем называть ненормированными, а тесты нестандартизированные по процедуре — нестандартизированными.

Читайте также:  Тест драйв мопеда орион

Это важно, поскольку в педагогике можно выделить ряд задач, которые могут быть решены ненормированными тестами. Однако при этом необходимо учитывать несколько существенных обстоятельств. Сфера применения ненормированного инструмента ограничена: с точки зрения субъекта — разработчиком теста, а объекта — той группой учеников, с которыми он в состоянии работать. Круг задач для ненормированных тестов — частные, специальные методические и узкометодические. Например, оценка качества усвоения материала той или иной темы, выявление усвоенных понятий, определений данной темы и т. д. Вторая область применения ненормированных гестов — сравнительные исследования групп учащихся в тех же узких областях. Однако при сравнительных исследованиях необходимость получения оценок и их сравнения приводит к необходимости нормирования в той или иной мере.

Необходимо сделать еще одно замечание: правила и требования к составлению заданий и их качеству остаются едиными для любых, в том числе и ненормированных и нестандартизированных тестов. Конечно, надежные результаты дает применение стандартизированных тестов. Результаты, полученные с помощью нестандартизированных тестов, малонадежны и требуют подтверждения [9].

Классификация тестов по назначению:

1) общедиагностические (тесты личности по типу вопросников Кеттелла или Айзенка, тесты общего интеллекта Векслера, Бине-Симона в редакции Термена и Меррила и др.);

2) профессиональной пригодности (множество общих классификационных тестов — общий армейский классификационный тест, классификационные тесты способностей Фланагана и др.);

3) специальных способностей (технических, музыкальных, тесты для пилотов, радиооператоров и т. д.);

4) достижений (например, произношения, качества написания письменных сочинений и т.п. т. е. тесты, предназначенные для оценивания результатов, достигнутых учащимися в процессе обучения.) [3].

По средствам, используемым в процессе тестирования:

— бланковые (тесты «бумага и карандаш», в которых используются тестовые тетради или бланки, в которых испытуемые отмечают или вписывают правильные ответы — вопросники личности, тест механической понятливости Беннета, большинство тестов достижений и др.);

— предметные (в которых необходимо манипулировать материальными объектами, результативность выполнения этих тестов зависит от скорости и правильности выполнения заданий — кубики Косса, тест Стенквиста на сборку конструкций и узлов деталей, тест «Сложение фигур» из набора Векcлера и др.);

— аппаратурные (тесты с использованием устройств для изучения особенностей внимания, восприятия, памяти и мышления — «детектор лжи», аппарат для определения энцефалограмм мозга и др.);

— практические (появившиеся относительно недавно, эти тесты схожи с известными у нас лабораторными работами — по химии, физике, биологии и пр., — однако они снабжены соответствующими инструкциями и имеют тестовое оснащение);

— программные (тесты с применением программ ЭВМ) [6].

По количеству одновременно обследуемых людей тесты бывают индивидуальные (тесты Векслера, тест Люшера и др.) и групповые (большинство стандартизованных вопросников, оценивающих основные характеристики личности, набор тестов Фланагана, большинство тестов достижений и т. д.) [4].

По форме ответа тесты делятся на устные, письменные и с применением ЭВМ.

По ведущей ориентации:

1) тесты скорости, содержащие простые задачи, время решения которых ограничено настолько, что ни один испытуемый не успевает решить все задачи в заданное время (Кольца Ландольта, Бурдона, «шифровка» из набора Векслера);

2) тесты мощности или результативности, включающие трудные задачи, время решения которых либо вовсе не ограничено, либо мягко лимитировано. Оценке подлежит успешность и способ решения задачи. Примером такого рода тестовых заданий могут быть задания для письменных итоговых экзаменов за курс школы;

3) смешанные тесты, которые объединяют в себе черты двух вышеперечисленных. В таких тестах представлены задачи различного уровня сложности: от самых простых до очень сложных. Время испытания в данном случае ограничено, но достаточное для решения предлагаемых задач большинством обследуемых. Оценкой в данном случае служат как скорость выполнения заданий (количество выполненных заданий), так и правильность решения. Эти тесты наиболее часто применяются на практике [4].

По степени однородности задач тесты бывают гомогенные, имеющие, как правило, одну шкалу, которые позволяют оценить одно свойство или качество личности и включают задачи, сходные по характеру, но различающиеся конкретным содержанием, а также гетерогенные, имеющие несколько шкал, которые позволяют оценить разнообразные характеристики личности и включают задания, отличающиеся как по характеру, так и по содержанию.

По характеру действий выделяют вербальные тесты (связанные с необходимостью произведения умственных действий — словесно-логические тесты, вопросники на проверку знаний, установление закономерностей и пр.) и невербальные (связанные с практическим манипулированием предметами — карточками, блоками, деталями).

По направленности, т.е. по тому, что именно предполагается изучать с помощью данного теста: тесты интеллекта, выявляющие особенности последнего b личностные тесты (иногда называемые тестами темперамента), с помощью которых изучаются особенности личности испытуемого; тесты настроении и состояний, направленные на изучение временных состояний, таких как эмоции [12].

По виду нормирования:

1) ориентированные на статистические нормы — тесты, основанием для сравнения в которых служат соответствующим образом обоснованные статистически полученные значения выполнения данного теста репрезентативной выборкой испытуемых;

2) критериально ориентированные — тесты, предназначенные для определения уровня индивидуальных достижений испытуемого относительно некоторого заданного критерия, существующего в реальной практике и заранее известного уровня знаний, умений, навыков, необходимых для выполнения определенного вида деятельности. Критерий может быть определен на основании экспертной оценки (например, критерий школьной успешности может быть определен путем опроса педагогов, работающих в данном классе или с данным ребенком) либо практической деятельности испытуемых (критерий школьной успешности может быть определен по оценкам за четверть или год);

3) прогностические, ориентированные на успешность дальнейшей деятельности;

По характеру ответов на вопросы тестирование бывает открытого типа (со свободными ответами — когда испытуемому необходимо самостоятельно дописать слово, словосочетание, предложение, знак, формулу и т. д.) т закрытого типа (с предписанными ответами — когда испытуемому необходимо выбрать из предложенных вариантов ответов тот или иной вариант) [7].

Кроме этого, выделяют следующие возможные варианты ответов, используемые в тестах открытого типа: задания дополнения — испытуемый должен сформулировать ответы с учетом предусмотренных в задании ограничений и задания свободного изложения — испытуемый должен самостоятельно сформулировать ответы, ибо никакие ограничения на них в задании не накладываются.

Читайте также:  Какой будет результат теста при внематочной беременности

Варианты тестов закрытого типа:

— альтернативных ответов, испытуемый должен ответить «да» или «нет»;

— соответствия (на восстановление соответствия) — испытуемому предлагается восстановить соответствие элементов двух списков;

— множественного выбора (ответы с вариантами выбора) — испытуемому необходимо выбрать, как правило, один правильный ответ из приведенного списка возможных ответов;

— исключения лишнего (устранения лишнего элемента, «встретил лишнее — убери»);

— аналогии — испытуемый должен выделить отношение аналогии между парами элементов (слов, свойств, качеств и т. д.);

— последовательности (на завершение последовательности) — испытуемый должен запершить некоторую последовательность элементов [1].

Кроме классификации по приведенным выше одиннадцати основаниям, можно выделить, так называемые, «объективные» тесты — тесты, объективность оценки результатов которых обусловливается тем обстоятельством, что в процессе обработки результатов тестирования не предусматривается использование их субъективных толкований тестирующим.

Проективные тесты — совокупность методик, разработанных в рамках проективного подхода в психологии, характеризующихся неопределенностью, неоднозначностью используемых в ходе тестирования стимулов, что допускает чрезвычайно большое разнообразие ответов и проявление определенной субъективности при их толковании тестирующим; индивидуально ориентированные тесты, специально создаваемые или являющиеся модификацией уже известных, но предназначенные для обследования определенного испытуемого [7].

Как уже говорилось выше, в настоящее время существует огромное множество тестов. В данном параграфе были рассмотрены классификация тестов, которые наиболее распространены и используются на сегодняшний день. Но все невозможно изложить, потому что регулярно появляются всё новые виды тестов. Это связано с высоким уровнем научно-технического прогресса в обществе.

Источник

Научная электронная библиотека

Зотова Л. Э., Краева М. Ю.,

2.8. Метод тестирования

Впервые термин «тест» был описан В. Вундтом в работе «Интеллектуальные тесты и измерения». Именно он предложил диагностику индивидов по унифицированным, стандартным методикам с целью сравнения индивидуальных результатов и научной количественной оценке получаемых данных.

Тесты относятся к формализованным методам. Формализованные методы характеризуются высокой степенью объективации и стандартизации. Это означает, что психолог (социолог, педагог) должен строго придерживаться процедуры проведения, строго определенно предъявлять стимульный
материал, не вмешиваться в деятельность испытуемого, единообразно по заданным ключам проводить обработку результатов и придерживаться заданной интерпретации шкал.

Тесты являются надежными, валидными и научными методами исследования. Это значит, что они должны быть пригодны для измерения именно того качества, которое изучает исследователь (валидность), а также обладать высокой степенью постоянства и точности, с которой измеряется изучаемое психологическое свойство или качество личности. Точным тест является тогда, когда имеется высокий уровень совпадения его результатов с другими методиками, используемыми с этой же целью. Постоянство проявляется тогда, когда имеются стабильные результаты, полученные на этой же выборке испытуемых. Под научностью теста подразумевается обоснованность теста теоретическими предпосылками, его «включенность» в ту или иную научную концепцию, внутренняя согласованность с логикой теоретических постулатов.

Наибольшие разногласия вызывает вопрос об отличии диагностических тестов и опросников.

Так, М.К. Акимова и К.М. Гуревич разводят понятия «тест» и «опросник» понимая под тестом стандартизированное, обычно краткое и ограниченное во времени испытание, предназначенное для установления количественных и качественных индивидуально-психологических различий между людьми. Опросник авторы относят к такой группе психодиагностических методик, где задания представлены в виде вопросов и утверждений и предназначены для получения данных со слов обследуемого.

Основным критерием, по которым различаются тесты и опросники, является особенность заданий респондентам. Авторы отмечают, что их отличительной особенностью является то, что они состоят из заданий, на которые от испытуемого нужно получить правильный ответ. В опросниках, в проективных и психофизиологических методиках правильных ответов не существует»

Авторы классифицируют тесты и выделяют:

— по форме: индивидуальные и групповые; устные и письменные; бланковые, предметные, аппаратурные и компьютерные; вербальные и невербальные

— по содержанию: тесты интеллекта, тесты способностей, тесты личности, тесты достижений.

Индивидуальные и групповые тесты отличаются включенностью экспериментатора во взаимодействие с испытуемыми. В первом случае взаимодействие происходит в индивидуальном порядке, во втором – с группой испытуемых.

Бланковые тесты предполагают письменное изложение вопросов на бумажном носителе. В предметных тестах используется предметный стимульный материал, например, цветовые карточки, таблицы, детали геометрических фигур и т.д. Аппаратурные тесты предполагают использование технических средств.

Компьютерные тесты с развитием кибертехнологий становятся все более и более популярными. Тестовые задания выполняются испытуемым на дисплее, автоматически происходит обработка результатов и предъявление результатов. Компьютерное тестирование используется, когда респонденты предпочитают оставаться анонимными, а также когда предмет исследования является достаточно «личным». Преимуществом компьютерного тестирования является и то, что оно проводится дистанционно и минимизирует временные затраты диагноста.

Вербальные и невербальные тесты отличаются по форме подачи стимульного материала. При проведении вербальных тестов, стимульный материал предъявляется в словесной форме, а невербальных – в наглядной.

М.К. Акимова и К.М. Гуревич приводят типологию опросников, авторами выделяются:

— личностные опросники (закрытые и открытые опросники);

— опросники-анкеты (с открытыми, закрытыми и полузакрытыми вопросами).

В закрытых личностных опросниках респондентам предлагается на выбор несколько ответов-альтернатив, примером многоальтернативных ответов является широко распространенная психометрическая «шкала Лайкерта», разработанная в 1932 г. Р. Лайкертом. При работе со шкалой испытуемый выбирает ту или иную степень согласия или несогласия с предлагаемыми в тесте суждениями:

1. Полностью не согласен.

3. Затрудняюсь ответить.

5. Полностью согласен.

В открытых личностных опросниках предусматриваются произвольные ответы респондентов.

Опросники-анкеты служат для получения информации, не касающейся психологических качеств человека. В них респондент может формулировать ответ на вопросы самостоятельно, выбирать из предложенных вариантов ответов, а также добавлять свой свободный вариант ответа (опросники–анкеты с полузакрытыми вопросами).

Как отмечалось выше, вопросы о дифференциации тестов, опросников и анкет является непростым в психологической науке. Для уточнения этого вопроса обратимся к мнению В.В. Никандрова [31].

В.В. Никандров отмечает, что субъективные тесты представлены в психодиагностике в основном многочисленными опросниками, которые являются тестами выявления индивидуально-психологических различий на основе самоописания их проявлений испытуемыми. Таким образом, не все психологи проводят жесткие разграничений понятий «тест» и «опросник».

В.В. Никандров разработал классификацию психологических тестов, в которой выделяются:

— субъективные тесты, основанные на получении информации от самого респондента. Суть их заключается в том, что испытуемый сам оценивает свою поведение, личностные качества и особенности. К таким тестам относятся многочисленные личностные опросники, выявляющие особенности темперамента, характера, направленности личности и т.д.;

Читайте также:  Мальдивы сдать пцр тест

— объективные тесты. Результаты этих тестов основываются на основании информации об особенностях выполнения деятельности и ее результативности. То есть они не зависят от представлений респондентов о себе, например, тесты интеллекта, креативности, общих и специальных способностей, достижений личности;

— проективные тесты. Выполняя такие тесты, испытуемый имеет дело со слабоструктурированным, неоформленным материалом, вследствие чего они становятся объектом проекции. Примером таким методик могут являться «Несуществующее животное» М. Друкаревича, «Дом-дерево-человек» Дж. Бука, цветовой тест Люшера и др.;

В процессе проведения тестирования исследователь проходит ряд этапов:

1) постановка цели диагностики;

2) обоснование выбора методик исследования;

3) установление контакта с испытуемым (испытуемыми), мотивирование их на совместную работу;

4) инструктаж испытуемого (испытуемых);

5) контроль за выполнением задания;

6) завершение ситуации контакта с испытуемым (испытуемыми);

7) обработка результатов диагностики;

8) интерпретация результатов и составление отчета.

Необходимо отметить, что разработка и апробация теста является достаточно сложным процессом. В основе этого процесса должна лежать теоретическая база, тест должен пройти процедуру на проверку надежности, валидности и стандартизации. Тест является точно выверенной процедурой, именно поэтому психолог и педагог должны в своей деятельности использовать только авторские, апробированные и признанные психологической общественность тесты. Как правило, эти тесты можно найти либо в авторских источниках (учебных пособиях, диссертациях, статьях и т.д.), либо в диагностических сборниках, предназначенных для профессиональной работы психологов и педагогов.

Вопросы для самоконтроля знаний студентов

1. Раскройте понятия «надежность» и «валидность».

2. В чем заключаются этические принципы использования тестов как психометрической процедуры?

3. В чем заключается отличие теста от опросника?

Задание для самостоятельной работы студентов

Изучите классификацию проективных тестов В.В. Никандрова. Приведите примеры ассоциативных, интерпретативных, манипулятивных тестов и тестов свободного выбора. Составьте таблицу, в которой разместите эти примеры с именами авторов и перечислением возрастных групп, на которые эти тесты направлены.

1. Девятко И.Ф. Методы социологического исследования: учебное пособие. – М.: КДУБ, 2010. – 296 с.

2. Добреньков В.И., Кравченко А.И. Методы социологического исследования: учебник. – М.: ИНФРА-М, 2013. – 768 с. Глава 5. «Применение тестов в прикладной социологи». – С. 627-664.

3. Никандров В.В. Экспериментальная психология. – Изд. 2-е, дополненное. – СПб.: Речь, 2007. – 512 с.

4. Психологическая диагностика: Учебник для вузов / Под ред. М.К.Акимовой, К.М.Гуревича. – СПб.: Питер, 2007. – 652 с.

Источник

Отличие тестов от других форм контроля

date image2015-05-20
views image3680

facebook icon vkontakte icon twitter icon odnoklasniki icon

1. Содержание теста подвергается четкому планированию. На стадии разработки теста происходит отбор содержания, которое будет подвергаться проверке, планируется форма заданий, их количество и расположение.

2. Форма заданий. В тестах форма заданий стандартизирована — по форме предъявления и по форме записи ответов.

3. Наличие статистических характеристик у тестовых заданий. Заранее известно, какова трудность предлагаемого задания, будет ли оно одинаково выполняться слабыми и сильными испытуемыми или нет (дифференцирующая способность) и др.

4. Наличие специальных шкал, которые соотнесены со стандартизированными нормами для подведения результатов тестирования.

5. Наличие оценок точности измерения (ошибки измерения). С помощью статистических методов мы можем оценить ошибку измерения, а по результатам оценки принять или не принять результаты тестирования.

Отличительные особенности теста определяют преимущества теста перед традиционными формами контроля учебных достижений: объективность, надежность, точность, экономичность измерений.

1.3. Тест, предъявляемый испытуемому, состоит из инструкции и тестовых заданий. В инструкции даются указания, из скольких частей состоит тест, какое количество времени дается на его выполнение, какой стратегии должен придерживаться испытуемый (например, если не знаете ответ на задание, приступайте к выполнению следующего), что надо сделать, чтобы записать правильный ответ. Если тест включает различные формы заданий, то при смене форм, перед каждым субтестом дается дополнительная инструкция по выполнению данной формы задания.

Далее, после инструкции располагаются пронумерованные тестовые задания. Задания в тесте (субтесте), в соответствии с теорией тестирования, должны располагаться по нарастанию трудности, то есть в начало теста включаются легкие задания, потом более сложные.

Тест всегда сопровождается подробной инструкцией для организаторов и наблюдателей тестирования. Данная инструкция должна обеспечить равные условия для всех, кто выполняет тест. Поэтому в этой инструкции четко оговариваются условия тестирования (требования, предъявляемые к помещению, где будет проходить тестирование, количество испытуемых в группе, время тестирования), форма заполнения тестовых бланков (данные испытуемого: имя, возраст, пол, школа и др.; как заносить правильные ответы и т. д.).

2. Надёжность и валидность теста

Основными показателями качества теста являются надежность и валидность теста. А так как тест является инструментом педагогического измерения, то эти показатели имеют численное значение и определяются с помощью различных методов как в классической теории тестов, так и в современной теории тестов.

Надежность — это характеристика теста, отражающая точность педагогического измерения, а также устойчивость результатов тестирования к воздействию посторонних (случайных) факторов.

Для оценки надежности нормативно-ориентированного теста используются две группы методов.

1. Двукратное тестирование:

– метод параллельных форм.

2. Однократное тестирование (метод расщепления теста).

Оценка надежности чаще всего строится на подсчете корреляции двух наборов результатов выполнения одного и того же теста или двух его параллельных форм. Чем выше корреляция, тем надежнее тест.

Данный метод оценки надежности предполагает двукратное проведение одного и того же теста в одной группе испытуемых. Повторное тестирование проводится примерно через 2-3 недели, чтобы учащиеся не слишком сильно забыли проверяемый материал и недалеко продвинулись в изучении нового, то есть уровень их учебных достижений остался примерно прежним.

Ретестовый метод основан на подсчете корреляции индивидуальных баллов испытуемых по результатам выполнения первого и второго тестирования.

Коэффициент надежности (коэффициент корреляции Пирсона):

-Хорошим коэффициент надежности теста считается, когда показатель колеблется в пределах 0,8 2 – дисперсия индивидуальных баллов,

N – число студентов.

Критериальная валидность измеряется от –1 до 1, валидность более 0,3 считается удовлетворительной.

Источник

Поделиться с друзьями
Наши факторы