Дифференцирующая способность теста. Мера трудности задания

Трудность заданий характеризуется индексом, который соответствует доле лиц, правильно решивших задание (Bortz & Döring, 2005). Ранее этот показатель носил название Индекса популярности. Цель индекса трудности заключается в различении заданий, обладающих высокой трудностью с более лёгкими. Непригодными признаются задания, на которые все испытуемые дают правильный ответ, либо задания ответ на которое не был найден никем. Индекс трудности обязательно должен располагаться между этими крайними случаями. В тестах, уровень трудности должен охватывать весь возможный диапазон измеряемой тестом характеристики.

Трудность заданий теста с двухступенчатым ответом (например, верно / неверно) рассчитывается следующим образом:

Nr = количество испытуемых, давших правильный ответ, N = количество испытуемых, p = Трудность задания (только для заданий с двухступенчатым ответом!) Это обеспечивает решение для простейшего случая. Если испытуемые не решили задание или есть подозрение, что некоторые задания были выполнены «наугад», то приходится полагаться на другие альтернативные решения. (vgl. Fisseni, 1997, 41-42).

Расчёт трудности заданий с многоступенчатыми (альтернативными) ответами: Случай, когда р не определено. Возможные решения этой проблемы: Произвести дихотомию значений множества (например, 0 и 1), в этом случае рассчитывается трудность задания с двухступенчатым ответом. Расчет среднего значения и дисперсии (среднее значение эквивалентна р, однако, разброс также должен учитываться).

Индекс для заданий с многоуровневыми ответами:

Упрощённая формула:

Для более точного расчета разные авторы предлагают различные способы (vgl. Fisseni, 2004, 43-45). Различие трудности двух заданий можно проверить с помощью многопрофильной таблицы. Эти формулы возможно применять только для тестового уровня, то есть тогда, когда не требуется проведение испытания и / или когда испытуемые смогли справиться со всеми задачами.

Дифференцирующая способность задания .

Показатели дифференцирующей способности заданий

Коэффициент дискриминативности,

Точечно-бисериальный коэффициент

корреляции,

Бисериальный коэффициент корреляции,

Фи-коэффициент корреляции.

Важным показателем качества тестового задания является дифференцирующая способность, который определяет насколько хорошо данное задание различает "лучших" и "слабых" испытуемых.

Понятие дифференцирующей способности строится на фундаментальном предположении, что экзаменующиеся, которые показывают высокий уровень подготовки по данному предмету, как предполагается, более вероятно правильно ответят на любое задание о том предмете, чем те, которые обладают низким уровнем подготовки.

Наоборот, задания, на которые или все экзаменующиеся ответили правильно или все ответили неверно, не обладают дифференцирующей способностью, т.е. не различают сильных и слабых испытуемых.

Задания, которые не обладают дифференцирующей способностью, не дают никакой информации о различиях между индивидуумами. Существуют несколько статистических процедур для количественной оценки дискриминативности задания. Эти показатели чрезвычайно полезны в анализе качества заданий, потому что указывают авторам на конкретные задания, нуждающиеся в усовершенствовании.

Коэффициент дискриминативности

В классической тестовой теории для оценки качества тестовых заданий широко применяется коэффициент дискриминативности - Dj. Этот коэффициент рассчитывается по результатам тестирования путем выделения двух "контрастных" групп испытуемых. В большинстве случаев это 27% "слабых" и 27% "лучших" студентов из всей выборки.

Коэффициент находится по формуле Dj = Рu - Рl , где Рu и Рl - это доли студентов в лучшей и слабой группе, ответивших на данное (j-тое) задание правильно.

Значение коэффициента Dj может изменяться от -1 до +1.

Если значение Dj близко к -+1, то данное задание обладает высокой различающей способностью, то есть "лучшая" группа студентов из выборки отвечают на него гораздо чаще, чем "слабая" группа.

Интерпретация коэффициент различающей способности Dj согласно классической тестовой теории представлена в таблице

Точечно бисериальный коэффициент корреляции .

Точечно - бисериальный коэффициент корреляции - статистический показатель, который может использоваться для анализа дифференцирующей способности заданий.

Данный показатель оценивает степень статистической связи между двумя переменными: профилем ответа на конкретное задание и результирующим тестовым баллом.



Для j-го задания точечно-бисериальный коэффициент корреляции вычисляется по формуле:

Здесь x 1 – среднее значение по Х объектов со значением «единица» по Y;

x 0 – среднее значение по Х объектов со значением «ноль» по Y;

s х – среднее квадратическое отклонение всех значений по Х;

n 1 – число объектов «единица» по Y, n 0 - число объектов «ноль» по Y;

n = n 1 + n 0 – объем выборки.

Согласно тестовой теории значение точечно-бисериального коэффи- циент корреляции rpbis равное или большее 0,3 является приемлемым пока- зателем его качества.

С помощью этого статистического показателя автор задания может оценить его дифференцирующую способность. Вообще говоря, задания с более высоким значением данного показателя лучше различают подготов- ленных и не подготовленных испытуемых. На практике, задания с отрица- тельным показателем точечно - бисериального коэффициента корреляции или удаляются из банка заданий, или полностью пересматриваются.

ТЕСТИРОВАНИЕ (от англ. test – опыт, проба) – метод психологической диагностики, использующий стандартизированные вопросы и задачи (тесты), имеющие определенную шкалу значений. Применяется для стандартизированного измерения индивидуальных различий.

Существуют три основные сферы тестирования:

а) образование – в связи с увеличением продолжительности обучения и усложнением учебных программ;

Б) профессиональная подготовка и отбор – в связи с увеличением темпа роста и усложнением производства;

в) психологическое консультирование – в связи с ускорением социодинамических процессов. Тестирование позволяет с известной вероятностью определить актуальный уровень развития у индивида необходимых навыков, знаний, личностных характеристик и т. д.

Процесс тестирования может быть разделен на три этапа:

1) выбор теста (определяется целью тестирования и степенью достоверности и надежности теста);

2) проведение теста (определяется инструкцией к тесту);

3) интерпретация результатов (определяется системой теоретических допущений относительно предмета тестирования).

На всех трех этапах необходимо участие квалифицированного психолога (педагога). Процедура обработки тестовых результатов при большом количестве испытуемых отнимает много времени и сил. Компьютерные программы тестирования позволяют за считанные секунды увидеть характеристики выборки, для большей наглядности представленные на графиках и в таблицах, создают атмосферу независимости, устраняя межличностные отношения – преподаватель-студент. Это экономит время, деньги и силы педагога-психолога. Современные компьютерные программы дают возможность быстрой и качественной обработки полученных данных.

Анализ и оценка тестовых заданий начинается после апробации теста на целевой группе. Полученные данные сводятся в таблицу с матричной структурой, в которой задания начинают сортироваться по следующим критериям:

1) мера трудности задания;

2) дифференцирующая способность задания;

3) первичный анализ результатов тестирования

Мера трудности задания

Мера трудности задания дает информацию о степени задействования того параметра изучаемого свойства, которое оно призвано измерять и определяет соответствие задания целевой группе теста.

Трудное задание или легкое, определяют путем подсчета доли неправильных ответов к каждому из них. Трудность задания можно определить и умозрительно, на основе предполагаемого числа и характера тех элементов, которые участвуют в выполнении.

Дифференцирующая способность

Дифференцирующая способность – это насколько задание может отличить сильного испытуемого от слабого по уровню знаний. Если по одному из заданий у всех испытуемых имеется одинаковое значение – это задание нецелесообразно включать в тест. Дифференцирующая способность эмпирически определяется через вариацию данных.

Вариация – это степень разнообразия данных, полученных при выполнении задания. Она отражает дифференцирующую способность. Если дифференцирующая способность высокая, мы говорим о вариативных данных, и наоборот. При невариативных данных задание удаляют из теста. Определяется вариация путем вычисления дисперсии. Дисперсия вычисляет сумму квадратных отклонений значений баллов от среднего арифметического балла, т.е. рассчитывается среднее арифметическое по выборке, и все полученные значения баллов начинают с ним сравниваться. Так можно получить информацию о вариации тестового задания. Общепринятой мерой вариации тестовых баллов задания является стандартное отклонение, которое определяется путем вычисления квадратного корня из дисперсии.

Первичный анализ результатов тестирования

После того, как тест стандартизован, апробирован, одобрен экспертной комиссией, можно получить необходимую информацию о способности человека. Для этого после проведения тестирования проводят первичный анализ результатов, лучше использовать результаты группового тестирования.

Полученные данные сначала необходимо свести к среднему значению. Оно более наглядно показывает групповой результат. Однако среднее значение мало информативно в отношении характеристики распределения значений баллов, частоты встречаемости каждого значения. Мода (Мо) – показатель наиболее часто встречающегося значения балла. Мод может быть несколько – наибольшее количество раз могли встретиться несколько значений. Далее выборку делят пополам, а значения баллов пограничного испытуемого принимаются за медиану (Ме).

График результатов теста обычно принимает форму колокола ("колокол Гаусса"), отвечая закону о нормальном распределении, где крайние значения показывают редко встречающиеся баллы, а при приближении к середине кривой частота встречаемости баллов увеличивается. Моды, медиана и среднее арифметическое значение также откладываются на графике. В некоторых случаях они могут совпадать – тогда распределение данных называют симметричным. Чем больше расстояние между модой, медианой и средним значением, тем больше результаты теста отклоняются от нормального распределения.

Помимо использования отдельных тестов специальных способностей, на Западе широко применяются батареи тестов, т.е. группы тестов, измеряющих относительно независимые особенности индивидов, в совокупности способствующие успешному осуществлению определенной деятельности. С помощью батарей можно получать профили тестовых показателей по относительно независимым существенным характеристикам, выявленным посредством факторно-аналитических исследований.

Первым опытом создания таких комплексных батарей способностей были Чикагские тесты основных умственных способностей (Primary Mental Abilities Tests - PMA) . Они основывались на концепции Л. Терстоуна о существовании 12 независимых первичных умственных способностей, лежащих в основе успешности учебной деятельности. Впервые опубликованные в 1941 г., они предназначались для учащихся старших классов и колледжей. Позднее эта батарея была усовершенствована (1962), в нее включили тесты для младших возрастов. Однако из-за наличия ряда существенных недостатков (низких надежности и валидности, неадекватности норм, необоснованности ряда показателей, чрезмерной зависимости результатов от скорости) в настоящее время она была вытеснена более современными методиками того же типа.

Одной из них является комплексная батарея Тестов различных способностей (Differential Aptitude Tests - DAT). Эта батарея, изданная в 1947 г., затем неоднократно пересматривалась; она предназначена для консультирования учащихся 8-12-х классов в процессе их обучения и профессиональной ориентации. Она применяется в двух эквивалентных формах S и Т, каждая из которых включает восемь субтестов.

Примеры заданий

1. Словесное мышление.

Выберите нужную пар)" слов, чтобы заполнить пропуски в предложении. Первое слово пары заполняет пропуск в начале предложения, второе в конце:

Вечером, а завтрак...

A. Ужин - угол.

B. Кроткий - утро.

C. Дверь - угол.

D. Течение - радость.

E. Ужин - утро. Правильный ответ - Е.

2. Числовые способности.

Для каждой задачи найдите правильный ответ: Сложить 13 и 12

Е. Ни одно из приведенных чисел. Правильный ответ - В.

3. Абстрактное мышление.

Каждое задание состоит из серии фигур, меняющихся по определенному правилу. Поняв правило изменения фигур в каждом задании, следует найти продолжение ряда фигур, выбрав ответ из пяти предложенных вариантов.

4. Скорость и точность восприятия.

В каждом задании теста подчеркнута одна из пяти предложенных комбинаций символов. На бланке ответов испытуемый должен был отметить точно такую же комбинацию.

5. Техническое мышление.

Каждое задание представляет собой изображенную ситуацию технического характера и короткий вопрос, ответ на который требует технического понимания.

6. Пространственные отношения.

В заданиях по изображенной развертке геометрической фигуры нужно найти се среди четырех вариантов ответов.

7. Грамотность.

Укажите, какое слово написано правильно, а какое с ошибкой.

  • (Символами х отмечены верные ответы).
  • 8. Использование языка.

Укажите, в какой из отмеченных буквами частей предложения содержится ошибка и отметьте эту часть на бланке ответов символом х. Если предложение не содержит ошибки, отметьте Н.

А. Нужноли нам /выходить/ на работу/ на следующей неделе?

Батарея DAT стандартизирована, проверена па валидность и надежность на выборке, репрезентативной популяции учащихся США 8-12-х классов. Выборка включала более 64 000 учащихся 76 школ из 33 штатов и округа Колумбия. Данные о валидности DAT составляют несколько тысяч коэффициентов, большая часть которых относилась к прогностической валидности достижений в школе и успешности последующего обучения (в вузах, на специализированных курсах и училищах и проч.). Признано, что эта батарея неплохо оценивает возможности индивидов в учебной деятельности общего характера. Однако учебный критерий далеко не всегда позволяет прогнозировать профессиональные достижения, а данных но профессиональным критериям недостаточно.

Поэтому в целях профессионального консультирования используются другие методики. Одной из наиболее признанных является Батарея тестов общих способностей (Général Aptitude Test Battery - GATB) . Она разработана Службой занятости США специально для применения в деятельности консультантов в государственных учреждениях. Посредством этой батареи измеряются девять факторов, в нее входят 12 тестов. В GATB представлены следующие факторы:

  • 1) общие способности к обучению (оцениваются по суммарному показателю трех тестов - словарного, математического мышления и восприятия трехмерного пространства);
  • 2) вербальные способности (измеряются словарным тестом, в котором испытуемый должен указать, какое из двух слов в каждом наборе имеет то же или противоположное значение);
  • 3) числовые способности (оцениваются тестами на вычисление и математическое мышление);
  • 4) пространственные способности (измеряются тестом восприятия трехмерного пространства, включающим задания на понимание отражения трехмерных объектов в двухмерном пространстве и на умения представлять результат движения в трех измерениях);
  • 5) восприятие формы (измеряется двумя тестами, в которых испытуемый сопоставляет чертежи деталей и геометрические формы);
  • 6) мысленное восприятие (тесты аналогичны тем, что используют для оценки восприятия формы, но сопоставляются названия, а не чертежи и формы);
  • 7) двигательная координация (измеряется простым тестом, в котором испытуемый делает в сериях квадратов определенные пометки карандашом);
  • 8) пальцевая моторика (измеряется двумя тестами, в которых испытуемый соединяет и разъединяет соответственно заклепки и шайбы);
  • 9) ручная моторика (оценивается с помощью двух тестов, в которых испытуемый перемещает и переворачивает фишки на доске).

Проведение всей батареи длится примерно 2,5 часа.

Батарея тестов общих способностей стандартизирована па выборке 4000 человек, репрезентативной популяции рабочих и служащих США. Были найдены системы показателей, в которых для каждой профессии установлены способствующие ее овладению особенности и их минимально допустимые уровни. Например, для бухгалтера необходимо получить показатели не ниже 105 по фактору общих способностей к обучению и не ниже 115 по фактору числовых способностей. Для слесаря минимальный показатель по фактору общих способностей к обучению равен 85, пространственных способностей и ручной моторики 85 и мысленного восприятия 75.

При консультировании профиль показателей индивида сопоставляется с нормативными показателями профессий, и тс профессии, нормативные показатели которых достигнуты или превышены испытуемым, могут при консультировании рекомендоваться ему.

Показатели разных видов надежности колеблются в пределах от 0,80 до 0,90. Удовлетворительны коэффициенты валидности. К недостаткам САТВ относят ориентацию тестов на скоростное выполнение, а также непредставленность многих способностей. Например, в этой батарее не оцениваются технические способности, находчивость и некоторые другие особенности. Поэтому ею не охвачены те профессии, где эти характеристики требуются.

Кроме того, было обнаружено, что тестовые профили высоко успешных представителей одной профессии могут различаться. Следовательно, при сопоставлении индивидуальных профилей с нормативными для тех или иных профессий далеко не всегда можно констатировать наличие профессиональной пригодности индивида. Это связано с тем, что возможна широкая компенсация одних особенностей, недостающих для успешного выполнения деятельности, за счет других. Как об этом уже говорилось выше, одного и того же уровня достижений можно добиться разными способами. Человеческая индивидуальность отличается высокой пластичностью, изменчивостью, способностью к развитию и совершенствованию. Изменчивость относится к миру многих профессий, к характеру тех требований, которые они предъявляют к работникам. Еще раз вспомним о решающей роли мотивации, интересов, склонностей человека.

Все сказанное объясняет, почему валидизация относительно критериев обучаемости отдельным профессиям дает коэффициенты валидности значимо выше, чем валидизация по критериям профессиональной успешности. Диагносты признают, что показатели GATB могут неплохо предсказывать успешность профессионального обучения и эффективность работы в начальный период (до двух лет стажа).

Чтобы облегчить использование показателей этой батареи для консультирования, профессии, выполнение которых требует сходных особенностей, в 70-е гг. XX в. были объединены в относительно небольшие по числу типы. Таких типов было выделено не многим более 60. Для каждого типа нормативные показатели устанавливались по трем наиболее важным характеристикам. Окончательная система показателей была названа системой Паттернов профессиональной пригодности (Occupational Aptitude Pattern - ОАР), охватывающих тысячи конкретных профессий и специальностей.

Для работы с учащимися старших классов, а также со всеми, кто проявил интерес к армейским специальностям, используется Батарея профессиональной пригодности Вооруженных сил США Armed Services Vocational Aptitude Battery - ASVAB), включающая 10 тестов, диагностирующих такие, например, параметры, как общие естественнонаучные знания, понимание параграфов инструкций, знания математики, техническое понимание, осведомленность в электронике и автотехнике и др.

Для отбора и распределения новобранцев в армии США используется Квалификационный тест вооруженных сил (Armed Forces Qualification Test - AFQT). Помимо этого, каждая из армейских служб (военно-воздушные силы, сухопутные войска и др.), используя субтесты Квалификационного теста, разрабатывает свои методики и комбинированные показатели по ним для отбора и распределения персонала в соответствии со своими критериями.

Служба занятости США для облегчения процедуры тестирования и поступления на работу малограмотных и культурно неразвитых людей разрабатывает специальные батареи, в которых используются особые процедуры, помогающие сориентироваться в тесте, правильно понять его задачи и характер. В эти батареи включаются материалы и планы бесед для снятия тревожности. Для этих категорий испытуемых издаются специальные брошюры, объясняющие, что значит хорошо выполнить тест, включающие примеры заданий и бланков ответов такого типа, какие использованы в GATB. К таким батареям, разработанным для особых категорий населения, относятся Тесты элементарной профессиональной грамотности (Basic Occupational Literacy Tests - BOLT), включающие тесты словарный, на понимание прочитанного, арифметических вычислений и математического мышления. Показатели этой батареи оцениваются в соответствии с требованиями, предъявляемыми разными группами профессий, а не школьным обучением.

Завершая обсуждение тестов и батарей специальных способностей, разработанных на Западе (главным образом в США), отметим, что эта область диагностирования является одной из наиболее развитых. Создано и используется большое число тестов и батарей специальных способностей как в системе образования, так и для профессиональных целей. Несмотря на позитивную в целом оценку возможностей этих тестов и батарей, психодиагносты продолжают собирать информацию относительно их надежности и валидности, уточняют параметры выборок, для которых они репрезентативны, выясняют воздействие разных факторов, влияющих на их выполнение, совершенствуют процедуры тестирования и их показатели, разрабатывают специальные приемы использования этих показателей.

Вместе с тем все чаще психодиагносты приходят к выводу, что прогнозы относительно учебной и профессиональной успешности возможны только на основе совокупной информации об индивиде, когда результаты тестов способностей рассматриваются не изолированно, а лишь как один из аспектов оценки наряду с показателями личностных методик, тестов достижений, биографических анкет и др. Так, Э. Гизелли нашел, что при обследовании водителей такси корреляция между их трудовой эффективностью и показателями тестов специальных способностей равнялась лишь 0,22. Но если учесть интересы и профессиональную мотивацию, то этот коэффициент можно существенно повысить - до 0,664 у водителей с высоким уровнем мотивации. В другом исследовании, выполненном Р. Грумсом и Н. Эндлером, было обнаружено, что успеваемость студентов с высокой тревожностью больше коррелирует с показателями тестов способностей (г = 0,63), чем у спокойных студентов (г = 0,19) .

Важно указать и на то, что в настоящее время западные диагносты признают зависимость тестов способностей от обученности индивидов, от приобретенных ими навыков и знаний. Так, исследователи пришли к выводу о том, что результаты Теста суждений об искусстве Мейера подвержены значительному влиянию профессионального обучения (корреляции от 0,4 до 0,69 между уровнем художественного образования и показателями теста Мейера). Найдена подверженность результатов Теста меры музыкальной одаренности Сишора влиянию практики и тренировки. Поэтому все чаще психодиагносты стремятся не использовать термин "способность" в названиях этой группы тестов, заменяя его понятиями "эффективность", "успешность" и др. Считается, что лучше отказаться от понятия "способность" применительно к тестам и говорить о различиях в знаниях и умениях, позволяющих в определенных условиях добиваться определенных достижений .

  • Анастази А. Психологическое тестирование: в 2 т. М.. 1982. 2 Там же.
  • Анастази А.
  • Анастази А. Психологическое тестирование: в 2 т. М., 1982.
  • Arntzen F. Einfuhrung in die Begabungspsychologie. Gottingen. 1976.

дипломная работа

2.4 МЕТОДЫ ОЦЕНКИ ДИФФЕРЕНЦИРУЮЩЕЙ СПОСОБНОСТИ

Дифференцирующая способность (ДС) - способность тестового задания дифференцировать (различать) сильных (способных) от слабых . Рассмотрим несколько методов вычисления дифференцирующей способности.

М етод 1 - вычисление коэффициента дискриминации.

А. В этом методе вычисляется коэффициент дискриминации по формуле :

где x - среднее арифметическое значение всех индивидуальных оценок по тесту, - среднее арифметическое значение оценок по тесту у тех испытуемых, которые правильно решили задачу, - среднеквадратическое отклонение индивидуальных оценок по тесту для выборки, n - число испытуемых, правильно решивших задачу, - общее число испытуемых.

В. Коэффициент дискриминации задачи может принимать значение от -1 до +1. Высокий и значимый положительный коэффициент является показателем того, что задача хорошо разделяет испытуемых с высокими и низкими оценками по тесту. Высокий, значимый отрицательный коэффициент свидетельствует о непригодности задачи для теста. Если значение коэффициента близко к 0, то задачи должны рассматриваться как некорректно сформулированные .

2-й метод - вычисление дискриминативности с применением метода крайних групп .

А. В этом методе вычисляется дифференцирующая способность (дискриминативности) с применением метода крайних групп, то есть при расчете учитываются результаты учащихся, наиболее и наименее успешно справившихся со всем тестом. Как правило, берут от 10 до 30% лучших и худших по результатам выполнения всего теста. Индекс дискриминации задания вычисляется как разность долей испытуемых из высокопродуктивной и низкопродуктивной групп, правильно решивших ее .

где - количество учащихся в группе лучших, верно выполнивших данное задание, - количество учащихся в группе худших, верно выполнивших данное задание, - общее количество испытуемых в группе лучших, - общее количество испытуемых в группе худших.

В. В этом методе, также как и в предыдущем, индекс дискриминации может изменяться в пределах от +1 (когда с заданием справились все учащиеся лучшей группы и ни один ученик из худшей группы) до -1 (когда складывается обратная ситуация - в лучшей группе никто не справился, а в худшей справились все). Задания с отрицательным значением индекса дискриминации или со значением, близким к нулю, не могут быть признаны удовлетворительными, и в них следует искать существенные ошибки. Показатель индекса дискриминации, больший 0,3, следует признать удовлетворительным .

3-й метод - сравнение средних достижений испытуемых, показавших наиболее высокие и наиболее низкие результаты.

А. Дифференцирующая способность вычисляется по формуле:

где и - средние достижения групп с наиболее высокими и наиболее низкими результатами соответственно (группа испытуемых делится на две равные части) .

4-й метод - проведение тестирования дважды в одной и той же группе в течение некоторого периода времени .

А. В этом методе дифференцирующая способность вычисляется по формуле:

где и - число правильных ответов по тесту, данных во время первого и второго тестирования соответственно, N - число испытуемых .

5-й метод - сравнение результатов выполнения одного и того же теста в разных группах.

А. И в последнем методе дифференцирующая способность вычисляется по формуле :

где и - число правильных ответов по тесту, данных в первой и второй группах, и - число испытуемых в каждой из групп.

В. Интерпретация результатов в последних трех методах следующая: дифференцирующая способность теста считается удовлетворительной, если показатель .

Вывод: можно заметить, что формулы нахождения дискриминативности 2-м и 3-м методами практически не отличаются. Разница заключается лишь в том, что в первом случае мы используем метод крайних групп. В 4-м и 5-м методах особенностью является ситуация тестирования (проведение тестирования дважды в одной группе и сравнение результатов в разных группах).

Государственное управление в сфере образования в Калмыкии

Проведение рыночных преобразований в России выдвигает соответствующие требования к подготовке высококвалифицированных специалистов, способных работать в новой экономической среде, а, следовательно, и к структуре системы образования...

Методика социально-педагогической деятельности по развитию творческих способностей детей младшего школьного возраста

творческий способность школьный изобразительная Под способностями понимают высокий уровень развития общих и специальных знаний, умений и навыков, обеспечивающих успешное выполнение человеком различных видов деятельности ...

Методы изучения педагогического опыта - это способы исследования реально складывающегося опыта организации образовательного процесса. Изучается как передовой опыт, т.е. опыт лучших учителей, так и опыт рядовых педагогов...

Методология научных исследований в педагогике

Третью классификацию методов мы рассмотрим более подробно. Традиционно-педагогические методы. Традиционными называются методы, доставшиеся современной педагогике по наследству от исследователей, стоявших у истоков педагогической науки...

Методы обучения и их выбор

Проверка и оценка знаний, умений и навыков учащихся является важным структурным компонентом процесса обучения и в соответствии с принципами систематичности...

Организация контроля и учета знаний, умений и навыков

Обсуждая оценку знаний по экономике, стоит хорошенько задуматься над вопросом - что именно учителя пытаются оценить? В прошлом в тестах и экзаменах делался неоправданно большой акцент на изучении и воспроизведении фактов. В последние годы...

Методы оценки основных характеристик теста состоят из двух частей: A. Вычисление некоторой величины или характеристики; B. Интерпретация полученного результата, в соответствии с нормой. Норма определяется согласно специфике теста...

Особенности статистической оценки качества теста диагностики индивидуального прогресса учащихся общеобразовательной школы

Напомним, что валидность в теории тестирования означает соответствие формы и содержания теста тому, что он должен оценивать или измерять по замыслу его создателей . Из анализа литературы мы выделили два метода оценки валидности...

Особенности статистической оценки качества теста диагностики индивидуального прогресса учащихся общеобразовательной школы

Как уже говорилось выше, надежность теста характеризует степень устойчивости результатов тестирования каждого испытуемого. Методы оценки надежности заключаются в вычислении коэффициента надежности разными способами...

Оценка эффективности деятельности государственного бюджетного образовательного учреждения среднего профессионального образования

Теоретические основы оценки качества образовательных услуг с участием потребителей» посвящена разработке и теоретическому обоснованию модели оценки качества образовательных услуг...

Пейзажная живопись как средство развития творческих способностей

Очень часто, когда мы пытаемся объяснить, почему люди, оказавшиеся в одинаковых или, почти одинаковых условиях, достигают разных успехов, мы обращаемся к понятию способности, полагая, что разницу в успехах людей можно объяснить именно этим...

Проблемы в повышении эффективности качества образования выпускников

В условиях модернизации системы профессионального образования...

Усвоение знаний в школе

В самом общем виде способности - это индивидуально-психологические особенности личности, обеспечивающие успех в деятельности, в общении и легкость овладения ими. Способности не могут быть сведены к знаниям, умениям и навыкам...

Физиолого-педагогические особенности развития учащихся в подростковом возрасте

Формирование двигательной активности детей старшего дошкольного возраста

Анализ литературы и опыт работы с детьми показывают, что для оценивания различных сторон физической подготовки дошкольников, используются контрольные испытания (тесты)...

1. Батарея тестов дифференциальных способностей (DAT)
комплексная батарея из восьми тестов, предназначенная для использования в образовательном и профессиональном консультировании учащихся старших классов средней школы.


Американская психологическая ассоциация
Год создания: 1947, пересмотрена в 1963 и 1973 гг
Назначение: прогноз успешности обучения в высшей школе и профессиональная консультация.
Суммарный показатель субтестов "Словесное мышление" и "Числовые способности" рассматривается как индекс способностей к обучению, он коррелирует на уровне 0.70 -0.80 со сложным критерием учебных достижений.
Возрастной диапазон: учащиеся 7-12 классов средней школы США
Время тестирования: 5 часов
тест DAT относится к тестам предельных возможностей. Надежность теста очень велика (0.90). Взаимные корреляции субтестов близки к 0.5. Результаты сопоставления данных теста с оценками школьной успеваемости показали, что корреляции достаточно велики.

Описание субтестов DAT:

1) словесное мышление. Используются двойные аналогии. От испытуемого требуется заполнить пропуски слов в предложении, выбрав нужную пару слов из списка.
2) числовые способности. Испытуемому предлагают простые уравнения. Он должен выбрать подходящий ответ.
3) абстрактное мышление. Серии фигур расположены в определенной последовательности. Испытуемый должен продолжить серию, выбрав соответствующую фигуру из 5 предложенных.
4) пространственные отношения. Предъявляются развертки геометрических тел. Испытуемый должен выбрать фигуру, соответствующую развертке.
5) техническое мышление. Даны картинки, описывающие определенную физическую ситуацию. Нужно ответить на вопрос, поняв физический принцип действия механизма.
6) скорость и точность восприятия. Предъявляется серия буквенных пар, одна из которых выделена. Испытуемый должен найти эту комбинацию на бланке ответов.
7) грамотность. Испытуемому предъявляется список слов, он должен проверить правильность их написания.
8) использование языка. Дается предложение, которое содержит грамматические или синтаксические ошибки. Испытуемый должен их найти.

Девятый показатель — мера способности к обучению (или академической способности), является производным, получаемым путем объединения показателей по тестам «словесное мышление» и «Числовые способности». В качестве дополнения в батарею также входит Опросник планирования карьеры

Существующие формы этого теста (S и Т) были стандартизованы на национальной выборке из 60 000 учащихся и имеют нормативные данные по классам и полу.

Представленные в руководстве данные по валидности свидетельствуют о том, что показатели Д. т. с. прогнозируют успеваемость по различным предметам в средней школе и дифференцируют уч-ся в отношении их будущей профессиональной деятельности. Вместе с тем, однако, имеется мало свидетельств в поддержку дифференциальной валидности паттернов показателей по различным тестам этой батареи.

2. Батарея тестов общих способностей (GATB)
Назначение: диагностика структуры интеллекта, а также перцептивных и сненсомоторных способностей с целью профессиональной ориентации и расстановки кадров в армии и в государственных утверждениях.
Разработан Службой занятости США для использования в области профессионального отбора и профориентации.
Год создания : 1940, позднейшая версия 1956 года
Возрастной диапазон: работающие, поступающие на службу и обучающиеся различным видам работы
Время тестирования: 2.5 часа
Стандартные нормы были получены на выборке 4000 рабочих и служащих США. Надежность теста весьма велика (r=0.90). Внешняя валидность теста характеризуется высокой положительной корреляцией с успешностью профессиональной деятельности. Для разных групп она колеблется от 0.40 до 0.84. Для большинства профессий этот показатель равен 0.6.

Разработка GATB базировалась на факторном анализе предварительного набора из 50 тестов, в ходе которого были выделены 9 основных факторов, диагностируемые GATB:

G — общая способность к обучению, восприятию указаний, рассуждению и оценке. Балл получается на основе сложения показателей 3 тестов: вербального, числового и теста на восприятие трехмерного пространства. (тесты III, IV, VI);
V — вербальные способности. Измеряются тестом на выделение из группы слов, которые имеют сходное или противоположное значение. (тест IV)
N — числовые способности. Тестируются двумя тестами: арифметические задачи (50 задач) и арифметические упражнения (50 простых заданий с одним действием). (тесты II, IV)
S — пространственные способности. Тестируются заданиями на восприятие форм: испытуемому дается чертеж с разверткой объемной фигуры, он должен отобрать изображение, соответствующее развретке. (тест III)
Р — восприятие формы. Измеряется двумя тестами. В первом тесте предлагается два набора фигур на двух частях листа. Фигуры одинаковы, отличаются лишь расположением и разворотом. Нужно найти идентичные фигуры. Во втором тесте требуется установить, какое из четырех изображений соответствует образцу. (тесты V, VII)
Q — мысленное восприятие слов (скорость восприятия клерка). Испытуемый должен выявить идентичность написания слов в парах (150 пар) (тест I)
К— двигательная координация. Испытуемый должен по образцу как можно быстрее нарисовать линии в квадратиках. (тест VIII)
F — пальцевая моторика. Измеряется двумя тестами "психомоторной ловкости". В первом тесте испытуемый должен, действуя обеими руками, вынимать стержни из отверстий в верхней части доски и вставляет их в отверстия нижней части. Тест повторяется трижды. Во втором тесте испытуемый одной рукой вынимает из отверстий каждый из 48 стержней, поворачивает его и вставляет другим концом в то же отверстие. Тест повторяется трижды. (тесты XI, XII);
М — ручная моторика. Измеряется двумя тестами на пальцевую подвижность. Даются доски со 100 отверстиями (по 50 в верхней и нижней частях). В верхней части доски в отверстия вставлены металлические заклепки. На доске закреплен стержень с набором шайб. В первом тесте испытуемый должен взять заклепку, надеть шайбу и вставить их в нижнюю часть доски. Во втором тесте он должен вернуть заклепки и шайбы в исходное положение. (тест IX, X).

GATB включает 12 тестов, направленных на анализ различных комплексных способностей, актуализируемых в широком круге видов профессиональной деятельности. Восемь субтестов являются тестами бланковыми, четыре требуют для проведения специальных приспособлений. Все субтесты являются тестами скорости. Состав тестов GATB следующий.

I тест. Сопоставление и выявление сходств и различий в парах слов по буквенному составу (150 пар).
II тест. Арифметические упражнения (50 простых задач с одним арифметическим действием).
III тест. Восприятие форм.
IV тест. Словарный.
V тест. Сравнение изображений.
VI тест. Арифметические задачи
VII тест. Сравнение геометрических фигур.
VIII тест. Воспроизведение линий рисунка по образцу.
IX тест. Психомоторная ловкость.
X тест. Психомоторная ловкость.
XI тест. Подвижность пальцев.
XII тест. Подвижность пальцев.

Процедура обследования занимает около 2,5 ч.



error: Контент защищен !!