Выполнение очередной серии групповых заданий в кольце крови в награнде дренора даст звание: имя чемпион крови

Глава 3 Диагностика интеллекта

Психометрические замечания

Психологической диагностике способностей, ставшей в последние два десяти­летия одной из самых популярных областей психологии, посвящено множество монографий, практических руководств, методичек и т. п., см., например, [1, 6, 8, 17]. Лучшим руководством по психодиагностике до сих пор является книга Анны Анастази «Психологическое тестирование» [I], неоднократно изданная во многих странах мира.

Это избавляет нас от необходимости останавливаться на проблемах валидности, надежности и достоверности тестов интеллекта, проблемах применимости тех или иных диагностических процедур при решении научных и практических задач, на детальной информации о многочисленных тестах и тестовых батареях, созданных в нашей стране или за рубежом.

Обратим внимание только на основные, наиболее распространенные в на­шей стране тесты общего интеллекта и его структуры, по возможности опираясь на опыт применения этих тестов в лаборатории психологии способностей Инсти­тута психологии РАН. По причине редкого применения в нашей стране и отсут­ствия квалифицированной ревалидизации ряд тестов, в частности тест Стэнфорд — Бине, в книге рассматриваться не будут.

Все же для удобства изложения нужно привести некоторые общие соображе­ния, касающиеся диагностики интеллекта и конструирования тестов интеллекта.

Разработка любого психодиагностического теста состоит из трех этапов: 1) анализ диагностической проблемы, 2) собственно конструирование теста, 3) отбор заданий.

На первом этапе автор формулирует задачу: что диагностировать, какое психическое свойство он собирается измерять. Ответ на этот вопрос содержится в многочисленных концепциях интеллекта, о которых говорилось выше. Ис­следователь либо берет на вооружение одну из существующих, либо, если суще­ствующие концепции чем-то его не устраивают, создает свою.

Второй вопрос: каким способом измерять интеллект? Производится теоре­тический анализ достоинств и недостатков существующих методов, и, если ме­тоды, созданные до сих пор, не удовлетворяют автора по некоторым теоретиче­ским или практическим соображениям, он берется за создание собственной методики.

Ответ на вопрос «для чего?» и сама его постановка от автора не зависят, а определяются той научно-практической задачей, которую он может модифици­ровать, но не в силах игнорировать.

На втором этапе происходит собственно работа по созданию теста. Главными инструментами здесь служат авторская интуиция, опыт предшественников и зна­ние специфики некоторой интеллектуальной деятельности. Психолог обычно ис­ходит из интуитивного представления об изоморфизме внутреннего (ментального) и внешнего (моторно-перцептивного) планов действия и аналогии между ними.

Любая психологическая методика, направленная на диагностику интеллекта или парциальных способностей, есть задача (игровая, учебная или трудовая), не­которая модель ситуации, встречающейся в обычной человеческой жизни. Вне­шняя валидность теста (ее еще можно назвать «экологическая валидность») — это соответствие тестовой задачи той реальной жизненной задаче, которая слу­жила прототипом теста.

Что касается внутренней валидности, которая, как известно, заключается в соот­ветствии процедуры измерения измеряемому свойству, то она зависит от интуиции исследователя, который предположил, что решение именно данной задачи опреде­ляется уровнем развития у человека определенного психического свойства.

Чтобы «измерить» это свойство, мы можем лишь вооружить испытуемого средствами («внешними» и «внутренними», проводя обучение или инструктируя). Кроме того, исследователь может воздвигать на пути правильного решения препят­ствия, затрудняя первичный анализ материала и условий задачи, повышать уровень трудности, вводить дополнительные помехи («внешние» и «внутренние»), изменять «обратную связь» и так далее. Но все затруднения мы вводим лишь на основе глу­бинной аналогии между «внешними» и «внутренними» планами поведения.

Единственное, что варьирует экспериментатор, — это трудность задания, а у испытуемого есть лишь одно средство ее преодолеть — проявить свои способ­ности. Предположение о независимости объективного уровня трудности задания от способностей испытуемого являлась основной предпосылкой при создании в 1952 году датским математиком Г. Рашем [2, 3] модели теста, на основе которой было создано семейство вероятностных моделей Раша.

Модель имеет две основные версии: мультипликативную и аддитивную. В соответствии с этой моделью правильность решения теста определяется либо высоким уровнем развития способности, либо низким уровнем трудности задания.

В специальной литературе описаны компьютерные алгоритмы и программы, позволяющие на основе эмпирических результатов рассчитать как объектив­ную трудность задания, так и «способность» каждого испытуемого [2, З].

Сам Г. Раш использовал свою модель при создании критериальных тестов и ввел единицу измерения, называемую логит, которая измеряет в одной шкале как трудность задания, так и способность испытуемого.

В. С. Аванесов [4] предложил использовать несколько модификаций модели Раша: модель, учитывающую вероятность угадывания правильного ответа, и бо­лее сложную модель, учитывающую влияние на успешность решения теста дру­гих способностей.

Как бы там ни было, интуитивно психологи при создании тестов всегда строили задания таким образом, чтобы они варьировали по трудности и были направлены на измерение не более чем одной способности.

Третий этап конструирования теста является этапом отбраковки непригодных заданий, а не творческим процессом их создания. Но именно этот этап традицион­но считается конструированием теста. Для него разработан весь существующий в настоящее время аппарат эмпирико-статистической теории теста, предназна­ченный для оценки валидности и надежности теста и отдельных его заданий.

Процедура валидизации и проверки на надежность, гомогенность (однород­ность), дифференцирующую силу, прогностичность и т. д. сводится к отбору за­даний теста и представляет собой итерационную процедуру доведения теста до требуемого уровня качества за счет замены заданий, их модификации, а также изменения процедуры проведения и интерпретации данных тестирования.

Все существующие тесты интеллекта можно условно разделить на две груп­пы: 1) тесты «скорости» и 2) тесты «уровня». Если при проведении первых вводится жесткий лимит времени, то при проведении вторых, хотя и есть ограни­чение времени выполнения теста или субтеста, но главную трудность для испы­туемого составляют особенности заданий. Встречаются варианты тестов, где используются оба вида затруднений.

Тесты «скорости» представляют собой несколько однотипных и близких по уровню сложности заданий. Испытуемый должен решить их за определенное время. Показателем успешности служит число правильно решенных заданий. Уровень сложности их должен быть близок 0,5, то есть задание решает правиль­но половина людей выборки, на которой проверяется тест.

В тестах «уровня», как уже было отмечено, время, которое дается испытуемо­му, значительно превышает время, необходимое среднему испытуемому для ре­шения теста. Создатель теста всегда полагает, что испытуемый, не справившийся с заданием за отведенное время, не решит его никогда. В качестве «измеритель­ной линейки интеллекта» в тестах «уровня» используется шкала сложности тестового задания.

Главное затруднение вызывает оценка сложности задания. Согласно модели Раша, сложность оценивается экспериментально, следовательно, имеет статисти­ческий характер. Кроме того, возникает необходимость установить: 1) минимально необходимое число заданий для каждого уровня сложности, 2) необходи­мое число уровней сложности, 3) достоверность различий оценок сложности заданий, принадлежащих разным уровням.

Эти проблемы решены в работе Ф. М. Юсупова [5], который предложил вероятностную модель прогнозирования параметров теста «уровня». Расчеты показывают, что в тестовом задании целесообразно брать от 6 до 10 вариантов ответа, чтобы минимизировать вероятность случайного решения.

Число заданий в тесте уровня не должно быть слишком велико для того, чтобы значения показателей сложности соседних по уровню сложности заданий надежно различались. Кроме того, нужно учесть, что правильный ответ может быть выбран испытуемым случайно.

При 6 вариантах ответа в каждом тестовом задании количество заданий не может быть более 6-7 (см. табл. 3).

Таблица 3.
Расчетные значения показателей сложности тестовых заданий

Номер задания

1

2

3

4

5

6

7

Показатель сложности

0,035

0,146

0,309

0,5

0,69

0,834

0,97

Модель, предложенная Ф. М. Юсуповым, позволяет спрогнозировать мини­мальный объем выборки, достаточной для стандартизации теста.

Соответствующая модель для расчета параметров теста с эквивалентными по трудности заданиями (тест «скорость») предложена в работе В. Н. Дружини­на [б].

Эмпирически проверка теста интеллекта на валидность и надежность — про­цедура стандартная и хорошо отражена в методических руководствах [I].

Главное, что следует заметить: все разработанные тесты рассматривают ин­теллект как некоторую непрерывную величину (по аналогии с ростом или ве­сом), которой люди характеризуются в разной степени.

Рис. 14. Отношения между шкалой IQ и шкалами отдельных тестов интеллекта

Подразумевается, что, как большинство биологических и социальных пара­метров, интеллект характеризуется нормальным распределением людей вдоль оси континуума.

Можно предположить, что существующие тесты интеллекта, включающие в себя задания разной сложности, захватывают разные участки этого континуума. Парадоксально, что это не отражается на характеристиках распределения людей по результатам тестирования! Возможно, к этому приводит искусственный под­бор заданий и процедура нормализации шкалы.

Число баллов в каждом тесте интеллекта имеет верхнюю и нижнюю грани­цы, а не простирается в бесконечность, следовательно, уместно говорить лишь о квазинормальности любого распределения людей по отношению к шкале тесто­вого балла.

При подсчете баллов во всех тестах используется кумулятивная аддитивная модель: суммируются баллы, набранные за выполнение каждого отдельного зада­ния, несмотря на их (заданий) содержательную разнородность.

На первый взгляд пользоваться гипотезой о прямой зависимости вероятно­сти решения задачи от уровня способности, с определенными оговорками, можно лишь для тестов с эквивалентными по трудности заданиями. В тестах «уровня» более целесообразно было бы применять шкалу трудности, измеряя способность самым сложным заданием, которое решил испытуемый. Однако решение зави­сит от массы случайных факторов, начиная с угадывания и кончая индивидуаль­ной интерпретацией тестовой задачи испытуемым.

На примере теста Равена мой аспирант Ф. М. Юсупов проверил, в какой мере валидны различные модели подсчета тестовых баллов:

  1. традиционный, применявшийся в тесте балльный показатель,
  2. сумма рангов сложности решенных заданий,
  3. количество правильно выполненных заданий (оценка трудности заданий не учитывалась),
  4. сумма показателей сложности решенных задач (сложность определялась отношением числа решивших задачу к общему числу испытуемых).

 

Таблица 4.
Коэффициенты вариации и их ошибки для четырех видов показателей тестовой шкалы

Система оценки

Коэффициент вариации

Ошибка коэффициента вариации

Без учета сложности

19,49%

1,4%

Модиф. показатель сложности

38,34%

2,76%

Сложность в баллах

24,43%

1,76%

Сложность в рангах

30,53%

2,19%

Время работы испытуемых с тестом не ограничивалось. Результаты иссле­дования показали, что наихудшей дифференцирующей способностью обладает показатель, не учитывающий трудности задания, что естественно, поскольку мы имеем дело с тестом уровня. Наилучшая дифференцирующая способность у модифицированного показателя трудности [5]. Показатель, учитывающий слож­ность в рангах, и традиционный показатель заняли второе и третье место.

W

0,8-0,7-0,6-0,5-0,4-0,3 -

m

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Рис. 15. График зависимости диапазона изменения показателя сложности от числа вариантов ответов в тестовом задании (по Ф. M. Юсупову)

Таблица 5.
Коэффициенты интеркорреляций для пяти различных показателей шкалы

Показатель шкалы

1

2

3

4

1. Используемый в тесте Равена

1

0,988

0,961

0,909

2. Учитывающий сложность в ранговой форме

0,988

1

0,94

0,981

3. Не учитывающий сложности тестовых заданий

0,961

0,94

1

0,885

4. Учитывающий сложность в форме весовых коэффициентов

0,909

0,981

0,885

1

5. Используемый в тесте

0,715

0,754

0,678

0,79

Таблица 6.
Результаты факторного анализа для пяти показателей шкалы

Показатель шкалы

I

II

h 2

1. Используемый в тесте Равена

0,911

0,385

0,978

2. Учитывающий сложность в ранговой форме

0,889

0,454

0,995

3. Не учитывающий сложность тестовых заданий

0,915

0,336

0,95

4. Учитывающий сложность в форме весовых коэффициентов

0,805

0,54

0,94

5. Используемый в тесте «уровня»

0,388

0,918

0,993

Для удобства факторизации показателей был введен пятый ранг наиболее сложного выполненного задания.

Факторизация по методу главных компонент с последующим их вращением по методу Г. Кайзера дала два значимых фактора (см. табл. 6). Наибольший вес по первому фактору имел традиционный показатель продуктивности, используе­мый в тесте Равена, а наименьший — показатель, учитывающий ранг наиболее сложного решенного задания.

Соответственно второй фактор имел максимальную нагрузку на последний показатель и минимальную — на традиционный, используемый в тесте Равена.

Поскольку первый фактор объяснял 64,9% дисперсии, а второй только 32%, можно было сделать совершенно очевидный вывод, что успешность выполнения теста Равена, несмотря на то что он является типичным тестом «уровня», опре­деляется скоростным фактором интеллекта в большей мере, чем фактором, обусловливающим решение сложных заданий. Естественно, результаты факто­ризации показали, что это разные факторы, и, следовательно, тесты «скорости» измеряют иной «интеллект», чем тесты «уровня». Этот результат тем более интересен, что тест Равена мы использовали без ограничения времени решения (не как тест «скорости», а как тест «уровня»).

Второй фактор интерпретируется как предельная возможность испытуемого при выполнении теста, что в большей мере соответствует теоретическому пони­манию способности как свойства психики.

Однако тестовая шкала, по которой способность будет определяться решени­ем лишь одного тестового задания, будет очень подвержена действию случайных факторов. Данные шкалограммного анализа показали, что испытуемые, решив­шие сложные задания, часто не справляются с простым.

Коэффициент корреляции реальной шкалограммы с идеальной равен 0,82 (желательная величина — 0,9).

Диагностика интеллекта 61

Тем самым наиболее приемлем комплексный показатель, учитывающий как число заданий, так и их эмпирически установленную сложность (см. табл. 4-5).

Первый же фактор следует назвать фактором скоростной продуктивности, что соответствует пониманию интеллекта Г. Айзенком.

Прогрессивные матрицы Дж. Равена

Дж. Равен был учеником Ч. Спирмена. В 1936 году он совместно с Л. Пенроузом предложил тест Progressive Matrices для измерения уровня развития об­щего интеллекта. По мнению Спирмена, наилучшим способом определения ин­теллекта является тест на поиск абстрактных отношений. В основу заданий тес­та положены теория гештальта и теория интеллекта Спирмена. Предполагается, что испытуемый первоначально воспринимает задание как целое, затем выделяет закономерности изменения элементов образа, после чего выделенные элементы включаются в целостный образ и находится недостающая часть изображения.

В качестве материала были выбраны абстрактные геометрические фигуры с внутренним рисунком, организованным по определенному закону (см. рис. 16).

Были сконструированы три основных варианта теста: 1) более простой цвет­ной тест, предназначенный для детей от 5 до 11 лет, 2) черно-белый вариант для детей и подростков от 8 до 14 лет и взрослых от 20 до 65 лет, 3) вариант теста, сконструированный в 1977 году Дж. Равеном в сотрудничестве с Д. Кортом и предназначенный для лиц с высокими интеллектуальными достижениями. По­следний вариант включает в себя не только невербальную, но и вербальную часть.

Тест может проводиться как с ограничением времени выполнения заданий, так и без ограничения (по желанию исследователя).

В цветном варианте теста используются три серии, различающиеся по уров­ню трудности. В каждой серии — 12 матриц. Второй вариант состоит из 5 серий (А, В, С, D , Е) по 12 заданий, расположенных по возрастанию трудности. Трудность заданий возрастает от серии А к серии Е. Первые 5 заданий серии А испытуемый выполняет с помощью экспериментатора, остальные — самостоятельно. Испы­туемый должен выбрать правильный ответ из 6-8 предложенных. Число вариан­тов ответа увеличивается по мере возрастания трудности серии.

Равен предполагал, что в ходе выполнения теста испытуемый обучается и выполнение предшествующего задания готовит его к выполнению последующего, более трудного.

В серии А испытуемый должен дополнить недостающую часть изображения. Он должен проявить умение дифференцировать элементы и выявлять связи между элементами гештальта, а также дополнять недостающую часть структуры, сличая ее с образцами.

В серии В испытуемый должен найти аналогии между парами фигур, диффе­ренцируя их элементы.

ЕЮ

Рис. 16. Стандартные прогрессивные матрицы Дж. Равена (образец задания)

При выполнении серии С нужно решить задачу, определив принцип измене­ния фигур по вертикали и горизонтали.

В серии D требуется определить закономерность перестановки фигур по горизонтали и вертикали.

Серия Е для своего решения требует анализа фигур основного изображения и составления недостающей фигуры по частям.

За каждое правильное решение присваивается 1 балл, подсчитывается число правильных решений в каждой серии и общее число баллов, которые переводят­ся либо в стандартные баллы (стэны), либо в стандартный коэффициент IQ . На основе результатов по сериям вычисляют также «индекс вариабельности». Су­ществуют полученные на выборке стандартизации распределения числа правиль­ных решений по сериям, соответствующие общей сумме баллов. Табличное рас­пределение сравнивается с полученным при тестировании испытуемого, а разно­сти ожидаемой и эмпирической оценок суммируются без учета знака. «Индекс вариабельности» характеризует достоверность результатов и направлен на вы­явление испытуемых, решавших задания путем угадывания или симулирующих низкий результат (не решавших простые задачи).

Нормальное значение индекса равно 0—4, при значении 7 ответы испытуемо­го считаются недостоверными.

Как уже было отмечено раньше, вряд ли такую интерпретацию можно счи­тать единственно возможной. В наших исследованиях показано, что решение теста Равена имеет вероятностный характер, поскольку отсутствие интереса к простым заданиям, неправильное понимание задачи (провоцируемое самим ма­териалом теста) приводят к тому, что испытуемый, решая сложные задания, мо­жет допустить ошибку в простых.

Надежность теста Равена варьирует в пределах от 0,70 до 0,89; средняя трудность заданий теста 0,32; корреляция с успешностью школьного обучения (оценкой успеваемости) — 0,72. Корреляция с IQ по тесту Д. Векслера ( WAIS ) составляет 0,70-0,74 (взрослые) и 0,91 (дети 9-10 лет), с арифметическими тестами — до 0,87. Наши исследования показали, что тест Равена не является метрологически безупречным.

Задания D 12 и Е8 сконструированы настолько неудачно, что вероятность их правильного решения (0,13 и 0,14) не превышает значимой вероятности случай­ного решения этого задания (р = 0,125). В задания либо заложена неправильная идея, либо форма материала делает вероятным для испытуемого логические по­строения, не предусмотренные разработчиком.

В задании ЕЮ, помимо правильного варианта ответа (№ 6), есть два (№ 1 и № 2), частота выбора которых испытуемыми статистически значимо превышает вероятность случайного ответа.

Для задания С12 оценка вероятности выбора правильного ответа (№2) пре­вышает границу статистической значимости, но оценка вероятности выбора лож­ного варианта (№ 4) значимо превосходит вероятность правильного выбора.

То есть сама структура неверно сконструированного задания наводит испы­туемого на ложный ответ. Такое положение дел есть следствие конфликта двух теорий, эклектически положенных в основу теста: перцептивной (гештальт-теория) и теории общего интеллекта. Перцептивные характеристики задания меша­ют испытуемому произвести его последовательный логический анализ. Тем са­мым не стратегия «от целого к деталям» вступает в конфликт со стратегией «от деталей к целому», а перцептивная закономерность противоречит логической.

Согласно модели Юсупова, число заданий в тесте уровня не должно превы­шать 7, а в тесте Равена их 60 (в сокращенном варианте — 30). Тест явно информационно избыточен. Базовыми заданиями, достоверно различающимися по уровню сложности, можно считать только: В8, А12, С4 (или D 6), D 8 (или D 10, илиЕ2),С8,Е6,Е10,Е12.

Число легких заданий в тесте Равена чрезмерно велико — на долю их при­ходится почти половина всех заданий теста. Более того, нет соответствия между эмпирической и стандартной трудностью заданий (г = 0,543).

Для оценки сложности задания нами и был предложен модифицированный показатель сложности:

С = 1 - n / N ,

где n — число решивших тестовое задание, N — общий объем выборки стандар­тизации.

В первом разделе главы уже упоминалось, что предложенный авторами те­ста вариант подсчета тестового балла не оправдывает себя и должен быть заме­нен на более достоверный, учитывающий эмпирическую сложность задания.

Успешность выполнения теста, как мы установили, зависит как от уровня развития «скоростного интеллекта», так и от когнитивной способности, обуслов­ливающей решение сложных заданий.

Возможно, в основе второго фактора лежит дифференцированность когни­тивного опыта личности, связанная с такими особенностями интеллекта, как ког­нитивная сложность, сформированность понятий, вербальная компетентность.

Факторизация корреляционной матрицы применения теста Равена, теста на диагностику когнитивной «простоты — сложности» (автор А. Г. Шмелев) и теста «Понятия» (на обобщение понятий) показала, что выделяются два независимых фактора — невербальный и вербальный, имеющие равный вес, но методика на обобщение понятий включена в невербальный фактор.

Факторный анализ матрицы интеркорреляций семи методик (тест когнитив­ной простоты — сложности, тест Равена, методика «Понятия», тест Айзенка и пр.) выявил 3 равнозначимых фактора: невербальный — перцептивный (максималь­ная нагрузка на тест Равена), скоростного интеллекта (максимальная нагрузка — тест Айзенка и геометрический тест на обобщение) и фактор вербальной компе­тентности (положительная нагрузка на тест «Понятия» и показатель когнитив­ной простоты). Вместе с тем обнаружена отрицательная и значимая нагрузка этого фактора на тест Равена. Следовательно, чем сложнее и дифференцирован­ное когнитивный опыт испытуемого, тем успешнее он решает тест Равена, требу­ющий аналитической работы, и хуже справляется с заданиями на понятийное обобщение.

Дифференцированность когнитивных структур является одним из главных параметров интеллекта, определяющих успешность решения аналитических мыслительных задач, в том числе — в тесте Равена.

Тест Д. Векслера

Тест Д. Векслера является одним из наиболее известных и часто использу­емых в психологической, педагогической и медицинской практике. Он относит­ся к числу индивидуальных тестов и применяется в ходе личного взаимодей­ствия психолога с испытуемым.

  • Тест основан на иерархической модели интеллекта Д. Векслера и диагностиру­ет общий интеллект и его составляющие — вербальный и невербальный интеллек­ты. Применению теста Векслера посвящено свыше 2000 публикаций. В нашей стране методические руководства к тесту и сам тест выпустили несколько пси­ходиагностических предприятий, поэтому, вместо того чтобы давать подробное
  • Диагностика интеллекта 65
  • описание теста, я ограничусь лишь необходимым минимумом информации, а так­же уместной теоретической и метрологической характеристикой теста.

Первая версия теста предложена в 1939 году (шкала Векслера — Бельвью, по названию клиники Bellevue ) для диагностики интеллекта людей в возрасте от 7 до 69 лет. Д. Векслер подверг критике существующие тесты (в первую оче­редь, тест Стэнфорд — Бине) считая их непригодными для тестирования взрос­лых. Традиционный показатель IQ — «умственный возраст» — совершенно не­применим для характеристики интеллекта взрослых. Большинство тестов ин­теллекта ориентированы на скорость, что может вызвать, по мнению Векслера, затруднения у пожилых людей.

В традиционных тестах много места занимали шаблонные операции со сло­вами и примитивные задания, сконструированные для детей.

Отказавшись от группировки заданий по возрастному параметру, Векслер объединил тестовые задания в сходные по содержанию субтесты, внутри субте­стов задания были расположены по уровню трудности. Вместо показателя «ум­ственный возраст» он впервые ввел возрастные нормы.

Результат испытуемого соотносился с нормами той возрастной группы, к которой он принадлежал на момент тестирования. Переход от абсолютных пока­зателей к относительным был и силой, и слабостью методики Векслера, посколь­ку этот прием постулировал константность IQ человека на протяжении жизни.

Используются 3 варианта теста Векслера: тест WAIS , предназначенный для тестирования взрослых (от 16 до 64 лет), тест WISC — для тестирования детей и подростков (от 6,5 до 16,5 года) и тест WPPSI (для детей от 4 до 6,5 года).

В России адаптированы первые два варианта теста, которые мы и будем рассмат­ривать в этом разделе.

Тест WAIS опубликован в 1955 году, редакция теста — WAIS - R вышла в 1981 году [9].

Тест включает в себя 11 субтестов. Из них 6 составляют вербальную шкалу и 5 — невербальную. В вербальную часть вошли следующие субтесты.

1. Общая осведомленность: включает 29 вопросов. Диагностирует уровень простых знаний. Нет вопросов, требующих специальных и теоретических знаний. Правильный ответ оценивается в 1 балл.

2. Понимание: 14 заданий на понимание смысла выражений. Оценивается способность к суждениям. Оценка в зависимости от правильности ответа: О, 1, 2 балла.

3. Арифметика: включает 14 задач из курса арифметики начальной школы. Задачи решаются устно. Диагностируется легкость оперирования числовым ма­териалом. Оценивается как правильность, так и затраченное время.

4. Нахождение сходства: 13 заданий. Испытуемый должен подвести 2 пред­мета под общую категорию, выявить, что между ними общего. Диагностируется по­нятийное мышление. Оценка в зависимости от правильности ответа: О, 1, 2 балла.

5. Запоминание цифр: первая часть содержит ряды, в которых от 3 до 9 цифр. Испытуемый должен прослушать цифры и устно их воспроизвести.

Вторая часть включает ряды от 2 до 8 цифр. Испытуемый должен воспроизвести ряд в обратном порядке.

6. Словарный запас: 42 понятия. Тест направлен на изучение вербального опыта и умения давать определения понятиям. Испытуемый должен объяснить значение слова. Первые 10 слов — распространенные в обыденной речи, следу­ющие 20 слов — средней сложности, последние 12 — абстрактно-теоретические понятия. Оценка от 0 до 2 баллов. Вербальная шкала тесно коррелирует с общей культурой испытуемого и академической успеваемостью. Результаты сильно зависят от языковой культуры испытуемого (от владения языком, на котором написан текст). Оценки по субтестам «Осведомленность», «Понятливость» и «Словарный запас» характеризуют общий уровень развития испытуемого, прак­тически не изменяются с возрастом и при старении. Полагают, что они опреде­ляются уровнем образования испытуемых. Я же считаю, что связь иная: по­скольку успешность выполнения этих субтестов в наибольшей степени корре­лирует с общим IQ , а также в наибольшей степени определяется генетически (см. раздел «Психогенетика общих способностей»), то скорее всего скорость накопления вербальных знаний определяет успешность и уровень образования.

Особняком стоит субтест «Сходство». Результаты его выполнения говорят о способности к логическому мышлению, обобщению и абстрагированию. Оцен­ки по тесту ухудшаются при старении. Вероятно, успешность его выполнения в большей мере детерминирована «текучим» интеллектом по Кэттеллу, нежели успешность выполнения других субтестов вербальной шкалы.

Субтест «Арифметический» диагностирует не только успешность решения вычислительных задач, но и произвольную концентрацию внимания. Результаты его выполнения зависят от профессии и уровня образования и мало изменяются при старении.

Субтест «Повторение цифр» наиболее слабо коррелирует с общим интел­лектом и направлен на определение объема кратковременной памяти и уровня активного внимания. Включение этого субтеста в шкалу Векслер обосновывал его диагностической ценностью: неспособность воспроизвести 4 цифры в пря­мом порядке свидетельствует о слабоумии. Прямое воспроизведение при старе­нии ухудшается незначительно, обратное — несколько значительней.

Наиболее устойчивы по отношению к воздействию различных факторов (интуиция, общее состояние испытуемого, болезнь и пр.) результаты теста «Сло­варный запас», поэтому его часто используют в качестве «точки отсчета» при анализе профиля оценок по субтестам шкалы Д. Векслера.

Невербальная шкала, или «шкала действий», состоит из 5 субтестов.

7. Шифровка (или Цифровые символы): является вариантом теста на кодовые замены. Испытуемый должен написать под каждой цифрой (всего 100) соответствующий символ за 1,5 минуты. На бланке приводится «ключ»: под каждой из 9 цифр нарисован определенный символ. Диагностируется зрительно-моторная скорость. Оценка успешности определяется числом правильно зашифрованные цифр.

Диагностика интеллекта 67

8. Недостающие детали (или Завершение картинок)', состоит из 21 кар­точки, на которых изображены картинки с отсутствующей деталью, и диагности­рует зрительную наблюдательность, а также способность выявлять существен­ные признаки. Время решения одной задачи — 20 с. Правильный ответ оценива­ется 1 баллом.

9. Конструирование блоков (Кубики Косса): 40 заданий. Включает набор карточек с красно-белыми чертежами и набор красно-белых кубиков. Испытуе­мый должен, глядя на образец, собрать из кубиков картинку. Диагностируются двигательная координация и визуальный синтез. Оценивается точность и время решения.

10. Последовательные картинки: 8 серий картинок. Каждая серия пред­ставляет сюжет. Картинки предъявляются в определенной неправильной после­довательности. Испытуемый должен их правильно расположить. Диагностиру­ются способности организации целого из частей, понимания ситуации, экстрапо­ляции. Оценка определяется правильностью и временем решения.

11. Сборка объекта (Складывание фигур): 4 задания. Испытуемый должен собрать фигуру хорошо знакомого предмета из отдельных деталей (фигуры «че­ловек», «профиль», «рука», «слон»). Диагностируется способность к синтезу цело­го из деталей. Оценка зависит от времени и правильности сборки.

В целом невербальная шкала диагностирует не только знания, но и способ­ность индивида к моторно-перцептивному взаимодействию с объектами окружа­ющего мира, зависящую от опыта деятельности.

Первоначально Д. Векслер полагал, что невербальный интеллект больше зависит от психофизиологических задатков индивида, но данные близнецовых исследований опровергли эту гипотезу.

Наиболее комплексным (принадлежность его к этой части теста весьма условна) тестом невербальной шкалы является «Шифровка», диагностирующая свойства внимания, восприятия, координации. Результаты его выполнения быст­ро ухудшаются после 40 лет.

Наиболее информативным субтестом невербальной шкалы многие авторы считают «Кубики Косса». Аналогичен по содержанию и тест «Сборка объек­тов».

Успешность выполнения этих трех тестов зависит от развития сенсомотор-ной координации, между тем как результаты по тестам «Недостающие детали» и «Последовательные картинки» не зависят от развития моторики, а в большей мере определяются когнитивными способностями. По мнению Векслера, успеш­ность выполнения этих двух тестов определяется опытом восприятия окружа­ющей среды и приобщенностью к культуре.

Итог проведения теста во многом зависит от того, какие складываются отно­шения между психодиагностом и испытуемым.

Тестирование производится по адаптивному алгоритму. Первые задания большинства вербальных субтестов (а также «Кубики Косса») предназначены для лиц, подозреваемых в умственной отсталости. В случае, если испытуемый, не подозреваемый в умственной отсталости, не выполняет задания основной серии, то ему предъявляются первые задания.

Рис. 17. Проведение теста WISC - R (Д Векслер) Субтест «Сборка объектов»

Процесс интерпретации результатов выполнения части вербальных тестов не полностью алгоритмизирован и предполагает активное участие эксперимен­татора.

Обработка и интерпретация результатов может проходить на трех уровнях: 1) подсчет и интерпретация баллов общего интеллекта, вербального и невер­бального интеллектов, 2) анализ профиля оценок выполнения субтестов испыту­емыми на основе подсчета соответствующих коэффициентов, 3) качественная интерпретация индивидуального профиля с привлечением данных наблюдения за поведением испытуемого в ходе обследования и прочей диагностической ин­формации.

Стандартный вариант обработки заключается в подсчете первичных «сы­рых» оценок по каждому субтесту. Затем «сырые баллы» по соответствующим таблицам переводятся в стандартные и отображаются в виде профиля. «Сы­рые» оценки отдельно по вербальной и невербальной части суммируют, а затем находят по таблицам соответствующие показатели общего, вербального и невер­бального IQ (см. табл. 7).

Таблица 7.
Классификация IQ-показателей по Векслеру

IQ-показатель

Уровень интеллектуального развития

Процент выявления (по выборке 1,7 тыс. лиц от 16 до 64 лет)

130 и выше

Весьма высокий интеллект

2,2

120-129

Высокий интеллект

6,7

110-119

«Хорошая норма»

16,1

90-109

Средний уровень

50,0

80-89

Сниженная норма

16,1

70-79

Пограничный уровень

6,7

69 и ниже

Умственный дефект

2,2

Дополнительным является индекс возрастного снижения интеллекта. Со­гласно данным Векслера, все субтесты его батареи делятся на две группы: основ­ные, успешность выполнения которых мало зависит от возраста, и субтесты, ре­зультаты выполнения которых ухудшаются с возрастом.

К первым он отнес: «Словарный», «Осведомленность», «Составление фигур», «Обнаружение недостающих деталей», ко второй группе — «Воспроизведениие цифр», «Обнаружение сходства», «Шифровка» и «Кубики Косса».

Коэффициент возрастного снижения интеллекта ( DQ ) равен:

ТНР - ТПР

DQ = ———————х 100%,

ТНР

где ТНР — показатель по субтестам с неизменными результатами, ТПР — пока­затели по тестам с переменными результатами.

При анализе профиля выполнения субтестов используется ряд дополни­тельных индексов.

Важнейшей характеристикой является показатель разброса баллов, полу­ченных испытуемыми за выполнение каждого субтеста:

^ ? Xi - X |

11

- ZX ;

где Хг — балл за выполнение отдельного субтеста, а Х == ——

Наиболее часто употребляется коэффициент словарного разброса: разница между шкальной оценкой данного субтеста и оценкой по субтесту «Словарный запас». Значение баллов по этому субтесту, как правило, всегда выше, чем по другим, поэтому за исключением редких случаев отклонение является величи­ной отрицательной.

Алгебраическая сумма этих отклонений называется «сложным словарным разбросом»: его величина также почти всегда отрицательная. Оценка по субте­сту «Словарный» наиболее показательна для общего интеллекта и относительно стабильна при нарушениях адаптации индивида к среде.

Реже используют индекс модифицированного среднего разброса — разницу между оценкой любого вербального субтеста и оценкой всех остальных вербаль­ных субтестов (кроме субтестов «Числовые ряды» и «Арифметический») или баллом любого невербального теста и средней оценкой всех остальных невер­бальных тестов. Эта оценка отражает связь достижений испытуемого в отдель­ном субтесте с центральной тенденцией его достижений в остальных субтестах.

Иногда используют показатель «среднего разброса» — разницу между оцен­кой по одному из субтестов и средней арифметической оценкой всех субтестов (кроме субтестов «Арифметический» и «Числовые ряды»). Этот показатель от­ражает отношения отдельных достижений субъекта к центральной тенденции всех достижений. В медико-психологической практике вычисление этих показа­телей используется для уточнения диагноза. Например, считается, что значитель­ная величина 'отрицательного словарного разброса является показателем психо­за, в частности, преобладание отрицательного словарного разброса в невербаль­ной части — показатель депрессии, а резкое снижение уровня выполнения вербальных тестов относительно балла по субтесту «Словарный» является при­знаком прогрессирующего шизофренического процесса и т. д.

При индивидуальном тестировании используются более тонкие интерпрета­ции диагностического профиля по тесту Векслера.

Оценки по шкале Векслера сопоставлялись с оценками, которые получают те же испытуемые по шкале Стэнфорд — Бине. Как правило, интеллектуалы получа­ют более высокий балл по шкале Стэнфорд — Бине, нежели по шкале Векслера. Наоборот, интеллектуально отсталые получают более высокие оценки по тесту Векслера, нежели по тесту Стэнфорд — Бине.

Надежность WAIS весьма велика: 0,97, по шкале вербальной — 0,96, а по шкале действий — 0,93.

Наименее надежны «Запоминание цифр», «Сборка объектов» и «Расположе­ние картинок» (0,6). Наиболее надежен субтест «Словарный запас» (0,96).

Корреляция уровня успеваемости и результаты по вербальной шкале равны 0,40-0,50.

Факторизация теста WAIS, проведенная Дж. Коэном, дала следующие резуль­таты [10].

Обнаружен единый фактор, объясняющий 50 % всей дисперсии.

Выявлены 3 «групповых» фактора:

  1. Вербальное понимание («Словарный запас», «Осведомленность», «Понима­ние», «Нахождение сходства»).
  2. Перцептивная организация (главным образом — «Конструирование бло­ков» и «Сборка объектов»).
  3. Обозначен Дж. Коэном как фактор «памяти» и включает субтесты «Ариф­метика», «Запоминание цифр». Значение этого фактора резко возрастает "^^^ s ^ s ^ s -^ s ^ ss ^ K ^ es ^ K .

Мне кажется, что Дж. Коэн получил классические результаты, аналогичные парциальным факторам, выделенным Спирменом: «лингвистические», «механиче­ские» и «числовые» способности. Вдобавок третий фактор более тесно связан с «текучим» интеллектом по Кэттеллу, отсюда повышение его значимости к старости.

Очевидно, тесты группируются не по виду «процесса», а по принципу сход­ства материала, заложенного в задании.

Шкала интеллекта для детей ( WISC ) вышла в 1950 году, усовершенствован­ный вариант WISC - R издан в 1974 году. Шкала предназначена для тестирования детей в возрасте от 6,5 до 16,5 года. В тест входят 12 субтестов, соответствующих субтестам теста WAIS, но дополненных более легкими однотипными заданиями.

В шкалу действия включен дополнительный субтест «Лабиринты». Кроме того, при проведении исследования субтест «Понимание» может быть заменен «Запоминанием цифр», а субтест «Лабиринт» субтестом «Кодирование». При диагностике субтесты вербальной и невербальной частей чередуются.

Показатели дополнительных тестов при подсчете IQ не учитываются.

Субтест «Лабиринт» состоит из возрастающих по трудности лабиринтов. Испытуемый должен выполнить его за определенный промежуток времени (най­ти выход), подсчитываются ошибки и регистрируется время.

Надежность теста WISC - R практически столь же велика, как и теста WAIS (см. табл. 8-9).

При повторном тестировании детей значение общего IQ возрастает на 7 единиц, вербального IQ — на 3,5 единицы, невербального IQ — на 9 единиц, что в очередной раз подтверждает предположение о наибольшей тренируемости невербального интеллекта.

Факторизация выявила 3 групповых фактора: общего вербального понима­ния, восприятия пространства и «памяти» — как и при анализе WAIS.

Психогенетические исследования показали, что наследственностью обуслов­лены оценки по субтестам «Осведомленность», «Словарный», «Шифровка». Со­циальными факторами определяются оценки тестов «Понятливость», «Недоста­ющие детали», «Последовательные картинки», «Кубики Косса».

Наиболее трудными в выполнении являются субтесты «Словарный» и «Складывание фигур», наиболее легкими — «Арифметический», «Кубики Косса», «Недостающие детали», «Шифровка».

У детей с задержкой психического развития снижен вербальный интеллект. Между тем у воспитанников детских домов снижен невербальный интеллект (субтесты «Последовательные картинки», «Складывание фигур»). Это лишний раз подтверждает мысль о зависимости уровня развития невербального интел­лекта от опыта взаимодействия с социокультурной средой [II].

При дифференциальной диагностике задержки психического развития у де­тей особое значение имеют оценки по тестам «Сходство», «Словарный» и «По­следовательные картинки» [12].

Часто тест WISC применяется в дефектологической и патопсихологической диагностике, в частности при дифференцировке умственной отсталости от задер­жки психического развития. Наибольшие различия между нормой и задержкой психического развития (ЗПР) наблюдаются по субтесту «Сходство» и невербаль­ной шкале, причем величина разброса значений в профиле у детей с ЗПР больше, чем у олигофренов.

В 1967 году опубликована версия теста Векслера для детей WPPSI (возраст 4-6,5 года). Шкала состоит из 11 субтестов (10 основных, 1 — дополнитель­ный). Восемь субтестов представляют собой облегченные и адаптированные варианты WISC. Три субтеста были разработаны заново.

Субтесты сгруппированы в вербальную и невербальную шкалы. При прове­дении диагностики субтесты WPPSI из вербальной и невербальной частей чере­дуются друг с другом. Эксперимент проводится как в один, так и в два приема.

В вербальную шкалу входят субтесты «Осведомленность», «Словарный за­пас», «Арифметика», «Нахождение сходства», «Понимание» и дополнительный субтест «Предложения». В шкалу действий входят субтесты «Дом животного», «Завершение картинок», «Лабиринты», «Геометрические схемы», «Конструирова­ние блоков» («Кубики Косса»).

Новыми по сравнению с WISC являются субтесты «Предложения», «Дом животного» и «Геометрические схемы». Субтест «Предложения» заменил тест

«Запоминание цифр» из WISC , им либо заменяют любой вербальный тест, либо применяют дополнительно. Субтест «Дом животного» (вместо «Шифровка» из WISC) состоит из карт с изображением собаки, цыпленка, рыбы и кошки. Ребе­нок должен расставить домики в соответствии с ключом по изображениям животных. При выполнении субтеста «Геометрические схемы» ребенок должен скопировать 10 чертежей с помощью цветного карандаша.

Факторизация теста дала один общий и два групповых фактора: вербальный и невербальный, причем вес невербального фактора возрастал от младших возраст­ных групп к старшим (пропорционально накоплению опыта взаимодействия с внешней средой).

В нашей стране тест Векслера неоднократно переводился и адаптировался.

Первая адаптация WAIS была проведена в Психоневрологическом научно-исследовательском институте им. В.М.Бехтерева (1956) в Ленинграде.

Последняя по времени адаптация теста WAIS произведена психологами Санкт-Петербургского государственного/университета (1991).

Таблица 8.
Коэффициенты надежности IQ-показателей в шкале Векслера

Вариант шкалы

IQ-показатель

Коэффициент надежности

Способ определения надежности

WAIS

Вербальный Практический Общий

0,96 0,93-0,94 0,97

Расщепление (возрастные группы 18-19, 25-34, 45-54 и более лет)

WISC-R

Вербальный Практический Общий

0,94-0,93 0,90 0,96-0,95

Ретестирование (интервал 1 мес.) Расщепление (отдельно для каждой из 11 возрастных групп)

WPPSI

Вербальный Практический Общий

0,87-0,90 0,84-0,91 0,92-0,94

Ретестирование (интервал 1 мес.) для каждой возрастной группы

Таблица 9.
Величины стандартной ошибки измерения (ст^)' IQ-показателей в шкале Векслера

Вариант

IQ-показатель

Значение о

m

WISC

Вербальный Практический Общий

3,00-5,19 4,74-5,61 3,36-4,25

WAIS

Вербальный Практический Общий

3,0 4,0 2,6

Тест WISC адаптирован А. Ю. Панасюком (1973) и издан Институтом гиги­ены детей и подростков Минздрава СССР. В варианте А. Ю. Панасюка замене­ны задания, не соответствующие условиям нашей страны. Изменения коснулись, в первую очередь, вербальной части — субтестов «Понятливость», «Осведом­ленность», «Словарный» и, в меньшей мере, субтеста «Сходство». Тест был про­верен на надежность сопоставлением результатов группы здоровых детей и группы олигофренов (стадия дебильности).

Данные здоровых и умственно отсталых детей различались на высоком уров­не значимости (а < 0,001). Оценка здоровых детей полностью укладывалась в нормативы, предложенные Векслером.

В 1992 году Ю. Филимоненко и В. Тимофеев выпустили «Руководство к методике исследования интеллекта у детей Д. Векслера». Авторы, исправив не­которые погрешности описания Панасюка, предприняли попытку унифицировать работу экспериментатора с WAIS и WISC. Методика выпущена Государствен­ным предприятием «ИМАТОН» (Санкт-Петербург). Тест Векслера для взрос­лых WAIS также выпускается предприятием «ИМАТОН» и поступает в рознич­ную и оптовую продажу.

Другую русскоязычную адаптацию теста WISC предприняли под руковод­ством Ю. 3. Гильбуха сотрудники отдела психодиагностики НИИ психологии Украины (Киев) в 1992 году. Руководство «Измерение интеллекта детей» под ред. Гильбуха и прилагаемый к нему тест WISC производится и распространяет­ся научно-практическим центром «Психодиагностика и дифференцированное обучение» (Киев).

Автор не располагает сведениями об использовании и адаптации в России и странах СНГ шкалы WPPSI .

Тест Векслера очень часто применяется в исследованиях отечественных психологов. В качестве примера подобного рода работ приведем исследование аспиранта лаборатории психологии способностей Института психологии РАН А. В. Чернина [13]. Автор использовал тест WISC для определения влияния соци­альных и биологических факторов на уровень интеллекта детей 5-6 лет перед поступлением их в школу.

Учитывались следующие факторы: 1) социальные: образование и профессия родителей, состав семьи, материальная обеспеченность и другие, 2) биологиче­ские: актуальное состояние здоровья, пренатальная травматизация и течение родов, перенесенные острые и хронические заболевания и другие.

Наиболее отчетливая корреляция развития различных особенностей интел­лекта детей обнаружена с профессией родителей. Причем профессия матери связана со становлением вербального интеллекта (субтесты «Арифметический», «Понятливость», «Сходство»). У детей, матери которых — преподаватели и врачи, вербальный интеллект выше. Профессия отцов отражается в развитии невер­бального интеллекта (субтесты «Последовательные картинки», «Кубики Косса», «Сложение фигур»). Наиболее благоприятны для развития интеллекта детей такие профессии отцов, как учитель, инженер.

Естественно, что общий IQ коррелирует с уровнем образования родителей. Это может объясняться как генетическими (что вероятнее), так и средовыми факторами.

Неблагополучное, стремительное течение родов и связанная с ним гипоксия головного мозга отрицательно влияют на развитие интеллекта детей, по преиму­ществу — вербального, что в очередной раз подтверждает мысль о его биологи­ческой детерминации (отчасти — генетической). Из невербальных функций особо страдают функции, связанные с пространственным мышлением (субтест «Кубики Косса»). Таким образом, при пренатальной травматизации страдают интеллектуальные способности, тесно связанные с врожденным общим интел­лектом. Следует заметить, что общая двигательная и познавательная активность детей положительно коррелировала с вербальным интеллектом.

В целом же первоначальная гипотеза Д. Векслера о врожденности и психо­физиологической обусловленности развития невербального интеллекта и о социально-средовой обусловленности развития вербального интеллекта опровергну­та: факты свидетельствуют о прямо противоположной зависимости.

Тесты структуры интеллекта

Группа этих тестов весьма многочисленна. Практически все они основаны на модели структуры интеллекта Терстоуна или на различных модификациях этой модели. Все тесты этой группы являются скоростными, то есть требуют от испытуемого проявить высокую продуктивность за небольшой промежуток вре­мени. Тесты структуры интеллекта можно проводить как индивидуально, так и с группой испытуемых, поэтому их относят к «групповым тестам».

Тесты структуры интеллекта имеют прототипы, существовавшие до возник­новения факторных теорий интеллекта. К числу подобных относится аналити­ческий тест интеллекта О. Мейли ( AIT ), предложенный им в 1928 году и состо­ящий из 6 субтестов. Но в нашей стране он распространения не получил.

Аналогом тестов структуры интеллекта является тест интеллекта «Психо­логические профили», разработанный Г. И. Россолимо в 1909 году.

Тест включал в себя 11 субтестов. С его помощью определялся уровень раз­вития психических процессов. Тип интеллекта испытуемого выявлялся на основе анализа профиля баллов, полученных за выполнение отдельных субтестов.

К числу наиболее широко применяемых в России тестов структуры интел­лекта принадлежит тест Р. Амтхауэра ( Amthauer Intelligenz - Struktur - Test , 1ST). Тест предложен автором в 1953 году (последняя редакция — 1973 года). Он предназначался для дифференцированного отбора кандидатов на разные виды профессионального обучения и для профессионального отбора [14]. На русском языке тест впервые описан в монографии В. М. Блейхера и Л. Ф. Бурлачука «Психологическая диагностика интеллекта и личности» (Киев: Вища школа. 1978).

Тест составлен Амтхауэром в трех формах: Л, В и С. Модификация 1ST — 70 имеет четыре формы (А, В, С, D ).

Р. Амтхауэр рассматривал интеллект как специализированную подструктуру в целостной структуре личности, состоящую из различных факторов (речевого, счетно-математического, пространственных представлений, мнемического).

Автор при составлении теста исходил из двух предпосылок: 1) корреляция результатов каждого субтеста с результатами по всему тесту должна быть максимальной, 2) корреляция между субтестами должна быть возможно мини­мальной (но положительной).

Тест валидизирован на максимально широкой профессиональной выборке и предназначен для испытуемых от 13 до 60 лет.

Р. Амтхауэр ввел только возрастные нормы, полагая установленной зависи­мость социального опыта от возраста испытуемого.

Тест диагностирует четыре компонента интеллекта: вербальный, счетно-ма­тематический, пространственный, мнемический. Корреляция этих факторов (три из которых аналогичны факторам Спирмена) равна 0,36. Время выполнения теста 90 мин.

В тест входят 9 субтестов. Во всех субтестах, кроме 4, 5 и 6, использованы задания закрытого типа.

  1. «Логический отбор» ( LS ) — исследуется «чувство языка» по Р. Амтхауэ-ру. Испытуемый должен завершить предложение, выбрав подходящее сло­во из списка.
  2. «Определение общих признаков» ( GE ) — исследуется способность к по­нятийной абстракции. Даются пять слов, из которых испытуемый должен выбрать единственное, не имеющее смысловой связи с остальными.
  3. «Аналогии» ( AN ) — тестируются комбинаторные способности. Даются три слова, между первым и вторым есть смысловая связь. Испытуемый должен подобрать к третьему слову четвертое, которое находилось бы с ним в аналогичной связи.
  4. «Классификация» ( KL ) — оценивается способность к суждению. Испыту­емый должен обозначить два слова общим понятием.
  5. «Счет» ( RA ) — тестируется уровень развития арифметического мышле­ния. Испытуемый должен решить 20 арифметических задач.
  6. «Ряды чисел» ( ZR ) — тестируется индуктивное мышление. Нужно уста­новить закономерность числового ряда, продолжить его.
  7. «Выбор фигур» ( FS ) — исследуется пространственное воображение. Предъявляются разделенные на части фигуры. Нужно выбрать фигуру, соответствующую разделенной.
  8. «Кубики» ( WU ) — тестируется умение мысленно оперировать объемными телами в пространстве. Дается рисунок куба в измененном положении. Нужно из предложенных рисунков выбрать куб, соответствующий данному (см. рис. 18).

Рис. 18. Образец задания и инструкции к субтесту VIII тестовой батареи Р. Амтхауэра. Первый ряд фигур состоит из пяти разных кубов, обозначенных буквами а, б, в, г, д Кубы расположены так, что из шести граней вы у каждого куба видите три. В каждом из последующих рядов вам предлагается один из этих пяти кубов, повернутый по-новому Ваша задача — определить, которому из пяти кубов соответствует куб, приведенный в очередном задании. В перевернутых кубах, естественно, могут появиться и новые значки Куб 01 представляет измененное положение куба а. Поэтому обведите на своих листах отве­тов в разделе VIII в строке 01 букву «а». Второй куб 02 соответствует кубу д, третий 03 — кубу б, 04 — в, 05 — г.

9. «Задание на сосредоточение внимания и память» ( ME ). Предлагается за­помнить ряд слов и найти эти слова среди других.

Каждое правильное решение оценивается в один балл (кроме 4-го субтеста). Первичные оценки переводятся в шкальные. Суммы первичных баллов по всем субтестам переводятся в общую оценку уровня интеллекта.

Отдельно анализируется профиль. Амтхауэр предполагает, что в том случае, когда наивысшие результаты получены по первым четырем субтестам, у испытуе­мого развиты «теоретические способности». В том случае, когда результаты луч­ше по последним пяти субтестам, более развиты «практические способности».

Показатели ретестовой надежности теста (при повторном обследовании че­рез один год): 0,83-0,9. Надежность параллельных форм — 0,95. Корреляция с учебной успеваемостью, по данным Амтхауэра, — 0,46, с экспертными оценками уровня интеллекта — 0,62.

В СССР тест часто адаптировался. Наиболее известные адаптации сделаны Л. К. Акимовой с соавторами в 1984 году [15] и В. Н. Намазовым и А. Н. Жмы-риковым в 1988 году [16]. Первая адаптация была проведена на выборке школь­ников 7— 10-х классов (450 человек). Проверялась ретестовая надежность: те­стировался 101 человек через один год (г=0,83). Корреляция общего балла по тестированию с учебной успеваемостью варьировала от 0,44 до 0,52. Вычисля­лись корреляции: между вербальным субтестом и успеваемостью по гуманитар­ным предметам (колебались в пределах от 0,20 до 0,53), а также между резуль­татами пространственных субтестов и успеваемостью по техническим предме-, там (от 0,23 до 0,34).

Адаптация В. Н. Намазова и А. Н. Жмырикова, осуществленная на базе Мос­ковского городского центра профконсультации, касалась переформировки зада­ний вербальных субтестов. Стандартизация теста проводилась на учащихся стар­ших классов средних школ, ПТУ (16-17 лет), студентах и курсантах вузов (18-21 год), инженерно-технических работниках и управленцах (22-25 лет). Авторы не ограничились только нормами для разных возрастных групп, были вычислены нормы для учащихся ПТУ, учащихся средних школ, студентов и курсантов 1- 2-х курсов, а также специалистов, имеющих высшее образование.

Авторы адаптации предлагают свой вариант интерпретации оценок теста структуры интеллекта, исходя из качественной выборки испытуемых (род заня­тий, образование, возраст) и стандартных оценок в единицах IQ .

Надежность теста проверялась повторным тестированием испытуемых че­рез 4 недели, и коэффициент корреляции «тест — ретест» изменялся в зависимо­сти от выборки от 0,74 до 0,91.

Оценки «теоретического интеллекта» (4 первых субтеста) сравнивались с достижениями по гуманитарным предметам, а оценки «практического интеллек­та» (5— 9-й субтесты) — с достижениями в «точных науках» (физике и матема­тике). Коэффициенты корреляции колебались от 0,58 до 0,89.

Тест Амтхауэра применялся во многих отечественных исследованиях, в ча­стности при изучении влияния ситуации на проявление испытуемыми интеллек­туальных способностей.

Быть может, наиболее часто используются на практике и в исследователь­ской работе тесты DAT и GATB .

Тест DAT ( Differential Apttitude Test ) создан в 1947 году и неоднократно пересматривался. Батарея была предназначена для тестирования учащихся VII-XII классов средней школы США в ходе профессиональной консультации.

Создатели тестов включали в него задания, выполнение которых позволило бы прогнозировать успешность обучения в высшей школе. Авторы исходили не только из практических нужд, но и учитывали результаты факторно-аналитиче­ских исследований.

Батарея разбита на две формы: S и Т. Тест включает в себя 8 субтестов.

  1. Вербальное мышление. Используются двойные аналогии. От испытуемого требуется заполнить пропуски слов в предложении, выбрав нужную пару слов из списка.
  2. Числовые способности. Испытуемому предлагают простые уравнения. Он должен выбрать подходящий ответ.
  3. Абстрактное мышление. Испытуемый должен продолжить серию геомет­рических фигур.
  4. Пространственные отношения. Предъявляются развертки геометрических тел. Испытуемый должен выбрать фигуру, соответствующую развертке.
  5. Техническое мышление. Даны картинки, описывающие определенную фи­зическую ситуацию. Нужно ответить на вопрос, поняв физический прин­цип действия механизма.
  6. Скорость и точность восприятия. Предъявляется серия буквенных пар, одна из которых выделена. Испытуемый должен найти эту комбинацию на бланке ответов.
  7. Грамотность. Испытуемому предъявляется список слов, он должен прове­рить правильность их написания.
  8. Использование языка. Дается предложение, которое содержит граммати­ческие или синтаксические ошибки. Испытуемый должен их найти.

Общее время выполнения теста очень велико (до 5 часов), поэтому часто применяют сокращенные варианты.

Нормы были получены на основе обработки результатов тестирования бо­лее 64 тыс. учащихся средних школ 33 штатов и округа Колумбия.

Тест DAT относится к тестам предельных возможностей. Надежность теста очень велика (0,90). Взаимные корреляции субтестов близки к 0,50. Результа­ты сопоставления данных теста с оценками школьной успеваемости показали, что корреляции достаточно велики.

К числу наиболее прогностичных относятся субтесты «Вербальное мышле­ние» (0,39-0,50), «Числовые способности» (0,32-0,48), «Предложения» (0,30-0,52). Суммарный показатель теста «Числовые способности» и «Вербальное мышление» характеризует способность к обучению (коэффициент корреляции с учебными достижениями варьирует в пределах 0,70-0,80).

Корреляция показателей DAT с успешностью производственной деятельно­сти колеблется от 5 до 45 % в различных исследованиях.

В нашей стране DAT используется сравнительно редко. В частности, Е. В. Кузь­мина, Н. Е. Милитанская использовали переведенные 5 субтестов теста DAT (реадаптирован в Братиславе, ЧССР, в 1973 году) при исследовании связи общих умственных способностей и профессиональных интересов школьников. В ис­следовании применялись субтесты: «Вербальное мышление», «Числовые способ­ности», «Техническое мышление», «Абстрактное мышление», «Пространственные отношения».

Авторы установили, что склонность к профессиям типа «человек — человек» (по Е. А. Климову) отрицательно коррелирует с общим интеллектом (г= -0,40) и уровнем технического мышления (г = -0,30). Вместе с тем уровень общего интеллекта положительно коррелирует с интересом к физике и математике (0,31; 0,34).

Несколько ранее (в 1940 году, позднейшая версия 1956 года), чем DAT , была разработана другая батарея общих способностей — GATB . GATB создана по заказу Службы занятости США для целей профессиональной ориентации и рас­становки кадров в армии и в государственных учреждениях. Разработчики GATB провели факторный анализ 50 тестовых батарей (в каждой было от 15 до 29 субтестов) и обнаружили, что они во многом идентичны. Были отобраны 59 субтестов, которые после обработки данных сгруппировались в 10 факторов. Первоначально для диагностики способностей использовались 15 субтестов.

В позднейшую версию GATB вошли 12 субтестов, а число факторов было сокра­щено до 9.

Стандартные нормы были получены на выборке 4000 рабочих и служащих США. Надежность теста весьма велика (г = 0,90). Внешняя валидность теста характеризуется высокой положительной корреляцией с успешностью профес­сиональной деятельности. Для разных групп она колеблется от 0,40 до 0,84. Для большинства профессий этот показатель равен 0,6. На базе GATB разработан ряд модификаций — батареи для определенных групп профессий ( SATB — Spe ­ cial Aptitude Test Battery , NATB и другие).

На основе многолетних обследований в США установлены системы показа­телей, характеризующих способности, необходимые для овладения той или иной профессией или их группой. «Система профессиональных способностей» (ОАР) разработана для нескольких десятков профессий.

Тестирование по GATB в США прошли десятки тысяч испытуемых. На сегодняшний день он является самым распространенным тестом общих способ­ностей.

Батарея относится к тестам структуры интеллекта, но тестирует также пер­цептивные и сенсомоторные способности.

Приведем список факторов и субтестов.

  1. G — общие способности к обучению. Балл получается на основе сложе­ния показателей 3 тестов: вербального, числового и теста на восприятие трехмерного пространства.
  2. V — вербальные способности. Измеряются тестом на выделение из груп­пы слов, которые имеют сходное или противоположное значение.
  3. N — числовые способности. Тестируются двумя тестами: «Арифметиче­ские задачи» (50 задач) и «Арифметические упражнения» (50 простых заданий с одним действием).
  4. S — пространственные способности. Тестируются заданиями на восприя­тие форм: испытуемому дается чертеж с разверткой объемной фигуры, он должен отобрать изображение, соответствующее развертке.
  5. Р — восприятие формы. Измеряется двумя тестами. В первом тесте пред­лагается два набора фигур на двух частях листа. Фигуры одинаковы, отли­чаются лишь расположением и разворотом. Нужно найти идентичные фигуры. Во втором тесте требуется установить, какое из четырех изобра­жений соответствует образцу.
  6. Q — мысленное восприятие слов («скорость восприятия клерка»). Испы­туемый должен выявить идентичность написания слов в парах (150 пар).
  7. К — двигательная координация. Испытуемый должен по образцу как мож­но быстрее нарисовать линии в квадратиках.
  8. F — пальцевая моторика. Измеряется двумя тестами «психомоторной лов­кости». В первом тесте испытуемый должен, действуя обеими руками, вы­нимать стержни из отверстий верхней части доски и вставлять в отверстия нижней части доски. Тест повторяется трижды. Во втором тесте испытуемый одной рукой вынимает стержень и, поворачивая его, вставляет другим концом в то же отверстие. Тест повторяют три раза. 9. М — ручная моторика. Измеряется двумя тестами на пальцевую подвиж­ность. Даются доски со 100 отверстиями (50 в каждой половине). В верхней части доски вставлены металлические заклепки. На доске есть стержень с набором шайб. В первом тесте испытуемый должен взять заклепку, надеть шайбу и вставить их в нижнюю часть доски. Во втором тесте он должен вернуть заклепки и шайбы в исходное положение.

Нетрудно заметить, что 8 субтестов в батарее являются бланковыми, а четы­ре требуют специального оборудования.

Все субтесты являются высокоскоростными. При обработке результатов «сырые» оценки переводятся в стандартные, и затем анализируется их профиль. Тест GATB применяется более чем в 30 странах.

В ФРГ на основе GATB создан немецкоязычный аналог — тестовая батарея BET ( Berufteignungstest ). Так же как и GATB, он состоит из 12 субтестов и диагностирует 9 факторов.

В нашей стране BET адаптирован сотрудниками ЛГУ В. К. Гайдой, О. С. Дей-некой, Н.Н.Ивановой и Е.С.Алешиной [17]. Были пересмотрены вербальные субтесты, осуществлен анализ трудности и дискриминантной способности за­дач. Валидизация и рестандартизация проводилась на группе старшеклассни­ков (120 человек). Факторная структура теста оказалась аналогична данным Г. Шмале и Г. Шмидке (ФРГ).

Интеллектуальные субтесты батареи достаточно надежны (0,73-0,98).

Разработчики теста проверили его (Тест общих профессиональных способ­ностей — ТОПС) на внешнюю «текущую» валидность и экспертную валидность (по интеллектуальным субтестам: 0,68-0,93).

Тест ТОПС широко используется в профессиональной ориентации и иссле­довательской работе.

В частности, автор этой книги применял ТОПС (интеллектуальные субтес­ты) при изучении связи между успешностью выполнения интеллектуальных те­стов и текущей школьной успеваемостью (оценками) по отдельным учебным предметам. Оказалось, что текущие оценки успеваемости независимы от оценок по интеллектуальным субтестам BET . Более того, оценки успеваемости по раз­ным предметам теснее связаны друг с другом, нежели субтесты BET . Исключе­ние составили данные по 9-му классу. Очевидно при переходе от 8-го к 9-му классу (исследование 1988 года) уровень сложности программ повышается, и успешность обучения в большей мере начинает зависеть от способностей, чем от других факторов (дисциплинированность, мотивация и пр.)

Подведем итоги. Большинство тестов интеллекта, созданных на основе иерар­хических или структурных моделей, явно или неявно диагностируют общий ин­теллект ( G — фактор по Спирмену) и основные групповые факторы, а именно: пространственный, числовой и вербальный. Диагностические исследования пока­зывают, что так называемый «невербальный интеллект» является комплексным образованием, развитие которого определяется преимущественно опытом испы­туемого по взаимодействию с окружением, а общий и вербальный интеллекты в большей мере зависят от наследственных и биологических факторов (например, травматизации при родах). Подтверждение этого вывода мы найдем в главе, посвященной развитию интеллекта.

Литература

  1. Анастази А. Психологическое тестирование. Ч . 1-2. М .: Педагогика , 1982.
  2. Rasc/i G. On specific objectivity // Danish Handbook of Philosophy. 1977. Vol. 14. P. 58-94.
  3. Rasch G. Probabilistic model for intelligence and attainement tests. Chicago : Univ . of Chicago Press , 1980.
  4. Аванесов В. С. Основы научной организации педагогического контроля в высшей школе. М., 1989.
  5. Юсупов Ф.М. Принципы конструирования невербальных тестов способностей // Автореферат дис. на соиск. степ. канд. психол. наук. М., 1993.
  6. Дружинин В. Н. Психологическая диагностика способностей: теоретические основы. Саратов: СГУ, 1990.
  7. Осипов Г. В., Андреев Э. П. Методы измерения в социологии. М.: Наука, 1977.
  8. Ямпольский Л. П. Измерение продуктивности интеллектуальной деятельности / / Вопросы психологии. 1984. № 5. С . 142-147.
  9. Wechsler D. Manual for the Wechsler adult intelligence scale. N.Y., 1955.
  10. Cohen J. A factor analytically based rationale for the Wechsler Adult Intelligence Sca­le // Journal of Consulting Psychology. 1957, № 21.
  11. Рабочая книга школьного психолога/ Под ред. Н. В. Дубровиной. М.: Просвещение, 1988.
  12. Шаумаров Г. В. К оценке значения интеллектуальных тестов в диагностике и изуче­нии развития детей с интеллектуальной недостаточностью // Дефектология. 1979. № 6. С. 16-24.
  13. Развитие и диагностика способностей/ Отв. ред. В.Н.Дружинин, В. Д. Шадриков. М .: Наука , 1991. С . 77-84.
  14. Amthauer R. Intelligenz und Beruf // Zeitschrift fur experimentale und angewandte Psychology. 1953. Bd 1.
  15. Общая психодиагностика // Под ред. А. А. Бодалева и В. В. Столина. М.: МГУ, 1987.
  16. Намазов В. П., Жмыриков А. Н. Психолого-педагогические методы исследования инди­видуально-личностных особенностей. М., 1988.
  17. Диагностика профессиональных и познавательных способностей. М.: ИПАН, 1988. С. 155-170.

наверх страницынаверх страницы на верх страницы

Источник: http://sbiblio.com/biblio/archive/druginin_psih/01...

  • Автор: Barteh_
  • Комментарии: 16
  • Просмотры: 1342