Как уже упоминалось, наиболее заметным достижением в области измерения индивидуальных различий, ознаменовавшим начало XX в., были тесты А. Бине, с именем которого также связано преодоление одного из первых кризисов в тестировании интеллекта. Шкалу Бине начинают использовать все более широко в разных странах.
Одним из первых в США этот тест применил Генри Годдард, который включил его в группу методик, предназначенных для обследования прибывающих из Европы иммигрантов. Работа Годдарда отчетливо продемонстрировала, что может дать применение неадаптированного теста при обследовании людей, плохо владеющих английским языком или не знающих его вовсе. По данным этого обследования получалось, что 83% евреев, 80% венгров, 79% итальянцев и 87% выходцев из России могли быть охарактеризованы как слабоумные.
Неудовлетворенный переводом шкалы Бине-Симона (редакция 1908 г.), который представил Г. Годдарт, другой американский психолог Льюис Мэдисон Термен в сотрудничестве с X. Д. Чайлдз приступил к новой адаптации теста. Его подход заключался в проверке валидности и надежности заданий шкалы так же, как это делал сам Бине, но на этот раз в США. Многие задания теста были модифицированы, а также добавлены новые. Эта шкала (Стэнфордская версия шкалы Бине-Симона) была стандартизирована на 2100 детях и 180 взрослых. Она охватила диапазон от трехлетнего возраста до уровня взрослых старшего возраста, но не включала тестов для 11 лет. Результат выражался как соотношение умственного развития с возрастом и мог быть преобразован в коэффициент интеллекта, или IQ. На основании распределения ІQ, полученного с помощью этой шкалы, Термен предложил следующую классификационную схему: IQ от 90 до 109 указывает на средние умственные способности, IQ ниже 70 возможен при слабоумии, IQ выше 140 свидетельствует о гениальности. При этом он обратил внимание на то, что установленные им ограничения определены произвольно и что сама классификационная схема предназначена только для использования в качестве общего руководства для нового измерения. К сожалению, этими предостережениями вскоре стали пренебрегать многие специалисты, ослепленные очевидностью заметных контрастов в успеваемости и общем поведении детей с высоким и низким IQ. Заслугой Термена является также то, что впервые в истории тестирования была разработана серия подробных инструкций для проведения теста и определения результатов. Термен многократно подчеркивал, что отклонения от стандартной процедуры тестирования могут быть причиной серьезных ошибок.
Стэндфордская версия шкалы вскоре стала наиболее используемой для определения умственных способностей в Соединенных Штатах. Более двух десятилетий труд Термена считался в США классическим образцом шкалы интеллекта. Благодаря своей надежности и достоверности она была определенным улучшением шкалы Бине. Тем не менее немалая часть критики, адресованной последней, могла быть в равной степени переадресована к варианту, разработанному Терменом. О чем идет речь? Все еще чересчур заметный акцент делался на вербальные навыки, что приводило, например, к неоправданно низким результатам у лиц, родившихся за рубежом. Каждое отдельное задание в тесте было настолько кратким, что возникали трудности в оценке настойчивости индивидуума (это была проблема, которой нельзя было избежать, поскольку краткость заданий предполагалась изначально с целью поддержания интереса ребенка). При отсутствии уровня 11 лет, эта шкала была удовлетворительной на протяжении 10-го года, но возникали проблемы интерпретации в том случае, если ребенок прошел все задания 10-летнего возраста, но не смог ответить на все задания в 12-летнем возрасте.
Более того, оставался открытым вопрос о значении «разброса» баллов (т. е. таких результатов тестирования, при которых правильные решения распределены на нескольких возрастных уровнях). Некоторые психологи полагали, что широкий разброс характерен для умственного дефекта и указывает на неравномерное развитие способностей у лиц, имеющих такие результаты. Используя эту шкалу, Термен также убедился в том, что она слишком легкая для младшего возраста и слишком трудная для старших возрастов. Эти, как и некоторые другие, замечания не умаляли в целом положительного отношения к шкале. Термен писал о том, что психолог, ее использующий, может получить после 45-минутной диагностики более надежную и более информативную оценку умственных способностей ребенка, чем та, которую могут предложить большинство учителей после года ежедневного общения с учащимся в классе.
После принятия во внимание некоторых из этих рекомендаций шкала Бине, изданная в 1911 г., была расширена от трехлетнего до уровня взрослого возраста, но исключала возраст 11,13 и 14 лет. Результат продолжал выражаться на основе умственного возраста, соотносимого с физическим (хронологическим), и толковался следующим образом: «Если умственное развитие ребенка соответствует его хронологическому возрасту, ребенок считается "обычным" (средним) по интеллекту; если умственное развитие ребенка выше, то ребенок "продвинутый"; если умственное развитие ребенка ниже - ребенок "отсталый"».
Бине продолжал подчеркивать важность качественных аспектов показателей. Он предложил возможный путь дифференциации в общей группе отсталых учеников, выделяя способы, с помощью которых дети способны поддерживать социальные отношения; идиоты ничего не могут, кроме общения с помощью жестов; слабоумные способны поддерживать контакт с помощью речи; отсталые могут научиться устанавливать взаимоотношения с людьми через письмо.
Результаты Бриджес и Колер (1917), свидетельствовавшие о высокой корреляции между умственными способностями детей и социальным статусом их родителей, поставили еще один вопрос, с которым психодиагностика вошла и в XXI в.: является ли такая корреляция следствием влияния наследственности или среды? Хотя окончательного ответа и не было получено, такого рода вопросы, связанные с тестированием IQ, сделали очевидным для специалистов тот факт, что проведение и интерпретация результатов теста для определения умственных способностей не могут быть доверены тем, кто не имеет соответствующего опыта и знаний.
В начале XX в. тест как инструмент измерения индивидуальных различий все более активно вторгается в прикладные исследования. Массовое использование тестов заставляет исследователей перейти к групповому тестированию.
Создание и развитие группового тестирования связано с именем Артура Синтона Отиса, одного из аспирантов Термена. В 1912 г. Отис пришел к Термену с идеей создания тестов, с помощью которых можно было бы обследовать нескольких людей одновременно. Термен поддержал эту идею, и в течение пяти лет Отис работал над созданием теста. Приняв за основу, как это сделал Термен, модель интеллекта Бине и работая таким же образом, как и Термен, Отис адаптировал уже имеющиеся задания для группового тестирования, а также разработал оригинальные задания. Несомненной заслугой Отиса была разработка таких приемов предъявления материала испытуемому, которые требовали минимального использования письма. Работа была завершена в 1918 г.
Мощным стимулом развития психодиагностического инструментария стала Первая мировая война. По выражению П. Фресса, эта война «освятила тесты». В значительной мере благодаря тестам, оказавшимся необходимыми для отбора и специализации миллионов людей, не имеющих военной подготовки, многие солдаты и офицеры сохранили свою жизнь и здоровье. При вступлении США в Первую мировую войну (1917) в армии начались широкомасштабные тестовые исследования.
В апреле 1917 г. был организован Генеральный комитет по психологии с целью организации и контроля над психологическими исследованиями в армии. Роберт М. Йеркс, в то время профессор психологии Гарвардского университета и президент Американской психологической ассоциации, был назначен председателем этого комитета. В Комитет входили многие видные психологи: Дж. Маккин Кеттелл, Г. Стенли Холл, Торндайк и др. Генеральный комитет организовал 11 подкомитетов, призванных решать разнообразные психологические проблемы в армии. Так, подкомитет армейского персонала разработал и внедрил во всей армии квалификационные рекомендации, которыми нужно было руководствоваться при назначении призывников на воинские должности. В этих рекомендациях обращалось внимание на род их гражданских занятий и образование. Не были обойдены вниманием и вопросы, связанные с присвоением очередных званий офицерам и их продвижением по службе. По словам самого Йеркса, комитет, на работу которого военное министерство выделило около миллиона долларов, смог достаточно глубоко изменить едва ли не все наиболее важные аспекты жизнедеятельности армии.
Сфера исследований, проводимых комитетом, простиралась от изучения влияния больших высот до отбора разведчиков. В целях контроля над боевым духом как военных, так и гражданского населения, при Генеральном штабе армии было организовано Отделение морального состояния. В составе Медицинского отдела армии было создано специальное подразделение для проведения тестов на умственное развитие среди призываемых на службу солдат и офицеров. К основным задачам этого подразделения относились: выявление интеллектуально неполноценных рекрутов, подбор людей для выполнения специальных заданий и выявление лиц с эмоциональными расстройствами. Уже в начале работы армейские психологи столкнулись с тем, что требующие значительного времени на проведение индивидуальные тесты не позволяли справляться с огромным количеством лиц, подлежащих обследованию. Были определены критерии, которым должны были отвечать армейские тесты для определения уровня интеллектуального развития, среди которых наибольшее значение наряду с валидностью имели приспособленность к групповому использованию, быстрота подсчета результатов, неподатливость к обучаемости (т. е. тесты должны быть по возможности такими, чтобы нельзя было научиться выполнять их правильно, как, например, определенный класс математических задач), интерес и привлекательность, экономичность во времени проведения. Полученная в результате шкала для группового тестирования, «Групповой экзамен А», выявила значительное сходство со шкалой Отиса.
Интересны и поучительны те организационные мероприятия, которые осуществлялись в американской армии для того, чтобы охватить психологическими исследованиями всех и каждого. Так, была организована школа военной психологии (планировалась организация нескольких школ, но потребность в этом отпала в связи с завершением войны). Персонал школы состоял из 7 психологов, возглавляемых старшим инструктором. Примерно 100 офицеров и больше 300 курсантов получили специальную подготовку за четыре месяца существования этой школы.
Всего во время войны через тесты прошли 1,726 млн человек в группах и 83 тыс. - индивидуально. Было обнаружено свыше 500 тыс. неграмотных, около 8 тыс. рекомендовано к увольнению по причине низких умственных способностей, и примерно 20 тыс. направлено в специальные батальоны для наблюдения и последующего обучения или задействованы для выполнения задач, не требующих высоких умственных способностей. Столь массовые исследования позволили обнаружить весьма любопытный факт. Оказалось, что около 3 % молодых людей нации имеют умственный возраст ниже 10 лет, а средний умственный возраст американских солдат составлял только 13,5 лет. Полученные данные были обнародованы и вызвали буквально шок в широких кругах общественности. Позднее эти результаты пытались интерпретировать в том смысле, что, дескать, тесты обнаруживали весьма узкий круг способностей, не затрагивая многих важных составляющих интеллекта. Тем не менее следует признать, что призываемые в армию молодые американцы, как правило, выходцы из малообеспеченных слоев общества, порой просто не умели писать и читать, не имели даже элементарных возможностей приобщения к культуре своего общества (из 1 566 011 рекрутов, обследованных в период с 28 апреля 1918 г. по 31 января 1919 г., примерно 25,3 % не могли читать и понимать газетные статьи, написать письмо домой). Естественно, это не могло не отразиться на результатах тестирования. Свидетельством тому является и необходимость разработки для нужд американской армии того времени помимо теста «Альфа» его аналога для тех, кто не овладел грамотой, - теста «Бета» (групповой тест для определения умственных способностей, известный под названием Army Alpha, представлял собой вербальную шкалу, которая включала такие задания, как решение арифметических задач, подбор синонимов и антонимов, способность к суждению и др., в Army Beta включались только невербальные задания).
После Первой мировой войны, несмотря на сохраняющуюся популярность в США Стэнфордской версии шкалы Бине-Симона, разрабатывались и другие варианты этого теста. К наиболее известным из них относятся шкалы Кульмана (1922), Йеркса (1923), а также оригинальная версия Геринга (1922). Появилось также много новых, ориентированных на обследование нескольких человек, тестов.
Вероятно, наиболее известным тестом интеллекта в США послевоенного периода был «Национальный тест интеллекта» (National Intelligence Test, 1920). В его разработке участвовали такие известные психологи, как Л. Термен, Э. Торндайк, Р. Йеркс и др. Подобно армейскому тесту Альфа, он состоял из двух шкал и двух параллельных форм. Но его особенностью было включение пробных (тренировочных) заданий для испытуемого, которые предшествовали основным. Впоследствии такие задания стали включать и в другие тесты.
В течение года после публикации данного теста было продано свыше 540 тыс. экземпляров, а в 1922/23 учебном году - еще 800 тыс.
В 1920-е гг. было разработано и издано немало других тестов интеллекта. По мнению экспертов-психологов, наиболее надежным и валидным из них стал «Термена групповой тест умственных способностей» ( Terman Group Test of Mental Ability), появившийся в 1920 г. и предназначенный для обследования лиц в возрасте от 7 до 11 лет. В последующие 25 лет этот тест служил стандартным инструментом для тестирования интеллекта младших и старших школьников. Он был пересмотрен Терменоми Макньюмаромв 1942 г. (Temtan-McNemar Test of Mental Ability); новая редакция учитывала достижения в области измерения интеллекта, появившиеся между 1920 и 1940-ми гг.
Распространение тестов, особенно тестов интеллекта, в США по своей масштабности трудно сравнить с чем-либо. Фримен (1926) сообщает, что только одной издательской фирмой было продано свыше 2,5 млн экземпляров тестов для измерения интеллекта в течение лишь 1922/23 учебного года. Тесты становятся не только инструментом психологии, но и предметом коммерции. Впрочем, расцвет тестирования не исключал резкой критики, разумеется, это в первую очередь относилось к тестам интеллекта. Наиболее преуспели в ней журналисты. Упоминание об одном из них, В. Липпмане (W. Lippmann), можно встретить во многих зарубежных работах, посвященных истории тестирования.
В Европе также плодотворно работал в области диагностики интеллекта Ришар Мейли. Разработанный им Аналитический тест интеллекта (1928) базировался на развиваемой в его исследованиях теории о четырех важнейших факторах интеллекта: доступной трудности, пластичности, целостности и беглости. На учебниках психодиагностики Мейли, неоднократно переизданных на разных языках, воспитывались многие поколения европейских психологов.
Анализ исследований в области интеллекта в 20-е гг. был бы неполным без упоминания работ Жана Пиаже. В 1919 г. во время пребывания в Париже, Пиаже был рекомендован Теодору Симону в качестве сотрудника, который мог бы вести с ним совместную работу. Симон предложил ему заняться стандартизацией теста интеллекта Барта, с тем чтобы им можно было обследовать парижских детей. В этот ранний период своей научной деятельности Пиаже широко использует психометрические тесты. Работами этого периода им закладывается фундамент оригинальной концепции интеллекта, на основе которой были разработаны известные задачи Пиаже.
Для завершения краткого обзора тестов, созданных в это десятилетие для измерения интеллекта и специальных способностей, назовем также Доски форм Фергюсона (1920); Сборный тест общих механических способностей, изобретенный Дж. Стенквистом в 1923 г. (это был первый тест, предназначенный для измерения способностей детей и взрослых к сборке частей механических приборов); Тест рисования человека (1926), созданный Флоренс Лаурой Гудинаф, в котором определение умственного уровня ребенка осуществлялось с помощью полученных им оценок за завершенность рисунка, точность и моторную координацию; лабиринты Стэнли Портеуса, первоначально разработанные в Австралии (1913). Автор первых «диагностических лабиринтов» заслуживает того, чтобы его биография наряду с другими, принадлежащими ученым, стоящим у истоков современной психодиагностики, попала на эти страницы.
Несмотря на разнообразие тестов, исследователи испытывали определенную неудовлетворенность большинством из них и хорошо осознавали, что еще многое предстоит сделать в этой области. Три основные проблемы волновали ученых: 1) отсутствие индивидуально используемой шкалы для определения интеллектуального развития взрослых; 2) необходимость в удобной шкале для определения умственного развития младенцев и 3) создание общей теории конструирования тестов, а также углубленная разработка таких важнейших психологических конструктов, как интеллект и личность. Работа по созданию шкалы для взрослых фактически не велась. Вероятно, причиной являлось то, что большинство психологов были привлечены к работе в школьных и детских учреждениях. Дефицит в тестах для младенцев был в какой-то мере восполнен работой Гезелла «Умственное развитие ребенка дошкольного возраста» (1925).
Арнольд Люциус Гезелл был первым, кто использовал кинематограф для изучения поведения младенцев. С 1924 г. он начал собирать библиотеку фильмов о развитии ребенка. На основании своих наблюдений Гезелл представил в своей вышеупомянутой книге и последующей публикации «Младенчество и развитие человека» (1929) 195 критериев-показателей, которые могли быть использованы для оценки развития детей в период от 3 до 30 месяцев. Были также разработаны и другие показатели, которые предлагалось использовать для обследования детей до 60 месяцев. Все показатели были представлены в виде графиков развития, которые описывали типичные формы поведения, свойственные определенному хронологическому возрасту. Показатели были сгруппированы в четыре большие категории: моторные, адаптивные (например, выбор предметов и сопряженное движение глаз), языковые и социально-личностные (например, способность кормить себя, а также контроль стула и мочеиспускания).
Графики развития Гезелла были подвергнуты критике (особенно это касалось социально-личностных показателей), однако они какое-то время оставались уникальным и, по сути, единственным диагностическим инструментом, позволяющим психологам и родителям оценивать развитие ребенка на ранних этапах его жизни.
В 1921 г. на волне популярности тестов интеллекта под руководством Термена начинается один из наиболее масштабных проектов, посвященных одаренным детям. Выборку этого исследования составляли 1528 детей из Калифорнии, чей коэффициент интеллекта варьировался от 135 до 200, а возраст - от 3 до 9 лет. Стэнфордское изучение одаренности детей, пожалуй, наиболее значительное лонгитюдное исследование. После первого тестирования повторные замеры организовывались раз в 12 лет, осуществлялись и промежуточные исследования с помощью почты. Последнее тестирование, проведенное через 35 лет после первого, позволило получить данные на 98 % от исходного количества обследуемых. Из этой грандиозной работы был сделан вывод о том, что одаренность ребенка (а затем и взрослого, достигающего социальных высот) напрямую связана с высоким социоэкономическим статусом семьи.
Несмотря на всеобщее увлечение тестами интеллекта, одновременно создавались и развивались методики для диагностики некогнитивной сферы личности (тесты личности). Идеи Гальтона о свободных ассоциациях не были забыты. С помощью ассоциативного эксперимента Евгений Блейлер и Карл Юнг пытались определить так называемые комплексы личности (неосознанно взаимосвязанные идеи, способные вызвать сильные чувства) и диагностировать психические болезни. Однако эта методика оказалась малопродуктивной для клинической диагностики и, как было установлено немного позднее, должна быть использована в комплексе с другими методиками.
Личностный опросник Роберта Сессиона Вудвортса (1917), был первым опросником, разработанным для выявления и измерения анормального поведения (по мнению некоторых психологов, первый опросник был разработан голландцами Г. Хеймансом и Е. Вирсмой, которые в 1909 г. использовали стандартизированный опрос для получения сведений о сочетаниях разных черт личности). «Личный листок данных» Вудвортса стал предшественником нескольких подобных опросников. Была разработана сокращенная версия - Вудворте-Кади с 85 вопросами вместо 116. Предлагался также вариант этого опросника для обследования детей от 12 лет и старше. Опросник Д. Лэйрда содержал 75 вопросов, предназначался для студентов колледжа и претендовал на диагностику следующих типов: шизоидного, неврастеноидного (ипохондрия и усталость), истероидного (конвульсии и амнезия) и психастеноидного (навязчивые идеи и страх). Был также создан «Опросник умственной гигиены» Вудворте-Хаус.
В 1924 г. Л. Марстон пополняет перечень опросников своим, предназначенным для диагностики интроверсии - экстраверсии (20 вопросов, по которым дети, начиная с двухлетнего возраста, могли быть соответствующим образом охарактеризованы в зависимости от ответов, данных их родителями).
Братья Флойд и Гордон Олпорт предложили проводить рейтинг черт личности и представлять полученные результаты в виде профиля (1921-1922). Они знали о том, что Торндайк установил (1920) существование halo effect («эффект нимба»), присущего рейтинговым оценкам (тенденция к выставлению только высоких или низких баллов по всем шкалам). Тем не менее Гордон Олпорт полагал (1921), что следует использовать рейтинговые шкалы ввиду отсутствия иных объективных методов оценки личности.
Фолкер предлагает для оценки личности тест (1921), состоящий из списка слов (X-О-тест). Обследуемый должен был вычеркнуть слова в соответствии со следующими инструкциями: слова, которые имеют неприятное значение; наиболее явно ассоциируются с предложенным ключевым словом; относятся к предметам беспокойства обследуемого; обозначают негативные моральные качества. Однако оказалось, что этот тест имеет низкие надежность и достоверность. Более того, никто не знал, как толковать полученные результаты.
Тесты Довней для диагностики «воли-темперамента» появились в 1919 г. и послужили стимулом для многочисленных исследований. Джуна Довней (1875- 1932) пыталась измерить импульсивность, волеизъявление, решительность, настойчивость, внимательность к деталям и соответственно антиподы этих качеств. Она пыталась выполнить все это, определяя время, которое затрачивает ребенок на написание фразы «Соединенные Штаты Америки» с нормальной скоростью, затем - как можно быстрее, затем - почерком, который как можно больше отличается от обычного почерка, и, наконец, как можно медленнее, но не переставая двигать карандаш. Было еще восемь других задач, большинство из которых были построены на выполнении письменных заданий. Оказалось, что тесты «воли-темперамента» Довней дифференцировали группы правонарушителей и законопослушных, а также индейцев и белых, но имели весьма спорную ценность для понимания личности.
В 1929 г. выходит в свет известная монография Л. Терстоуна и Е. Чейва «Измерение аттитюдов». Она знаменует появление нового типа опросников - опросников аттитюдов (установок). Достаточно быстро опросники установок становятся популярными для измерения широкого круга аттитюдов.
Хартшорн и Мэй в 1920-е гг. пытались использовать ситуации реальной жизни для изучения обмана, внушаемости и настойчивости у детей школьного возраста (создавались ситуации, в которых дети могли быть нечестными). Определенная работа велась в области графологии. Однако психологи, особенно в Соединенных Штатах, не воспринимали всерьез анализ почерка как средство оценки личности.
В период с первой половины и до конца 1920-х гг. заметно возрастает внимание исследователей к измерению разного рода способностей и интересов. В 1921 г. Стенкюст издал свой «тест способности учащихся к обучению механике»; в 1922 г. Фрайд представил Бланк интереса к учению. В 1927 г. Эдвард Келлог Стронг-младший разработал бланк профессиональных интересов (Strong Vocational Interest Blank). Эта новаторская методика быстро приобретает популярность, ее используют во многих отраслях психологии. Опросник состоял из 420 заданий, шкалы были направлены на выявление интереса к 34 профессиям.
Широкую известность приобрели тесты Сишора на способность к обучению музыке. Результаты тестирования способностей к обучению были обобщены в известной работе Стэнли Нолла Attitude Testing (1928).
Отдельного упоминания заслуживает вышедшая в свет в 1921 г. книга швейцарского психиатра и психолога Германа Роршаха «Психодиагностика». В этой книге автор предлагал новый тест, основанный, как он писал, на перцепции. Тест содержал 10 таблиц с симметричными черно-белыми и цветными чернильными пятнами, глядя на которые нужно было сказать о том, что это может быть, на что это похоже. Пройдет сравнительно немного времени - и термин «психодиагностика» станет на какое-то время синонимом клинической психологии, а сам тест одной из наиболее популярных методик исследования личности.
Продолжается начатое в исследованиях Ч. Спирмена (см. выше) развитие факторного анализа (как известно, сам Спирмен допускал существование между фактором генеральным и факторами специфическими как бы факторов промежуточных, свойственных схожим видам деятельности; эти факторы получили название групповых). Одновременно закладываются основы мультифакторной теории интеллекта, чему в немалой степени способствовали исследования Трумэна Келли, обобщенные в его работе «Перекрестки человеческого разума» (1928). Это направление исследований позднее будет продолжено JI. Терстоуном (см. о нем ниже).
Во втором десятилетии XX в. под влиянием Хуго Мюнстерберга, который и сам разрабатывал тесты для оценки разных психических функций, возникли многочисленные центры тестирования. Упомянем наиболее известных исследователей, которые занимались этим. В Германии - Трамм (Я. Тгатт), Меде ( W. Мое- de) и Пиотровский (К. Piotrowsi), в Италии - Джемелли (A Gemelli), в Испании - Мира-и-Лопец, во Франции - Л эх и Пьерон (/. М. Lahy и Pierori), в Швейцарии - Клаперед, в Англии - Майерс (С. S. Myers), в Бельгии - Христиэйс (О. Christiaes).
В 1920 г. произошло событие, которое имело большое значение для организации и координации усилий тестологов разных стран, - было создано Международное общество психотехники (Societe Internationale de Psychotechnique), позднее переименованное в Международную ассоциацию прикладной психологии {International Association of Applied Psychology). Первый президент этого общества Эдуард Клапаред инициировал наряду с другими исследованиями работы по созданию общих стандартов для психологических тестов.
Кризис
В первые два десятилетия XX в. тесты, завоевав всеобщее признание в решении практических задач, в то же время существовали как бы в стороне от официальной психологической науки. Для традиционной психологии тех лет тесты были инородным явлением, возможности измерения в психологии подвергались сомнению. Психологическое тестирование оставалось прерогативой прикладных направлений исследований. В психологии это направление известно как психотехника, в педагогике - педология. Психотехника стремилась удовлетворить те потребности в измерении индивидуальных различий, которые испытывали промышленность, армия, а педология пыталась сделать это в образовании (сказанное, конечно, не означает, что психотехника и педология были нацелены исключительно на измерение индивидуальных различий).
К концу 1920-х гг. существовало около 1300 тестов, с помощью которых в течение года получали примерно 30 миллионов показателей (Г. Галликсен, 1949). Казалось, сложилась весьма благоприятная ситуация, способствующая дальнейшему победоносному шествию психологического тестирования, его проникновению буквально во все сферы человеческой жизнедеятельности. Однако в психологической науке тех лет возникает кризис, причина которого, по мнению Л. С. Выготского (1982, т. 1), заключается в развитии прикладной психологии, приведшем к перестройке всей методологии науки на основе принципа практики, что неизбежно вело к «разрыву» психологии на две науки.
Этот кризис не мог не коснуться и психологического тестирования, прошедшего через «крупный, но преждевременный подъем».
Тестология, воодушевленная победами в области измерения человеческого поведения и стремящаяся количественно определить все и вся в психологии, оторвавшись от неудовлетворявшей ее академической науки, не смогла создать собственной теории. Своеобразие кризиса в тестировании связано как с закономерно углубляющейся специализацией тестов, так и с тем, что тесты предлагали ограниченное, фрагментарное знание о личности. Первоначальное предположение о том, что использование нескольких тестов спасет положение и позволит достаточно полно, целостно охарактеризовать личность, не оправдалось, впрочем, как и ожидание появления некоего универсального теста. Все возрастающие запросы практики оказались неудовлетворенными. А. Анастази следующим образом характеризует ситуацию, сложившуюся в результате широчайшего распространения тестов в образовании, армии, промышленности: «Применение групповых тестов интеллекта значительно обогнало их методические возможности. В погоне за показателями и практическими результатами частенько забывалось, что тесты оставались достаточно грубым инструментом. Когда же тесты не оправдывали необоснованных ожиданий, то часто это приводило к скептицизму и враждебному отношению ко всякому тестированию. Таким образом, тестовый бум 1920-х гг., приведший к неразборчивому применению тестов, не только не задержал, но и способствовал прогрессу психологического тестирования» (Анастази, 1982, с. 25).
Хотя у А. Анастази речь идет о групповом тестировании интеллекта, тестовый бум, разумеется, не был связан исключительно с измерением способностей. Из нашего обзора исследований 1920-х гг. хорошо видно, что с помощью тестов пытались измерять едва ли не все известные проявления индивидуальности.
Р. Хейс приводит убедительные примеры беспомощности специализированных тестов в решении практических задач того времени. Так, в армейской психологии, после трехдневного обследования пригодности испытуемого к выполнению обязанностей офицера, исследователь-психолог оказывался совершенно безоружным перед множеством частных (единичных) результатов. При этом он, естественно, не располагал никакими методическими указаниями по обобщению полученных частных данных (для этого понадобилась бы теория!). Критический оборот принимала ситуация, когда получали противоречащие друг другу результаты: «...исследование становилось неконтролируемым, методически необоснованным». Р. Хейс пишет о возможности возникновения подобных ситуаций и сегодня. К сказанному можно лишь добавить, что эта возможность нередко становится реальностью.
Преодоление тестологического кризиса связано, во-первых, с разработкой теоретических проблем индивидуальных различий (формирование или углубление представлений о психологической природы изучаемых явлений, их механизмах, причинах дифференциации), во-вторых, с определением места и значения измерения вовне физической области человеческого поведения.