ГЛАВА ПЕРВАЯ

Ошибочная проверка знаний учащихся

ИСТОРИЯ СНОСОК-СНЕЖИНОК («ASTERISKS»)

В этой главе будет подвергнута критике практика проведения наших нынешних тестов по чтению. Общественное мнение здесь сходится: повсюду в стране вспыхивают бунты против тестирования, родители и ученики бойкотируют обязательные экзамены. Такое активистское движение кажется непродуманным. Тесты всегда были необходимы в образовании. Правильное решение — сократить их число и улучшить их качество. Единственный путь к этому — основать тесты на чётких, основанных на знаниях программах (curriculums). Нет другого способа сделать тесты справедливыми и плодотворными. А ещё это единственный способ сделать школы одновременно и высококачественными, и справедливыми. Это, по сути, главный итог главы.

Если пришлось бы выбрать один-единственный показатель академического уровня системы школьного образования, им бы стал средний балл по чтению у выпускников семнадцати лет. Вербальные показатели в этом возрасте предсказывают готовность студентов к колледжу и дальнейшей карьере, а также их последующий экономический успех. Технически корректный тест по чтению, точно прогнозирующий способность учащегося понимать самые разные тексты, очевидным образом предскажет и его способность понимать любую устную и письменную речь. Тест по чтению — это проверка общего объёма знаний и словарного запаса; он оценивает способность ученика полноценно функционировать в общественной сфере. А поскольку валидный тест по чтению выявляет степень включённости ученика в публичное пространство — что является фундаментальной целью образования, — любая политика, которая снижает результаты тестов по чтению или не пытается их улучшить, оказывается провальной образовательной политикой.

В математике, в отличие от чтения, американские результаты у семнадцатилетних на протяжении многих лет оставались стабильными. Хотя и неприятно, что баллы по математике к семнадцати годам не показывают значительного роста, по крайней мере они не упали, как это произошло с чтением. Ведь в 2012 году, спустя десятилетие после вступления в силу «Акта Ни Один Ребёнок Не Останется Вне Внимания» (No Child Left Behind, NCLB) с его жёстким акцентом на тестировании, результаты чтения среди семнадцатилетних оказались заметно ниже по сравнению с 1988 годом, то есть до принятия NCLB. Рисунок 1.1 из «долгосрочного отчёта» (long-term trend) Национальной оценки образовательного прогресса (NAEP) за 2012 год — на сегодня это последний общенациональный анализ многолетних тенденций в чтении среди семнадцатилетних. Он показывает статистически значимое падение на три балла в чтении у семнадцатилетних по сравнению с результатами 1988, 1990 и 1992 годов. Обратите внимание на «звёздочки» (asterisks) на диаграмме — это ценная деталь, характерная для подобных многолетних отчётов. Они указывают статистически значимую разницу (в большую или меньшую сторону) между результатами прошлых лет и 2012 года. При этом не просто сравнивается средний балл, а проводится более детальный анализ данных.

file01

Результат 2012 года для семнадцатилетних выглядит особенно странным потому, что та же возрастная группа за четыре года до этого, в тринадцать лет, продемонстрировала самый высокий балл, когда-либо зафиксированный NAEP. Он был выше любого предыдущего, кроме 1992 года, с которым он совпадал. Подобные «несогласованности» мы видим в разные годы: тринадцатилетние стабильно показывают прогресс в чтении, а результаты семнадцатилетних остаются неизменными. Ни колледжи, ни работодатели, ни сама страна не сильно заботятся о том, насколько хорошо ученики читали в тринадцать лет, если к семнадцати их вербальные способности хуже, чем были до новых реформ.

Могли ли недавние программы жёсткого тестирования внести свой вклад в это разочарование? Ученикам, которым в 2002 году было семь лет, в 2012 году исполнилось семнадцать. Они как раз «выросли» внутри NCLB, проводя почти десять лет в режиме жёсткого тестирования по чтению, который оказывал глубокое влияние на то, чему учителя их обучали в младших классах. Однако вся эта интенсивная подготовка в итоге не улучшила их уровень чтения в старшем возрасте. Поскольку их возрастная группа до эры NCLB достигала более высоких результатов, можно задать вопрос: не привели ли в итоге добрые намерения создателей тестов к негативным последствиям на долгосрочном отрезке?

Мысль эта тревожна, потому что очевидно: режимы тестирования помогли улучшить технику начального чтения (то есть способность быстро и правильно «озвучивать» текст) — это важный прогресс. Младшие ученики теперь распознают слова более бегло и точно, чем раньше. В результате на ранних этапах чтения снизились «разрывы» между этническими и расовыми группами, для которых навыки беглости играют существенную роль. Увы, между тринадцатью и семнадцатью годами эти разрывы снова начинают расти, когда решающую роль приобретают знания и словарный запас.

Сначала может показаться, что виноваты, возможно, средние и старшие классы (high school), которые «сошли на нет» после достигнутых результатов в младших классах. Но как специалист в области понимания текста я знаю, что это неверно. Объём словарного запаса семнадцатилетнего не формируется непосредственно в семнадцать, шестнадцать или пятнадцать лет. Это «растение медленного роста», зависящее от объёма полученных знаний с рождения до семнадцати лет. Начальное образование особенно важно для лексического развития у социально незащищённых учеников, и одни методы обучения дают здесь заметно лучшие результаты, чем другие. Но хотя нынешнее начальное обучение и повысило техническую сторону чтения (беглость, «озвучивание»), судя по данным NAEP, оно ухудшило словарный запас к семнадцати годам. Мой вывод (который задаёт направление всей главе): в начальных классах теперь тратится слишком много времени на подготовку к тестам и слишком мало — на расширение объёмных знаний, требующихся для богатого словарного запаса.

Таким образом, история со «снежинками-сносками» (asterisks) сводится к следующему: высокие ставки тестов, от которых теперь зависят судьбы учеников, учителей, директоров и начальников управлений образования, стали постепенно внедряться в американские школы в десятилетия после появления в 1983 году отчёта «Нация в опасности» (A Nation at Risk). В том докладе говорилось о снижении качества среднего образования в 1960‑х и 1970‑х годах. После образовательных саммитов губернаторов в 1989 и 1996 годах все штаты, кроме Айовы, ввели стандартные показатели (standards) для чтения по классам, на которых должна была основываться учебная программа. А когда в 2002 году был подписан закон NCLB, он уже предписывал соблюдение стандартов и ежегодное «высокоставочное» тестирование по чтению и математике в соответствии со стандартами штата.

Я упомянул уже одно следствие этих реформ: улучшение обучения декодированию (превращению письменных знаков в звуки и слова). Это, в свою очередь, должно было повысить и понимание текста, и действительно повысило его для несложных тем в младших классах. Но оно никак не улучшило результаты чтения сложных текстов по более серьёзным темам. Я ожидал обнаружить это несоответствие, так как многие школы жаловались мне, что после введения высокоставочных тестов по чтению по линии NCLB им стало недоступно полноценное преподавание истории и искусств: теперь их заставляли «учить чтению» вместо этого — с упором на подготовку к тесту. Их руководители были убеждены, что ниточка бесконечных занятий «по формулировке выводов» и «поиск главной идеи» повысит результаты теста эффективнее, чем изучение материала про Древний Египет или Солнечную систему, или объяснение того, почему у штата Невада ровно столько же сенаторов, сколько у штата Нью-Йорк.

Абсолютно непредвиденным закономерным результатом стало то, что низкие результаты семнадцатилетних, скорее всего, были вызваны чрезмерными, трудоёмкими усилиями поднять эти результаты. В этой главе я предсказываю, что высокоставочные тесты по чтению, прилагаемые к новым «Единым общеобразовательным стандартам» (Common Core State Standards), будут иметь такую же ничтожную или даже негативную динамику для чтения в семнадцать лет в будущем — если только мы не предпримем решительных мер, чтобы сделать овладение знаниями (knowledge acquisition) главной целью обучения, начиная с самых ранних классов.

КАК ТЕКУЩИЕ ВЫСОКОСТАВОЧНЫЕ ТЕСТЫ ПО ЧТЕНИЮ ВЛИЯЮТ НА ОБУЧЕНИЕ

Till that which suits a part infects the whole, And now is almost grown the habit of my soul.

(«Пока что-то, полезное лишь части, не заразит всё целое — и теперь уже едва ли не стало моей второй натурой».)

На момент написания этой книги чрезмерная частота тестирования в школах США наконец-то стала темой, вызывающей озабоченность и даже самоанализ со стороны министра образования и президента страны. В докладе Министерства образования США за октябрь 2015 года говорится: «Если тестирование проводится плохо, чрезмерно или без чёткого понимания цели, оно отнимает у учеников ценное время, которое можно было бы посвятить обучению, и мешает творческому подходу на уроках. В стремлении обеспечить для всех школьников высокие результаты крайне важно, чтобы тесты были справедливыми, качественными и занимали лишь минимально необходимое время».

Возможно, на заявление министра (Арне Данкана — Arne Duncan) и президента Обаму повлиял тревожный отчёт Совета крупных городских школ (Council of Great City Schools), показавший, что в больших городах каждый ученик ежегодно проходит в среднем около восьми единых тестов, а на само «сидение за тестом» уходит более 4% учебного времени. Но это лишь «вершина айсберга». Время, затраченное непосредственно на написание теста, не самое разрушительное следствие чрезмерного тестирования.

Например, в языковом искусстве (Language Arts) сама система оказалась деформирована, стала скучной и неэффективной из-за «натаскивания» на навыки вроде «сокращения содержания» или «формулировки вопросов к автору». Считается, что многократный упор на такие упражнения должен улучшить способность понимать любые тексты. И действительно, учащиеся показывают краткосрочное улучшение при отработке поиска «главной идеи». Но вскоре рост останавливается. Это подтверждают метаисследования и неизменные данные NAEP. Массированная практика формальных навыков понимания текста не повышает результатов чтения на продвинутом уровне; напротив, она отнимает уйму учебного времени, которое можно было бы посвятить накоплению знаний.

Тревожащиеся директора и завучи вводят эти программы подготовки к тестам, исходя из теории, что стратегии — ключ к пониманию. Учителям внушают, что предметное содержание вторично: стратегии можно изучать и на книжке «Тайлер готовит блинчики!» (Tyler Makes Pancakes!), и на «Потрясающих спортивных стадионах» (Stupendous Sports Stadiums) одинаково хорошо, как и на биографии Авраама Линкольна. Однако в старших классах обнаруживается, что ученики с таким подходом не обладают нужным объёмом знаний и словарным запасом, чтобы понять язык газетных статей, учебников и политических выступлений. Они могут осилить «Потрясающие спортивные стадионы», но не «Экономические последствия мира» (The Economic Consequences of the Peace).

Как определить, что слишком много времени уходит на отработку формальных навыков, вроде умения «резюмировать»? Принцип прост. Известно, что умение понимать текст в любой конкретной ситуации определяется больше объёмом соответствующих знаний, чем формальными стратегиями. Как только стратегии однажды в общих чертах освоены, они «работают автоматически» и нет нужды постоянно их упражнять. Если школа следует стройной и конкретной обучающей программе, в которой чётко прописаны данные для освоения знания, а содержание этой программы является главным предметом тестов, мы можем быть уверены, что ученики продвигаются в изучении тех тем, которые заложены в модуле. Главное, что должна помнить школа: после освоения навыка декодирования («озвучивания») критическим становящимся фактором в понимании текста является релевантное знание. Мудрый учитель и школа автоматически воспитают хороших «резюмирователей» и «находителей главной идеи», если сосредоточатся на накоплении знаний — это полезнее, эффективнее и куда менее утомительно.

ТЕХНИЧЕСКИ ВАЛИДНЫЕ, НО НЕВАЛИДНЫЕ В ОБРАЗОВАТЕЛЬНОМ СМЫСЛЕ ТЕСТЫ ПО ЧТЕНИЮ

На сегодняшних тестах по чтению невозможно предугадать темы, которые встретятся в отрывках. Логично, что общий тест по чтению (а только такой и может считаться «справедливым», коли темы обучения не заданы) вынужденно не может опираться на какие-то конкретные школьные знания. Эта структура «по умолчанию» вынуждает школы делать упор на «стратегии» и тренировку этих псевдонавыков, а не на систематическое накопление знаний.

При всём этом лучшие тесты по чтению, например Gates-MacGinitie, Iowa Test of Basic Skills или тот же NAEP, технически надёжны и достоверны. Между разными вариантами одного и того же теста (формами) есть очень высокая взаимная корреляция (около 0,9 по шкале, где 1 = идеальное совпадение). Значит, эти тесты надёжны и один и тот же ученик покажет примерно одинаковый результат на разных вариантах. Хорошо выверенные тесты также демонстрируют высокий уровень «валидности» (то есть действительно измеряют среднюю способность к чтению): их корреляция с другими точными тестами колеблется в районе 0,7–0,8. Все эти «старые» и хорошо откалиброванные тесты помогают нам надёжно знать, на каком среднем уровне находятся наши ученики. Так мы и узнаём, что девятилетние и тринадцатилетние улучшили результаты, а семнадцатилетние — нет.

Но в реальном использовании в школах подобные проверочные работы не повысили, а скорее затормозили развития чтения на зрелом уровне. Другими словами, они технически валидны, но в образовательном смысле — нет. На это давно указывал теоретик тестирования Сэмюэл Мессик (Samuel Messick), введя термин «последующая валидность» (consequential validity). Смысл его идеи в том, что сама по себе техническая корректность теста мало чего стоит. Цель педагогического тестирования — помогать образованию. Если тест мешает образованию, значит, по итоговым последствиям он невалиден. Нынешние тесты по чтению, создавая ложное впечатление, будто они оценивают некие «общие навыки», которых в природе не существует, фактически подталкивают школы к ошибочной практике. Они оказываются «невалидными по последствиям» (consequentially invalid).

Эта проблема кроется не столько в самих тестах, сколько в поверхностных штатных стандартах, не предусматривающих конкретных знаний. Именно стандарты вводят школы в заблуждение насчёт природы навыка чтения. Они, сосредоточившись на «поиске главной идеи», поддерживают миф о существовании единого «навыка поиска главной идеи», благодаря тренировке которого можно улучшить чтение. Но если бы это было так для продвинутого уровня, то нынешнее поколение школьников уже показывало бы более высокие результаты — ведь их усиленно учили искать главную идею.

Тестовые вопросы про «главные идеи» и «умение делать выводы» (inferencing) внушают ложную мысль, будто проверяют всеобщие стратегические «умения», вроде умения прогнозировать, резюмировать и делать выводы. На деле они проверяют знания и словарный запас. За счёт того, что Закон NCLB сфокусировал внимание на декодировании, дети действительно научились лучше «озвучивать» текст. Но по мере роста читательской беглости решающим фактором понимания становится знание предметной области. Любой специалист по когнитивной лингвистике согласится с этим. Пусть невольно и без знаний психолингвистики, но авторы тестов вводят в заблуждение. Их формулировки вопросов создают впечатление проверки «формальных навыков». Но как бы хорошо детей ни тренировали в поиске главной идеи, ученик с меньшим словарным запасом и объёмом знаний на тесте обязательно проиграет тому, кто всё это имеет.

Поэтому родительские и учительские протесты против введения новых тестов и массовые отказы от них недвусмысленно говорят о том, что люди справедливо почувствовали: что-то идёт не так. Движение «отказников» (opt-out) набирает силу в немалом числе округов. Учителя жалуются, что подготовка к тестам «сужает» программу начальной школы, вытесняя обществознание, естественные науки и искусства. Родители жалуются на то, что из-за постоянных экзаменов страдают история и искусство, а на детей накладывается излишний стресс. Вот характерная цитата из недавней статьи в New York Times:

«Родители возмущались системой, перегруженной новыми тестами всех уровней — районными, штатными, федеральными. Некоторые плакали, описывая подростков, которые принимают “Ксанакс” (успокоительное) от экзаменационного стресса, детей, которые отказываются ходить в школу, и учителей, которые увольняются, а не хотят поддерживать культуру, в которой, по их словам, “тестирование важнее обучения”. “Моя третьеклассница обожала школу, но в этом году я не могу заставить её выйти из машины”, — сквозь слёзы рассказывала Дон ЛаБорд, у которой трое детей в школах округа Палм-Бич. По её словам, у сына, одиннадцатиклассника, такой стресс, что мне пришлось отвести его к врачу. “Он не может спать, но всё время уставший. Он не может есть, но голоден”. Один отец расплакался, говоря, что собирается забрать своего ребёнка-второклассника из школы. “Натаскивание на тест разрушает наше общество”, — сказал он.»

Все эти протесты важно направить в конструктивное русло. Такое возможно.

НЕСОСТОЯТЕЛЬНОСТЬ СТАНДАРТОВ ПО ЧТЕНИЮ

Штатные тесты по математике обычно строятся на конкретных содержательных стандартах, но ситуация меняется радикально, когда речь идёт о чтении, где тестостроители справедливо замечают: «Как можно создать тест, который будет поощрять усвоение конкретных знаний, если сами стандарты лишены содержания и поощряют лишь оценку неких общих навыков?» Разработчики стандартов сочли, что в математике, в принципе, возможно продвинуть однозначные требования по содержанию, а в чтении это вызвало бы бурные политические споры. Поэтому создатели американских образовательных стандартов были вынуждены «уклониться» от конкретики в чтении, сводя всё к беспредметным «навыкам». Сегодняшние стандарты в математике гораздо лучше помогают учителям и тестостроителям, чем нынешние «пустые» стандарты в области чтения.

Для иллюстрации сравним несколько примеров из Техасских стандартов в математике и чтении. Ниже — фрагменты по теме «дроби», конкретные и последовательные, усложняющиеся класс за классом:

3 класс: “Объясните, что две дроби эквивалентны тогда и только тогда, когда они соответствуют одной и той же точке на числовой прямой или представляют одну и ту же часть одинакового целого (при моделировании площади).” 
4 класс: “Представлять дробь a/b как сумму дробей 1/b, где a и b — целые числа и b > 0, включая случаи, когда a > b.” 
5 класс: “Представлять и решать задачи на сложение и вычитание дробей с разными знаменателями, относящимися к одному целому, используя наглядные модели и свойства арифметических действий.”

А вот Техасские стандарты по чтению для работы с информационным текстом. Они не только весьма общие, но и практически не демонстрируют никакой содержательной последовательности. Из опасения конкретизировать темы или тексты стандарты упирают на умение находить главную идею:

3 класс: “(A) выявлять детали или факты, подтверждающие главную идею.” 
4 класс: “(A) резюмировать главную идею и поддерживающие её детали в тексте так, чтобы сохранять смысл.” 
5 класс: “(A) резюмировать главные идеи и поддерживающие детали в тексте так, чтобы сохранялся смысл и логический порядок.” 
6 класс: “(A) резюмировать главные идеи и поддерживающие детали в тексте, демонстрируя понимание, что в резюме не включаются мнения.” 
7 класс: “(A) оценивать, насколько точно резюме отражает главные идеи, подтверждающие детали и общий смысл исходного текста.” 
8 класс: “(A) кратко резюмировать главные идеи, поддерживающие детали и взаимосвязь идей в тексте, сохраняя при этом смысл и логический порядок.”

В моём родном штате Виргиния прямым текстом признают нелепое однообразие и содержательную пустоту таких стандартов по чтению:

2 класс: “g) Определять главную идею.” 
3 класс: “g) Определять главную идею.” 
4 класс: “d) Определять главную идею.” 
5 класс: “g) Определять главную идею.” 
6 класс: “g) Определять главную идею.” 
7 класс: “g) Определять главную идею.” 
8 класс: “h) Определять главную идею.”

«Общие государственные стандарты» (Common Core State Standards) по английскому языку и литературе (ELA) от этих же недостатков не спасены:

3 класс: “Определять главную идею текста; пересказывать ключевые детали и объяснять, как они поддерживают главную идею.” 
4 класс: “Определять главную идею текста и объяснять, как её поддерживают ключевые детали; резюмировать текст.” 
5 класс: “Определять две или более основных идей текста и объяснять, как их поддерживают ключевые детали; резюмировать текст.” 
6 класс: “Определять центральную идею текста и то, как она выражена с помощью отдельных деталей; давать резюме текста, содержащееся отдельно от личных мнений или оценок.” 
7 класс: “Определять две и более центральных идей текста и анализировать их развитие на протяжении текста; давать объективное резюме текста.” 
8 класс: “Определять центральную идею текста и анализировать её развитие, в том числе в соотношении с поддерживающими идеями; давать объективное резюме текста.”

Подобные «пустые» стандарты не просто бессодержательны — они вредны. Представление о «навыке поиска главной идеи» как замене конкретного содержания не только пусто, но и вводит в заблуждение. Не существует надёжного навыка извлечения одной-единственной главной идеи. Если ученик понимает отрывок, он правильно ответит и на вопрос о «главной идее». Если не понимает — не ответит, как бы он ни отрабатывал «умение» её находить. Более того, в хорошем, сложном тексте зачастую нет единственной «главной идеи». Взять хотя бы «Клятву верности» (Pledge of Allegiance) — разве там не как минимум три разные «центральные мысли»?

Все эти усечённые стандарты возникли из политической целесообразности. Разработчики стандартов и тестов выстроили «искусственный мир», безболезненный с точки зрения политики, но основанный на неправильном понимании природы чтения.

«ПУСТЫЕ» НАВЫКИ ПОРТЯТ И ТЕСТЫ, И ОБУЧЕНИЕ

Тестостроители послушно следуют логике авторов стандартов, подавая чтение как «универсальный навык», будто декодирование. Но это не так. Сами стандарты и тесты создают воображаемую альтернативную реальность в классе. В реальности степень понимания отрывка определяется объёмом знаний и словарного запаса ученика, необходимых для данной темы. Если школа не учит конкретным сведениям и лексике, без которых ученик не сможет понять текст теста, то сам тест несправедлив как показатель того, чему школа его научила. (То есть нынешние тесты действительно несправедливы — об этом чуть подробнее в следующей главе). Тест лишь отражает суммарные знания и словарный запас ученика, накопленные из всех возможных источников. А поскольку тест не проверяет, какие знания и словарь были усвоены именно в школе (ведь в стандартах «без содержания» это попросту негде прописать), школа остаётся «в стороне» от этой оценки.

В такой ситуации создателям тестов остаётся только замаскировать фундаментальную несправедливость, представляя чтение набором универсальных «стратегий», якобы проверяемых в тестах. Внешняя форма вопросов создаётся так, чтобы казалось, что они оценивают именно «общие навыки» (например, определение главной идеи, умение делать выводы, предвидеть содержание и т. п.). Вот некоторые «стемы», вынесенные из опубликованных заданий тех же техасских тестов, которые вводят в заблуждение, создавая впечатление, что «техника» чтения важнее знаний:

Какова основная цель абзацев 7 и 8? [главная идея] 
С какой, по всей видимости, целью автор написал этот отрывок? [главная идея] 
Какое предложение раскрывает главную мысль абзаца 2? 
Что можно заключить о том, почему Чу так беспокоит привычка Дасти? [“навык умозаключения”] 
Какое из приведённых высказываний лучше всего резюмирует этот отрывок? [главная идея] 
Какие выводы может сделать читатель об отношении автора к Дасти? [“умозаключение”] 
Что можно заключить о причине долгой жизни сосен-востроносок (bristlecone pines)? 
В чём, согласно тексту, основная идея в отношении сосен? 
Как структура абзацев 2–4 способствует раскрытию главной мысли автора?

Ответ на такие вопросы для ученика с нужным бэкграундом прост и понятен. Но если таких знаний не хватает, никакая многократная тренировка приёмов «определения главной идеи» не поможет быстро и правильно разобраться в отрывке. Ребёнок, у которого нет нужных знаний, будет долго искать подсказки по тексту и заниматься «приёмами», не успевая вовремя закончить тест и делая много ошибок.

Суммируя: чтобы скрыть несправедливость тестов, приходится моделировать фиктивный мир, в котором метанавыки якобы равны или даже важнее предметного содержания и словарного запаса. В «пустых» стандартах, уклоняющихся от конкретного содержания, всё свели к «прокачке навыков» вроде умения делать выводы, ставить гипотезы, определять главную идею. С такими стандартами и тесты выглядят «соответствующими стандартам» и «охватывающими школьный курс». Но при этом, вопреки справедливости (а особенно в ущерб малообеспеченным ученикам), они упорно остаются неэффективными для развития полноценного чтения.

Неужели совсем не существует универсальных стратегий? И неужели их освоение вовсе не повышает навык чтения? Краткий ответ даёт статья-обзор Уиллингема и Ловетта «Можно ли обучить пониманию текста?». Их ответ: «Фактически нет». Стратегии чтения действительно дают краткосрочный эффект и помогают научиться отвечать на типовые вопросы теста, но осваиваются очень быстро, не требуют длительной практики и достигают «потолка» на том, что уже есть. Двух недель работы над «навыками понимания» достаточно. Всё, что сверх того, — пустая трата времени. Более того, когда детей слишком уж заставляют сознательно применять стратегии, это отвлекает их внимание и снижает итоги.

Таким образом, «принципы подотчётности», основанные на этой ошибочной схеме, не дали никакого реального прогресса в умении читать сложные тексты. Чтобы добиться улучшения, нужна иная модель работы со чтением и тестами, устроенная по аналогии с математикой, где стандарты и программа конкретны, а тесты базируются на этом содержании. Возможно, «Единые общеобразовательные стандарты» (Common Core) в перспективе разовьются именно в этом направлении.

«НОВЫЕ ТЕСТЫ ПО ЧТЕНИЮ COMMON CORE»

Я посвящу следующую главу инициативе Common Core. Реакция многих школ на новые тесты Common Core уже заметна. Многие администраторы школ реагируют на них так же непродуктивно, как и на предыдущие «высокоставочные» (high-stakes) тесты в рамках закона No Child Left Behind. Школы интенсивно отрабатывают приёмы вроде «делать выводы» и «находить основную идею», а теперь ещё и практикуют «внимательное чтение» (close reading) и «управление сложностью» (complexity managing) в преддверии новых версий высокоставочных тестов по чтению, которые, как и прежде, претендуют на проверку неких «общих умений» делать внимательный анализ, управлять сложностью и находить основную идею — общих умений, которых на самом деле не существует.

Я с некоторой неохотой завершаю эту главу критикой тестов по чтению, которые разрабатываются консорциумами в рамках Common Core State Standards. Сами стандарты Common Core в некоторых отношениях превосходят большинство региональных (штатных) стандартов. Они содержат важное предписание о том, что реализация стандартов возможна лишь посредством «намеренно и последовательно выстроенной учебной программы, призванной развивать богатую систему знаний внутри классов и между ними». Эти драгоценные слова, на мой взгляд, самые важные во всём новом стандарте. Но почти не видно, чтобы школьные округа или штаты уделяли им сколько-нибудь серьёзного внимания, поскольку это общее предписание не является конкретным стандартом, который можно напрямую сопоставить с заданиями теста по чтению.

Из-за отсутствия чёткого поуровневого (поклассного) перечня содержания (grade-by-grade content guidance) создатели тестов Common Core оказались в том же положении, что и их предшественники, разрабатывавшие тесты по государственным стандартам. Новые задания также будут проверять умение находить основную идею и делать выводы, как и раньше, а теперь ещё и умение «внимательно читать». Таким образом, несмотря на все расходы и компьютерные новшества в новых тестах по чтению, маловероятно, что они принесут больше пользы, чем те тесты, которые они заменяют. Новые тесты по чтению, как и старые, придётся строить вокруг основных идей и умения делать выводы. Новая разновидность вывода должна быть связана с дополнительной стратегией вывода, называемой «внимательное чтение», согласно стандарту: «Внимательно прочитать, чтобы определить, что текст прямо говорит, и сделать логические выводы на его основе».

Опубликованные примерные задания от консорциумов, разрабатывающих тесты Common Core, в полной мере подтверждают мой прогноз о том, что тесты будут проверять прежде всего умение находить основную идею и «внимательно» читать. Это те элементы стандартов Common Core, которые в наименьшей степени связаны с конкретным содержанием и больше напоминают «стратегии». Так, PARCC, один из двух консорциумов, разработал задания из двух частей: первая часть оценивает понимание текста, вторая требует «внимательного чтения» и «логического вывода» в обоснование ответа ученика. Вот пример для 3-го класса от PARCC:

«Часть A: Каково значение слова “avenge” (отомстить) в контексте этого рассказа? 
Часть B: Какой фрагмент рассказа лучше всего подтверждает ответ на Часть A?»

Такая структура вполне разумна, при условии, что школы поймут: секрет ответа на эти вопросы — это не часы практики «навыков вывода» и «внимательного чтения», а лишь обладание учеником соответствующим багажом знаний о словах и темах.

Консорциум «Smarter Balanced» объединил эти две части в один вопрос, например, для 4-го класса:

«Прочитайте предложение из текста. Затем ответьте на вопрос. 
“Нанобриллианты — это звёздная пыль, образовавшаяся при взрывах древних звёзд много лет назад и ‘извергавшая’ (disgorging) оставшиеся в них элементы в космос.” 
Исходя из контекста этого предложения, какое наиболее точное значение имеет слово ‘disgorging’? 
• scattering randomly (разбрасывать хаотично) 
• throwing out quickly (быстро выбрасывать) 
• spreading out widely (широко распространять) 
• casting forth violently (выбрасывать с силой)»

Нет сомнений, что при «внимательном чтении» ученику предлагается такой путь рассуждений: «Посмотрим. Звезда взорвалась — это насильственное событие. Значит, disgorge должно означать, что частицы были выброшены с силой. Значит, “casting forth violently” является правильным ответом».

Однако этот же пример наглядно показывает, насколько слабо применение идеи «логических выводов» для «внимательного чтения». Читатели, которые уже знают смысл слова disgorge, понимают, что в зависимости от ситуационного употребления все эти предложенные значения могут оказаться верными, ведь нанобриллианты могли быть «быстро выброшены», «широко распространены» или «разбросаны хаотично», помимо якобы единственно верного ответа. Правильный ответ зависит от того, какую сторону явления автор, как предполагается, хотел подчеркнуть: итог действия или его характер. Можно предположить, что автор не имел в виду что-то очень уж «насильственное», поскольку слово «disgorge» обычно не описывает крайне взрывной процесс. Как бы то ни было, чистая «логика» не решит эту задачу. Либо нужно засчитать верными все варианты о нанобриллиантах, либо признать этот вопрос недействительным. Он основан на неверном представлении о природе вывода и чтения.

Ещё более интересен в тексте фрагмент “remaining elements” («оставшиеся элементы»). Вопросы в тесте его игнорируют, и он гораздо менее поддаётся приёмам «внимательного чтения» и логического анализа. Можно хоть весь день внимательно читать “remaining elements” и анализировать его «логически», но остаться ни с чем или прийти к неправильному толкованию. Правильное понимание требует конкретных фоновых знаний довольно высокого уровня (скорее всего, они уже были представлены в источнике), которых у большинства пятиклассников обычно нет. Поэтому этот фрагмент удобно проигнорирован в тестовом задании, но он хорошо иллюстрирует то, как знания всегда важнее «навыка». Знание — это самый перспективный путь, чтобы преодолеть спад в умении читать. Это самый многообещающий способ повысить навыки чтения у всех и сократить разрыв в уровне чтения между разными группами учащихся.

Недавно я опубликовал заметку в Huffington Post со следующим подзаголовком: «Тесты Common Core по языковым искусствам (Language Arts) скоро придут в школы ваших детей. Скажите вашему начальнику округа: ‘Не волнуйся. Ребята легко справятся с этими тестами, если они учат историю, обществоведение, литературу, науку и изящные искусства’». Комментарии учителей к моей заметке были отрезвляющими. Они передавали идею: «Ну что ж, мистер Хирш, это всё хорошо, но если бы вы были на нашем месте, вы бы понимали, что наша работа окажется под угрозой, если мы не будем делать тренировки к тестам по указанию начальства». Они правы.

Родителям и учителям нужно активно включаться в вопрос тестирования — не только жаловаться на стресс, но и менять характер тестов по чтению и методик обучения чтению. Потраченные впустую часы занятий следовало бы посвятить более интересным и продуктивным предметам, которые накапливают объём знаний и словарный запас, а значит, ведут к более высокой компетентности в чтении. Родителям стоит добиваться содержательного наполнения учебного плана в рамках языкового блока, чтобы заменить бессодержательные упражнения, выхолащивающие знания, убивающие душу и почти бесполезные после десяти уроков. Когда учащийся реально обогащает багаж знаний по сути, это и есть лучшая долгосрочная стратегия чтения.

Да, нам нужны тесты. Да, ученики, учителя и школы должны нести ответственность. Но за что? Сами стандарты не сказали об этом достаточно конкретно и без учёта реальной природы чтения. Только такие стандарты, которые указывают, что именно надо осваивать по классам, могут стать основой для справедливых и полезных тестов. Законодатели справедливо настаивают на «подотчётности» (accountability). Но им надо понять, что без конкретных стандартов содержания учебной программы невозможно добиться ни справедливой, ни эффективной «подотчётности» в сфере чтения. Нельзя просто взмахнуть руками и повелеть повысить качество чтения, не указав конкретно, что дети должны узнать и чему школы должны обучить в каждом классе, чтобы постепенно достичь этой долгосрочной цели.

Сторонники жёсткой «подотчётности» должны проявить больше упорства, разрабатывая региональные и местные стандарты учебного содержания. Им следует вместе с родителями и учителями определить, какие знания по классам должны получать все дети в их округе. Более ответственное отношение к подотчётности признает, что только определённые стандарты содержания могут привести к справедливым и эффективным тестам по чтению.

Пока же полезным промежуточным шагом было бы убрать систему карательных санкций против учителей, привязанную к нашим слабо обоснованным тестам по чтению (тема следующей главы). Если бы эти высокие риски исчезли, разумные учителя и директора охотнее обращались бы к «длинной дуге» накопления знаний, которая и является главным путём к подготовке хороших читателей и выпускников, готовых к дальнейшему обучению. Подведём итог: в этой главе показано, что имеющиеся, технически корректные тесты по чтению вводят в заблуждение, если используют их для оценки того, чему реально учили в школе. Они пагубно сужают содержание обучения и приносят больше вреда, чем пользы. Их можно было бы исправить, если бы тесты основывались на хороших, «знание-ориентированных» стандартах. Такие «пересозданные» стандарты и тесты могли бы приносить гораздо больше пользы, чем вреда, — но для этого необходимы более смелые действия и более глубокое научное понимание, чем то, что мы видели в недавнем прошлом.