← Články

Proč se ve světě ustupuje od plošného testování znalostí

21. 5. 2012

EDUin

Publikujeme zhruba rok starý článek Jany Strakové, v té době pracovnice Ústavu pro informace ve vzdělávání, který vyšel v odborném časopisu Řízení školy pod titulkem Aktuální poznatky o dopadech a možnostech plošného testování. Je zajímavý především proto, že 21. května startuje i v České republice pilotní plošné testování žáků pátých a devátých tříd. Připomínáme tedy, jak se projekty plošného testování vyvíjely v zemích s delší tradicí ověřování výsledků vzdělávání.
Startuje generálka testování žáků, Události ČT (20. května). Aktuální informace na webu Stop plošné testování.

V uplynulých desetiletích začaly být v řadě vyspělých zemí používány plošné testy jako jeden z důležitých nástrojů k zajištění kvality vzdělávání. Výkon žáků v těchto testech má často zásadní důsledky pro žáky, jejich učitele a školy, které navštěvují. Je podle něj posuzována kvalita práce učitelů, kvalita práce škol, testy jsou kritériem pro rozhodování o další vzdělávací dráze žáka.

Tvůrci vzdělávacích politik vycházeli při zavádění testů ze dvou základních předpokladů. Za prvé se domnívali, že tyto testy jsou schopny postihnout důležité vědomosti a dovednosti, tedy že z jejich výsledků skutečně můžeme vyvozovat závěry o tom, do jaké míry žáci dosahují stanovených cílů vzdělávání. Za druhé přepokládali, že žáci a učitelé vědí, jak dosáhnout kýžených cílů, že se jenom dostatečně nesnaží. Věřili, že pod hrozbou závažných důsledků budou žáci i jejich učitelé usilovněji pracovat a že to samo o sobě bude stačit ke zlepšování výsledků žáků.

Dlouho se zdálo, že to tak opravdu funguje, že testy skutečně představují účinný nástroj pro zlepšování výsledků vzdělávání, neboť v systémech, které začaly plošné testy používat, se výsledky žáků v těchto testech zlepšovaly. V posledních letech se však množí důkazy o tom, že testování nemá na vzdělávací systémy ani zdaleka tak blahodárný dopad, jak se předpokládalo.

Předpoklady o fungování testů nejsou naplňovány

V první řadě byl zpochybněn předpoklad o vypovídací hodnotě testů. Výzkumy ukázaly, že poskytují o vědomostech žáků často nadhodnocenou informaci. Díky přípravě na testy je procvičována ta část učiva, která je testována, a proto v ní dochází ke zlepšování. Výsledek v testu ale již nevypovídá o celé vzdělávací oblasti, tedy o vědomostech a dovednostech, které nejsou součástí testu. Již ze samé podstaty plošného testování vyplývá, že nemůže hodnotit komplexní cíle vzdělávání. Vzhledem k tomu, že z výsledků testů jsou vyvozovány závažné důsledky, je kladen velký důraz na jejich spolehlivost a validitu. Z toho důvodu jsou v těchto testech četněji zastoupeny typy úloh (typicky úlohy, ve kterých žák vybírá jedinou správnou z více nabízených možností), které jsou objektivně vyhodnotitelné, ale neumožňují hodnotit například dovednosti vyšších úrovní Bloomovy taxonomie, procedurální znalosti (postupy řešení) nebo porozumění principům (mylné představy žáků). Tyto netestovatelné oblasti často stagnují, nebo se dokonce zhoršují, neboť jim je ve výuce věnováno méně pozornosti. Testování tedy nejenže nepřináší validní informaci o vzdělávacích výsledcích, ale má negativní dopad na obsah a metody vzdělávání. Nejen tím, že má za následek zúžení kurikula na položky, které jsou součástí testů, ale též oslabováním iniciativy, zodpovědnosti a tvořivosti učitelů. Ti se přestávají řídit vlastním pedagogickým úsudkem o tom, na co je třeba klást ve výuce důraz a jak je vhodné postupovat, a nacvičují s dětmi testované učivo. Ukázalo se, že negativní efekty ve vztahu k výuce se objevují i při absenci zásadních dopadů na školy a učitele, protože učitelé vždy považují za důležité, aby jejich žáci v testech uspěli.

Analýzy dopadů testování na vzdělávací systém zpochybnily také předpoklad, že ke zlepšování bude docházet jaksi apriori jen samotnou existencí testování. Ukazuje se, že testy nepomáhají ke zlepšení vyučování a učení ani k profesnímu rozvoji učitelů, neboť se zaměřují na výsledek, nikoli na proces učení. Mohou tedy stimulovat nácvik jednoduchých vědomostí a dovedností, ale nepomohou v případě složitějších cílů vzdělávání, protože nevedou na lepší porozumění těmto cílům ani neukazují cestu k jejich zvládání. Z hlediska poskytování zpětné vazby je zásadní překážkou dlouhý interval mezi testem a výsledkem a skutečnost, že neexistuje přímá návaznost testu na výuku.

Cesta ke zlepšení vede přes formativní hodnocení

Zjištěné nedostatky se snaží tvůrci vzdělávacích politik odstranit dvěma cestami. Za prvé přemýšlejí o tom, jak zdokonalit plošné testy. Zde se vyskytují snahy o doplnění testů o činnostní úlohy (performance assessment), které jsou sice obtížněji vyhodnotitelné, ale mají prokazatelný pozitivní dopad na výuku a profesní rozvoj učitelů. Další snahy směřují k větší provázanosti testů se stanovenými cíli vzdělávání tím, že budou rozlišovací testy (jejichž cílem je rozdělit žáky podle výkonnosti) nahrazovány testy ověřovacími (jejichž cílem je ověřit, zda žáci dosáhli stanovených vzdělávacích cílů/ standardů).

Hlavní poučení, která vyplynula z analýz dopadů plošného testování, nicméně směřují k tomu, že plošné testy, ať již budou sebedokonalejší, kvalitní vzdělávání nezajistí. Pro trvalé zlepšování výsledků je důležité se zaměřit na proces vyučování a učení a zdokonalit hodnocení, které probíhá přímo ve třídě. Hodnocení musí být integrální součástí učení, musí bezprostředně reagovat na žákovy výkony. Musí poskytovat kvalitní informaci o vědomostech a dovednostech každého žáka tak, aby bylo možno přizpůsobovat výuku jeho potřebám. Kvalitní zpětná vazba musí být včasná, musí se vztahovat ke kritériím specifikujícím očekávané výkony, musí obsahovat specifická doporučení, jak se zlepšovat a musí být odstupňovaná podle úrovně žáka tak, aby byla pro žáka srozumitelná. Na jejím základě se žáci naučí reflektovat vlastní práci a její výsledky tak, aby se sami stali zainteresováni na vlastním pokroku a byli schopni jej sledovat: existují doklady o tom, že žáci, kteří se naučili se učit, dosahují lepších výsledků. Formativnímu hodnocení je třeba se nejprve naučit, neboť představuje zásadní změnu v pojetí vyučování a učení se a ve změně vztahu mezi žáky a učiteli. Žáci nemohou skrývat své nedostatky, neboť efektivní učení spočívá právě v jejich odhalení a odstraňování.

Doporučení ke zkvalitnění sumativního i formativního hodnocení

Z analýz dopadů plošného hodnocení na vzdělávací systémy vyplynula následující doporučení:

Zvýšit zapojení učitelů do hodnocení standardizovaných úloh

Tím, že učitelé budou zapojeni do hodnocení žákovských prací, lépe porozumějí stanoveným cílům a tomu, jaký žákovský výkon těmto cílům odpovídá.

Posílit profesní hodnocení učitelů

Pokud učitelé učiní vlastní zkušenost s tím, jak vypadá kvalitní zpětná vazba, budou schopni tuto zpětnou vazbu lépe poskytovat svým žákům. Součástí profesního standardu učitele by také měly být aspekty související s formativním hodnocením a přizpůsobením výuky potřebám žáků, profesní hodnocení tedy přirozeně obrátí pozornost učitelů k těmto aspektům jejich práce.

Zvyšovat kvalitu formativního i sumativního hodnocení na základě výzkumu

Výzkum poskytuje informace o tom, jak se děti učí a jaké jsou jejich mylné představy, které brání porozumění základním principům. Výzkum přináší také cenné poznatky o dopadech různých typů hodnocení na proces vyučování a učení.

Vyvinout hodnocení pro potřeby učitelů

Učitelům by měly být k dispozici rozmanité úlohy, na základě kterých mohou vyhodnotit úroveň vědomostí a dovedností svých žáků ve specifické oblasti tehdy, kdy to bude z hlediska postupu ve výuce vhodné. Spolu s úlohami by měli mít učitelé k dispozici návod pro hodnocení žákovské práce včetně ukázek jiných žákovských prací s jejich vyhodnocením. Úlohy by měly poskytovat informaci o naplňování stanovených standardů i srovnání výkonu žáků s výkony žáků z jiných škol.

Vyvinout diagnostické nástroje pro žáky s nízkou úrovní dovedností

Z hlediska výuky je nezbytné včas rozpoznat žáky, kteří mají problémy s učením a poskytnout jim specifickou péči.

Realizovat národní testování nikoli plošně, ale na výběrových souborech

Při plošném testování je všem žákům zpravidla zadáván stejný test, neboť jsou poměřovány výkony jednotlivých žáků. Takový test může z časových a praktických důvodů obsahovat jen velmi omezené množství úloh a tedy poskytuje jen velmi omezenou informaci o tom, jak žáci zvládají jednotlivé učební celky. Proto je pro získání informace o fungování celého vzdělávacího systému vhodnější používat výběrová šetření, při kterých jsou různým žákům zadávány různé testové sešity a je tedy možno učební celky analyzovat komplexněji s větším množstvím různorodých úloh. V takových šetřeních také nedochází ke srovnávání výkonu jednotlivých žáků a je tedy možno zařazovat i úlohy, jejichž vyhodnocování je zatíženo určitou mírou subjektivity.

Při hodnocení využívat možností moderních technologií

Moderní technologie poskytují možnosti testování komplexních vzdělávacích cílů. Typickým příkladem jsou například úlohy na ověřování kompetence k řešení problému, které simulují problémové situace a monitorují postup žáků při jejich řešení.

Tento text byl zpracován na základě stati Janet W. Loony (Janet W. Loony: Integrating Formative and Summative Assessment, OECD Working Paper No.58. http://www.oecd-ilibrary.org/education/integrating-formative-and-summative-assessment_5kghx3kbl734-en), která byla jedním z podkladových dokumentů v projektu Review on Evaluation and Assessment Frameworks for Improving School Outcomes, jehož realizace je v ČR spolufinancována Evropským sociálním fondem a stáním rozpočtem České republiky.