Seznamte se: MITCH – nový dětský IQ test z dílny Mensy ČR

Zuzana Kořínková

V oblasti testování IQ je Mensa ČR v porovnání s ostatními Mensami dlouhodobě na špičce. Naše testování absolvuje až 9 000 lidí ročně, a s přehledem tak trumfneme třeba i Mensu USA. A protože nám nejde jen o množství otestovaných, ale také o přesnost a kvalitu výsledků, před třemi lety se tým pod vedením Dany Havlové pustil do přípravy zcela nového IQ testu pro děti, který by byl šitý na míru českému prostředí, byl spolehlivý a přesný, a který by tak mohl plnohodnotně nahradit doposud užívaný dětský IQ test a svými kvalitami ho i předčít. Podařilo se a dětský IQ test MITCH (Mensa Intelligence Test for CHildren) je připraven k nasazení. Jak náročná vlastně je příprava IQ testu? Jaká jsou specifika testování dětí? A jaké jsou plány do budoucna? Zeptali jsme se Vladimíra Marčeka, Ph.D., psychologa a člena týmu, který se na přípravě IQ testu MITCH podílel.


Vladimíre, proč přesně se vlastně začal test MITCH vytvářet?

Jednoduše řečeno kvůli zpřesnění výsledků měření.

Měření IQ je vždy jen statistický odhad, který je do velké míry závislý na konkrétním sociokulturním prostředí. IQ je totiž v podstatě porovnání toho, jak si v daném testu člověk vede vůči ostatním jeho věku – tedy jeho percentil vůči populaci. A už z toho je jasné, že aby byl IQ test dokonale přesný, jeho tvůrci by museli otestovat úplně všechny obyvatele daného státu a podle výkonu je seřadit – teprve pak by dokázali určit s jistotou jejich IQ. Ale protože testování takového rozsahu je nemožné, musí nám stačit jen reprezentativní vzorek, díky kterému vzniknou tzv. „psychometrické normy“. Takový vzorek je ze své podstaty omezený, proto když dokonale určíme percentil testovaného vůči testovanému vzorku, stejně nám pak při vztažení na celou populaci vznikne jen určité rozpětí (tzv. interval důvěryhodnosti). A až jeho střední, nejpravděpodobnější hodnota se uvádí jako konkrétní IQ.

Testy jsou navíc ne vždy vytvořené v té zemi, ve které se nakonec používají, vzorky, na kterých se stanovují psychometrické normy, nemusejí být vždy úplně velké (a někdy mohou být i částečně zkreslené nevyváženým výběrem vzorku) a nevyhnutelně časem zastarávají. Odhaduji, že běžně používaný psychologický test v ČR má 5–10 let staré normy, což např. u IQ může znamenat posun i 5 bodů. To všechno má vliv na nižší přesnost výsledků. A právě to byl důvod, proč jsme se rozhodli vytvořit pro děti test nový, který bude v zájmu co nejvyšší přesnosti normovaný přímo na českých dětech, na současném, vyváženém a dostatečně velkém reprezentativním vzorku.

Jak velký je „dostatečně velký“ vzorek? Na kolika dětech se test normoval?

Běžné psychologické testy vytvořené v ČR, nebo přeložené a normované v ČR (a to ať již měří IQ nebo něco jiného), mívají normy vytvořené na vzorku několika set lidí – třeba 800 lidí se už pokládá za relativně hodně. Náš vzorek má v současnosti 1474 dětí (a ještě pár stovek přibude), což nám umožňuje měřit IQ mnohem přesněji. A pokud to jen trochu půjde, plánujeme normy pravidelně obnovovat, aby nám test nezastaral.

Otestovat tolik dětí muselo být náročné – a to ještě nemluvím o tvorbě testových úloh a celkově o zpracování testu… Kolik lidí se na přípravě testu podílelo?

Když pomineme reprezentativní vzorek :) tak na testu pracovalo cca sedm lidí. Dana Havlová přišla s nápadem, resp. potřebou vytvořit nový test a také testovala děti ve vzorku. To byl celkem megalomanský výkon, se kterým jí vydatně pomáhala Lucie Měchurová. Testové položky jsme tvořili s Danou společně, na mně jako psychologovi pak byla statistika a zachování psychologických standardů (správný proces tvorby, interpretace výsledků v průvodním listu apod.). S několika výpočty nám pomáhal i pan profesor Tomáš Urbánek, vedoucí psychologického ústavu Akademie věd ČR a spoluautor mnoha článků o testování IQ. Grafiku měla na starosti Erika Töröková, která naše čmáranice donekonečna překreslovala do počítače, upravovala je dle potřeb a podobně. Vzhled obálek a záznamových archů nám pak dělal designér Vašek Peca – mimochodem jeden z nejlepších českých žonglérů. A celkem se včetně přípravné fáze na testu pracovalo od poloviny roku 2015.

Co je vlastně obsahem testu? Jak vypadají úlohy? A co přesně měří? Inteligence je přeci jen poměrně široký pojem…

MITCH jsou vlastně tři testy. První se jmenuje MITCH mini (obrázek 1). Je určený pro děti od 5 do 8 let včetně, a má 27 položek – tedy jinak řečeno testových úloh. Jeho administrace, tedy zadání a vypracování, trvá 20 minut, což je pro menší děti tak akorát na udržení pozornosti. Položky jsou dvojího druhu – jednak doplnění výřezu v nějakém vzoru (obrázek 2), nebo maticový typ (obrázek 3).

Děti od 9 let do 15 let se už zvládnou soustředit déle, proto můžeme použít podrobnější test – v našem případe rovnou dva. Každý z nich má 22 položek a časový limit 15 minut a oba dva je potřeba zadat hned po sobě. MITCH-A (obrázek 4) je opět maticového typu. MITCH-B (obrázek 5) je inspirován nejnovější generací dětských IQ testů, které na doplnění maticového testu používají ještě úkoly matematického charakteru, ale bez čísel – tzv. vyvažování misek vah (obrázek 6).

Tyto druhy úkolů jsou zlatým standardem měření tzv. fluidní inteligence – tedy té vrozené, nezávislé na vzdělání a předchozích zkušenostech, která Mensu primárně zajímá. Můžeme říct, že na základě této inteligence se pak rodí její doplněk – tzv. krystalizovaná inteligence, tedy získané vědomosti. Ta se pak měří typicky např. testem slovní zásoby nebo obecného přehledu. Díky tomu, že test měří fluidní inteligenci, není na závadu ani to, že mladší děti neumějí číst – čtení zkrátka během testu není potřeba.

MITCH se tedy dá použít od pěti let věku… Je to nějaká standardní hranice, nebo je testování dětí jinými testy možné už dřív? Občas v novinách vyskočí zpráva o ani ne tříletém britském géniovi…

Individuální testy jako třeba SON-R umožňují psychologům testovat děti již od 2,5 let věku (mimochodem tento test je normován i v ČR a zakoupení stojí psychologa cca 50 000 Kč). Otázka ale je, proč bychom měli testovat již tak malé děti. Čím menší dítě, tím pádnější by podle mě měl být důvod k testování – například podezření na nadání, nebo naopak vývojové zaostávání. Testování IQ by nemělo být samoúčelné a musí být vždy psychologem uvedeno do kontextu.

Mimochodem, slovo génius je spíš populární než odborný termín, a osobně bych jej používal spíš až když už někdo přetaví svůj potenciál v nějaké konkrétní, zásadní benefity pro společnost. Ovšem v tom už hraje roli spousta dalších faktorů jako motivace, sociální prostředí, určitě i štěstí a řada dalších. Na druhé straně, když má člověk vysoké IQ (nebo jiné nadání), zdaleka to neznamená, že někomu něco dluží a musí se celý život ždímat víc než všichni kolem.

Jak prakticky probíhala příprava testu? Už jsme zmínili fázi stanovování normy, ale při té už musí test existovat – co jí předchází?

Tak úplně na začátku je potřeba vybrat typ položek. My jsme se na základě současného vědeckého konsenzu a nejnovějších komplexních testů rozhodli pro zmíněné matice a váhy. Pak je potřeba analyzovat pravidla, která se v těchto typech úkolů uplatňují, a všechny je využívat při tvorbě nových položek. Je klíčové neopakovat jen jeden princip, ať už by vypadal sebezajímavěji – větší počet položek založených na stejném principu by pro nás totiž neměl žádnou výpovědní hodnotu.

Po výběru typu úkolů je potřeba na základě vhodných pravidel vytvořit konkrétní položky (třeba čtyřicet položek pro mladší, a dvakrát dvacet pro starší děti) a šest možností odpovědí pro každou z nich. A potom musí proběhnout jejich „beta test“. To v našem případě znamenalo, že Dana zadala tento prototyp cca 150 dětem, abychom zjistili, jestli jsou položky uspořádané podle náročnosti, a hlavně jestli opravdu měří to, co měřit mají – tedy inteligenci, a ne třeba pozornost. Odlišit to je někdy dost těžké. Zčásti pomáhají statistické metody (míra vnitřní konzistence škály, Raschovská analýza infit/outfit apod.), zčásti zdravý rozum. Třeba když většina dětí u jednoduché položky uvede špatnou odpověď, která se ale vizuálně podobá správné, asi je to spíš o pozornosti. Zejména pokud tytéž děti zvládnou několik dalších, náročnějších úkolů.

Jak velký může být takový „odpad“ testových úloh? Kolik se jich rámcově musí vyřadit, než se ustálí konečná podoba testu?

Může to být třeba i třetina položek. Obvykle se některé nové, správně obtížné, musejí přidat a bývá potřeba upravit i pořadí položek nebo upravit možnosti odpovědí, protože třeba není možné některé z nich jednoznačně vyloučit (to bylo v našem případě časté u vah). Tento cyklus jsme my opakovali asi pětkrát. A protože polovina spolupráce v našem týmu probíhala na dálku, kladlo to celkem vysoké nároky na to, aby si nikdo nepopletl jednotlivé verze a pořadí položek, jejich odpovědí, sesbíraných dat…

A pak už se to testuje na reprezentativním vzorku?

Ano – když se ustálí konečná podoba testů a všechny statistické parametry jsou v pořádku, nastává okamžik pravdy – tvoření norem naostro. Od té chvíle se už totiž v testu nesmí nic měnit, aby celý vzorek 1500+ dětí dostal tentýž test, stejně jako i všichni v budoucnu. Kdyby ale během tohoto procesu třeba 985. dítě objevilo chybu, už ji tam musíme nechat, protože jakákoliv úprava v testu by zničila dosud nasbíraná data. Kontrolovali jsme to proto každý nezávisle několikrát, včetně rodinných příslušníků – a třeba i v rok staré položce jsme ještě objevili jednu možnost odpovědi, která se nedala úplně vyloučit.

Bylo něco, co vás při přípravě testu třeba i příjemně překvapilo?

Já jsem byl příjemně překvapený třeba tím, jak veliký vzorek dětí Dana zajistila. A taky se mi líbilo, že když jsem Erice popsal nějakou grafickou změnu (a že jich bylo), opravdu to dokázala udělat tak, jak jsem si představoval. A také Vaškův návrh obálek se mi líbil hned na první pohled… Spolupráce se nám zkrátka dařila.

A co bylo během celého procesu tvorby nejobtížnější?

Pro mě byly asi nejtěžší finální statistické analýzy. Normy u dětských IQ testů je totiž nutné odstupňovat dle věku. Na rozdíl od dospělých, kde stejné skóre ve 22 letech a 28 letech vypovídá v podstatě o tom samém IQ, u dětí je rozdíl třeba mezi šestiletým a dvanáctiletým naprosto propastný. Velikost našeho vzorku nám umožnila vrstvit to velmi jemně, po půl roce věku, což je ale dost práce. A také bylo občas potřeba statistiku korigovat ručně, když bylo zjevné, že třeba zrcadlí nereprezentativnost vzorku v některé věkové kategorii.

Podařilo se tedy u MITCHe dosáhnout vyšší přesnosti výsledků než u předchozího používaného testu?

Vzhledem k tomu, že MITCH oproti staršímu testu používá ne jeden, ale dva druhy úkolů (matice a váhy) a navíc má normy postaveny na mnohem novějším a větším vzorku, rozhodně je přesnější. Co do přesnosti měření je v současné chvíli na úplné špičce, ve srovnání s testy, které používají ostatní Mensy. I když třeba komplexním individuálním testům u psychologa (které trvají několik hodin a skládají se vlastně z 10–12 menších testů) konkurovat pořád nemůže, i přesto se MITCH naměřeným výsledkem IQ bude i takovému komplexnímu testu velmi pravděpodobně blížit.

Byl by test použitelný v téhle podobě i jinde, nebo by se musel nějak upravovat?

Test je vždy jednoznačně závislý na sociokulturním prostředí testovaného. Každý stát má vlastní jazyk, vlastní systém vzdělávání, vlastní rozpočet na podporu nadaných i problémových dětí atd. Dává tedy smysl z technického i společenského hlediska, že všechny psychologické testy je potřeba když už ne vyvinout lokálně, tak alespoň přeložit a normovat v lokální populaci. Doporučuje to tak i psychometrická směrnice EFPA (Evropská federace psychologických asociací). Test může mít otázku třeba o geografii Německa, ale pochopitelně naše a německé děti se budou lišit v tom, jak často uvedou správnou odpověď – a je to tak v pořádku, akorát je potřeba to zohlednit v normách. Bohužel to platí i o fluidní inteligenci, i když ta je relativně nezávislá na vzdělání. Dosud třeba není úplně jasné, proč naši prarodiče, klidně v té samé zemi a v tom samém testu, měli třeba o 25 IQ bodů míň (tzv. Flynnův efekt). Je přece jasné, že mentálně zaostalí nebyli – jde prostě o limity testování IQ. I po 115 letech výzkumu nám mnoho věcí není jasných. Každopádně testy je potřeba přizpůsobovat danému státu a době.

A je do budoucna v plánu test nabídnout třeba ostatním národním Mensám?

V současné chvíli jsme rádi, že máme výborný test, který není k nalezení nikde na internetu nebo v knihovnách – což bohužel bývá potíž s jinými, staršími testy.

Do MITCHE jsme investovali velké množství času a energie a jakýkoliv únik dat by ho znehodnotil – v současné době tedy neplánujeme test prodávat dalším Mensám, i kvůli zvýšenému riziku zveřejnění. Je možné, že se to časem stane, ale v blízké době to nebude.

A co zkusit zúročit zkušenosti z tvorby MITCHe při přípravě nového testu pro dospělé? Vidíte už teď nějaké podstatné odlišnosti, které by jeho přípravu mohly ovlivnit?

Vývoj nového testu pro dospělé by opravdu mohl být dalším logickým (i potřebným) krokem. Těší nás, že to podobně vidí i Rada Mensy ČR. Zatím nepadlo žádné rozhodnutí, ale pokud bychom se do toho pustili, je už teď jasné, že sehnat reprezentativní vzorek populace by bylo mnohem náročnější než u dětí. Určitě bychom to ale zvládli.

Související odkazy

4.8.2018

MITCH – nový dětský IQ test z dílny Mensy ČR
3.8.2018
Nové dětské IQ testy začne Mensa ČR používat od školního roku 2018/2019.
Nové dětské IQ testy začne Mensa ČR používat od školního roku 2018/2019.
Obrázek 1: MITCH mini je určen pro děti ve věkovém rozmezí 5–8 let včetně a má 27 položek (tzn. testových úloh). Jeho administrace, tedy zadání a vypracování, trvá 20 minut.
Obrázek 1: MITCH mini je určen pro děti ve věkovém rozmezí 5–8 let včetně a má 27 položek (tzn. testových úloh). Jeho administrace, tedy zadání a vypracování, trvá 20 minut.
Obrázek 2: MITCH mini – první typem položky (testové úlohy) je doplnění výřezu v nějakém vzoru.
Obrázek 2: MITCH mini – první typem položky (testové úlohy) je doplnění výřezu v nějakém vzoru.
Obrázek 3: MITCH mini – druhým typem položky (testové úlohy) je maticový typ úlohy.
Obrázek 3: MITCH mini – druhým typem položky (testové úlohy) je maticový typ úlohy.
Obrázek 4: MITCH-A (první část testu MITCH) je určen pro děti ve věkovém rozmezí 9–15 let, má 22 položek a časový limit 15 minut. Jedná se o úlohy maticového typu.
Obrázek 4: MITCH-A (první část testu MITCH) je určen pro děti ve věkovém rozmezí 9–15 let, má 22 položek a časový limit 15 minut. Jedná se o úlohy maticového typu.
Obrázek 5: MITCH-B (druhá část testu MITCH) je určen pro děti ve věkovém rozmezí 9–15 let, má 22 položek a časový limit 15 minut.
Obrázek 5: MITCH-B (druhá část testu MITCH) je určen pro děti ve věkovém rozmezí 9–15 let, má 22 položek a časový limit 15 minut.
Obrázek 6: MITCH-B je inspirován nejnovější generací dětských IQ testů, které na doplnění maticového testu používají ještě úkoly matematického charakteru, ale bez čísel – tzv. vyvažování misek vah.
Obrázek 6: MITCH-B je inspirován nejnovější generací dětských IQ testů, které na doplnění maticového testu používají ještě úkoly matematického charakteru, ale bez čísel – tzv. vyvažování misek vah.


Zpět