Ogólna dyskusja oceniająca

https://www.remigiuszkurczab.pl/aspergeraut.php

Każde z omówionych narzędzi diagnostycznych ma pewne dowody przemawiające za ich zastosowaniem w diagnostyce różnicowej. Jednak nie wszyscy mają równe poparcie. Zarówno ADOS, jak i ADI-R mają znaczące badania potwierdzające ich użycie. Jednak porównując ich właściwości psychometryczne z innymi omawianymi skalami, nie wyróżniają się one tak bardzo, jak można by sądzić na podstawie ich powszechnego stosowania. Niemniej jednak skale te są z pewnością akceptowane przez społeczność naukową jako złoty standard. Ponadto, chociaż odpowiednie właściwości psychometryczne są wymaganą cechą, nie jest to jedyna rzecz, na podstawie której można ocenić użyteczność narzędzia diagnostycznego. Na przykład wszystkie te skale wymagają pewnego poziomu czasu. ADI-R jest zdecydowanie najdłuższym z tych narzędzi, podczas gdy CHAT jest najkrótszy. Celem powinno być stworzenie najbardziej efektywnego narzędzia pod względem czasu administracji i szkolenia bez utraty doskonałej niezawodności i trafności . Najlepsze z obu światów prawdopodobnie będzie między tymi dwoma biegunami. Dlatego należy ocenić stopień, w jakim czułość i specyficzność uległy poprawie, jeśli w ogóle, przy zwiększonych wymaganiach administracyjnych i szkoleniowych. W przypadku większości omówionych badań, klasyfikacje diagnostyczne dokonywane za pomocą celowanego instrumentu są przeciwstawiane diagnozom klinicznym opartym na kryteriach DSM-IV lub ICD-10. Rzadko jednak wyniki tych instrumentów są ze sobą skontrastowane. Jest to ważne do oceny, ponieważ wnioski dotyczące diagnozy konkretnego dziecka mogą się różnić w zależności od użytego instrumentu. Najczęściej porównywano ADI-R i CARS. Pierwszy raport był autorstwa Lorda (1995), który badał stabilność diagnozy od 2 do 3 roku życia. Zgłosiła wysoki poziom zgodności między dwoma instrumentami, ale wykazała, że CARS jest mniej dokładny pod względem nadmiernej diagnozy autyzmu. Później Pilowsky, Yirmiya, Shulman i Dover (1998) ocenili 70 osób z podejrzeniem autyzmu i stwierdzili, że ogólna zgodność diagnostyczna między CARS a ADI-R wynosi około 85%. Stwierdzono również podobne poziomy zgodności diagnostycznej między CARS i ADI-R . Ostatnio Saemundsen, Magnússon, Smári i Sigurdardóttir (2003) stwierdzili wysoką korelację między wynikami ADI-R i CARS. Ponadto porównano również klasyfikacje diagnostyczne, wykazując ogólną zgodność na poziomie 67%, gdy zastosowano sugerowane diagnostyczne wyniki odcięcia. Jednak gdy zastosowano mniej rygorystyczne punkty odcięcia, zgodność stale wzrastała do 83%, a następnie do 94%. Autorzy ci uzyskali również podobne wyniki do Lorda (1995), w którym CARS był bardziej włączający niż ADI-R, z sugerowanym wynikiem granicznym klasyfikującym więcej dzieci z autyzmem niż ADI-R. Bishop i Norbury (2002) stwierdzili słabą zgodność między diagnozami opartymi na ADI-R i ADOS-G. Część tej niezgodności może wynikać z formatu narzędzia, z których jeden opiera się na raporcie opiekuna, a drugi na bezpośredniej obserwacji. Analityk behawioralny ma niewątpliwie tendencję do faworyzowania bezpośredniej obserwacji nad raportem opiekuna. Jednak ta stronniczość może nie być pozbawiona wad. Po pierwsze, chociaż obserwacje pozwalają na bezpośrednią obserwację i ocenę zachowania dziecka, nadal istnieje duży stopień osądu, co stanowi zachowanie wskazujące na ASD. Jest to przypuszczalnie podstawa do wymogu długiego szkolenia i wiedzy specjalistycznej w zakresie ASD w celu zastosowania środków takich jak ADOS. Nie jest to tak proste, jak operacyjne zdefiniowanie kilku dyskretnych zachowań, z których można zbierać dane dotyczące częstotliwości. Wymagany jest dodatkowy krok wnioskowania o uogólnionych repertuarach zachowań z ograniczonej próby zachowań. To jest ten krok wnioskowania, na który przypuszczalnie wpływa szkolenie i ogólne doświadczenie z ASD. Co więcej, obserwacje są zwykle prowadzone przez stosunkowo krótki okres, podczas którego badający wykonuje szereg czynności, aby zaobserwować, jak dziecko reaguje. Te „prasy” zostały fachowo zaprojektowane, aby wywołać objawy autyzmu, ale wciąż stanowią ograniczoną próbkę zachowania dziecka. Pomiary pośrednie wykorzystujące raport opiekuna mają tę zaletę, że polegają na próbkowaniu znacznie większego zakresu ustawień i okazji. Niemniej jednak środki raportu opiekuna również nie są pozbawione ograniczeń. Może się zdarzyć, że najlepszą czułość i specyficzność diagnostyczną można znaleźć, włączając zarówno bezpośrednią obserwację, jak i raport opiekuna (Lord i in., 2006). Matson, Nebel-Schwalm i Matson (2007) skomentowali rozbieżność między argumentami przemawiającymi za szerszymi metodami diagnostycznymi, które uwzględniają ocenę klinicysty, a tym, co jest faktycznie praktykowane w badaniach naukowych. Przy czym pierwsi sugerują, że oceny kliniczne są kluczowe dla dobrych praktyk diagnostycznych, a drudzy rzadko uwzględniają te oceny w swoich badaniach. W jednej z nielicznych empirycznych ocen stabilności diagnostycznej Lord i in. (2006) stwierdzili, że klinicyści identyfikowali dzieci z autyzmem tylko w 1% przypadków, podczas gdy ADI-R i PL-ADOS nie. Ponadto odkryli, że 15% dzieci zostało sklasyfikowanych jako autystyczne, gdy ADI-R lub PL-ADOS sklasyfikowały je jako autystyczne. Chociaż argument za włączeniem oceny klinicysty ma pewne uzasadnienie, pytanie ma charakter empiryczny. Ocena kliniczna może dodać pewności osobie stawiającej diagnozę; jednak dostępna literatura nie potwierdza poglądu, że jest to wymagane do stabilnego lub ważnego rozpoznania. Jest również prawdopodobne, że po dodaniu oceny klinicysty ogólna wiarygodność decyzji diagnostycznych będzie się zmieniać i zwiększać zmienność w zależności od doświadczenia i wiedzy klinicysty. Warto zauważyć, że twórcy testów rzadko przedstawiają dane opisujące wczesne etapy rozwoju oceny, które obejmują proces wyboru pozycji i rzetelności na poziomie pozycji. Należy wspierać ten poziom przejrzystości. Podręczniki testowe rzadko podlegają recenzowaniu. Tak więc, chociaż prezentacja tych informacji w podręczniku testu jest chwalona, nie zastępuje publikacji tego procesu w recenzowanym czasopiśmie. Wpływ różnicowych metod diagnostycznych wykracza poza zwykłe określenie, w jakim typie klasyfikacji umieścić dziecko. Duży wpływ ma również obszar badań interwencyjnych ASD. Jak zauważył Matson (2007b), jednym z największych ograniczeń w badaniach nad leczeniem ASD są metody oceny. Naleganie na stosowanie skal zaprojektowanych w oparciu o podejście kategoryczne, a nie ilościowe, ograniczyło badaczom zgłaszanie rzeczywistych zmian w podstawowych objawach autyzmu. Zamiast tego powszechne jest traktowanie drugorzędnych wyników, takich jak zmiany w wynikach IQ, jako głównej zmiennej zależnej. Doprowadziło to do pewnego zamieszania i błędnych założeń na temat tego, co faktycznie jest leczone w ramach intensywnych programów ABA. Rzeczywiste objawy podstawowe muszą być mierzone jako podstawowa zmienna zależna dla tych badań. Co więcej, niektóre badania wyników leczenia ASD donoszą o zmianach diagnostycznych, takich jak przejście od diagnozy zaburzenia autystycznego do mniej poważnej diagnozy PDDNOS. Jednak prawie żaden z omówionych powyżej środków nie został oceniony poza ścisłą diagnozą autyzmu. PDD-NOS i inne diagnozy ASD w dużej mierze zniknęły bez opracowania narzędzi diagnostycznych. Narzędzia diagnostyczne, takie jak ASD-D lub PDDBI, które uwzględniają pełne spektrum ciężkości, znacznie przyczynią się do przyspieszenia badań nad wynikami leczenia, umożliwiając bardziej czuły pomiar zmian diagnostycznych.

ABA : Skala Responsywności Społecznej

https://www.remigiuszkurczab.pl/aspergeraut.php

Skala Reakcji Społecznej (SRS) mierzy nasilenie objawów ze spektrum autyzmu, które występują w naturalnych warunkach społecznych. SRS został opracowany do użytku z dziećmi w wieku od 4 do 18 lat i kładzie nacisk na mierzenie objawów w całym spektrum, szczególnie w podprogowym zakresie zaburzeń autystycznych. Podaje się, że czas podawania wynosi 15–20 minut. SRS to kwestionariusz składający się z 65 pozycji, który obejmuje świadomość społeczną, poznanie społeczne, komunikację społeczną, motywację społeczną i maniery autystyczne. Podczas gdy wyniki są podane dla tych pięciu podskal, podstawowa interpretacja SRS koncentruje się na całkowitym wyniku 65 pozycji. Constantino i Gruber stwierdzili, że wzajemne zachowania społeczne są warunkiem sine qua non wszystkich zaburzeń ze spektrum autyzmu. Zasadniczo to, co robi, to skupienie wyróżniających cech ASD na wzajemnych zachowaniach społecznych, co sugerowałoby, że najlepszym narzędziem do diagnozy różnicowej jest takie, które koncentruje się na społecznych aspektach tego zaburzenia. Wypada więc, aby SRS, który został opracowany przede wszystkim jako narzędzie diagnostyczne i narzędzie przesiewowe, skupiał się na umiejętnościach społecznych. SRS został opracowany do użytku z dziećmi w wieku od 4 do 18 lat. Podaje się, że czas podawania wynosi 15–20 minut. Rozwój SRS obejmował dość dużą próbę standaryzacyjną (N = 1636), która była połączeniem pięciu badań przeprowadzonych w całej Ameryce Północnej. Jeśli chodzi o właściwości psychometryczne, spójność wewnętrzna była doskonała ze wszystkimi współczynnikami alfa powyżej 0,9. Rzetelność Interrater była również dobra z wartościami w zakresie od 0,75 do 0,91. Stabilność czasową mierzono przy średnim opóźnieniu testu-retestu wynoszącym 17 miesięcy. Oceny dla mężczyzn były bardziej stabilne niż dla kobiet, ale obie mieściły się w przedziale od akceptowalnego do dobrego. Walidacja SRS dotyczyła jej wykorzystania jako instrumentu diagnostycznego, jako takiego dokonano kontrastów z innymi skalami diagnostycznymi (np. ADI-R). SRS wykazał dobrą zgodność z tymi skalami diagnostycznymi. Ostatnio wykazano również przydatność SRS do szybkiej oceny objawów ASD. Ze względu na ostatnio położony nacisk na wczesne wykrywanie i diagnozowanie autyzmu, opracowano przedszkolną wersję SRS dla dzieci w wieku od 36 do 48 miesięcy. Rzetelność test-retest w okresie 1 miesiąca mieściła się w akceptowalnym zakresie (r = 0,7). Nie zgłoszono żadnych dalszych badań dla tej wersji. SRS był używany jako zmienna zależna w wielu badaniach naukowych. Constantino i Todd (2003) donoszą o cechach autystycznych w populacji ogólnej, mierząc objawy wśród bliźniąt. Ciągły charakter wyników SRS pozwolił na zbadanie pełnego zakresu nasilenia objawów. W innym badaniu oceniającym cechy autystyczne u bliźniąt Constantino i Todd (2005) donoszą o obecności podprogowych wyników rodziców dzieci z ASD wykazujące wyższe wyniki SRS. Pojęcie podatności genetycznej zostało dalej zbadane przez Constantino i in. (2006), którzy ocenili wyniki SRS w parach rodzeństwa probandów. Podobnie jak we wcześniejszych badaniach, stwierdzili, że wyniki objawów są stale dystrybuowane, z najwyższymi wynikami wśród rodzeństwa dzieci z autyzmem. Constantino i inni wykorzystali SRS i ADI-R do oceny struktury czynnikowej objawów autyzmu. Odkryli, że objawy autyzmu były najlepiej reprezentowane jako mieszczące się w jednym kontinuum, a różne stopnie nasilenia w komunikacji społecznej i domeny stereotypowych zachowań były tym, co najlepiej wyróżniało klastry diagnostyczne. SRS został wykorzystany do oceny objawów ASD w populacjach innych niż ASD. Ostatnio Pine, Guyer, Goldwin, Towbin i Leibenluft (2008) opisali objawy autyzmu u dzieci z zaburzeniami nastroju i zaburzeniami lękowymi. Ogólnie rzecz biorąc, SRS jest obiecującym instrumentem diagnostycznym dla ASD. Chociaż pozycje koncentrują się na pomiarze zachowań społecznych, wykazano, że mają one dobrą użyteczność diagnostyczną. Skala została uwzględniona w wielu badań naukowych, ale niewielu szczegółowo zbadało właściwości psychometryczne skali. Constantino i jego współpracownicy położyli dobre podstawy w rozwoju tej skali i z pewnością zasługuje ona na dalszą uwagę badaczy.

ABA : Inwentarz zachowań PDD

https://www.remigiuszkurczab.pl/aspergeraut.php

Inwentarz Zachowań PDD (PDDBI) to skala ocen wypełniona przez rodziców lub nauczycieli. Podaje się, że czas podawania formularza standardowego wynosi 20–30 minut. Dostępny jest rozszerzony formularz do oceny zachowań niezwiązanych konkretnie z postawieniem diagnozy ASD. Podanie formularza rozszerzonego zajmuje około 45 minut. Autorzy stwierdzają, że do administrowania PDDBI nie jest wymagane żadne formalne szkolenie ani stopień naukowy; stwierdzają jednak, że interpretacji wyników powinna dokonywać wyłącznie osoba posiadająca wykształcenie wyższe w pokrewnej dziedzinie . Zdaniem autorów cel powstania PDDBI wynikał z ograniczeń istniejących narzędzi oceny, zwłaszcza w zakresie pomiaru zmian w czasie . Co więcej, PDDBI został opracowany w celu pomiaru zarówno zachowań adaptacyjnych, jak i nieprzystosowawczych, a nie tylko skupiania się na deficytach lub ekscesach zachowań. Cohen, Schmidt-Lackner, Romanczyk i Sudhalter (2003) przedstawiają dane dotyczące 311 dzieci w wieku od 1 roku do 17 lat. Autorzy ocenili rzetelność i strukturę czynnikową PDDBI. Skala wykazała dobrą spójność wewnętrzną z wynikami współczynnika alfa w zakresie od 0,79 do 0,97 dla wersji rodzica i od 0,73 do 0,97 dla wersji nauczyciela. Wiarygodność między oceniającymi była słaba między rodzicami a nauczycielami w przypadku zachowań nieprzystosowawczych, ale była wystarczająca w przypadku zachowań adaptacyjnych. Wyniki rzetelności poprawiły się, gdy nauczycieli porównano z innymi nauczycielami, wykazując akceptowalną rzetelność dla wszystkich wyników podskal. Wyniki analiz czynnikowych głównych składowych potwierdziły większość podskal PDDBI. Jednak Cohen i inni zauważają, że pozycje zgrupowane w „werbalnych” podskalach adaptacyjnych nie odpowiadały wynikom analizy czynnikowej i mogą wymagać ponownego przypisania z podskali a priori. Cohen  również opisał trafność kryterialną PDDBI. W jego badaniu 84 dzieci w wieku od 3 do 6 lat oceniono za pomocą PDDBI, ADI-R, CARS, Nisonger Child Behaviour Rating Form , Vineland Adaptive Behaviour Scales  oraz Griffiths Mental Development Scales . Wyniki PDDBI skontrastowano z każdą z tych skal. Dla celów oceny PDDBI w diagnostyce różnicowej najważniejsze są kontrasty z ADI-R i CARS. Podskale PDDBI i ogólny wynik autyzmu wykazały statystycznie istotne, ale stosunkowo niskie współczynniki korelacji z wynikami algorytmu ADI-R i aktualnymi wynikami zachowania. Chociaż współczynniki mogą być zmniejszone z powodu różnych metod punktacji między PDDBI i ADI-R (Cohen, 2003), nie wyjaśnia to statystycznie istotnych, ale stosunkowo niskich współczynników korelacji między CARS i PDDBI (r = 0,53 dla ocen rodziców; r = 0,50 dla ocen nauczycieli). Ogólnie rzecz biorąc, PDDBI jest obiecującym narzędziem do stosowania w diagnostyce różnicowej ASD. Cohen i jego współpracownicy zainwestowali dużo czasu w opracowanie i zbadanie tego instrumentu. Podstawy koncepcyjne PDDBI dobrze pasują do obecnego rozumienia autyzmu jako zaburzenia ze spektrum, a wyniki nie odnoszą się tylko do jednej diagnozy (zaburzenie autystyczne). Ponadto w podręczniku przedstawiono dane normatywne, a wyniki są oparte na standaryzowanych wynikach t. Jednak przeprowadzono stosunkowo niewiele badań w celu zbadania właściwości psychometrycznych PDDBI.

ABA : Lista kontrolna autyzmu u małych dzieci

https://www.remigiuszkurczab.pl/aspergeraut.php

The Checklist for Autism in Toddlers (CHAT) to skala oceny opracowana przede wszystkim jako narzędzie przesiewowe do wykrywania ASD we wczesnym wieku. W związku z tym skala jest stosunkowo szybka w użyciu (5–15 minut) przez wyszkolonego klinicystę. Celem jest identyfikacja dzieci do 18 miesiąca życia na podstawie etapów rozwoju. Opracowano również dwie dodatkowe iteracje CHAT, wersję zmodyfikowaną (M-CHAT) i wersję ilościową (Q-CHAT). Oryginalny CHAT składa się z 14 pozycji ocenianych dychotomicznie i pochodzących z 5 obszarów kamieni milowych, które zwykle występują do 15 miesiąca życia u normalnych dzieci z neuronami. ASD ma zwykle negatywny wpływ na te kamienie milowe: zabawy społeczne, zainteresowanie społeczne, zabawa w udawanie, wspólna uwaga i protodeklaratywne wskazywanie. Uwzględniono dodatkowe 4 obszary, o których się mówi na które nie ma wpływu ASD: zabawa funkcjonalna, protoimperatywne wskazywanie, rozwój motoryczny oraz brutalna zabawa. Postawiono hipotezę, że dwa kluczowe kamienie milowe spośród nich mają kluczowe znaczenie w identyfikowaniu dzieci z ASD. Pierwsza to zabawa w udawanie, a druga to wspólna uwaga. Jednym ze sposobów, w jaki dziecko może zademonstrować wspólną uwagę, jest użycie wskazywania protodeklaratywnego; wskazywanie w celu wskazania innej osobie obiektu zainteresowania, a wskazywanie protoimperatywne; wskazując, aby po prostu wskazać pragnienie tego obiektu. Innym sposobem, w jaki dziecko może wykazać wspólną uwagę, jest monitorowanie wzroku; patrzenie w kierunku czyjegoś wzroku. Nieosiągnięcie tych kamieni milowych przez 18 miesięcy jest głównym wskaźnikiem ASD. Obecność tych osiągnięć rozwojowych jest najpierw oceniana na podstawie wywiadu z rodzicem, a następnie potwierdzana obserwacją behawioralną jako zabezpieczenie przed wadami samoopisu. Początkowe właściwości psychometryczne CHAT zostały oparte na londyńskiej grupie 91 dzieci w wieku 17–21 miesięcy. Pięćdziesięcioro z tych dzieci zostało losowo wybranych spośród dzieci uczęszczających na badania kontrolne. Pozostałe 41 dzieci rekrutowano z puli dzieci ze starszym rodzeństwem zidentyfikowanym jako mające ASD. Z tej próby 4 dzieci z grupy rodzeństwa z ASD zostało zidentyfikowanych jako mające również ASD. W 2,5-letniej obserwacji te czworo dzieci nadal spełniało kryteria ASD, wykazując ważność różnicową dla CHAT. Ponadto żadne z dzieci z losowo wybranej grupy nie rozwinęło ASD. Ponadto badania te wykazały, że wiarygodność raportu rodziców i potwierdzających obserwacji klinicystów była zgodna w 92% przypadków. W kolejnym badaniu Baron-Cohen i in. (1996) zbadali czułość i swoistość CHAT na próbie 16 000 dzieci uczęszczających na badania kontrolne przez 18 miesięcy. Autorzy ci opisali, że dla ich próby punkt odcięcia istotnego wyniku ADI-R został obniżony dla sekcji „Powtarzające się zachowania”, aby zwiększyć zróżnicowanie między ich grupami. Według autorów, dzieci z ASD uzyskały wyniki znacznie powyżej wartości granicznej w sekcjach „Wzajemne interakcje społeczne” i „Komunikacja”, ale zbliżyły się do wartości granicznej tylko w przypadku „Powtórzalnego zachowania”. Stosując to podejście stwierdzono, że mogą oni odróżnić dzieci z ASD od dzieci z innym opóźnieniem rozwojowym lub uznanych za typowe w rozwoju. Z ich próby 12 dzieci zostało zidentyfikowanych jako mające ASD, a u 10 z tych 12 dzieci nadal zdiagnozowano ASD po 3,5-letniej obserwacji. Na podstawie tych badań Baron-Cohen i in. (1996) doszli do wniosku, że CHAT może zidentyfikować ASD we wczesnym wieku i że można to zrobić za pomocą określonych elementów CHAT. Wszystkie dzieci w ich próbce z ASD nie zdały 3 z 5 pytań CHAT zaprojektowanych specjalnie do oceny zabawy w udawanie, wskazywania protodeklaratywnego i monitorowania wzroku. Co najważniejsze, monitorowanie spojrzenia wskazano jako kluczową różnicę między dziećmi z ASD, dziećmi z innymi zaburzeniami rozwojowymi i dziećmi opisanymi jako normalne nerwowo. Używając ich jako kryteriów identyfikacji ASD, autorzy byli w stanie stwierdzić, że CHAT dokładnie zidentyfikował 83% dzieci z ASD. Ponadto odsetek wyników fałszywie dodatnich w tej grupie wyniósł 17%. Podczas 3,5-letniej obserwacji 100% wcześniej zidentyfikowanych dzieci nadal uzasadniało diagnozę ASD. Znaczna część nie zdała również dodatkowych pozycji, 50% nie zdało pozycji 2 dotyczącej społecznego zainteresowania innymi, a 90% nie zdało pozycji 6 dotyczącej stosowania protoimperatywnego wskazywania. Identyfikując dzieci z innymi zaburzeniami rozwojowymi, autorzy ci donoszą, że konsekwentnie nie zaliczali tylko elementów CHAT związanych z zabawą w udawanie i/lub wskazywaniem protodeklaratywnym. Wykorzystując te kryteria, CHAT dokładnie zidentyfikował 68% dzieci z innymi zaburzeniami rozwojowymi. Wreszcie, dzieci opisane jako normalne nerwowo były w stanie zademonstrować wszystkie kamienie milowe ocenione przez CHAT.  Baron-Cohen i inni opisali dodatkowe psychometryczne oceny CHAT. Z ich próbą 50 dzieci spełniających kryteria ICD-10 dla autyzmu i 44 dzieci spełniających kryteria dla innych całościowych zaburzeń rozwojowych, zbadali specyficzność, czułość i trafność predykcyjną CHAT. W tym badaniu przedstawiono dane dotyczące ocen po 18, 20 i 42 miesiącach. Korzystając z wcześniej ustalonych metod, badacze ci najpierw starali się rozróżnić dzieci z wysokim, średnim i niskim ryzykiem ASD. Co ciekawe, odkryli, że niewielki odsetek dzieci z poważnymi cechami ASD przeszedł przez kategorie diagnostyczne do końcowej 42-miesięcznej oceny. Przechodzenie przez kategorie diagnostyczne nie dotyczyło grupy niskiego ryzyka. Gdy dziecko zademonstrowało umiejętność kamienia milowego, w tej grupie próbnej nie nastąpiła regresja umiejętności. Podobnie jak w przypadku ich poprzednich badań, dzieci z wysokim ryzykiem autyzmu nie zdały 3 z 5 zadań CHAT zaprojektowanych specjalnie do oceny zabawy w udawanie, wskazywania rotodeklaratywnego i monitorowania wzroku. Ponadto dzieci z grupy niskiego ryzyka wykazały się wszystkimi umiejętnościami kamieni milowych. Jednak dzieci ze średnim ryzykiem nie powiodły się jedynie wskazywaniem protodeklaratywnym, co różni się od opisanego w badaniu z 1996 r., w którym monitorowanie spojrzenia wskazano jako kluczową różnicę wśród dzieci z ASD. Ogólnie rzecz biorąc, Baron-Cohen i in. podali, że CHAT ma doskonałą swoistość (100%), niską czułość (21%) i dobrą wartość predykcyjną dodatnią (75%) i doskonałą wartość predykcyjną ujemną (100%). Analiza długoterminowych danych z badania Baron-Cohena i innych ,zbadali dzieci podczas 6-letniej obserwacji. Wykorzystując 94 dzieci w wieku 7 lat, obliczyli czułość identyfikacji dzieci sklasyfikowanych jako wysoka, średnia i niska zarówno dla autyzmu, jak i PDD. Ogólna specyficzność była analogiczna do opisanej przez Barona-Cohena . Modified Checklist for Autism in Toddlers (M-CHAT) ma na celu ocenę dzieci w wieku 16 i 30 miesięcy w ramach kontroli stanu zdrowia. Uznając, że amerykański system opieki zdrowotnej nie zapewnia takiego samego poziomu dostępu do usług jak w Wielkiej Brytanii, autorzy ci zaplanowali e-design, który był łatwy, obiektywny i niezawodny tylko dla rodzicielskiej listy kontrolnej. Starając się zwiększyć czułość bez zmniejszania specyficzności, do procesu oceny dodali ustrukturyzowany wywiad uzupełniający dla dzieci, które uzyskały znaczące wyniki. Dzięki temu wywiadowi liczba wyników fałszywie dodatnich została zmniejszona. Podstawową różnicą w stosunku do M-CHAT jest włączenie nowych pozycji oprócz pierwszych 9 pozycji z oryginalnego CHATU. Uwzględnione obszary obejmują aktywność sensoryczną, ruchową, interakcje społeczne, wspólną uwagę oraz nieprawidłowości językowe/komunikacyjne. Na podstawie dołączonych instrukcji testowych autorzy informują, że M-CHAT jest nadal badany i może zostać zmieniony w przyszłości. raport z badań psychometrycznych M-CHAT oparty na próbie pochodzącej głównie z Connecticut, USA. Uczestnicy (n = 1122) zostali zrekrutowani z wizyt kontrolnych odnowy biologicznej i nominacji dostawcy wczesnej interwencji (n = 171). Rozwój pozycji opierał się na literaturze, innych środkach przeznaczonych dla starszych dzieci oraz doświadczeniu klinicznym. Ocenę specyficzności, czułości i trafności predykcyjnej zakończono oceniając dzieci podzielone na jedną z czterech grup. Zgodnie z oczekiwaniami, żadne dziecko ze znaczącymi wynikami od pierwszego rodzica nie ukończyło M-CHAT, które nie miało typowego rozwoju. Badacze ci odkryli, że każda z ich czterech grup uzyskała inny wynik. Dzieci z nieistotnymi wynikami nie zdały tylko 0,5 pozycji, a następnie grupa dzieci wykluczona z wywiadu telefonicznego, która nie zdała 3,4 pozycji. Trzecia grupa, dzieci, u których stwierdzono opóźnienia językowe lub globalne, ale nie ASD, nie powiodła się w 6,4 pozycjach. Kontrastuje to z grupą dzieci z ASD, które nie powiodły się w 10,3 pozycjach. Identyfikacja i różnicowanie były najbardziej skuteczne, gdy ustrukturyzowany wywiad uzupełniający prowadzony przez telefon był częścią procesu przesiewowego. Wartość odcięcia 3 na początkowym rodzicu, który ukończył M-CHAT lub dalszy wywiad telefoniczny, dała wartość czułości 0,97, wartość specyficzności 0,99, dodatnią wartość predykcyjną 0,68 i ujemną wartość predykcyjną 0,99. Spójność wewnętrzną oceniono na próbie 480 uczestników, alfa Cronbacha wyniosła 0,85. Poprzez kanoniczną analizę funkcji dyskryminacyjnej zidentyfikowano sześć krytycznych pozycji. Dotyczyły one wskazywania protodeklaratywnego, podążania za punktem, przynoszenia przedmiotów do pokazania rodzicowi, zainteresowania innymi dziećmi, naśladowania i reagowania na imię. Autorzy zalecają, aby dzieci, u których nie powiodło się więcej niż 3 pozycje lub 2 pozycje krytyczne, kierowane były do przeszkolonego diagnosty ASD z doświadczeniem w diagnozowaniu bardzo małych dzieci. Ilościowy CHAT (Q-CHAT) to najnowsza iteracja CHAT. Ta nowa wersja składa się z 25 pozycji, ocenianych teraz w 5-stopniowej skali (0–4). Allison i inni donoszą, że jest to wynikiem uznania, że oryginalny CHAT jest najbardziej wrażliwy na klasyczną prezentację autyzmu, ale nie na zespół Aspergera. Jest tak prawdopodobnie dlatego, że zespół Aspergera jest zwykle diagnozowany w starszym wieku niż CHAT ma na celu ocenę, w szczególności wiek szkolny, młodzież i dorosłość. Ich próba badawcza obejmowała 779 dzieci sklasyfikowanych bez ASD i 160 dzieci z rozpoznaniem ASD. W tej ostatniej grupie dzieci z rozpoznaniem ASD uzyskały średni wynik w Q-CHAT 52, podczas gdy dla dzieci sklasyfikowanych bez ASD średni wynik wyniósł 27. Rzetelność testu-retestu, obliczona na podstawie korelacji wewnątrzklasowej, wyniosła 0,82. Podsumowując, CHAT we wszystkich iteracjach oceniany jest pozytywnie. Wykazano, że miara ta, specyficzna dla CHAT, ma doskonałą pozytywną i negatywną trafność predykcyjną i specyficzność. Jest szybki w administrowaniu i wykorzystuje wielometodowe podejście do oceny. Najbardziej zauważalną wadą dla osób spoza Europy jest to, że dane normatywne pochodzą z Wielkiej Brytanii i mogą nie mieć zastosowania do innych krajów. Jednak wobec braku dowodów na to, że istnieją regionalne różnice w prezentacji autyzmu, jest to mało prawdopodobne. Inne obawy dotyczą tego, że oryginalny CHAT może nie mieć zastosowania do dzieci ze znacznym stopniem niepełnosprawności, ponieważ ta grupa została wykluczona w procesie normatywnym. Stosowanie dychotomicznego podejścia do oceniania stwarza dodatkowe obawy, ponieważ przypisuje się minimalne wykorzystanie zgłoszonej umiejętności, co może prowadzić do fałszywych wyników negatywnych wraz z niedokładnymi raportami rodziców. Ta miara jest podatna na wpływ dojrzewania/wieku i mniej zdolna do zidentyfikowania ASD o późnym początku, zwłaszcza gdy ocena jest zakończona na wczesnym etapie życia. Jak wspomniano powyżej, CHAT ma ograniczoną czułość w wykrywaniu Zespołu Aspergera, co oznacza, że Q-CHAT został zaprojektowany w celu rozwiązania tego problemu. Niedawna konstrukcja Q-CHAT zapewnia aktualną teorię diagnostyczną, definicje i psychometrię. W przeciwieństwie do poprzedniej wersji, wykorzystuje podejście oceny wymiarowej, które uwzględnia minimalne wykorzystanie zgłoszonej umiejętności. M-CHAT ma kilka zalet, z których najważniejszą jest szybka administracja. Jednak M-CHAT generuje wysoki odsetek wyników fałszywie dodatnich, wykorzystuje dychotomiczne podejście do oceny i może nie mieć zastosowania do dzieci z poważnymi zaburzeniami językowymi lub deficytami motorycznymi, ponieważ te grupy zostały wykluczone z procesu normatywnego. Ogólnie rzecz biorąc, odkrycia te sugerują, że ta skala jest najlepiej stosowana jako narzędzie przesiewowe.

ABA : Skala oceny autyzmu Gilliama

https://www.remigiuszkurczab.pl/aspergeraut.php

Skala Oceny Autyzmu Gilliama (GARS) to kwestionariusz składający się z 56 pozycji, podzielony na cztery podskale. Te podskale obejmują interakcje społeczne, komunikację, zachowania stereotypowe i zaburzenia rozwojowe. Każda skala jest miarą aktualnego i typowego zachowania dziecka. Wyjątkiem jest skala zaburzeń rozwojowych, która wykracza poza poważne zachowania dezadaptacyjne. Wszystkie pozycje są sumowane, a suma dla każdej podskali jest przeliczana na wyniki standardowe. Dane psychometryczne dostarczone przez autora  zostały opracowane na próbie około 1100 dzieci z ASD w wieku od 3 do 22 lat. Wiarygodność i ważność zostały zgłoszone jako doskonałe. Zgłaszana spójność wewnętrzna (współczynnik alfa) wahała się od 0,88 do 0,96. Dwuszeregowe współczynniki korelacji punktowo-punktowej dla wszystkich pozycji były powyżej 0,35, przy wartościach median w zakresie od 0,61 do 0,69. Wiarygodność testu-powtórnego testu w ciągu 1 tygodnia wyniosła 0,88 dla ilorazu autyzmu (AQ), a wszystkie podskale były powyżej 0,80. Analizy trafności dyskryminacyjnej przy użyciu AQ poprawnie sklasyfikowały 90% osób. Równoczesna trafność z Listą kontrolną zachowań autystycznych wyniosła 0,94 i wahała się od 0,37 do 0,92 dla podskal. Rzetelność między oceniającymi (n = 57) dla AQ wyniosła 0,88 i wahała się od 0,73 do 0,82 dla podskal. Recenzje tego środka były krytyczne, ale nie lekceważące. Południe i in. (2002) ocenili GARS na 119 dzieciach, głównie mężczyznach rasy kaukaskiej. Średni wiek wynosił 6 lat, a zakres wynosił 3–10,5. Wszystkie dzieci zostały zdiagnozowane przez uznanych ekspertów od autyzmu i zebrane z pięciu ośrodków badawczych w całych Stanach Zjednoczonych. South i współpracownicy doszli do wniosku, że uzyskana przez nich próbka znacząco różni się od tej opisanej przez Gilliama (1995). Ich próbka uzyskała wynik znacznie poniżej średniej odniesienia, klasyfikując tylko 52% próbki jako „prawdopodobnie autystycznych”. Podczas gdy rzetelność skal była dobra, trafność zbieżna została zgłoszona jako słaba, a funkcja adaptacyjna wydawała się być ujemnie skorelowana z miarą. Ostateczna krytyka autorstwa South et al. (2002) było to, że kilku rodziców zgłosiło zamieszanie co do sformułowania pozycji; zostało to omówione w drugim wydaniu. Lecavalier (2005) zawiera obszerną ocenę GARS. Analizy przeprowadzono na 284 dzieciach z ASD z 29 okręgów szkolnych w Ohio. Większość tej próby stanowili mężczyźni rasy kaukaskiej w średnim wieku 9 lat i w przedziale od 3 do 21 lat. Przeanalizowano strukturę czynnikową i zaproponowano rozwiązanie trójczynnikowe; jednak pozycje niekoniecznie trzymały się razem w podskali, do której zostały przypisane. Około połowa pozycji była związana tylko z jednym czynnikiem pochodzącym z analizy Lecavaliera. Jak donosi South , Lecavalier podał, że znaczna część próby (62%) została sklasyfikowana jedynie jako „prawdopodobnie autystyczna”, co sugeruje niską czułość pomiaru. Rzetelność między oceniającymi (n = 63) również była niska, a korelacje wewnątrz klas wahały się od 0,31 do 0,48. Są one uważane za biedne do przeciętnych (Cichetti, 1994). Przegląd trafności treści pozycji wykazał nadmierny nacisk na stereotypy, echolalię i powtarzające się manieryzmy ruchowe. I odwrotnie, zasugerowano niedostateczny nacisk na obszary treści społeczne i komunikacyjne oraz związane z nimi trudne zachowania pica, samookaleczenia i nieuzasadnione lęki. Ocena charakterystyki uczestnika (płeć, wiek i poziom sprawności) wykazała, że ogólny poziom funkcjonowania był ujemnie skorelowany z GARS, podobnie jak opisali South ei inni.

Najbardziej pozytywną recenzję GARS przedstawili Eaves, Woods-Groves, Williams i Fall (2006). Ta grupa oceniła psychometrię GARS i Skali Oceny Całościowych Zaburzeń Rozwojowych (PDRS). Analizy przeprowadzono z udziałem 134 dzieci z ASD i dziećmi z innymi zaburzeniami rozwojowymi z pięciu południowo-wschodnich stanów i Waszyngtonu. Większość tej próby stanowili mężczyźni rasy kaukaskiej, a ta grupa obejmowała dużą próbę Afroamerykanów (40%). Średnia wieku wynosiła 9,75 lat z przedziałem od 3 do 26 lat. Trafność konstruktu analizowano poprzez porównanie z PDDRS. Alfa Cronbacha wyniosła 0,94 przy podskalach od 0,74 do 0,90. Korelacja z PDDRS wyniosła 0,84. oraz współczynniki trafności dla podskal wahała się od 0,09 do 0,84. Analiza trafności dyskryminacyjnej była znacząca, a wielkość efektu dla GARS wyniosła 0,19. Jak donosi South i inni (2002) i Lecavalier (2005) znaczna część próby została sklasyfikowana jedynie jako „prawdopodobnie autystyczna” sugerujące niską czułość pomiaru. Kiedy jednak Eaves i in. dostosował punkt odcięcia do 85 ze 100 i przeprowadził analizy trafności predykcyjnej, czułość została zgłoszona jako 0,83, specyficzność jako 0,68, a dodatnia wartość predykcyjna jako 0,81. GARS został niedawno zrewidowany w 2006 r., w związku z czym obecnie dostępnych jest więcej informacji na temat GARS.

GARS niż GARS-2. Nie byliśmy w stanie zidentyfikować żadnych opublikowanych badań oceniających tę rewizję. Powody tej rewizji opierały się na przeglądach testów, informacjach zwrotnych, nowych badaniach i obserwacjach klinicznych. Wersje obejmują nową próbkę normatywną, przepisane elementy i dokładniejsze wyjaśnienie wytycznych dotyczących punktacji. GARS-2 to skala ocen, w której rodzice lub opiekunowie są przesłuchiwani na temat zachowania osoby badanej. Czas podawania wynosi około 20 min. Ta ocena wymaga minimalnego przeszkolenia, ale wymaga przeszkolenia i doświadczenia z ASD w celu interpretacji wyników. Narzędzie to składa się z 42 pozycji podzielonych na trzy podskale (zachowania stereotypowe, komunikacja i interakcja społeczna). Te podskale zostały oparte na definicjach autyzmu dostarczonych przez Autism Society of America i DSM-IV-TR (Amerykańskie Towarzystwo Psychiatryczne, 2000), jednak pozycje niekoniecznie odpowiadają podskalom, w których się znajdują. Dane psychometryczne dostarczone przez autora (Gilliam, 2006) zostały opracowane na próbie około 1100 dzieci z ASD w wieku od 3 do 22 lat. Gilliam poinformował, że rzetelność i trafność były dobre. Rzetelność wewnętrznej spójności Indeksu Autyzmu (AI) jest zgłaszana jako współczynnik alfa równy 0,94 z podskalami zachowań stereotypowych na poziomie 0,84, komunikacji na poziomie 0,86 i interakcji społecznych na poziomie 0,94. Rzetelność testu-powtórnego testu w ciągu 1 tygodnia (n = 37) została zgłoszona jako 0,84 dla AI, 0,64 dla komunikacji, 0,82 dla interakcji społecznych i 0,83 dla podskal zachowań stereotypowych. Analizy ważności obejmują trafność treściową, trafność związaną z kryteriami oraz trafność identyfikacji konstruktu. Współczynniki dyskryminacji pozycji wahały się od 0,35 do 0,64. Równoczesna trafność z listą kontrolną zachowań autystycznych wyniosła 0,64. Korelacja między pozycjami dla AI i podskal wahała się od 0,53 do 0,64. Korelacje dla podskal wahały się od 0,46 do 0,59. Trafność predykcyjna została zgłoszona dla grupy osób z ASD, niepełnosprawnością intelektualną (ID), wielorakimi niepełnosprawnościami i bez niepełnosprawności. Podaje się, że czułość mieści się w zakresie od 1,0 dla osób pełnosprawnych, 0,85 dla ID i 0,84 dla osób z wieloma niepełnosprawnościami. Swoistość wahała się od 0,84 do 0,87, a dodatnie wartości predykcyjne wahały się od 0,84 do 0,85. Wiarygodność oceniających nie jest zapewniona. Ogólnie rzecz biorąc, GARS był szeroko stosowany, ale badacze mieli mieszane wyniki. Pozytywne cechy GARS to szybka administracja i punktacja. GARS był szeroko stosowany i akceptowany. Miara ta może być stosowana jako wskaźnik nasilenia autyzmu dla wybranych populacji, jak również jako miara określonych zachowań (np. powtarzalnych zachowań motorycznych). Lecavalier zasugerował, że może wykazywać dobrą trafność dyskryminacyjną w przypadku osób o niższym poziomie funkcjonowania. Ostatnią krytyką było to, że Lecavalier kwestionuje użyteczność podskali Zaburzeń Rozwojowych, ponieważ wydaje się, że nie ma ona akceptowalnych parametrów psychometrycznych (tj. Słaba trafność diagnostyczna, niska trafność zbieżna i słaba spójność wewnętrzna). GARS-2 został opracowany w celu rozwiązania niektórych ograniczeń zgłoszonych przez naukowców. Środek ten wykorzystuje podejście wielometodowe, w którym ocena jest zakończona wywiadami z rodzicami, bezpośrednią obserwacją dziecka oraz częścią oceniającą, w której badający odpowiada na „Kluczowe pytania” służące do syntezy wniosków diagnostycznych egzaminatora. Inne ważne cechy tego środka to jego ostatnia data publikacji z aktualnymi danymi normatywnymi, opublikowane w 2006 r. Wykazano, że środek ten odróżnia osoby z autyzmem w wieku od 3 do 22 lat od innych, które mają poważne problemy behawioralne, może być używany jako wskaźnik nasilenia autyzmu, może być używany jako miara określonych zachowań (np. Słabe strony tego miernika to brak opublikowanych badań niezależnych od podręcznika, przedział wiekowy nie uwzględnia kryteriów DSM prezentacji objawów przed 3 rokiem życia, dane normatywne nie są rozbite na wiek, płeć czy poziom funkcjonowania oraz nie przewiduje alternatywnych form komunikacji dla osób niewerbalnych.

ABA: Skala oceny autyzmu dziecięcego

https://www.remigiuszkurczab.pl/aspergeraut.php

Skala Oceny Autyzmu Dziecięcego (CARS) została opracowana w ramach programu Terapii i Edukacji dzieci upośledzonych autystycznie i powiązanymi z komunikacją (TEACCH). Jest to aktualizacja wcześniejszej wersji zatytułowanej Childhood Psychosis Rating Scale . Aktualizacje CARS obejmowały nowe oceny psychometryczne, nowe lub zaktualizowane elementy oraz zmniejszenie ograniczeń dotyczących kwalifikacji specjalistów do administrowania instrumentem. Czas podawania wynosi około 30 min. Biorąc pod uwagę jego wiek; korzysta z wielu opublikowanych badań przedstawiających dane psychometryczne i demonstrujących ich użyteczność. Został zaprojektowany jako instrument obserwacyjny używany do oceny ASD i odróżniania dzieci z zaburzeniami autystycznymi od dzieci z innymi zaburzeniami rozwojowymi. CARS składa się z 15 pozycji, które są sumowane w celu wygenerowania całkowitego wyniku, który jest używany do określenia, gdzie na kontinuum od „lekko-umiarkowanie autystyczny” do „poważnie autystyczny” lub „nieautystyczny” odpowiada ocena. Włączenie pozycji oparto na pięciu wybitnych pracach dotyczących diagnozy i klasyfikacji ASD: Kanner (1943), Creak (1961), National Society for Autistic Children (1978), Rutter (1978) oraz Diagnostic and Statistical Manual of Mental Disorders Wydanie trzecie – poprawione (Amerykańskie Towarzystwo Psychiatryczne, 1987). Warto jednak zauważyć, że ta próbka źródeł pozostawia miarę nieobsługiwaną jako całość przez dowolne z pięciu dzieł. Jak już wspomniano, klasyfikacja jest podzielona na jeden z trzech zakresów: umiarkowanie autystyczny, średnio autystyczny lub nieautystyczny. Autorzy zalecili stosowanie CARS jako wstępnej pomocy w procesie klasyfikacji i zaprojektowali go jako ocenę obserwacyjną lub przegląd archiwalny (tj. Przegląd wykresów lub zapisów). Jest przeznaczony do podawania po minimalnym przeszkoleniu. Dodatkowo autorzy przedstawiają skorygowane wyniki odcięcia dla młodzieży i dorosłych. CARS od samego początku cieszył się dużym zainteresowaniem społeczności badawczej i klinicznej. Oryginalni autorzy Schopler i Reichler z kolegami DeVellis i Daly (1980) przedstawiają niektóre z oryginalnych psychometrii i uzasadnienie dla CARS. Zauważają, że włączenie pozycji i uzasadnienie dla CARS wynikało z ich doświadczenia klinicznego i obserwacji. Odkryli, że w ich doświadczeniu klinicznym kryteria Kannera (1943) wykluczały dzieci, u których zdiagnozowano ASD, a kryteria Creaka (1964) wykluczały małe dzieci. Tak więc ich praca miała na celu ustalenie przydatności i trafności merytorycznej CARS poprzez porównanie jej z innymi kryteriami diagnostycznymi: Rimland (1971), Rutter (1978) oraz Ritvo i Freeman (1978). Wykorzystując próbę 450 dzieci, u uczestników zdiagnozowano różne kryteria od Rimlanda Ruttera, Ritvo i Freemana. Ogólnie stwierdzili, że te środki, pojedynczo lub łącznie, identyfikują osoby z ASD. Podczas gdy Rutter kładł nacisk na podobieństwo i stereotypowe zachowania, Ritvo i Freeman kładli nacisk na osobliwości sensoryczne. Oba te systemy samodzielnie lub łącznie zidentyfikowały te z ASD. Dane psychometryczne dostarczone przez autora zostały opracowane na próbie około 1600 dzieci z ASD w wieku od poniżej 6 do powyżej 10 lat. Większość stanowili chłopcy rasy kaukaskiej (67%) (75%). Siedemdziesiąt jeden procent ich próby miało wyniki IQ poniżej 70. Rzetelność i trafność oceniono jako dobre. Wewnętrzna spójność wyniku całkowitego (TS) była doskonała (0,94). Rzetelność między oceniającymi (n = 280) dla TS wyniosła 0,71, a pozycje wahały się od 0,55 (Poziom i spójność odpowiedzi intelektualnej) do 0,93 (Odniesienie do ludzi). Roczna rzetelność testu-powtórnego testu (n = 91) została zgłoszona jako 0,88. Trafność związana z kryteriami została zbadana poprzez porównanie CARS TS z równoczesnymi ocenami klinicznymi. Korelacje były dobre dla wszystkich kontrastów (r > 0,8). Garfin i McCallon (1988) również zbadali wyniki CARS wśród różnych grup wiekowych. Badanie różnic wiekowych zostało zainspirowane przez badaczy, którzy zasugerowali, że objawy ASD mogą z czasem stać się mniej wyraźne (np. Rutter, Greenfeld i Lockyer, 1967). Oceniono dwudziestu dwóch dopasowanych nastolatków i dzieci z autyzmem. Uczestnicy ci zostali dopasowani pod względem pochodzenia etnicznego, płci, IQ i wyników listy kontrolnej wstępnej selekcji. Nie stwierdzono statystycznie istotnej różnicy między tymi grupami wiekowymi, a autorzy doszli do wniosku, że CARS był niewrażliwy na zmiany rozwojowe w ich próbie. Należy jednak zauważyć, że wyniki młodzieży były niższe o 2 punkty. W podręczniku CARS zaleca się obniżenie punktów odcięcia o 2 dla młodzieży i dorosłych. Garfin i McCallon (1988) również zbadali trafność dyskryminacyjną CARS. Dwudziestu nastolatków z autyzmem połączono z nastolatkami bez diagnozy autyzmu. Odkryli, że wyniki CARS były w stanie rozróżnić te dwie grupy. Kamień i in. (1999) wykorzystali wyniki CARS do zbadania wiarygodności i stabilności diagnoz autyzmu u dzieci w wieku poniżej 3 lat. CARS był podstawową zmienną zależną używaną do oceny wiarygodności międzygatunkowej wśród doświadczonych klinicystów. Procentowa zgodność co do różnicowania osób z ASD i bez ASD wyniosła 88% (n = 65). Jednak odsetek zgodności był niższy przy różnicowaniu osób z autyzmem i PDD-NOS (64%) i wahał się od 38 do 82% w zależności od osoby oceniającej. Stabilność wyników w 12-miesięcznym odstępie test-retest (n = 37) wykazała podobne wyniki, ponieważ była większa stabilność dla osób sklasyfikowanych jako autyzm (r = 0,80) w porównaniu z osobami sklasyfikowanymi jako PDD-NOS (r = 0,42). Autorzy doszli do wniosku, że na podstawie wyników CARS autyzm był bardziej stabilną diagnozą. Strukturę czynnikową CARS zbadali Magyar i Pandolfi (2007). Wykorzystując dane archiwalne dotyczące 164 dzieci, obliczono analizę głównych składowych i głównych czynników. Zidentyfikowano cztery czynniki, które odpowiadały za 57% wariancji. Czynniki te zostały oznaczone jako komunikacja społeczna, interakcje społeczne, stereotypy i nieprawidłowości sensoryczne oraz regulacja emocjonalna. Autorzy przytaczają te wyniki jako poparcie dla stosowania CARS i zwracają uwagę, że miara ta jest nadal aktualna, mimo że została skonstruowana zgodnie z wersją Diagnostic and Statistical Manual of Mental Disorders z 1980 roku. W sumie wykazano, że CARS ma użyteczność kliniczną. Miara ta jest szeroko stosowana i ma obszerną bazę literaturową. Ten środek wymaga minimalnego przeszkolenia do administrowania. Jednak oceniający powinien znać sekwencje rozwojowe i chronologię. Ma tę zaletę, że uzyskuje punkty odcięcia zarówno dla młodzieży, jak i dorosłych. Przedmiotem zainteresowania jest jednak przestarzała grupa normatywna, która została zebrana tylko z jednego państwa. Ponadto obejmuje elementy, które nie są już uważane za podstawowe behawioralne prezentacje ASD.

ABA : Zaburzenia ze spektrum autyzmu – diagnostyka

https://www.remigiuszkurczab.pl/aspergeraut.php

Zaburzenia ze spektrum autyzmu – diagnostyka (ASDD) to skala ocen oparta na informatorach. Skala może być podana bezpośrednio przez przeszkolonego użytkownika testu informatorowi lub może zostać przekazana rodzicowi lub opiekunowi do samodzielnego wypełnienia. Wykonanie ASD-D zajmuje około 30–45 minut. ASD-D jest częścią większej baterii ocen, która obejmuje instrument diagnostyczny, ocenę zaburzeń współistniejących (ASD-C) oraz ocenę zachowań problemowych (ASD-PB). Każda z tych ocen ma wersję opracowaną specjalnie do użytku z dziećmi. Jednak baterii ASD poświęcono ostatnio wiele uwagi w celu diagnostyki różnicowej; skupimy się na tych badaniach, które omawiają ASD-D. Rzetelność i struktura czynnikowa ASD-D oceniana u 192 osób dorosłych z różnymi poziomami ID . Matson i jego współpracownicy przedstawiają dane z całego procesu rozwoju ASD-D. W tym wstępnym badaniu pozycje zostały najpierw ocenione pod kątem wiarygodności interterrater i test-retest. Te elementy, które zostały zachowane, zostały następnie ocenione pod kątem braku wariancji i jeśli istniała znacząca różnica w poparciu między grupami ASD i nie-ASD. Na koniec przeprowadzono eksploracyjną analizę czynnikową dla pozostałych pozycji. Ogólnie rzecz biorąc, współczynniki rzetelności na poziomie pozycji były umiarkowane, ale istotne statystycznie. Należy spodziewać się stosunkowo niskich współczynników rzetelności, ponieważ pojedyncze elementy rzadko mają wysokie współczynniki. Eksploracyjna analiza czynnikowa dała 3 czynniki, które luźno odzwierciedlają trzy główne grupy objawów ASD, a mianowicie deficyty komunikacyjne, deficyty umiejętności społecznych i stereotypowe zachowanie. Każdy z tych czynników wykazywał wysokie współczynniki stabilności wewnętrznej. Dane normatywne i wyniki odcięcia dla ASD-D przedstawiono dla dorosłych z niepełnosprawnością intelektualną . Najlepszy wynik odcięcia został określony poprzez obliczenie charakterystyki operacyjnej odbiornika (ROC). Wyniki pokazały, że optymalny punkt odcięcia dla klasyfikacji między osobami dorosłymi z niepełnosprawnością intelektualną i autyzmem a osobami wyłącznie z niepełnosprawnością intelektualną dał czułość na poziomie 0,86 i swoistość na poziomie 0,62, co dało łączny wskaźnik prawidłowej klasyfikacji na poziomie 73,7%. Zadanie stało się jednak znacznie trudniejsze, gdy próbowano odróżnić autyzm od PDD-NOS. W celu odróżnienia autyzmu od PDD-NOS autorzy stwierdzili, że punkty odcięcia całkowitego wyniku były nieskuteczne. Zamiast tego zastosowano indywidualne wyniki odcięcia dla każdego czynnika. Dzięki tej metodzie autorzy byli w stanie skutecznie rozróżnić grupy autystyczne i PDD-NOS. Dalsze dowody potwierdzające ważność ASD-D przedstawiają Matson, Wilkins, Boisjoli i Smith. Przedstawiono odmianę macierzy wielocechowo-wielometodowej , w której 307 dorosłych z ID zostało ocenionych za pomocą zróżnicowanej baterii ocen. Wykazano, że ASD-D ma dobrą trafność zbieżną i dyskryminacyjną. Właściwości psychometryczne dziecięcej wersji ASD-D zostały niezależnie ocenione w dwóch badaniach. ASD-DC wykazało doskonałą spójność wewnętrzną (0,99), dobrą niezawodność międzyrasową (0,67) i dobrą niezawodność testu-retestu (0,77). Wykazano, że ASD-DC ma doskonałą czułość (92,5 ) i specyficzności (79,3) w różnicowaniu rozwoju atypowego od ASD (Matson, González i Wilkins, w druku). Rozróżnienie między rozwojem typowym a nietypowym wykazało mniejszą czułość (55,2), ale doskonałą specyficzność (95,9). PDD-NOS i Aspergera, ASD-DC wykazało doskonałą czułość (92,9) i specyficzność (80,0).Różnicowanie między PDD-NOS a autyzmem również wykazało doskonałą czułość (83,3), ale mniej solidną specyficzność (58,3).ASD-D jest stosunkowo nowy instrument, który przeszedł ogromną liczbę badań, biorąc pod uwagę czas, w jakim był dostępny. Ogólnie rzecz biorąc, ASD-DC ma silne podstawy psychometryczne.Jest to obiecująca skala do diagnostyki różnicowej, szczególnie wśród dzieci. Mocną stroną tego instrumentu jest jego rozwój w celu oceny objawów w całym spektrum autyzmu.

Harmonogram obserwacji w diagnostyce autyzmu – ogólny

https://www.remigiuszkurczab.pl/aspergeraut.php

Harmonogram obserwacji diagnostycznej autyzmu – ogólny (ADOS-G) to częściowo ustrukturyzowana ocena, która wykorzystuje bezpośrednią obserwację i interakcję z osobami, które mogą mieć ASD. Podawanie ADOS-G składa się z serii interakcji z osobą, które mają na celu wywołanie szerokiej gamy reakcji społecznych, które egzaminator może wykorzystać do określenia obecności lub braku objawów ASD. Podobnie jak w przypadku ADI-R, ADOS-G wymaga gruntownego przeszkolenia w zakresie administracji. Jak stwierdził Lord „korzystanie z ADOS-G jest wyraźnie związane z umiejętnościami egzaminatora” . Czas podawania ADOS powinien trwać około 30 minut . ADOS-G jest najnowszą wersją Harmonogramu Obserwacji Diagnostyki Autyzmu (ADOS; Lord i in., 1989), który pierwotnie został skonstruowany jako narzędzie towarzyszące ADI (Lord i in., 2000). W miarę pojawiania się zapotrzebowania na instrument odpowiedni do stosowania u młodszych dzieci, ADOS został rozszerzony do użytku z dziećmi w wieku 2 lat. Ta wersja ADOS stała się Pre-Linguistic Autism Diagnostic Observation Schedule (PL-ADOS). Jednak Lord i inni zauważają, że PL-ADOS miał tendencję do niedostatecznej diagnozy dzieci z autyzmem, które miały pewne ekspresyjne umiejętności językowe. W ten sposób ADOS-G został zaprojektowany, aby wypełnić lukę w rozwoju między PL-ADOS i ADOS. Proces rozwoju ADOS-G został dobrze opisany . Rzetelność Interrater na poziomie pozycji była dobra dla wszystkich modułów z wyjątkiem modułu 4, który wymagał wyeliminowania szeregu pozycji. Ogólnie rzecz biorąc, po wyeliminowaniu elementów o słabej niezawodności międzyrasowej, międzyrasowa niezawodność elementów w modułach ADOS-G była bardzo wysoka. Wyniki domen wykazały wysoką rzetelność interterrater i test-retest dla wszystkich domen. Jeśli chodzi o trafność, wszystkie moduły ADOS-G wykazały doskonałą specyficzność i czułość dla osób z autyzmem (95% prawidłowej klasyfikacji) i osób spoza spektrum autyzmu (92%). Jednak w przypadku osób z PDD-NOS tylko 33% zostało sklasyfikowanych jako mające ASD nieautystyczne. Tak więc ADOS-G wydaje się być doskonały do różnicowania autyzmu i PDD-NOS z zaburzeniami spoza spektrum, ale ma słabszą zdolność do różnicowania w spektrum autyzmu. Mniej solidne wyniki zostały znalezione przez Noterdaeme i inni dla poprzedniej wersji ADOS. Autorzy ci stwierdzili, że do różnicowania między autyzmem i zaburzeniem językowym, ADOS miał doskonałą specyficzność, w której żadne z dzieci z zaburzeniem językowym nie zostało fałszywie sklasyfikowane jako mające autyzm. Odwrotnie, stwierdzili, że ADOS ma słabą wrażliwość, a tylko 3 z 11 dzieci z autyzmem spełnia granicę dla stereotypowych zachowań. Autorzy ci zauważają jednak, że prawidłowe wskaźniki klasyfikacji mogłyby być lepsze, gdyby algorytm ADOS-G był dostępny do ich badań. DiLavorre, Lord i Rutter  opisują rozwój PL-ADOS i wstępną ocenę psychometryczną. Stwierdzili, że niezawodność międzyrasowa waha się od umiarkowanej do doskonałej we wszystkich domenach. Jeśli chodzi o diagnostykę różnicową, DiLavorre i inni uzyskali podobne wyniki do tych, które już opisano, to znaczy wykazując doskonałą specyficzność z bardzo małą liczbą fałszywych alarmów, ale ogólnie słabszą czułość w klasyfikowaniu osób z autyzmem jako autystycznych. Ta słabość, specyficzna dla PL-ADOS, została zaobserwowana w odniesieniu do dzieci autystycznych, ale posiadających również pewien poziom umiejętności werbalnych. Jak wspomniano, ta słabość była jednym ze zgłoszonych celów opracowania ADOS-G (Lord i in., 2000). Ogólnie rzecz biorąc, ADOS-G jest doskonałym narzędziem diagnostycznym. Jednak podobnie jak w przypadku ADI-R, właściwe użycie tego instrumentu wymaga znacznego przeszkolenia. Ograniczenia zauważone przy stosowaniu ADI-R w badaniach klinicznych dotyczą również ADOS-G. Jednak ADOS-G zajmuje znacznie mniej czasu niż ADI-R, co poprawia ogólną użyteczność instrumentu. Co więcej, ADOS jest jedną z niewielu miar oceny, która ma wynik oceniający z bezpośrednich obserwacji. To, czy prowadzi to do poprawy zdolności diagnostycznych, jest pytaniem empirycznym, które nie zostało przetestowane. Niemniej jednak ten format może być szczególnie atrakcyjny dla wielu klinicystów, którzy uważają, że punktacja na podstawie obserwacji może dać bardziej precyzyjną i zniuansowaną ocenę diagnostyczną.

ABA : Wywiad diagnostyczny autyzmu – poprawiony

https://www.remigiuszkurczab.pl/aspergeraut.php

The Autism Diagnostic Interview – Revised (ADI-R) to częściowo ustrukturyzowany wywiad z opiekunami osób z autyzmem. ADI-R jest drugą edycją Wywiadu Diagnostycznego Autyzmu . Ogólnie czas podawania ADI-R wynosi od 1,5 do 2,5 . Zgłoszone zastosowania ADI-R mają pomóc w diagnozowaniu autyzmu, planowaniu leczenia i diagnostyce różnicowej między innymi zaburzeniami rozwojowymi . ADI-R tworzy algorytm, który jest używany do ustalania diagnozy. Algorytm opiera się na kryteriach diagnostycznych ICD-10 i DSM-IV. Algorytm jest obliczany na podstawie całkowitego wyniku danej osoby w odniesieniu do wszystkich kwestionowanych objawów, bez względu na nasilenie w poszczególnych domenach objawów. W odniesieniu do szkolenia użytkowników instrukcja wymaga od użytkowników spełnienia trzech elementów. Po pierwsze, obszerna znajomość ASD i behawioralnych manifestacji objawów ASD. Po drugie, odpowiednie umiejętności przeprowadzania wywiadów w celu uzyskania szczegółowych informacji. Po trzecie, umiejętność kodowania zachowań w celu spełnienia formatu pozycji ADI-R. Instrukcja przewiduje również, że istnieją dwa poziomy szkolenia w zakresie korzystania z ADI-R. Pierwszy poziom jest przeznaczony do użytku klinicznego lub niezwiązanego z badaniami ADI-R. Jest to uważane za mniej precyzyjny poziom szkolenia, ponieważ wymaga od użytkownika jedynie spełnienia wyżej wymienionych kryteriów oraz przeczytania instrukcji i przestudiowania filmów szkoleniowych wyprodukowanych przez Western Psychological Services. Bardziej rygorystyczny poziom szkolenia jest wymagany od twórców testów, jeśli użytkownik zamierza wykorzystać wyniki ADI-R w badaniach. Duża część tego dodatkowego szkolenia polega na uczestnictwie w zatwierdzonych programach szkoleniowych i przesłaniu nagranych na wideo wywiadów z próbkami kodowania. Jako rewizja ADI, ADI-R opiera się na oryginalnych właściwościach psychometrycznych zgłoszonych przez Le Couteur i innych Poprawiona wersja została usprawniona w celu skrócenia czasu podawania i opracowano nowy algorytm do identyfikacji punktów granicznych z najwyższą czułością i specyficznością. W wersji WPS skala została jeszcze bardziej usprawniona, ale w podręczniku zauważono, że algorytm pozostaje ten sam. Pan i innni podają, że algorytm ma wysoki poziom czułości i specyficzności (oba powyżej 0,9). Wstępne dane psychometryczne dotyczące rzetelności i trafności ADI-R przedstawiają Lord i inni W sumie 20 dzieci, 10 z autyzmem i 10 „upośledzonych umysłowo lub z upośledzeniem językowym” zostało oceniane za pomocą ADI-R. ADI-R wykazał adekwatną do dobrej rzetelność międzyrasową, wewnętrzną spójność i stabilność wyników w okresie 6 miesięcy. W przypadku analiz ważności wielkość próby zwiększono do 50, z 25 uczestnikami na grupę. Trafność algorytmu diagnostycznego została przetestowana poprzez ocenę różnic między grupami diagnostycznymi w zakresie poszczególnych pozycji zawartych w algorytmie. Znaczące różnice między grupami stwierdzono dla wszystkich pozycji. Użyteczność ADI-R do odróżniania autyzmu od innych zaburzeń rozwojowych była dalej oceniana przez Mildenberger, Sitter, Noterdaeme i Amorosa (2001). W swoich badaniach zbadali wskaźniki klasyfikacji ADI-R wśród dzieci z rozpoznaniem autyzmu lub receptywnych zaburzeń językowych. Okazało się, że 1 z 11 dzieci z autyzmem nie zostało sklasyfikowane jako mające autyzm. Ponadto odkryli, że jedno z 16 dzieci z receptywnymi zaburzeniami językowymi zostało błędnie sklasyfikowane jako cierpiące na autyzm. Ogólnie rzecz biorąc, dane te pokazują, że ADI-R jest przydatny w diagnostyce różnicowej wśród tych objawów podobnych zaburzeń. Wyniki Mildenbergera kontrastują jednak z wynikami Bishopa i Norbury’ego . Chociaż celem badania Bishopa i Norbury’ego nie była ocena właściwości psychometrycznych ADI-R, ale raczej zbadanie nakładania się objawów na granicy dwóch grup diagnostycznych, ich wyniki dostarczają ważnych informacji dotyczących procesu diagnozy różnicowej przy użyciu ADI-R. Odkryli, że proces klasyfikacji wśród dzieci z ASD i dzieci ze specyficznymi zaburzeniami językowymi jest znacznie bardziej skomplikowany niż stwierdzili Mildenberger i inni. W szczególności Bishop i Norbury stwierdzili, że ADI-R i ADOS-G miały słabą zgodność między diagnozami. Ocena autyzmu u bardzo małych dzieci ma coraz większe znaczenie, ponieważ zdano sobie sprawę z wpływu wczesnej interwencji na leczenie ASD. W związku z tym właściwości psychometryczne skal diagnostycznych muszą być oceniane w próbach małych dzieci. Lord, Storoschuk, Rutter i Pickles (1993) ocenili ADI-R u 51 dzieci z autyzmem i 43 dzieci z zaburzeniami rozwojowymi innymi niż ASD. Odkryli, że grupy różniły się istotnie we wszystkich pozycjach ADI-R. ADI-R wykazał również dobrą czułość u 1 z 51 dzieci z autyzmem, które nie spełniało pełnych kryteriów ADI-R. Lord i jej współpracownicy dalej stwierdzili, że niezawodność międzyrasowa jest dobra. Stabilność wyników diagnostycznych ADI-R u małych dzieci została również oceniona przez Coxa. Stwierdził, że stabilność diagnozy autyzmu z ADI-R była dobra w okresie między 20 a 42 miesiącem życia. Odkryli również, że ADI-R miał dobrą specyficzność, a wszystkie dzieci zidentyfikowane jako mające autyzm w wieku 20 miesięcy ostatecznie otrzymały diagnozę w wieku 42 miesięcy. Natomiast ADI-R wykazał słabą czułość u dzieci w wieku 20 miesięcy. Poinformowali, że tylko 50% dzieci, u których ostatecznie zdiagnozowano autyzm w wieku 42 miesięcy, zostało zidentyfikowanych w wieku 20 miesięcy za pomocą ADI-R. Ponadto donoszą, że w przypadku dzieci, które spadły na spektrum autyzmu, ale które nie spełniały kryteriów diagnozy autyzmu ICD-10, wrażliwość była jeszcze niższa. W ich badaniu żadne z dzieci, u których zdiagnozowano zespół Aspergera lub inne PDD, nie zostało zidentyfikowane przez ADI-R.  Moore i Goodson (2003) ocenili stabilność diagnozy autyzmu za pomocą ADI-R i oceny klinicznej w wieku od 2 do 4-5 lat. Odkryli, że 14 z 16 dzieci, u których zdiagnozowano autyzm w wieku dwóch lat, nadal było podobnie klasyfikowanych w wieku od 4 do 5 lat. Zauważyli jednak, że raport rodziców i wspomnienia na temat ADI-R mogły nie być wystarczające same w sobie i że czuli, że muszą rozszerzyć swoje decyzje diagnostyczne o ocenę kliniczną. W związku z tym wyniki te nie odzwierciedlają samej stabilności klasyfikacji ADI-R, ale jedynie w połączeniu z oceną kliniczną. Stabilność diagnozy u małych dzieci za pomocą ADI-R została ponownie oceniona przez Charmana przez okres 5 lat. W swoich badaniach ocenili 26 dzieci w wieku 2 i ponownie w wieku 7 lat. Ich wyniki wykazały znacznie większą zmienność stabilności diagnostycznej niż ta opisana we wcześniejszych badaniach , przy czym 17 z 26 (65%) uczestników otrzymało tę samą klasyfikację diagnostyczną w wieku 7 lat, jaką otrzymali w wieku 2 lat. Stabilność diagnostyczna była nieco lepsza w krótszym okresie, co widać w okresie 4-5 lat, kiedy 19 z 26 (73%) uczestników otrzymało tę samą diagnozę, co w wieku 2 lat. Prawdopodobnie najbardziej interesującym odkryciem Charmana i współpracowników jest jednak znaczna zmienność w czasie w wynikach klasyfikacji ADI-R, w której 17 sklasyfikowanych jako mające autyzm w wieku 7 lat niekoniecznie było tymi samymi, którzy zostali sklasyfikowani w wieku 4–5 lat jako osoba z autyzmem. Zamiast tego wielu ich uczestników poruszało się po różnych kategoriach diagnostycznych w fazach oceny. Zauważają również, że zmienność nasilenia objawów wzrastała wraz z wiekiem. ADI-R jest często uważany za złoty standard w diagnozowaniu autyzmu. Rzeczywiście, Krajowa Baza Danych Badań nad Autyzmem (NDAR) wymaga uwzględnienia zarówno ADI-R, jak i ADOS w przedłożonych danych z badań klinicznych (National Institutes of Health). Jednak ADI-R wymaga znacznej ilości szkoleń do administrowania. Prosty koszt uczestnictwa w seminariach szkoleniowych prawdopodobnie ograniczy chęć naukowców do korzystania z tego instrumentu, zwłaszcza tych z ograniczonym budżetem na badania. Podobnie ADI-R wymaga znacznej ilości czasu do podania. To również często przekracza środki dostępne na prowadzenie studium. Tak więc, chociaż ADI-R wykazał doskonałe właściwości psychometryczne, ogólne wymagania dotyczące stosowania skali w badaniach klinicznych są istotną wadą.

ABA : Narzędzia oceny

https://www.remigiuszkurczab.pl/aspergeraut.php

Lista kontrolna zachowań autystycznych

Lista kontrolna zachowań autystycznych (ABC; Krug, Arick i Almond, 1980) jest jedną z pierwszych tego rodzaju metod i jest stosowana zarówno w USA, jak iw Szwecji. Jest to lista kontrolna zawierająca 57 pozycji, używanych samodzielnie lub jako część większej baterii, Autism Screening Instrument for Educational Planning (ASIEP-3; Krug, Arick i Almond, 2008). ASIEP jest obecnie w trzeciej iteracji, ale ABC nie zostało jeszcze zmienione. ABC jest przeznaczone do samodzielnego wypełnienia przez rodzica lub nauczyciela, a następnie zinterpretowane przez klinicystę. Czas podawania wynosi około 20 min. Grupą docelową tego działania są dzieci z poważną niepełnosprawnością w wieku od 3 lat do wieku szkolnego. Chociaż jest nadal używana i istnieje szeroka baza literaturowa, badacze badający psychometrię zakwestionowali jej użyteczność wykraczającą poza ogólną ocenę ASD (Ozonoff, Goodlin-Jones i Solomon, 2005; Rellini, Tortolani, Trillo, Carbone i Montecchi, 2004 ). Kruga i in. (1980) przedstawiają pierwszą psychometryczną ocenę ABC. Wybór pozycji opierał się na trzyczęściowym podejściu, przeglądzie literatury, konsultacach eksperckich, i praktyce administracyjnej. Najpierw był przegląd literatury Rimlanda (1964);  Ruttenberg, Dratmann, Fraknoi i Wemar (1966); Rendle-Short i Clangy (1968); Lotter (1974) Lovaas, Freitag, Gold i Kassorla (1965), Lovaas, Koegel, Simmons i Long (1973); i Kannera (1943). Od tych badaczy opracowano elementy i przesłano je do oceny ekspertów. Po otrzymaniu komentarzy od grupy ekspertów, poprawione pozycje zostały uformowane w 57-punktową listę kontrolną z 5 racjonalnie wyprowadzonymi czynnikami . Pozycje zostały pogrupowane w czynniki oznaczone jako sensoryczne, powiązane, używanie ciała i przedmiotów, język, społeczne i samopomoc. Następnie lista kontrolna została wysłana do praktyków w celu administrowania i zwrotu do analizy statystycznej. Dało to 1049 wypełnionych protokołów. Wiek badanych wahał się od 18 miesięcy do 35 lat. Przeprowadzono analizę pozycji w celu określenia krytycznych pozycji. Obliczono wyniki gamma i phi; wyniki gamma wskazują na spójny porządek porządkowy wyników między zmiennymi, a wyniki phi wskazują na związek między zmiennymi binarnymi. Na podstawie tych cech pozycjom przypisano wagi 1–4, przy czym 4 jest najwyższym predyktorem ASD. Całkowite wyniki mieszczą się w zakresie od 0 do 120, z punktami granicznymi 68 lub wyższymi uważanymi za wysokie prawdopodobieństwo autyzmu, zakres 53–67 za wątpliwy autyzm, a mniej niż 53 uważa się za mało prawdopodobne, aby miał autyzm. Jednak niektórzy badacze kwestionowali te zalecane punkty odcięcia. Wiarygodność i trafność ABC oceniono jako dobre. Wiarygodność wewnętrznej spójności wyniku całkowitego (TS) jest zgłaszana za pomocą analizy podzielonej połowy, r = 0,87, oraz momentu iloczynu Pearsona, r = 0,94 dla pełnej listy kontrolnej. Jednak Volkmar i inni znaleźli mniej solidne wyniki (połowa podzielona: 0,74). Rzetelność między oceniającymi dla ZT została obliczona przy użyciu 42 oceniających oceniających 14 dzieci; każde dziecko zostało ocenione jednocześnie przez trzech oceniających. Zgodność oceniających wyniosła 95%. Ponownie Volkmar i inni stwierdzili odmienne wyniki z zgodnością na poziomie 0,70. Raporty ważności obejmują trafność kryterialną poprzez porównanie całkowitego wyniku pomiarów całej próby osób z ASD z losową próbą 62 dzieci wylosowanych z większej grupy osób z ASD. Okazało się, że 86% z tej drugiej grupy uzyskało wynik w granicach 1 odchylenia standardowego średniej dla większej grupy, a 14% uzyskało wynik w granicach 1,5 odchylenia standardowego. Jednak niektórzy badacze są rozczarowani tymi dowodami.

Trafność związana z kryteriami została zbadana za pomocą analizy wariancji, aby porównać osoby z ASD i bez ASD pod względem czynników płci, wieku, miejsca zamieszkania, rozwoju językowego i stosunku liczby uczniów do nauczycieli. Autorzy stwierdzili, że prawie wszystkie permutacje były statystycznie istotne, z wyjątkiem analiz dotyczących dzieci z ASD i tych z poważnymi zaburzeniami emocjonalnymi. Osoby te miały łączne wyniki podobne do osób sklasyfikowanych jako ASD w 3 z 15 analiz. Na koniec przeprowadzono analizę niezawodności zarówno pod kątem niezawodności wewnątrz, jak i międzygatunkowej. Rzetelność intrarater była dobra (połowa: 0,87; pełna: 0,94). Wiarygodność między oceniającymi została oceniona przy użyciu 42 oceniających oceniających 14 dzieci; każde dziecko było oceniane jednocześnie przez trzech oceniających. Zgoda wynosiła 95%. Trafność dyskryminacyjną oceniano, dzieląc protokół ABC na cztery grupy reprezentujące następujące klasyfikacje: ASD (n = 172), ID (n = 423), poważnie zaburzone emocjonalnie (n = 254), głuchoniewidomy (n = 100), i neuronowa normalna (n = 100). Okazało się, że 55 z 57 pozycji było przydatnych do odróżnienia ASD od czterech grup innych niż ASD. Osoby z ASD uzyskały wyższe wyniki we wszystkich 5 czynnikach i uzyskały łączną średnią punktów 77. Osoby z grup ID, poważnie zaburzonych emocjonalnie i głuchoniewidomych uzyskały podobne wyniki i uzyskały łączną średnią punktów 42. Wreszcie, osoby z grup neuronowych grupa normalna miała całkowitą średnią wyników równą 0. Kolejną analizę trafności kryterialnej przeprowadzono na próbie utworzonej z 62 losowo wybranych osób w wieku od 3 do 23 lat z pierwotnej grupy osób z ustalonym rozpoznaniem ASD. Okazało się, że 86% z tej drugiej grupy uzyskało wynik w granicach 1 odchylenia standardowego średniej dla większej grupy, a 14% uzyskało wynik w granicach 1,5 odchylenia standardowego. I odwrotnie, Volkmar i in. (1988) stwierdzili, że tylko 57% osób z ASD zostało prawidłowo sklasyfikowanych jako „prawdopodobnie autystycznych”, 23% jako „wątpliwie autystycznych”, a 62% jako „normalnych neuronów”. Wadden i inni również stwierdzili niską czułość i specyficzność przy użyciu oryginalnych wyników odcięcia. Kiedy jednak punkt odcięcia został obniżony do 44, badacze ci odkryli, że 87% osób z ASD zostało prawidłowo sklasyfikowanych, a także 96% normalnych neuronów. Ostatnio Eaves, Campbell i Chambers (2000) zastosowali niższy wynik odcięcia zalecany przez Kruga, Aricka i Almonda (1993) i stwierdzili, że ABC prawidłowo sklasyfikowało 80% uczestników w ich próbie. Podsumowując, ABC ma duży zbiór opublikowanych badań. Odnotowanymi atrybutami są jego prostota, czas administracji i łatwość punktacji. Dostępne są opublikowane dane dla różnych grup wiekowych. Skala może być wykorzystana jako wywiad z rodzicami lub może być wypełniona samodzielnie przez rodziców. Być może najlepszym zastosowaniem jest wskaźnik objawów ASD lub narzędzie przesiewowe. Odnotowane słabe strony to ograniczona użyteczność w przypadku dzieci w wieku poniżej 3 lat, możliwa nadmierna identyfikacja autyzmu u dzieci z niepełnosprawnością intelektualną oraz możliwa niedostateczna identyfikacja „wysoko funkcjonujących” dzieci z ASD w wieku szkolnym.