https://www.remigiuszkurczab.pl/aspergeraut.php
Ocena dokładności i wiarygodności danych zebranych w drodze bezpośredniej obserwacji
Dokładność jakiejkolwiek miary częstotliwości lub czasu trwania zachowania odnosi się do stopnia, w jakim zebrane dane odpowiadają „prawdziwej” wartości częstotliwości lub czasu trwania. Na dokładność danych behawioralnych będzie miało wpływ wiele czynników, w tym kompleksowość i przejrzystość definicji docelowe zachowanie, zakres szkolenia i praktyki, które obserwatorzy podejmują przed zebraniem danych klinicznych, zmęczenie obserwatora, liczba różnych rejestrowanych zachowań/zdarzeń i tak dalej. Zasadniczo dokładność dowolnego konkretnego systemu obserwacji można ocenić, wykorzystując system do zbierania danych z nagranych na wideo sekwencji odpowiednich interakcji społecznych ze znanymi właściwościami. Jednak w praktyce klinicznej „prawdziwe” wartości poziomów zachowania na ogół nie będą znane. W takich okolicznościach, nie mogąc określić dokładności zebranych danych, analityk behawioralny będzie jednak chciał przynajmniej ocenić ich wiarygodność. Rzetelność odnosi się do stopnia, w jakim wielokrotne zastosowanie systemu obserwacji do określonego segmentu zachowania skutkuje identycznymi pomiarami. Wysoki stopień wiarygodności nie gwarantuje dokładności danych, ale niewystarczająca wiarygodność jest silnym wskaźnikiem prawdopodobnej niedokładności. Wiarygodność można ocenić, powtarzając obserwację jednego obserwatora i rejestrując zdarzenia rejestrowane na wideo. Wysoki stopień rzetelności mierzony w ten sposób pozostawia jednak otwartą możliwość, że osiągnięty stopień rzetelności zależy od nieznanych czynników, jak również od zastosowanego systemu obserwacji. Z tego powodu najczęściej stosowaną miarą rzetelności w analizie zachowania jest zgodność międzyobserwacyjna, a mianowicie stopień, w jakim dwóch obserwatorów, posługujących się tymi samymi definicjami zachowania, odpowiednio przeszkolonych w zastosowaniu określonej techniki obserwacji i zapisu, i niezależnie obserwując te same zdarzenia, zgadzają się co do poziomu zaobserwowanego zachowania. Cooper i inni dokonali przeglądu szeregu podejść mających zastosowanie do pomiaru zgodności między obserwatorami, w zależności od wymiaru zachowania będącego przedmiotem zainteresowania i zastosowanego systemu obserwacji. Tam, gdzie stosuje się rejestrację interwałową lub próbkowanie czasowe, najprostsza metoda oceny interobservera. Zgodność polega na bezpośrednim porównaniu, czy dwaj obserwatorzy zgadzają się lub nie zgadzają co do obecności lub braku zachowania w każdym przedziale systemu obserwacji. Zakres zgodności między obserwatorami można następnie ocenić, licząc liczbę przedziałów, w których dwaj obserwatorzy są zgodni, dzieląc tę liczbę przez liczbę zgodności plus liczbę przedziałów, w których dwaj obserwatorzy nie zgadzają się, i wyrażając wynikową liczbę jako procent . Jeśli jednak zachowanie występuje rzadko, fakt, że ta metoda mierzy zgodność zarówno w odniesieniu do występowania, jak i niewystępowania zachowania, oznacza, że może ona dawać wysoki poziom zgodności w przypadkach, gdy dwaj obserwatorzy rzadko zgadzają się co do występowania zachowania. Tę trudność można rozwiązać, obliczając zgodność występowania między obserwatorami, w której powyższe obliczenia są wykonywane przy użyciu tylko tych przedziałów, w których co najmniej jeden obserwator zarejestrował zachowanie jako obecne. Alternatywnym podejściem jest ocena stopnia zgodności przy użyciu kappa Cohena, statystyki, która wskazuje stopień zgodności, biorąc jednocześnie pod uwagę stopień, w jakim proporcja przedziałów, w których zachowanie jest rejestrowane jako obecne, wpłynie na prawdopodobieństwo „zgody” występujące przypadkowo. Długa tradycja stosowanej analizy zachowania utrzymuje, że gdy zgodność między obserwatorami jest mierzona za pomocą zgodności procentowej interwał po interwale, pożądany jest minimalny średni poziom zgodności wynoszący 80%. Konwencje dotyczące stosowania kappa z danymi obserwacyjnymi są mniej ugruntowane, ale często podaje się minimalną średnią wartość kappa wynoszącą 0,6 jako niezbędną, aby dane były warte analizy. Badacze stosowani będą generalnie dążyć do oceny wiarygodności międzyobserwatorami podczas około jednej trzeciej sesji obserwacyjnych, rozłożonych w trakcie badania. Jeśli praktykujący analityk behawioralny ma czas i środki (np. na nagrywanie sesji wideo) niezbędne, takie standardy mają również zastosowanie w praktyce klinicznej. W innych sytuacjach, np. gdy dane są zbierane przez nauczyciela lub rodziców, ocena porozumienia między obserwatorami może być trudna. Niemniej jednak, stosowany analityk behawioralny powinien, o ile to możliwe, podjąć próbę takiej oceny. Jeśli nauczyciel zbiera dane za pomocą wykresu rozrzutu (patrz poniżej) z odstępami godzinowymi, na przykład, a analityk behawioralny zbiera dane obserwacyjne za pomocą 10-sekundowego zapisu częściowego interwału przez 2 godziny tygodniowo, po prostu upewniając się, że obserwacje są prowadzone w ciągu ramy czasowe dopasowane do wykresu rozrzutu nauczyciela umożliwią analitykowi behawioralnemu ocenę zgodności między obserwatorami między jej danymi (po zwinięciu w ciągu godziny) a danymi z wykresu rozrzutu