Psychodeliki vs antydepresanty – co mówi metaanaliza z 2026?
Pełna analiza metaanalizy Williamsa, Barnett i Szigetiego (JAMA Psychiatry, 2026)
Ten tekst jest rozwinięciem mojego posta na Facebooku. Jeśli trafiliście tu stamtąd, znacie już puentę – 0,3 punktu na HAM-D. Tu wchodzę głębiej, w matematykę, w metodologię, w pytania, na które ta praca nie odpowiada. Jeśli nie czytaliście posta, nie ma problemu, jest poniżej jako Część Pierwsza. Część Druga to obiecane rozwinięcie.
Czytaliście już post z Facebooka? Przejdźcie od razu do rozwinięcia, gdzie wchodzę w matematykę, metodologię i pytania, na które ta praca nie odpowiada.
Przejdź do rozwinięcia →Część Pierwsza – post z Facebooka
Ta metaanaliza hula jak halny po internetach. Nagłówki krzyczą, ludzie podają dalej, komentarze się mnożą. Ale jak patrzę na te dyskusje, to widzę głównie reakcje na abstrakt. „Psychodeliki nie lepsze od antydepresantów!” Szok, niedowierzanie, triumf, albo oburzenie. Świętej wojny ciąg dalszy. Tyle że abstrakt to jest… Abstrakt. Cała historia jest w środku, w metodologii, w dyskusji, w tym, czego autorzy nie napisali wprost. Bebechy są tłuste. A tłuszczyk jest ponoć nośnikiem smaku, więc będzie syta szama! :) Przepraszam zaprzyjaźnionych wegan za porównanie, ale to jakoś weszło ;-)
Więc pochylmy się nad tym daniem.
Pamiętacie? Zaczęło się od nagłówków typu „Psychodeliki skuteczniejsze od antydepresantów.” „Psylocybina zmienia życie po jednym podaniu.” „Rewolucja w psychiatrii.” Podawało się dalej na ślepo. Kto nie podał dalej i nie pomyślał no wreszcie? Ja przyznam, że byłem nie raz z fascynacji wstawiony.
Trzeba uczciwie powiedzieć, że te nagłówki nie brały się znikąd. Wczesne badania z psylocybiną, ayahuaską, LSD wyglądały naprawdę dobrze. Duże efekty, szybka poprawa, pacjenci opisujący doświadczenia, które zmieniały sposób, w jaki rozumieli siebie. Dla kogoś, kto pracuje z ludźmi z depresją to jest silna obietnica. Dla samych pacjentów to potencjalny przełom. Możliwość, że jedno głębokie doświadczenie psychodeliczne, osadzone w relacji terapeutycznej, może zrobić coś, czego miesiące farmakoterapii nie potrafią, jest intelektualnie i klinicznie pociągające ponad skalę, przyznajcie. Prawda? Trudno się nie ekscytować.
Tyle że ekscytacja to jeszcze nie dane ani dowód.
W minionym tygodniu w JAMA Psychiatry ukazała się metaanaliza Williamsa, Barnett i Szigetiego (2026). Metaanaliza to rodzaj badania, które nie zbiera własnych danych, ale bierze wyniki wielu wcześniejszych badań i analizuje je łącznie. To statystyczne narzędzie, które pozwala zobaczyć wzorzec tam, gdzie pojedyncze badanie pokazuje tylko fragment. Z tego powodu metaanalizy stoją wysoko w hierarchii dowodów (danych naukowych). Dlatego media i influencerzy się na nie rzucają i dlatego warto je czytać uważnie. Siła metaanalizy zawsze zależy od jakości badań, które do niej weszły. Wchodzi bałagan, wychodzi elegancko zapakowany bałagan ;-) A jak było tym razem?
Tym razem to wyszła praca, do której będę wracał. (I jak się ładnie zrymowało!) Czytałem ją ze trzy razy i nie mogłem do końca się z nią ułożyć. Ilekroć zaznałem spokoju, traciłem go gdzieś pomiędzy zachwytem nad elegancją statystyczną a nierównym rytmem przez ograniczenia, które autorzy potraktowali trochę po macoszemu. Myślę, że spokojnie mogę powiedzieć, że ta analiza to majstersztyk. Ale jak każdy majstersztyk… prowokuje pytania, na które sama nie odpowiada.
Ten artykuł to nie jest łatwa lektura. Sporo statystyki, metodologii i matematyki. Modelowanie bayesowskie, ROPE, przeliczenia skal, analizy wrażliwości. Trzeba się przez to przegryźć. Ale dopiero jak się przegryzie, widać, że to jest piękna nauka. Tak, nauka jest piękna również dzięki statystyce. Może zwłaszcza dzięki statystyce.
Koniec wstępu. Do rzeczy. Autorzy przeanalizowali 24 badania. 8 z terapią psychodeliczną (łącznie 249 pacjentów) i 16 z klasycznymi antydepresantami podawanymi bez zaślepienia (7921 pacjentów). I tu warto się na chwilę zatrzymać przy tych ośmiu badaniach. Bo pod etykietą „terapia psychodeliczna” kryją się bardzo różne rzeczy. Psylocybina, ayahuasca, LSD, 5-MeO-DMT. Każda z tych substancji ma inny profil farmakologiczny, inny czas działania, inny charakter doświadczenia. Do tego różnią się protokoły terapeutyczne. Różna bywa liczba sesji przygotowawczych, różne bywają dawki, inna obecność i rola terapeuty, inne metody integracji po sesji. Wrzucenie tego wszystkiego do jednego worka i porównanie z antydepresantami to uproszczenie, które trzeba mieć na uwadze, czytając wyniki. Metaanaliza widzi wzorzec, ale zaciera różnice.
Pytanie autorów było elegancko proste. Co się stanie, jeśli wyrównamy warunki zaślepienia, a raczej odślepienia? Jeśli w obu grupach pacjent wie, co dostaje?
Bo to jest sedno problemu. W standardowym badaniu klinicznym ani pacjent, ani badacz nie wiedzą, kto dostał lek, a kto placebo. Przynajmniej jest to o wiele, wiele trudniejsze by się “domyślić”. Escitalopram może nam zabijać w żołądku, ale świat nie stanie się bardziej kolorowy. Ta niemożność posiadania przekonania, co do zastosowanej substancji to “zaślepienie”. Dzięki niemu możemy oddzielić efekt substancji od efektu oczekiwań, od samej nadziei, że „to mi pomoże”. W badaniach z psychodelikami ten mechanizm nie działa. Po psylocybinie często nie trzeba się domyślać, w której grupie się jest. Doświadczenie jest tak charakterystyczne, że 90 do 95 procent uczestników poprawnie identyfikuje swoją grupę. Dla porównania, w badaniach z klasycznymi antydepresantami ten odsetek to około 60 procent. Niemniej jednak zauważmy, że są osoby, które nie doświadczają efektu psychodelicznego nawet po pełnej dawce w badaniach oraz takie, które doświadczają tych efektów w grupie 1 mg substancji. Zaślepienie w badaniach klinicznych to nie techniczny drobiazg. To jest pytanie o to, ile z tego, co widzimy w wynikach badań, jest efektem farmakologii, a ile efektem bycia przekonanym, że dostałem coś przełomowego. Można to odślepienie minimalizować i są lepsze i gorsze badania pod tym względem, ale to na inny post.
Autorzy metaanalizy podeszli do tego sprytnie. Zamiast porównywać psychodeliki z placebo (gdzie zaślepienie jest trudne), porównali je z antydepresantami podawanymi otwarcie, bez zaślepienia. “Wyrównali warunki”. Porównali badania, w których w obu grupach pacjent wiedział, co bierze.
Wynik? Różnica na 17-punktowej Skali Depresji Hamiltona (HAM-D) między terapią psychodeliczną a otwartą terapią antydepresantami wynosi 0,3 punktu. Na 52-punktowej skali. Przy p równym 0,73. Statystycznie i klinicznie – nic.
I moim zdaniem dobrze. Niech te dane schładzają entuzjazm. Nie dlatego, że psychodeliki nie działają. Działają, i to między innymi dobitnie pokazuje ta analiza. Powyższy wynik jest dowodem, że działają nie gorzej niż klasyczne leki przeciwdepresyjne. Ale entuzjazm bez pokrycia w danych prowadzi do szkód. Prowadzi do pacjentów, którzy rezygnują z leczenia, które działa, na rzecz leczenia, które obiecuje więcej, niż na razie potrafi udowodnić.
Ale ta praca ma też swoją ciemną stronę, stronę, o której nagłówki nie mówią. I dopiero za trzecim razem do mnie dotarło!
Średni czas do oceny efektu w badaniach psychodelicznych wynosił 3,4 tygodnia. W badaniach z antydepresantami 8,1 tygodnia. To poważna różnica – porównanie dwóch klatek z zupełnie różnych momentów filmu. Antydepresanty mają czas, żeby się rozkręcić. Psychodeliki są mierzone, zanim jeszcze wiemy, co się z pacjentem stanie za miesiąc. Autorzy wspominają o tym w ograniczeniach, ale nie modelują tego statystycznie. Nie wiemy, czy te trajektorie zmierzają w to samo miejsce, czy po prostu patrzymy na różne odcinki drogi.
Zanim ktoś powie „czyli psychodeliki nie działają”, zatrzymajmy się. Bo ta metaanaliza nie mówi, że nie działają. Mówi, że nie działają lepiej niż klasyczne antydepresanty, gdy wyrównamy jeden kluczowy czynnik, jakim jest wiedza osoby uczestniczącej w badaniu o tym, co bierze.
I tu zaczyna się ciekawsza rozmowa. O tym, co tak naprawdę leczy… cząsteczka, doświadczenie emocjonalne, relacja terapeutyczna, nadzieja, czy to wszystko razem w proporcjach, których jeszcze nie rozumiemy.
Część Druga – rozwinięcie blogowe
Uprzedzam, od tego miejsca matematyka gęstnieje. Modelowanie bayesowskie, ROPE, rozkład wielkości efektów, pytania o interwencje złożone. Obiecałem to na Facebooku. Oto jest. A że byłem na urlopie, to miałem czas się wczytać :)
Skąd się wzięła „przewaga 5 punktów”?
Żeby zrozumieć, dlaczego ta metaanaliza jest ważna, trzeba najpierw zrozumieć, co próbuje wyjaśnić. A żeby to zrozumieć, trzeba cofnąć się o krok i porozmawiać o tym, jak w ogóle mierzymy, czy lek na depresję działa. W badaniach klinicznych standardowym narzędziem jest Skala Depresji Hamiltona (HAM-D), 17-pozycyjny kwestionariusz wypełniany przez klinicystę. Pacjent odpowiada na pytania o sen, apetyt, nastrój, lęk, poczucie winy, spowolnienie psychomotoryczne. Każda pozycja to kilka punktów, łącznie do 52. Im wyższy wynik, tym cięższa depresja. I tu pojawia się pojęcie, które będzie wracać – minimalna klinicznie istotna różnica, w skrócie MCID (Minimal Clinically Important Difference). To próg, poniżej którego zmiana w wynikach istnieje w danych, ale pacjent jej nie czuje w swoim życiu. Grupa ekspertów NICE (Kendrick i Pilling, 2012) zaproponowała, że dla HAM-D ten próg wynosi 3 punkty. Trzy punkty. Żeby było jasne, co to oznacza w praktyce… wyobraźcie sobie dwie osoby z depresją. Jedna budzi się o trzeciej w nocy i nie może zasnąć do rana. Druga śpi kiepsko, ale przesypia noc. Na HAM-D ta różnica to może 2 punkty na jednej pozycji. Różnica 3 punktów na całej skali to jest mniej więcej granica, przy której pacjent zaczyna mówić „czuję, że coś się zmieniło”. Poniżej tej granicy zmiana jest statystyczna, nie ludzka. I tu warto się na chwilę zatrzymać przy czymś, o czym rzadko się mówi wprost. Nauczyliśmy się rozmawiać o depresji przez pryzmat skal. Tyle a tyle punktów na HAM-D, tyle na BDI, tyle na PHQ-9. To jest użyteczne, bo daje nam wspólny język i porównywalność między badaniami. Ale depresja to nie jest wynik na skali. Depresja to jest budzenie się z uczuciem, że dzień nie ma sensu, zanim jeszcze się zaczął. To jest niezdolność do cieszenia się obecnością własnego dziecka. To jest cierpienie, które żaden kwestionariusz nie ogarnia w całości. Może kiedyś dojdziemy do metodologii, która potrafi to uchwycić lepiej. Na razie mamy to, co mamy, i musimy wiedzieć, jak to czytać. Wracam do historii. Historyczne dane z badań nad depresją wyglądały tak. Klasyczne antydepresanty (SSRI, SNRI) w porównaniu z placebo dawały poprawę o około 2,4 punktu HAM-D. Dwa i cztery dziesiąte. Przy progu MCID wynoszącym 3 punkty. To jest standard, na którym od dekad opiera się farmakoterapia depresji. Niewiele, ale to jest to, co mamy. Potem pojawiły się psychodeliki. Badania z psylocybiną, ayahuaską, LSD wykazywały poprawę o około 7,3 punktu HAM-D w porównaniu z placebo. Trzy razy więcej niż te 2,4 dla antydepresantów. Na papierze wyglądało to jak skok jakościowy. Nagłówki pisały się same, zanim jeszcze na świat przyszedł ChatGPT. Różnica między tymi dwoma liczbami, między 2,4 a 7,3, wynosi około 5 punktów. Zachary Williams (badacz z Vanderbilt University, zajmujący się metanauką i metodologią badań klinicznych), Holly Barnett i Balázs Szigeti (neuronaukowiec z Imperial College London, znany z prac nad efektem placebo i funkcjonalnym odślepieniem w badaniach psychodelicznych) postanowili wyjaśnić, skąd ta 5-punktowa różnica się bierze. Ich praca, Williams, Barnett i Szigeti (2026), rzuca nowe światło na dotychczasowe entuzjastyczne doniesienia.
Wizualizacja: Skala HAM-D
Skala HAM-D – kontekst liczbowy
Skala depresji Hamiltona (HAM-D-17): 0–52 pkt
Zbliżenie (0–14 pkt)
Region of Practical Equivalence (ROPE) to przedział ±3 punkty od 0. Jeśli wynik mieści się w tej strefie, oznacza to, że badane interwencje mają zbliżony efekt kliniczny, a ewentualne różnice są nieodczuwalne dla pacjenta.
Różnica 0,3 pkt to 0,6% całej skali. Nawet efekt antydepresantów (2,4 pkt) nie przekracza progu klinicznej istotności. A „imponujące” 7,3 pkt? Ponad 70% to artefakt zaślepienia.
Dekonstrukcja matematyczna – skąd te 5 punktów?
Autorzy rozkładają tę 5-punktową przewagę na dwa składniki. I robią to w sposób, który jest jednocześnie fascynujący i przygnębiający. Zanim opiszę te składniki, ważne zastrzeżenie. To nie jest tak, że autorzy wzięli kalkulator i „udowodnili” swoją tezę jednym równaniem. To jest interpretacja oparta na porównaniu wielkości efektów z różnych analiz w ramach ich modelu statystycznego. Matematyka się zgadza, ale jak każda interpretacja, opiera się na założeniach modelu. Siła tego argumentu polega na tym, że liczby pasują do siebie zbyt dobrze, żeby to był przypadek. Ale to jest argument za spójnością wyjaśnienia, nie dowód w sensie matematycznym. Składnik 1 – efekt oczekiwań (expectancy/blinding effect). Gdy pacjent wie, że bierze aktywny lek (podanie otwarte, tzw. open-label), poprawa jest o około 1,29 punktu HAM-D większa niż gdy tego nie wie (podanie zaślepione). To jest czysta siła świadomości, „biorę lek, który ma mi pomóc”. Ten efekt dotyczy obu grup, psychodelików i antydepresantów. W badaniach z psychodelikami jest jednak zawsze obecny (bo pacjent zawsze wie, co dostał), a w zaślepionych badaniach z antydepresantami częściowo ukryty. Składnik 2 – efekt nocebo, czyli „know-cebo”. I tu jest najciekawsze. Sam termin „know-cebo” to neologizm Szigetiego, podkreślający, że nie chodzi tu o klasyczny efekt nocebo (pogorszenie pod wpływem negatywnych oczekiwań wobec substancji), ale o coś specyficznego, pogorszenie wynikające z wiedzy, że nie dostało się substancji aktywnej¹. Grupy placebo w badaniach psychodelicznych wypadają o około 4,0 punkty HAM-D gorzej niż grupy placebo w badaniach z antydepresantami. Powód jest inny. Placebo w badaniach psychodelicznych aktywnie szkodzi. Wyobraźcie sobie. Chorujesz od dłuższego czasu na ciężką depresję. Zapisujesz się do badania. Przez tygodnie przygotowujesz się na doświadczenie, które ma zmienić Twoje życie. Przychodzisz do pokoju z przygaszonym światłem, dostajesz tabletkę, zakładasz maskę na oczy, puszczają Ci muzykę. I po godzinie zdajesz sobie sprawę, że nic się nie dzieje. Nie dostałeś psylocybiny. Dostałeś nikotynamid². Rozczarowanie, które w tym momencie czujesz, nie jest neutralne. Ono pogłębia depresję. Suma tych dwóch efektów – 1,29 + 4,0 = 5,29 punktu HAM-D. Co niemal idealnie odpowiada obserwowanej różnicy 4,9-5,0 punktu między psychodelikami a antydepresantami w tradycyjnych porównaniach. I to jest właśnie ta siła argumentu. Że dwa niezależnie oszacowane efekty sumują się do liczby, która niemal co do punktu odpowiada obserwowanej różnicy, to nie jest przypadkowa zbieżność. To jest silna przesłanka za tym, że dekonstrukcja trafnie identyfikuje źródła tej przewagi. Nie dowód w sensie logicznym, ale coś, co trudno zignorować. Innymi słowy, ponad 55% opisywanej przewagi psychodelików nad antydepresantami nie wynika z tego, że psychodeliki działają lepiej. Wynika z tego, że grupa placebo w badaniach psychodelicznych radzi sobie dramatycznie gorzej. To nie psychodeliki wygrywają. To placebo przegrywa. I tak uważają autorzy, pisząc wprost, że obserwowana przewaga psychodelików w zaślepionych badaniach jest w dużej mierze artefaktem funkcjonalnego odślepienia.
Wizualizacja: Dekonstrukcja 5 punktów
Dekonstrukcja przewagi 5 punktów
Obserwowana przewaga ~5 punktów mieści się w sumie artefaktów metodologicznych. Efekt oczekiwań + know-cebo = 5,29 pkt. Ile z tego to rzeczywista farmakologia?
Analiza bayesowska – jak pewni możemy być?
Autorzy nie poprzestawali na klasycznej statystyce. A żeby zrozumieć, dlaczego to ważne, warto na chwilę zatrzymać się przy tym, czym właściwie różnią się te dwa podejścia. Klasyczna statystyka (tzw. częstościowa, frequentist) odpowiada na pytanie „gdyby naprawdę nie było żadnej różnicy między psychodelikami a antydepresantami, jak prawdopodobne byłoby uzyskanie takich wyników, jakie uzyskaliśmy?” To jest wartość p. W tym przypadku p = 0,73, co oznacza, że takie wyniki byłyby bardzo prawdopodobne nawet gdyby różnicy nie było. Czyli brak podstaw do odrzucenia hipotezy, że leczenia działają tak samo. Ale statystyka bayesowska zadaje inne pytanie, bardziej intuicyjne, „biorąc pod uwagę dane, które zebraliśmy, jakie jest prawdopodobieństwo, że psychodeliki są naprawdę lepsze?” To jest subtelna, ale fundamentalna różnica. Częstościowa mówi o danych przy założeniu hipotezy. Bayesowska mówi o hipotezie przy danych, które mamy. I to drugie jest bliższe temu, co chcemy wiedzieć. Autorzy zdefiniowali minimalną klinicznie istotną różnicę (MCID) na poziomie 3 punktów HAM-D. Żeby to poczuć… 3 punkty na HAM-D to mniej więcej różnica między kimś, kto budzi się rano z poczuciem pustki, ale funkcjonuje, a kimś, kto nie potrafi wstać z łóżka. Albo między kimś, kto je z przymusu, a kimś, kto zaczyna odczuwać smak jedzenia. Na papierze to niewielka zmiana, ale pacjent ją czuje. Analiza bayesowska pokazała, że szansa, że terapia psychodeliczna przewyższa klasyczne antydepresanty o co najmniej te 3 punkty HAM-D, wynosi 0,2%. Mówiąc prościej, gdybyśmy postawili 500 zakładów na to, że psychodeliki są klinicznie lepsze, wygralibyśmy mniej więcej jeden. Z drugiej strony, 99,1% wyników analizy mieści się w tak zwanym ROPE (Region of Practical Equivalence), czyli obszarze ±3 punkty HAM-D, w którym uznajemy, że dwie interwencje są praktycznie równoważne. ROPE to taki pas bezpieczeństwa – jeśli prawie cały rozkład prawdopodobieństwa (to, co analiza bayesowska „widzi” jako możliwe wartości rzeczywistej różnicy) mieści się w tym pasie, to znaczy, że różnica, o ile w ogóle istnieje, jest tak mała, że pacjent jej nie poczuje. To więcej niż „nie znaleźliśmy różnicy” – to aktywne potwierdzenie, że różnicy nie ma. Cieszyć się czy płakać? Myślę, że jedno i drugie, zależnie od tego, czego się spodziewaliśmy.
Problem czasu – 3,4 vs 8,1 tygodnia (rozwinięcie)
Sygnalizowałem to w Części Pierwszej i chcę tu wejść głębiej, bo uważam to za najpoważniejsze ograniczenie tej metaanalizy. Najpierw wyjaśnienie dla tych, którzy potrzebują kontekstu. W badaniach klinicznych „punkt końcowy” (endpoint) to moment, w którym badacze mierzą efekt leczenia. To jest z góry ustalony termin, kiedy pytamy, czy pacjentowi jest lepiej? Pierwszy punkt końcowy (primary endpoint) to ten najważniejszy, ten, na którym opiera się główny wniosek badania. Średni czas do oceny tego pierwszego punktu końcowego w badaniach psychodelicznych wynosił 3,4 tygodnia. W badaniach z antydepresantami – 8,1 tygodnia. Antydepresanty z grupy SSRI potrzebują 4-6 tygodni, żeby osiągnąć pełne działanie farmakologiczne. Punkt pomiarowy w 8 tygodniu łapie je w momencie szczytowej skuteczności. Psychodeliki mierzone są po 3,4 tygodnia, nierzadko jeszcze w fazie, gdy efekt doświadczenia psychodelicznego dopiero się integruje. Porównanie tych dwóch punktów końcowych to jak porównanie sprintera z maratończykiem na odcinku kilometra. Sprinter wygląda świetnie, ale nie wiemy jeszcze, kto dobiegnie do mety. Autorzy wspominają o tej dysproporcji w sekcji ograniczeń. Przyznają, że ta różnica może wpływać na wyniki. Ale nie modelują jej statystycznie. Nie włączają czasu do punktu końcowego jako zmiennej w swoim modelu. Zostawiają to jako zastrzeżenie, nie jako element analizy. A to jest istotne, bo metody pozwalające modelować trajektorie zmian (a nie tylko statyczne punkty pomiarowe z różnych momentów czasu) istnieją. I tu wchodzi coś, co mnie osobiście zatrzymało. W 2018 roku opublikowałem z Ludmiłą Zając-Lamparską i Moniką Deją artykuł o modelowaniu latentnych krzywych rozwojowych (LGCM) w Polskim Forum Psychologicznym. W ogóle wtedy nie myślałem o badaniach nad psychodelikami, przyszły do mnie dwa lata później. Ale kwestia czasu w danych podłużnych okazała się mieć znaczenie akurat w kontekście psychiatrii psychodelicznej. Latentne krzywe rozwojowe to metoda, która pozwala analizować dane podłużne nie jako pojedyncze punkty pomiarowe, ale jako trajektorie zmian. Statystyka pomaga zamodelować oddzielnie punkt startowy (intercept) i tempo zmian (slope), a co najważniejsze, modeluje indywidualne różnice w tych trajektoriach. Nie pytamy „ile się zmieniło”, tylko „jak przebiega zmiana i dla kogo przebiega inaczej”. Co by było, gdyby autorzy metaanalizy zamiast porównywać statyczne punkty końcowe z różnych momentów czasu, modelowali trajektorie zmian? Na przykład za pomocą meta-regresji z czasem do punktu końcowego jako kowariantem? Obraz mógłby wyglądać inaczej. Nie mówię, że wynik by się zmienił. Mówię, że byłby pełniejszy. Tak zwane IPD meta-analizy (Individual Participant Data meta-analyses) pozwalają na modelowanie krzywych zmian na poziomie poszczególnych uczestników, a nie zagregowanych wyników badań. Wymagają dostępu do surowych danych z każdego badania, co jest logistycznie trudne, ale metodologicznie możliwe. Nie wiemy, czy trajektorie zmiany u pacjentów leczonych psychodelikami i antydepresantami zmierzają w to samo miejsce, czy po prostu patrzymy na różne odcinki drogi. To jest kierunek, w którym ta dziedzina powinna pójść.
Wizualizacja: Porównanie osi czasu
Sprinter vs maratończyk
Porównanie czasu działania psychodelików i antydepresantów w badaniach klinicznych
Nie wiemy, co dzieje się po 3,4 tygodnia. Każda linia na wykresie to możliwa trajektoria. Żadnej nie znamy. Porównanie sprintera z maratończykiem na odcinku kilometra nie mówi nam, kto dobiegnie do mety. Potrzebujemy dłuższych badań.
Uwaga: ta wizualizacja dotyczy okien pomiarowych z metaanalizy Williamsa i in. (2026). Poszczególne badania stosują różne punkty czasowe.
Badanie EPISODE – co mówi o mechanizmie?
Metaanaliza Williamsa, Barnett i Szigetiego mówi nam, że psychodeliki nie działają lepiej niż antydepresanty, gdy wyrównamy warunki. Ale nie mówi nam, co w psychodelikach właściwie działa. I właśnie dlatego warto spojrzeć na inne badanie, które ukazało się w tym samym numerze JAMA Psychiatry. Badanie EPISODE (Mertens i in., 2026) to randomizowane badanie kliniczne – 144 osoby z depresją lekooporną, psylocybina 25 mg versus aktywne placebo (nikotynamid 100 mg), potrójne zaślepienie, dwa ośrodki w Niemczech. Pacjenci mogli otrzymać dwie dawki w odstępie 6 tygodni. Główny wynik? Psylocybina nie osiągnęła istotności statystycznej na pierwszorzędowym punkcie końcowym, czyli na odpowiedzi na leczenie (response). Mówiąc prościej, odsetek pacjentów, u których objawy depresji zmniejszyły się o co najmniej 50%, nie różnił się istotnie między grupami. Ale jest w tym badaniu coś innego, coś, co uważam za potencjalnie ważniejsze od głównego wyniku. Pacjenci, którzy opisywali tak zwane emotional breakthroughs, stany pogłębionej otwartości emocjonalnej, wglądu, poczucia przełomu wewnętrznego, mieli lepszą odpowiedź na leczenie. I te emotional breakthroughs były opisywane częściej w grupie otrzymującej wyższe dawki psylocybiny. To mnie zatrzymuje. Jeśli efekt antydepresyjny wiąże się nie tyle z dawką substancji, co z jakością doświadczenia emocjonalnego, to zaczynamy rozmawiać o czymś zupełnie innym niż „lek na depresję”. Zaczynamy rozmawiać o interwencji złożonej.
Czym jest interwencja złożona? Czy działa substancja, terapia, setting (otoczenie terapeutyczne), nadzieja?
Terapia psychodeliczna to nie tabletka. To jest substancja plus tygodnie przygotowania terapeutycznego, plus obecność terapeuty (często dwóch) przez 6-8 godzin doświadczenia, plus sesje integracyjne po. To jest, jak argumentują Muthukumaraswamy i współpracownicy (2025), interwencja złożona (complex intervention), w której substancja, psychoterapia, setting (otoczenie) i oczekiwania pacjenta są ze sobą splecione. Paradygmat randomizowanego badania klinicznego został zaprojektowany do testowania izolowanego działania substancji. Oddzielasz lek od kontekstu, dajesz jednym lek a drugim placebo i patrzysz, co robi sam lek. W terapii psychodelicznej to oddzielenie jest strukturalnie niemożliwe. Nie chodzi o niekompetencję badaczy. Sam obiekt badania jest nierozerwalny. I tu trafiłem na coś, o czym warto wspomnieć, bo niewiele osób o tym wie. Istnieje narzędzie o nazwie PRECIS-2 (Pragmatic-Explanatory Continuum Indicator Summary), które mierzy, na ile dane badanie kliniczne jest „laboratoryjne” (explanatory, nastawione na wyjaśnienie mechanizmu w kontrolowanych warunkach) a „kliniczne” (pragmatic, nastawione na sprawdzenie, jak leczenie działa w realnym świecie). Wynik PRECIS-2 dla badań z psychodelikami wynosi około 15-16, co lokuje je blisko bieguna wyjaśniającego, daleko od pragmatycznego. Badamy psychodeliki w warunkach takich jak pokój z przygaszonym światłem, muzyka, dwóch terapeutów, wielogodzinna sesja, które mają niewiele wspólnego z tym, jak leczenie wyglądałoby w realnym gabinecie psychiatrycznym. To jest ciekawostka, ale też problem. O PRECIS-2 warto wiedzieć i napiszę o tym oddzielny post.
Co mówią eksperci?
James Rucker, psychiatra i starszy wykładowca w Institute of Psychiatry, Psychology & Neuroscience przy King’s College London, kierujący Psychoactive Trials Group i będący jednym z najbardziej doświadczonych badaczy klinicznych psychodelików w Europie, komentując oba artykuły dla Science Media Centre, powiedział coś, co warto zapamiętać. Że wyniki potwierdzają realny efekt antydepresyjny psychodelików, ale sugerują, że za istotną częścią tego efektu stoją pozytywne oczekiwania. I dodał perspektywę kliniczną, którą uważam za kluczową – w praktyce leki nie są podawane na ślepo, pacjent zawsze wie, co bierze. Więc porównanie z open-label jest bliższe temu, co dzieje się w gabinecie. David Owens, emerytowany profesor psychiatrii klinicznej na University of Edinburgh, podkreślił, że oba artykuły dotykają centralnego problemu w ocenie psychodelików jako narzędzi terapeutycznych – problemu zaślepienia. Że dopóki nie rozwiążemy tego problemu, będziemy się kręcić w kółko z interpretacją wyników. A w kontekście badania EPISODE inni komentatorzy zauważyli, że psylocybina, mimo nieosiągnięcia istotności na pierwszorzędowym punkcie końcowym, wykazała efekt antydepresyjny na wtórnych miarach i że druga dawka podawana po 6 tygodniach wydaje się wzmacniać ten efekt. Pytanie, czy to jest efekt farmakologiczny, czy efekt drugiego intensywnego doświadczenia terapeutycznego, pozostaje otwarte.
Alternatywne wyjaśnienia – czego ta metaanaliza nie rozstrzyga?
Metaanaliza Szigetiego jest elegancka, ale nie wszechmocna. Poniżej moje pytania, te, które nie dają mi spokoju, a na które ta praca nie odpowiada. Czy równoważność na HAM-D oznacza równoważność kliniczną? Skala Hamiltona mierzy objawy – bezsenność, utratę apetytu, spowolnienie psychomotoryczne. Nie mierzy sensu, relacji, zdolności do pracy, jakości życia. Badanie escitalopram versus psylocybina (Carhart-Harris i in., 2021; Erritzoe i in., 2024) wykazało, że przy identycznych wynikach na HAM-D, grupa psylocybinowa miała lepsze wyniki funkcjonalne po 6 miesiącach. Liczby na HAM-D mogą być równe, a obraz w gabinecie zupełnie inny. Czy episodyczne podanie jest klinicznie lepsze od chronicznego? Jeśli jedno doświadczenie psychodeliczne daje taki sam spadek na HAM-D jak miesiące codziennego łykania SSRI, ale bez codziennych skutków ubocznych (stępienie emocjonalne, przyrost masy ciała, dysfunkcje seksualne), to ta równoważność wygląda zupełnie inaczej z perspektywy pacjenta. Równoważność statystyczna to nie równoważność doświadczenia. Co z trajektorią w czasie? Problem 3,4 vs 8,1 tygodnia to nie tylko kwestia techniczna. To jest pytanie o to, czy psychodeliki osiągają swój pełny efekt szybciej i czy ten efekt utrzymuje się długoterminowo. Tego metaanaliza nie bada. Co z terapią lekooporną? Autorzy przeprowadzili analizę wrażliwości wykluczając badania z depresją lekooporną (TRD) i wynik się nie zmienił. Ale to nie odpowiada na pytanie, czy dla pacjenta, który nie odpowiada na trzeci z kolei antydepresant, psychodeliki mogą być wartościową alternatywą nawet przy identycznej skuteczności populacyjnej. Dla tego pacjenta „nie gorsze” to może być „jedyne, co zostało”.
Gdzie to nas zostawia?
Ta metaanaliza jest ważna i potrzebna. Robi dokładnie to, co powinna – chłodzi narrację, która wyprzedziła dane. Ale dyskusji nie zamyka, tylko otwiera ją na nowo. Psychodeliki prawdopodobnie działają. Pytanie, co dokładnie w nich działa – cząsteczka, doświadczenie emocjonalne, relacja terapeutyczna, nadzieja, czy to wszystko razem w proporcjach, których jeszcze nie rozumiemy. Będę o tym mówił na konferencji Nauka Psychodeliczna 2026 (13-14 czerwca, Uniwersytet Warszawski) w wykładzie „Niewidoczne zmienne: czego jeszcze o terapii psychodelicznej nie wiemy?”. Nacisk położę na perspektywę klinicznego zastosowania – co te dane oznaczają dla człowieka siedzącego naprzeciwko mnie w gabinecie, a nie tylko dla modelu statystycznego. Jeśli temat Was interesuje, zapiszcie się – naukapsychodeliczna.org/etn/konferencja-nauka-psychodeliczna-2026 Zaciekawione Szanowne Osoby? :)
Źródła
Carhart-Harris, R. L., Giribaldi, B., Watts, R., Baker-Jones, M., Murphy-Beiner, A., Murphy, R., Martell, J., Blemings, A., Erritzoe, D. i Nutt, D. J. (2021). Trial of psilocybin versus escitalopram for depression. New England Journal of Medicine, 384(15), 1402–1411. https://doi.org/10.1056/NEJMoa2032994
Erritzoe, D., Barba, T., Greenway, K. T., Murphy, R., Martell, J., Giribaldi, B., Timmermann, C., Murphy-Beiner, A., Baker-Jones, M., Nutt, D. J., Weiss, B. i Carhart-Harris, R. L. (2024). Effect of psilocybin versus escitalopram on depression symptom severity in patients with moderate-to-severe major depressive disorder: Observational 6-month follow-up of a phase 2, double-blind, randomised, controlled trial. eClinicalMedicine, 76, 102799. https://doi.org/10.1016/j.eclinm.2024.102799
Kendrick, T. i Pilling, S. (2012). Common mental health disorders: Identification and pathways to care: NICE clinical guideline. British Journal of General Practice, 62(594), 47-49.
Mertens, L. J., Hinze, T., Gründer, G., Bröcker, A., Jungaberle, H., Böhringer, A., Kambeitz, J., Jessen, F. i Schmidt, S. (2026). Efficacy and safety of psilocybin in treatment-resistant major depression: The EPISODE randomized clinical trial. JAMA Psychiatry. https://doi.org/10.1001/jamapsychiatry.2025.4810
Muthukumaraswamy, S. D., Baggott, M. J., Schenberg, E. E., Decker, R. i Reckweg, J. T. (2025). Psychedelic-assisted therapy as a complex intervention: Implications for clinical trial design. Therapeutic Advances in Psychopharmacology, 15. https://doi.org/10.1177/20451253251381074
Williams, Z. J., Barnett, H. i Szigeti, B. (2026). Psychedelic therapy vs antidepressants for the treatment of depression under equal unblinding conditions: A systematic review and meta-analysis. JAMA Psychiatry. https://doi.org/10.1001/jamapsychiatry.2025.4809
Zając-Lamparska, L., Warchoł, Ł. i Deja, M. (2018). Modelowanie latentnych krzywych rozwojowych jako metoda analizy danych podłużnych w psychologii. Polskie Forum Psychologiczne, 23(2), 342–362.