Kolor streszczenia
Kolor komentarzy
Kolor cytatów

Rozdział VI
SPRZĘŻENIE ZWROTNE Z POWIADOMIENIEM O SUKCESIE I POUCZANIE PRZEZ POTWIERDZENIE (CONDITIONING BY REINFORCEMENT)

VI. 1. NOWE SPRZĘŻENIE ZWROTNE

U wszystkich istot ze świata zwierzęcego, których centralny system nerwowy osiągnął określony poziom zróżnicowania, tzn. u głowonogów, raków, pajęczaków, owadów oraz kręgowców z człowiekiem włącznie, występuje pewna umiejętność zdobywania wiedzy przerastająca sprawnością wszelkie dotychczas omawiane mechanizmy poznawcze, mianowicie umiejętność uczenia się w ściślejszym sensie. Ponieważ umiejętność tę wykazuje tak wiele rozmaitych istot, psychologowie, którym biologia była obca i którzy nie wiedzieli o konwergencji przystosowań, zaopiniowali błędnie, że chodzi tu o jakiś prafenomen, o podstawową formę wszelkiego zdobywania wiedzy i o jedyny wręcz element zachowania w ogóle. W rzeczywistości aparatura nerwowa, stanowiąca podłoże zdolności, o której mowa, ukształtowała się u każdego z wymienionych typów zwierzęcych niezależnie od innych, dzięki przystosowaniu konwergentnemu, tak samo jak niezależnie jeden od drugiego uzyskały one oczy i kończyny.

Uczenie się z sukcesów i niepowodzeń było typową fulguracją w uprzednio (r. II.2) wyłożonym sensie, która powstała dzięki wytworzeniu się nowego połączenia pomiędzy istniejącymi i zdolnymi do niezależnego funkcjonowania mechanizmami nerwowymi. Zapoznaliśmy się już przedtem z działaniem każdego z tych mechanizmów składowych.

Zespół zachowań nazywany przez Heinrotha swoistym gatunkowo działaniem z popędu składa się, jak już wiemy, z zachowania apetencyjnego, z reakcji wrodzonego mechanizmu wywoławczego i z wykonania genetycznie zaprogramowanego ciągu zachowań, aż do osiągnięcia zaspokajającej popęd sytuacji końcowej. Ten łańcuch, złożony z trzech wyodrębnionych procesów, stanowi podłoże, na którym rozwinęła się umiejętność wszelkiego uczenia się z sukcesów i niepowodzeń (conditioning). Nowe właściwości systemowe nadaje tej liniowej sekwencji procesów wynalazek zaprawdę epokowy: końcowy rezultat procesualnego toku może teraz wpływać zwrotnie na inicjujące ten tok sposoby zachowania i modyfikować je.

Poszukiwawcze sposoby poruszania się, które w zachowaniu apetencyjnym występowały mniej lub bardziej przypadkowo, zostają wskutek takiego oddziaływania zwrotnego wzmocnione, jeśli wykonanie całego ciągu przyniosło sukces sprzyjający utrzymaniu gatunku, w przeciwnym natomiast razie słabną. Innymi słowy: sukces oddziałuje tak jak to, co powszechnie zwiemy "nagrodą", niepowodzenie zaś tak jak "kara". W literaturze anglojęzycznej wszystko, co prowadzi w ten sposób do wzmocnienia, czyli do "przyuczenia" poprzedzającego zachowania, określa się słowem reinforcement, którego używają też niestety psychologowie piszący po niemiecku; odrzucają oni wyrażenia zrozumiałe w niemczyźnie jako "subiektywistyczne". Ponieważ pojęcie reinforcement pochodzi od Iwana Piotrowicza Pawłowa, poprosiłem jedną z moich współpracownic, dobrze władającą rosyjskim, aby sprawdziła, kiedy ten autor użył owego terminu po raz pierwszy, i jak to brzmiało po rosyjsku. Okazało się, że wczesne prace, w których wielki fizjolog ukuł to pojęcie, pisał on po niemiecku używając słów Verstarkung, verstarken ("wzmocnienie" i "wzmacniać"). Nie wydaje mi się całkiem zadowalający taki dobór niemieckiego terminu. Z tego, dzięki czemu dochodzi do skutku omawiany tutaj proces uczenia się, zdamy sobie lepiej sprawę powiadając, że sukces utwierdza (bestarkt) zwierzę w prowadzącym do niego zachowaniu.

Wraz z nowym sprzężeniem zwrotnym powstaje proces poznawczy, który w jednym jedynym wykonaniu przynosi osobnikowi więcej trwałego przyrostu wiedzy, i to co najmniej dwukrotnie więcej, niż w najkorzystniejszym przypadku zdolna jest sprawić metoda genomu w toku jednej generacji, gdyż w procesie tym informacje uzyskiwać można nie tylko z sukcesu, jak to czyni genom, lecz także z niepowodzenia. Proces uczenia się, o który tu chodzi, "nie gra" też w ciemno, jak genom, żonglując wszystkimi w ogóle dostępnymi mu czynnikami, relewantnymi i nierelewantnymi, lecz rozwój swój opiera na wypróbowanych wrodzonych hipotezach roboczych, mianowicie tych, które są trwale wpisane w system zachowania wszystkich zwierząt wyższych w formie mechanizmów zdobywających informację chwilową, o czym traktował rozdział IV. Zachowanie podlegające modyfikacji w wyniku sukcesów i niepowodzeń jest przez to z góry nakierowane ku wyższemu prawdopodobieństwu sukcesu, nie przypadkiem "z góry" znaczy po łacinie a priori. W podrozdziałach o zrozumieniu i uczeniu się będzie jeszcze o tym mowa bardziej szczegółowo.

Wobec uzyskanej w ten sposób ogromnej sprawności nowego aparatu poznawczego jasne jest, że wśród wyższych, szybko poruszających się zwierząt sprostać konkurencji mogą jedynie te, które aparat ów posiadają.


VI. 2. MINIMUM KOMPLIKACJI SYSTEMU

Z drugiej strony jasne jest również, wobec dotąd powiedzianego, dlaczego u zwierząt jednokomórkowych i niższych wielokomórkowców, które nie mają scentralizowanego systemu nerwowego, nie mogło w ogóle dojść do uczenia się z sukcesów. Istnienie kilku i to niezbyt prostych podsystemów o bardzo dobrze zorganizowanym działaniu stanowi oczywisty warunek wstępny powstania systemu, który jest w stanie wykorzystać jako źródło wiedzy sukces lub niepowodzenie określonego poprzedzającego sposobu zachowania i potrafi przenieść zwrotnie rezultat takiego wykorzystania na mechanikę owego sposobu zachowania, modyfikując ją. Poznaliśmy te podsystemy i ich układ działania przy omawianiu swoistego gatunkowo działania z popędu.

Stosunkowo najłatwiej można wyobrazić sobie mechanizm, który utwierdza zwierzę w sposobach zachowania prowadzących po prostu do zaspokojenia zapotrzebowania tkanek. Wystarczyłby tu jeden tylko "czujnik" rejestrujący obecność lub brak niezbędnej do życia substancji i składający meldunek aparatowi zachowania poprzedzającego. Jakoż istnieją poszczególne przypadki realizacji tej najprostszej możliwości prawdziwej reakcji warunkowej, na przykład według Dehtiera niektóre muchy tak właśnie zdobywają pożywienie. W ogóle jednak u większości systemów zachowania podatnych na adaptacyjną modyfikację przez uczenie się w pełnym znaczeniu, muszą być spełnione trzy następujące warunki wstępne.

Po pierwsze: sposób zachowania inicjujący całe działanie musi posiadać program "szeroko otwarty", tzn. oferujący możliwość wielorakich modyfikacji adaptacyjnych; wiemy już, że warunkiem wstępnym takiego programu jest szczególnie wielki zasób informacji genetycznej.

Po drugie: forma, w jakiej w poszczególnym przypadku przebiegało ostatnie wykonanie inicjujących członów działania, musi być w jakiś sposób "protokołowana" czy "zapamiętywana" i to wspomnienie musi być kontaktowane ze zwrotnym powiadomieniem o sukcesie.

Po trzecie: takie powiadomienie zwrotne musi być w dostatecznej mierze godne zaufania. Działanie końcowe zaspokajające popęd, consummatory act w ujęciu Wallace'a Craiga, bądź też docelowa sytuacja bodźcowa w przypadku apetencji do stanów spoczynku w rozumieniu Moniki Meyer-Holzapfel muszą mieć w wewnętrznych i zewnętrznych procesach receptorycznych charakterystykę tak jednoznaczną, by wykluczone było z dostatecznym prawdopodobieństwem błędne powiadomienie o sukcesie lub niepowodzeniu. Innymi słowy: aparat receptoryczny z powiadomieniem zwrotnym musi mieć podobną sprawność, jak wrodzony mechanizm wywoławczy (r. IV.8. i n.).

Prostszy model myślowy aparatu fizjologicznego, który sprawiałby uczenie się z sukcesów (conditioning by reinforcement), jest niewyobrażalny.

System zachowań zdolnych do takiego uczenia się nie może więc być nigdy prostym "odruchem", jak to implikuje terminologia L P. Pawłowa. Istnieją wprawdzie proste "odruchowe" reakcje unikania w rodzaju omawianych w rozdziale V. 6, które dochodzą do skutku dzięki prostemu skojarzeniu pomiędzy reakcją ucieczki i sytuacją bodźcową o nabytej zdolności wywoławczej i które są powierzchownie podobne do obecnie rozważanych procesów uczenia się. Nie znamy jednak ani jednego przypadku, w którym udałoby się zmodyfikować adaptacyjnie jakiś system zachowań przez przyuczenie, tzn. przez pozytywnie oddziaływające "nagradzające" bodźce, jeśli nie uczestniczy w tym systemie zachowanie apetencyjne. Już dawno temu wskazał na to E. C. Tolman.

Również w klasycznym przypadku warunkowego "odruchu" ślinienia się, badanym przez I. P. Pawłowa, tresura nie umacnia wcale samego tylko wspomnianego procesu odruchowego, przeciwnie, ślinienie się jest jedynie drobnym fragmentem o wiele bardziej złożonego ciągu sposobów zachowania, z których wszakże w klasycznym eksperymencie laboratoryjnym większość została wyłączona przez prosty zabieg umieszczenia psa w tak przemyślnej uprzęży, że pozbawiono go niemal kompletnie możliwości ruchu. Mój nieżyjący już przyjaciel Howard Liddell, pracując gościnnie w laboratorium Pawłowa, wywołał kiedyś niejakie zdziwienie swym nieortodoksyjnym eksperymentem. Przyuczył on najpierw psa do bodźca warunkowego polegającego na przyspieszaniu tempa stale tykającego metronomu. Kiedy można już było liczyć, że pies będzie się ślinił w odpowiedzi jak należy, Liddell uwolnił go z uwięzi. Na to pies podbiegł zaraz do metronomu, który tykał sobie równomiernie, i podskakując, łasząc się, merdając ogonem, skomląc, innymi słowy całym swym psim zachowaniem wykazał, że oto prosi o jedzenie swego pana czy też starszego towarzysza w sforze. Ślinił się przy tym gwałtownie, chociaż metronom wcale nie przyspieszył uderzeń, bodźca warunkowego zatem nie było. Wypraszanie jedzenia i wzajemne karmienie są to zachowania bardzo rozpowszechnione u społecznie żyjących Canidae. Według Crislera już jednoroczne wilki karmią obce młodsze szczenięta, u likaonów (Lycaon pictus L.) osobnik, któremu powiodło się na polowaniu, karmi wszystkich członków stada. Koordynacje dziedziczne proszenia są u obu tych gatunków takie same jak u psa domowego. One to właśnie, nie zaś tylko wydzielanie śliny, upostaciowują reakcję, którą uwarunkowano w klasycznym eksperymencie!

Ani mi w głowie deprecjonować eksperymenty Pawłowa. Sztuczne wydzielenie pojedynczej reakcji jest najzupełniej uprawnionym zabiegiem, zwłaszcza jeśli zyskuje się dzięki temu tak dobre możliwości badania ilościowego, jak przy ślinieniu się psa. Trzeba tylko tak postępując zachować świadomość, że wycina się fragment z systemu. Nie wolno w żadnym razie wyobrażać sobie, jak to się najwyraźniej przydarza łacno ludziom skłonnym do analizy, że teraz system składa się już tylko z wydzielonego fragmentu i że sam ten fragment wystarcza do zrozumienia wszystkich właściwości całego systemu. Kiedy przyjmując punkt widzenia analizy adekwatnej do systemów biologicznych spróbujemy przyjrzeć się temu, co nam dziś wiadomo o występowaniu reakcji warunkowanych przez utwierdzenie (reinforcement), potwierdza się najzupełniej przedstawiona tutaj opinia: pozytywna tresura przez nagradzanie jest ważkim kryterium "prawdziwej" reakcji warunkowej. W przytoczonym przez C. Foppę spisie reakcji "dających się warunkować" znalazło się omyłkowo nieco przypadków, w których reakcje unikania polegające na prostym skojarzeniu pozorują prawdziwe conditioning.


VI. 3. W POSZUKIWANIU ENGRAMU

Nim zajmę się kwestią, w jakie partie całości systemowej modyfikowalnej przez uczenie się ingeruje modyfikacja adaptacyjna i skąd pochodzi nowa informacja, która to sprawia, chciałbym wypowiedzieć parę uwag ogólnych o fizjologicznej naturze uczenia się i pamięci.

Dotychczasowe poszukiwania engramu, runicznego znaku pamięci zapisywanego przez uczenie się, okazały się beznadziejnie niemal bezskuteczne. K. S. Lashley nadał swemu błyskotliwemu odczytowi In Search of the Engram (W poszukiwaniu engramu) podtytuł Thirty years of frustration (Trzydzieści lat frustracji). W rzeczywistości cierpliwe badania Lashleya przyniosły obok innych nader istotnych wiadomości także i tę, że engram nie jest umiejscowiony w żadnym określonym punkcie mózgowia, lecz zasadza się na organizacji wiążącej wszelkie możliwe części mózgu. Po prawdzie, dziś nadal nie potrafimy powiedzieć, jakie procesy fizjologiczne stanowią podłoże takiego engramu. To wyjaśnia, dlaczego gdy tylko poznano genetyczne kodowanie informacji w cząsteczkach łańcuchowych, zaraz tak wielu poważnych badaczy wystąpiło z hipotezą, że podobna jest procedura utrwalania wiedzy nabywanej w doświadczeniu osobniczym i gromadzonej w pamięci. Jednakże hipoteza ta wzbudza bardzo poważne wątpliwości. Jeśli by była słuszna, znaczyłoby to, że muszą istnieć dwa niezależnie od siebie funkcjonujące mechanizmy, z których jeden natychmiast "zapisuje na taśmie" wszystkie nadchodzące impulsy nerwowe, tzn. wytwarza z ich ciągu czasowego przestrzenny układ odpowiedniej cząsteczki łańcuchowej szyfrującej fakty swoim kodem. Drugi mechanizm musiałby umieć odczytywać ten kod i przekładać go z powrotem na impulsy nerwowe skoordynowane czasowo i przestrzennie. Pomijając ogólne nieprawdopodobieństwo, hipoteza ta nie jest w stanie wyjaśnić, dlaczego u wszystkich znanych istot żywych umiejętność uczenia się pozostaje w stosunku prostym do liczby komórek w zwojach i w ogóle do rozmiarów oraz zróżnicowania centralnego systemu nerwowego. Biochemicy wykazali ostatnio, że chemiczne kodowanie w cząsteczkach łańcuchowych informacji nabywanej osobniczo jest niemożliwością ze względów czasowych. Ponieważ okazało się również, że w badaniach kontrolnych nie udaje się powtórzyć znacznej części rezultatów, które zdawały się dowodzić, iż informację nabytą osobniczo można przekazywać chemicznie, obstaję przy opinii, że wszelkie uczenie się, przynajmniej w takim zakresie, w jakim warunkuje ono bardziej złożone adaptacyjne modyfikacje zachowania, dokonuje się w synapsach, tzn. przez wytwarzanie połączeń pomiędzy poszczególnymi elementami nerwowymi oraz że te zmiany, jak już powiedziano (r. V.2. i n.), są nader podobne do embriogenetycznych procesów indukcji. Nie przeczę bynajmniej, że jakąś rolę w tych lokalnych zdarzeniach mogą odgrywać zmiany w zakodowaniu cząsteczek łańcuchowych.


VI. 4. «INSTRUKTAŻ» WRODZONY

Otwarty program mechanizmów zachowania, który każdemu osobnikowi został za sprawą filogenezy przekazany na drogę życia przez jego przodków, jest zawsze, w sposób wypróbowany, tak skonstruowany, że jego niedomknięte, wymienne partie odnoszą się do tych danych środowiska, o których nie można wprawdzie przepowiedzieć ani jak wypadną, ani też kiedy i gdzie wystąpią, lecz które są za życia osobnika na tyle stałe, iż pożądane jest gromadzenie dotyczącej ich informacji. Pisklę gęsi szarej dopiero co wyklute, nie może oczywiście wiedzieć, jak wyglądają osobniki, za którymi ma przez całe miesiące biegać jako za rodzicami, młoda zaś pszczoła nie może dysponować wrodzoną informacją o geografii otoczenia jej ula. Umiejętności w rodzaju rozpoznawania osobniczo istot własnego gatunku oraz wyuczania się drogi są dobrymi przykładami gotowości do nabywania przez uczenie się takiej relewantnej informacji, której nie mogą dostarczyć ani genom, ani mechanizmy zdobywające informację chwilową.    

Z drugiej strony, jak wiemy, właśnie program otwarty zakłada mnóstwo informacji nabytej filogenetycznie i związanej w genomie. Transpozycja tej informacji w sensowne zachowanie zwierzęcia następuje na drodze innej niż rozwój morfogenetyczny. Wprawdzie na początek właśnie w morfogenezie powstają na podstawie tej informacji całkiem określone organizacje nerwowe, jak np. omówiona w r. V.6. wrodzona dyspozycja do błyskawicznego kojarzenia jednego bardzo mocnego bodźca do ucieczki z całą towarzyszącą sytuacją bodźcową. Również cała omawiana w rozdziale VI.2 struktura aparatu utwierdzania przez sukces powstaje oczywiście na podstawie informacji związanej w genomie. Jeśli nie chcemy wykraczać poza ramy wyjaśnień naturalnych, jest niewyobrażalne, by transpozycja związanej w genomie informacji w sensowne w rozumieniu utrzymania gatunku zachowanie mogła się odbywać inaczej, niż poprzez ukształtowanie realnych struktur systemu nerwowego i narządów zmysłowych.

Właśnie ta strukturalizacja nadaje sensowny tok uczeniu się. Z niej wywodzą się "instruktaże", które zapewniają, że otwarte miejsca w rozmaitych programach wypełnione są w każdym przypadku w sposób sensowny dla utrzymania gatunku. Jak to już było kilkakrotnie podkreślane, same te struktury winny być jak najbardziej niepodatne na modyfikujące zmiany, aby nie gubiły niczego z zawartej w nich informacji wrodzonej. Jeśli w jakimś systemie sposobów zachowania jeden podsystem jest bardzo podatny na modyfikację przez uczenie się, to niechybnie warunkiem tej podatności jest dostateczna odporność na modyfikacje innych podsystemów tak, by zagwarantowane było wykonanie programu nauki modyfikowalnych części.

Jeśli nie chce się zakładać czynników pozanaturalnych, jak choćby przedustawnej harmonii pomiędzy organizmem a środowiskiem, to aby wyjaśnić ewidentną sprawność większości procesów uczenia się w zachowywaniu gatunku, trzeba przyjąć istnienie wrodzonych mechanizmów uczenia się. Również te "instruktaże" należą do warunków możliwości doświadczenia, odpowiadających kantowskiej definicji tego, co aprioryczne: wrodzone instruktaże są tym właśnie, co jest dane przed wszelkim uczeniem się i dane być musi, aby uczenie się umożliwić.

Kiedy przyrodnik ma do czynienia z jakimś złożonym systemem sposobów zachowania, który do sprawnego funkcjonowania wymaga adaptacyjnej modyfikacji przez uczenie się, wówczas jest dla niego bardzo nęcącym przedsięwzięciem wytropić w tym systemie miejsca zawierające utrwalony genetycznie, otwarty program procesów uczenia się. Związana w genomie informacja, która jest tu podstawą wszystkiego, może tkwić w najrozmaitszych mechanizmach narządów zmysłowych i systemu nerwowego. Może być na przykład skoncentrowana w mechanizmach czysto receptorycznych. Przy tym typie zachowań, który Wallace Craig nazwał awersjami, ja zaś za Moniką Meyer-Holzapfel wolę określić jako apetencję do stanów spoczynku, filogenetycznie zaprogramowane procesy receptoryczne powiadamiają organizm, że w świecie zewnętrznym "coś jest nie tak". Może być za sucho, za wilgotno, za ciepło, za zimno, za jasno, za ciemno, zasolenie wody może być zbyt duże lub zbyt małe, biotop dawać zbyt skąpą osłonę lub zawierać zbyt wiele ograniczających widoczność struktur itd., itp. Podniecenie motoryczne, w którym znajduje się zwierzę, dopóki zachodzi "wzbudzająca awersję" sytuacja, może przybierać najrozmaitsze formy i ogarniać różne poziomy organizacji, od najprostszej kinezy aż po skomplikowane, nakierowane na cel sposoby zachowania, do których należy uczenie się i rozeznanie [Używany jest też termin: wgląd - przyp. tłum.]. Gdy zachodzi modyfikacja adaptacyjna, dotyczy ona zawsze sposobów znajdowania drogi. Tak dochodzi do wyuczania się drogi: są to prawdziwe reakcje warunkowe, które najszybciej wyprowadzają organizm z zasięgu niepokojącego bodźca.

Podobnie rozpowszechniony i równie prosto zaprogramowany jest inny jeszcze wrodzony typ powstawania reakcji warunkowych, dzięki któremu zwierzę osiąga ważną zdolność utrzymywania stałych warunków wewnątrz organizmu przez skierowane na zewnątrz zachowanie, tzw. zdolność zabezpieczania homeostazy przez reakcje celowe. Wiemy z własnego doświadczenia, że jeśli coś jest nie w porządku, w którymś z rozmaitych obwodów regulacyjnych naszego ciała, otrzymujemy wówczas niezawodny o tym meldunek. Ten meldunek "czujnika" może mieć charakter swoisty, jak na przykład przy braku określonych substancji w tkankach. Najpospolitszymi przykładami są głód i pragnienie. Najstarsi behawioryści, jak Thorndike, byli zdania, że zaspokojenie zapotrzebowania tkanek (tissue needs) jest najważniejszym z potwierdzeń dających w efekcie samoprzyuczania się (Selbstdressuren). Nie stawiano przy tym w ogóle pytania, skąd organizm jako całość, zwłaszcza jego system nerwowy, ma "wiedzieć", czego mu brak i jakimi sposobami zachowania mógłby temu brakowi zaradzić.

Innym przykładem mechanizmu, który - acz w nieco odmiennym sensie - melduje o niepożądanym stanie rzeczy jest zmysł bólu. Jego szczególną umiejętnością jest lokalizacja zakłócenia, dowiadujemy się od razu, gdzie tkwi błąd i ból nie pozwala nam o tym zapomnieć. Jednakże spośród meldunków o zaburzeniach homeostazy, nadsyłanych nam przez nasze ciało, interesujące są zwłaszcza te, które są w małym stopniu zlokalizowane. Nie potrafimy wówczas powiedzieć nic innego jak to, że jest nam niedobrze. Np. przy jakiejś drobnej infekcji nie jesteśmy w ogóle w stanie określić miejsca zaburzenia, nawet jeśli "czujemy się zdechle". Kiedy natomiast komuś "chce się rzygać", wówczas informacja jest już lepiej umiejscowiona i nieraz można nawet powiedzieć, dlaczego ów ktoś źle się czuje. Najwyraźniej na tym właśnie polega wartość takiego doniesienia dla zachowania gatunku. Jeśli np. złe samopoczucie wynikło ze spożycia nadpsutego pokarmu, wówczas w drodze "swobodnego" - jak mówią psychoanalitycy - "kojarzenia" przyjdzie nam na ogół na myśl nieco podejrzana potrawa, którą jedliśmy poprzedniego dnia, i skoro tylko to sobie uprzytomnimy, związek przyczynowy stanie się dla nas subiektywnie pewny. Warunkowe reakcje unikania, które występują w następstwie takich przeżyć, mogą się utrzymywać bardzo długo, nieraz przez całe życie.

Wrodzony mechanizm uczenia się, który wytwarza te reakcje warunkowe stosując złe samopoczucie jako "karę" i dobre jako potwierdzenie, może być zaprogramowany bardzo ogólnie. Potrzebny mu jest jeden tylko, w sensie techniki regulacji, czujnik w każdym z rozmaitych obwodów regulacyjnych organizmu i wystarcza, by karał za każdą zmianę oddalającą od wartości pożądanej, nagradzał zaś każde zbliżenie. Na tej zasadzie polega w rzeczy samej mechanizm, który określa dobór diety u wielu "euryfagów", tzn. zwierząt żywiących się rozmaitym, w szerokim zakresie, pokarmem. Kurt Richter ustalił już przed wielu laty, że szczury, którym podaje się rozmaite potrzebne im w pożywieniu substancje w wielu różnych naczyniach - białka rozdzielano nawet przy tym na poszczególne aminokwasy - biorą z każdej miseczki dokładnie tyle, ile wymaga dobrze wyważona dieta. Ponieważ nie sposób, by szczur mógł dysponować nabytą filogenetycznie informacją o tym, jakie aminokwasy dają się zsyntetyzować w pożywne dla niego substancje białkowe i ile każdego z nich trzeba, wiedza zwierzęcia musi pochodzić skądinąd. Doniosłe rezultaty na temat zaprogramowania wrodzonego mechanizmu uczenia się, który dostarcza szczurowi tej informacji, przyniosły badania J. Garcii i F. R. Ervina. Szczura można przyuczyć lub oduczyć przyjmowania określonych substancji pokarmowych jedynie przeżyciami, których źródło tkwi w trzewiach. Wymienieni badacze używali jako bodźców karnych zastrzyków apomorfiny wywołujących mdłości i wymioty albo też promieniowania rentgenowskiego w dawkach powodujących te same konsekwencje w postaci tzw. kociokwiku porentgenowskiego. Bezskuteczne natomiast były wszelkie próby oduczenia szczurów przyjmowania określonych substancji pokarmowych przy zastosowaniu bodźców bólowych i innych najcięższych kar. Z drugiej strony równie niemożliwe okazało się oduczenie zwierząt za pomocą wspomnianych bodźców trzewnych jakiegokolwiek innego sposobu zachowania, niż właśnie przyjmowania określonych pokarmów.

Zarówno przy adaptacyjnej modyfikacji zachowania apetencyjnego zmierzającego do stanów spoczynku, jak i przy samoprzyuczaniu się do określonych substancji pokarmowych, o którym dopiero co była mowa, na pierwszy plan wysuwają się warunkowe reakcje unikania.   Uogólniający termin awersji, użyty przez Craiga, jest więc w pewnej mierze usprawiedliwiony. Nigdy jednak nie można rozstrzygnąć obiektywnie, czy zwierzę, które na przykład przepełza ze środowiska chłodniejszego w cieplejsze, ucieka od chłodu czy też poszukuje ciepła; właśnie dlatego bardziej mi odpowiada termin Moniki Meyer-Holzapfel. Pewne jest przecież, że tak czy inaczej organizm znajduje się w stanie podniecenia i że właśnie eliminacja podniecenia działa jak potwierdzenie przyuczające. Jest to ów, uznany przez C.L.Hulla za szczególnie ważny, typ potwierdzania przez spadek napięcia - relief of tension.

Istnieją też modyfikowalne systemy zachowań, w których informacja wrodzona tkwi nie tylko w receptorycznym mechanizmie wywoławczym, analizującym sytuację bodźcową, lecz raczej w samej wywoływanej koordynacji dziedzicznej. Dobry przykład stanowi budowanie gniazda przez kawki (Coloeus monedula L.) oraz inne krukowate (Corvidae). Stojąc w środku przyszłego gniazda ptak z materiałem budowlanym w dziobie wykonuje swoisty dygocący ruch popychania, szerokim zamachem w bok i nieco od siebie, wciskając i wbijając materiał w podłoże lub w już uprzednio zbudowane części gniazda. Jeśli spotka się przy tym z oporem, dygotanie wzmaga się, ciągłe zaś pchanie przechodzi w serię energicznych, identycznie skierowanych uderzeń, które w skutkach mechanicznych są dość podobne do ruchów wykonywanych wyciorkiem przez człowieka czyszczącego fajkę, kiedy przy wprowadzaniu narzędzia do przewodu natrafia ono na opór. Jeśli ptak przyniósł gałązkę lub podobny przedmiot, materiał zostanie stopniowo wciśnięty i wreszcie, po długich wysiłkach budowniczego, utkwi na dobre i nie będzre go już można ani wyciągnąć, ani wepchnąć głębiej. Skoro to tylko nastąpi, ruchy "popychającego dygotania" osiągają orgazmiczne maksimum i urywają się z kryzysową nagłością. Ptak przestaje się teraz interesować przyniesionym przedmiotem i chwilowo nawet w ogóle budową gniazda. Popychające dygotanie, którego nagłe urwanie zaspokaja popęd, jest typowym przykładem działania końcowego consummatory act, czyli działania spełniającego lub konsumacyjnego w ujęciu Wallace'a Craiga.

W przeciwieństwie do wielu różnych ptaków śpiewających, kawki i inne krukowate nie dysponują najwyraźniej żadną umiejscowioną w mechanizmie wywoławczym informacją o tym, co się nadaje do budowy gniazda. Kiedy odzywa się u nich po raz pierwszy popęd do budowania, znoszą najbardziej nieprawdopodobne przedmioty i usiłują je umocować w nadającym się do budowy gniazda miejscu, za pomocą popychającego dygotania. O tym, które miejsce się nadaje, wiedzą w sposób wrodzony. Widywałem kawki i kruki popychające takimi dygotkami odłamki szkła, stare oprawki od żarówek, nawet kawałki lodu. Nie chciało się to oczywiście trzymać, nie dochodziło do działania końcowego zaspokajającego popęd. I oto ptak uczy się bardzo prędko używania tylko takich przedmiotów, od których przy popychającym dygotaniu przychodzą zwrotne meldunki, czyli "reaferencje" zaprogramowane we wrodzonym mechanizmie uczenia się jako potwierdzenia. Wystarczają one, by przyuczyć ptaka do wyboru materiałów, z których za pomocą ruchu instynktowego może upleść konstrukcję szczególnie wytrzymałą. Zdarza się czasem, że ten wrodzony instruktaż zawodzi, co wobec zwięzłości informacji wrodzonej jest łatwe do pojęcia: drut lub skrawek blachy dają oczywiście szczególnie mocne reaferencje, toteż bywa, że ptak przyuczy się do tego materiału, który ze względu na swe przewodnictwo cieplne jest biologicznie nieprzydatny. W pobliżu zakładów przemysłowych metalowe gniazda nie są wcale rzadkością. Sprawa ta jest przykładem odziaływania tzw. ponadnormalnego obiektu, reakcja na taki obiekt ma, jak potem jeszcze zobaczymy, charakter przywary.

Bardziej skomplikowane są procesy uczenia się, dzięki którym następuje u szczura zintegrowanie w jedną funkcjonalną całość rozmaitych ruchów instynktowych budowy gniazda. Jak zdołał wykazać L. Eibl-Eibesfeldt, każda z uczestniczących koordynacji dziedzicznych oddzielnie jest całkowicie wrodzona. W jedynym przypadku jest też tak samo z kolejnością tych koordynacji: szczur "wie" z przyrodzenia, że budowę powinien rozpocząć od zbierania materiału daleko od przyszłego gniazda i zanoszenia go następnie na miejsce. Szczury wyhodowane przez Eibl-Eibesfeldta w klatkach, gdzie nie było żadnych dających się przenieść przedmiotów, używały jako namiastki własnego ogona: najpierw, daleko od zwykłego legowiska, brały go w zęby, zanosiły "do domu" i starannie składały na właściwym miejscu. Ponieważ zamierzeniem było eksperymentowanie z osobnikami pozbawionymi doświadczenia, trzeba było powtórzyć tę próbę z takimi szczurami, którym we wczesnej młodości, na długo przed rozbudzeniem się działań budowlanych, obcięto ogony. Kiedy takim osobnikom już dorosłym dostarczono miękkich skrawków papieru, natychmiast przystępowały do budowy. Te z nich, które miały w niepoprzegradzanym pojemniku stałe preferowane legowisko, od razu tam właśnie składały znoszone skrawki. U tych, które przed eksperymentem układały się zazwyczaj na spoczynek to tu, to tam, trwało kilka minut, nim zdecydowały się na jakieś określone miejsce budowy. Osłonięcie jednego z narożników kawałkiem blachy o rozmiarze kilku centymetrów kwadratowych spowodowało, że wszystkie poddane eksperymentowi zwierzęta tam właśnie ulokowały budowę.

Działalność budowlana szczurów pozbawionych doświadczenia różniła się w wymowny sposób od działalności normalnych zwierząt kontrolnych. Była przede wszystkim o wiele bardziej wytężona. Niedoświadczone szczury rzucały się wprost chciwie na materiał do budowy, co tłumaczyło się spiętrzeniem nigdy nie odreagowanych ruchów instynktowych, a czego jak najbardziej należało się spodziewać. Ważna różnica polegała jednak na tym, że w działaniu szczurów poddanych eksperymentowi brakowało kolejności koordynacji dziedzicznej, znamiennej dla osobników doświadczonych w budowaniu gniazd. Szczur doświadczony przystępując do budowy ogranicza się do znoszenia materiału dopóty, dopóki nie uzbiera pokaźnego stosu. Wtedy obracając się wokół osi pionowej ściąga ten materiał koncentrycznie ku sobie tak, że wokół środka gniazda wyrasta pierścień ściany. Dopiero wówczas gdy ściana osiąga dostateczną wysokość, doświadczone zwierzę przechodzi do tak zwanego "tapetowania", które polega na ubijaniu i wygładzaniu przednimi łapkami wewnętrznej powierzchni ściany. Szczury, z którymi eksperymentował Eibl-Eibesfeldt, wykonywały od razu każdy z tych rodzajów ruchu w sposób doskonale skoordynowany, również analiza filmu ze zwolnionymi zdjęciami nie wykazała żadnych różnic w porównaniu z ruchami doświadczonych współplemieńców. Brakowało jednak zupełnie wspomnianej uprzednio kolejności, szczur przybiegał gorliwie z jednym papierowym skrawkiem i złożywszy go zaraz wykonywał w powietrzu ruch wznoszenia lub wygładzania, bez ładu i składu.

Modyfikowalny system jest w całości bardziej skomplikowany u szczura niż u kawki, ale każdy z większości istniejących u nich wrodzonych mechanizmów uczenia się funkcjonuje według tej samej zasady. W obu przypadkach przyuczenie i utwierdzenie określonego następstwa ruchów następuje za sprawą dwóch procesów. Po pierwsze, dzięki temu, że koordynacja dziedziczna w tej formie może być źródłem nagradzającego meldunku zwrotnego tylko w najzupełniej określonej, przewidzianej w programie sytuacji w otoczeniu. Po drugie zaś dzięki samemu meldunkowi o sukcesie lub niepowodzeniu, który składają mechanizmy ekstero- i prawdopodobnie również prioprioceptoryczne.

Jest też prawdopodobne, że bezpośredni wpływ oduczający wywiera samo, by tak rzec, spalenie na panewce ruchu instynktowego, który nie daje żadnych reaferencji. W każdym razie przy bezpośredniej obserwacji omawianych tutaj procesów uczenia się odnosi się wrażenie, że szczur o wiele ładniej, i z o wiele większą satysfakcją, potrafi się delektować ruchem wznoszenia ściany, kiedy materiał jest już na miejscu, oraz że ruch tapetowania daje pełną satysfakcję dopiero wtedy, gdy ściana już stoi.

Mając na uwadze czytelnika zainteresowanego teorią uczenia się zauważę, iż procesy uczenia się, przy których duża część informacji wrodzonej zlokalizowana jest nie w sektorze receptorycznym, lecz w samym sposobie poruszania się skoordynowanym dziedzicznie, dają się podciągnąć pod pojęcie "warunkowania sprawczego", czyli instrumentalnego (operant conditioning) [Operant conditioning, czyli tzw. warunkowanie instrumentalne jest terminem, którego związek z behawioryzmem Lorenz podkreśla zachowując angielski - przyp. tłum.]. W tym przypadku jednak nie sprowadza się ono do jakiegoś prostego ruchu o wielorakim zastosowaniu, do, powiedzmy, drapania czy grzebania przednią łapą, ruchu zatem mogącego z łatwością przynieść za którymś razem potwierdzający sukces całkiem przypadkowo - jak to się dzieje choćby przy pociśnięciu dźwigni w skrzynce Skinnera lub w jednej z dawniejszych "sekreter", skrzynek z tajemnym mechanizmem - lecz polega na wysoce zróżnicowanym ruchu instynktowym, który przydatny jest do wykonywania jednego tylko swoistego zadania, właśnie tego, dla którego się zrodził w filogenezie dysponującego nim gatunku.

W przypadku prostych sposobów poruszania się o wielorakim zastosowaniu obowiązują prawidłowości sformułowane przez B. F. Skinnera dla procesu uczenia, się, określanego przez niego jako typ R-conditioning (warunkowanie R). Pierwsze z tych praw orzeka, iż siła warunkowania instrumentalnego wzrasta, jeśli występuje po nim utwierdzająca sytuacja bodźcowa. Drugie prawo orzeka, iż siła ta zmaleje, jeśli po utwierdzonym już przez conditioning warunkowaniu instrumentalnym nie wystąpi utwierdzający bodziec. Prawa te sprawdzają się, jeśli warunkowanie instrumentalne jest tzw. reakcją narzędziową, jak lokomocja lub inne proste sposoby poruszania się służące rozmaitym popędom. Prawa te obowiązują jedynie częściowo wówczas, gdy warunkowanie instrumentalne jest ruchem instynktowym, do którego apetencja motywuje zwierzę. W tym przypadku zachowanie poprzedzające zostanie wprawdzie na dalszą metę utwierdzone przez sukces, chwilowo jednak będzie nawet wskutek niego radykalnie wygaszone. Najpierw następuje zaspokojenie popędu. Dopiero po ponownym jego rozbudzeniu da o sobie znać wpływ przyuczający. Natomiast brak potwierdzenia nie skłania wcale zwierzęcia do rezygnacji z warunkowania instrumentalnego. Ponieważ jest on koordynacją dziedziczną z autonomicznym napędem, brak zaspokojenia ma ten tylko skutek, że zwierzę stara się o zaspokojenie tego sposobu poruszania się w innych sytuacjach i na innych obiektach, ale z rosnącą apetencją.

Uwydatnienie tych różnic ważne jest dlatego, że metodę prób i błędów, którą opisaliśmy powyżej na przykładzie kawek i szczurów i którą posługuje się w ten sam sposób bardzo wiele zwierząt, można by pomylić z tak zwanym zachowaniem eksploratywnym, czyli z ciekawości, o którym mowa będzie później.

Przy wyżej opisanych procesach ruch instynktowy wykonywany jest pod naciskiem własnej, w nim samym tkwiącej motywacji, toteż zwierzę wypróbowuje ten sposób poruszania się bez zmiany wobec najrozmaitszych obiektów. Natomiast w przypadku zachowania z ciekawości we właściwym sensie organizm - jak to przekonywająco przedstawiła Monika Meyer-Holzapfel - wprawia w ruch motywacja najzupełniej odmiennego rodzaju, niezależnie od popędowego ciśnienia poszczególnego ruchu instynktowego. Nie jeden ruch instynktowy jest wówczas wypróbowany wobec rozmaitych obiektów, lecz jeden obiekt jest poddawany po kolei próbie wielu ruchów instynktowych, często całego repertuaru czynności, jakim dysponuje zwierzę. Oba procesy uczenia tym różnią się od klasycznego operant contitioning, że w tym ostatnim warunkowanie instrumentalne reprezentowane jest przez ogólnie stosowalną reakcję narzędziową, która może być wywołana pod ciśnieniem bardzo rozmaitych motywacji.

Szczególnie interesującą i nieoczekiwaną lokalizację informacji wrodzonej wykrył M. Konishi badając, jak formuje się pienie u młodych ptaków śpiewających. O wielu gatunkach z tej grupy wiadomo, że pienie zgodne we wszystkich szczegółach z normą gatunkową, ukształtuje się u niedoświadczonego młodego osobnika tylko pod warunkiem, że usłyszy on śpiew dorosłego współplemieńca. Podobnie badania J. Nicolai'a ujawniły zdumiewający fakt, że niektóre ptaki, jak np. gil, uczą się wyłącznie od ściśle określonych osobników, z którymi pozostają w równie ściśle określonych i bardzo bliskich stosunkach społecznych. Wiedziano również, że młode ptaki wielu gatunków, w których obowiązuje nauka przez naśladownictwo, wybierają sobie za wzór własny śpiew gatunkowy nawet wówczas, gdy słyszą dużo innych głosów ptasich i gdy głosy współplemieńców nie są przy tym wcale ani najgłośniejsze, ani najbardziej się wyróżniające. Oskar Heinroth zaobserwował poza tym, że wyhodowane w izolacji młode z gatunków, w których niezbędny jest wzór współplemieńca, w końcu, po długich próbach, potrafią jednak wydać pienie w przybliżeniu zgodne z normą gatunkową. Heinroth przypuszczał, że zachodzi "samonaśladowanie".

Odkrycia Konishiego przyniosły wyjaśnienie wszystkich tych zjawisk. Ptaki, którym Konishi niszczył narząd słuchu w najwcześniejszej młodości, wydawały jako dorosłe pienie złożone raczej ze szmerów, niż z tonów i pozbawione jakiejkolwiek struktury. Tak samo było w przypadku gatunków, w których u osobników podrastających w dźwiękoszczelnych pomieszczeniach, ukształtowało się pienie wyraźnie rozpoznawalne gatunkowo. Wynika stąd zdumiewający, ale nieodparty wniosek, że pozbawiony doświadczenia ptak dysponuje receptorycznym wzorcem - Konishi mówi o auditory template - swego swoistego gatunkowo pienia. Cicho, jakby dla igraszki podśpiewując, ptak na podobieństwo gaworzącego dziecka wypróbowuje najrozmaitsze kombinacje dźwięków i zachowuje te, które najlepiej odpowiadają "majaczącemu" mu, gatunkowemu szablonowi akustycznemu. Cichy przedśpiew, który nasi miłośnicy ptaków tak ładnie nazwali "komponowaniem", ma więc charakter eksplorującej gry.

Omówione przykłady filogenetycznie zaprogramowanych mechanizmów uczenia się wystarczająco ukazują trzy fakty ważne w kontekście niniejszej książki.

Po pierwsze: dzięki odpowiedniej analizie eksperymentalnej można zawsze w zasadzie wskazać, w którym podsystemie złożonego i podatnego na modyfikację systemu zachowań tkwi informacja wrodzona, stanowiąca rękojmię, że zwierzę przyuczy się do sposobów zachowania celowych w sensie utrzymania gatunku.

Po drugie: nie można zrozumieć żadnego poszczególnego procesu uczenia się nie znając całego systemu, którego modyfikację proces ten sprawia.

Po trzecie: niemożliwe są żadne wiążące orzeczenia, co działa utwierdzająco - jako reinforcement - w uczeniu się w ogóle. Teoria Thorndike'a, że istotnym potwierdzeniem jest zaspokojenie zapotrzebowania tkanek, czy też teoria Hulla dopatrująca się istotnego czynnika przyuczającego w odprężeniu nerwowym - relief of tension - są trafne jedynie w odniesieniu do przypadków szczególnych. W każdym poszczególnym przypadku uczenia się trzeba odrębnie badać fizjologiczną naturę procesu utwierdzania.


VI. 5. MODYFIKOWALNE PODSYSTEMY I ICH ADAPTACYJNA ZMIENNOŚĆ

W rozważaniach powyższych, jeszcze gruntowniej zaś w książce Evolution and Modification of Behaviour (Ewolucja i modyfikowanie zachowań, Harvard University Press 1965), starałem się wykazać, iż nie sposób przyjmować możliwości modyfikacji adaptacyjnej wszystkich w ogóle występujących cząstkowych procesów zachowania, chyba że uciekniemy się do witalistycznego założenia przedustawnej harmonii pomiędzy organizmem a środowiskiem. Warunkiem wstępnym wszelkiej podatności na modyfikację, jeśli ma się ona okazać wartościowa dla zachowania gatunku, jest w sposób oczywisty obecność filogenetycznie powstałego programu otwartego, i ponadto jeszcze mechanizmu uczenia się, również zaprogramowanego filogenetycznie, w rodzaju omawianych w poprzednim podrozdziale. Powszechna bez reszty plastyczność wszystkich sposobów zachowania oznaczałaby z założenia nieskończoną mnogość zarówno informacji filogenetycznej, jak i tych mechanizmów uczenia się, co jest oczywiście nonsensem.


VI. 6. REAKCJA  WARUNKOWA,  PRZYCZYNOWOŚĆ I PRZEMIANA DYNAMICZNA

Zdarza się nieraz, jak już wspomniano na wstępie, że aparaty poznawcze o różnych poziomach integracji powstały najwyraźniej w przystosowaniu do tej samej danej pozapodmiotowej. Czasem aparaty takie przypadają w udziale, każdy oddzielnie, formom zwierzęcym o różnych poziomach rozwoju, czasem znajdują się, funkcjonując niezależnie od siebie, u jednego i tego samego gatunku. Dotyczy to także aparatów, o których teraz będzie mowa.

Najważniejsze z osiągnięć, które przyniosła umiejętność formowania reakcji warunkowych, polega, jak to podkreślił E. C. Tolman w książce Purposive Behaviour of Animals and Man (Zachowanie celowe u zwierząt i człowieka) na tym, że pozwala ona organizmowi oceniać pewien określony układ bodźców, sam w sobie biologicznie nierelewantny, jako zapowiedź rychłego wystąpienia sytuacji w sensie życiowym ważnej i przygotować się do niej.

Miałem niegdyś możność obserwować, jak półdzikie kozy w górach Armenii, słysząc daleki jeszcze grzmot, przezornie podążały ku określonym wydrążeniom skalnym, rozsądnie oczekując ulewy. Tak samo postępowały słysząc huk odpalanych w pobliżu ładunków. Przypominam sobie dokładnie, że właśnie obserwując te kozy, nagle uprzytomniłem sobie po raz pierwszy jasno, iż w sytuacjach naturalnych z uformowania się reakcji warunkowych wynika coś sensownego w rozumieniu zachowania gatunku tylko wtedy, gdy bodziec warunkowy pozostaje w przyczynowym związku z bezwarunkowym.

Niezawodnie regularne post hoc, od którego zależy wartość reakcji warunkowej dla zachowania gatunku, nigdy nie zachodzi w wolnej przyrodzie bez związków przyczynowych, które wówczas łatwo przejrzeć. W zasadzie jednak związki takie istnieją także wówczas, gdy jakiś eksperymentator regularnie uruchamia "dzwon obiadowy" przed karmieniem pawłowowskiego psa. Oczywiście, przyczynowe zdeterminowanie w zachowaniu badacza wymyka się jeszcze tymczasem naszej analizie.

Sądzę, że wykazując teleonomiczność reakcji warunkowej rzuca się istotne światło na pewien błąd w empiryzmie Hume'a, który jest także przedmiotem krytyki w książce Karla R. Poppera Objective Knowledge (Wiedza obiektywna). Ze stanowiska czystej logiki niemożliwością jest, jak pokazuje Hume, wnioskować o konieczności powtórzenia się określonego następstwa zdarzeń nawet z dowolnie wielkiej liczby precedensów; nie można też nawet wnosić, iżby prawdopodobieństwo takiego domniemania rosło wraz z liczbą powtórzeń. W związku z tą tezą logiczną Hume stawia następujące pytanie psychologiczne, skąd to się bierze, że każdy rozumny człowiek oczekuje z wielką pewnością, iż słońce wzejdzie również nazajutrz, iż upuszczony kamień spadnie na ziemię i że w ogóle sprawy na świecie będą się nadal toczyć jak dotychczas. Wielki empirysta odpowiada na to pytanie twierdząc, że chodzi tu o skutek przyzwyczajenia - custom of habit - innymi słowy, że dzięki wielokrotnemu powtarzaniu uruchomiony zostaje mechanizm kojarzenia idei bez którego, powiada Hume, nie bylibyśmy w ogóle zdolni żyć.

Jak pokazuje Popper, sprzeczność pomiędzy logiką i zdrowym rozsądkiem - common sense - nie tylko kazała wielu myślicielom zwątpić o możliwości wiedzy obiektywnej, lecz również samego Hume'a popchnęła ku wierze w nieracjonalną epistemologię. Popper powiada o nim: "Powtarzanie nie ma żadnej mocy dowodowej, chociaż panuje nad naszym życiem poznawczym czy też naszym «pojmowaniem»; ten uzyskany przez Hume'a rezultat prowadzi go do wniosku, że dowody bądź rozum odgrywają jedynie podrzędną rolę w naszym pojmowaniu. Nasza «wiedza» zostaje zdemaskowana jako mająca charakter przeświadczenia i to przeświadczenia nie dającego się racjonalnie bronić, irracjonalnej wiary." ("His result that repetition has no power whatever as an argument, although it dominates our cognitive life or our «understanding» led him to the conclusion that argument or reason plays only minor role in our understanding. Our «knowledge» is unmasked as being not only of the nature of belief, but of rationally indefensible belief - of an irrational faith.")

Chciałbym zacytować trzy zdania z przejrzystego wywodu, w którym Karl Popper ukazuje wyjście z tej aporii; nawet wyrwane z kontekstu dokumentują one zasadniczą zgodność pomiędzy wynikami logiki i etologii. Popper pisze: "Rozróżnienie pomiędzy problemem logicznym i psychologicznym, zawarte implicite w rozumowaniu Hume'a, uważam za niezwykle doniosłe. Nie sądzę jednak, by zadowalający był pogląd Hume'a na to, co ja jestem skłonny nazwać «logiką». Opisuje on, jakże jasno, procesy ważnego wnioskowania, ale rozpatruje je jako «racjonalny» proces umysłowy." ("I regard the distinction, implicit in Hume's treatment, between a logical and a psychological problem as of the utmost importance. But I do not think that Hume's view of what I am inclined to call «logic» is satisfactory. He describes, clearly enough, processes of valid inference, but he looks upon these as «rational» mental process.")

Do zasad metodologicznych Poppera należy transponowanie wszelakiej terminologii subiektywnej na obiektywizującą, kiedy tylko wchodzą w grę problemy logiczne. Powiada on wprost: "Co jest prawdziwe w logice, jest prawdziwe w psychologii." ("What is true in logic, is true in psychology.") Ta zasada transponowalności - principle of transference - pomiędzy subiektywnym i obiektywnym odpowiada ściśle przeświadczeniu wyrażonemu przez nas w "Prolegomenach" o zasadniczej tożsamości wszystkich procesów przeżywania z procesami fizjologicznymi.

Myślenie logiczne, nie inaczej niż formowanie reakcji warunkowych i niezliczone inne procesy "psychologiczne", jest dokonaniem ludzkiego aparatu światoobrazu, który jako całość pozostaje wobec danych rzeczywistości pozapodmiotowej w owym stosunku odpowiedniości, wielokrotnie już tu wspomnianym (Prol. 3.). Gorzki wniosek empiryzmu Hume'a, iż naprawdę wszelka nasza wiedza jest jedynie najzupełniej bezpodstawną wiarą, byłby tylko wtedy słuszny, gdyby słuszne było zdanie: Nihil est in intellectu quod non antefuerat in sensu - nie ma niczego w umyśle, czego by wpierw nie było w czuciu (percepcji zmysłowej).

Wiemy już jednak, jak fałszywe jest to zdanie, wiemy, że ilekroć następuje przystosowanie, jest to proces poznawczy oraz że dany nam a priori aparat, dzięki któremu dopiero możliwe jest indywidualne zdobywanie doświadczenia, sam już zakłada obecność mnóstwa informacji uzyskanej filogenetycznie i nagromadzonej w genomie. Hume tego wszystkiego jeszcze nie wie; behawioryści nie chcą tego wiedzieć.

Kiedy spotykamy się z powtarzalnością w zachodzeniu jakiegoś określonego zdarzenia, każdego z nas coś przymusza przyjąć, że pomiędzy poszczególnymi manifestacjami istnieje jakiegoś rodzaju związek, nie dający się najpierw bliżej zdefiniować. Pamiętam dobrze, że jako uczeń długo nie chciałem uwierzyć memu nauczycielowi, iż kiedy w ruletce bardzo dużo razy wychodziło czerwone, to prawdopodobieństwo zatrzymania się kulki przy następnym rzucie na czarnym nie wzrasta wraz z liczbą powtarzających się wygranych czerwonego. Nauczyciel przekonał mnie w końcu argumentem: "Popatrz, kółko nie przypomina sobie przecież, co było poprzednio, każdy kolejny rzut jest znów taki sam jak pierwszy, czarne i czerwone są w nim równie prawdopodobne." Rozmawiałem z bardzo wieloma ludźmi, którzy zaobserwowali u siebie ten sam nie dający się logicznie wyjaśnić przymus. Pytanie interesujące, ale niełatwo o odpowiedź na nie: jaki to właściwie realny mechanizm przypisuje się takimi oczekiwaniami kołu ruletki? Rzecz ma się bez mała tak, jakbyśmy spodziewali się po nim, jak po żywej istocie, że po tak wielu powtórzeniach zmęczy się stale tym samym sposobem zachowania i zapragnie odmiany.

O wiele łatwiej odpowiedzieć na pytanie, dlaczego przeżywszy kilkarotnie pewną sekwencję zdarzeń skłonni jesteśmy te z nich, które zachodzą najpierw, traktować jako niezawodną zapowiedź późniejszych.

Taki przymus w myśleniu i zachowaniu byłby bezsensowny, gdyby rzeczywistość pozapodmiotowa przypominała koło ruletki i jej zdarzenia następowały po sobie, jak w ruletce, w rozkładzie przypadkowym.

Otóż w wolnej przyrodzie zdarzenia o czysto przypadkowym rozkładzie, następujące po sobie na podobieństwo rozgrywek na ruletce, przytrafiają się niezmiernie rzadko. Natomiast łańcuchy zdarzeń, w których rezultat przemiany dynamicznej warunkuje przyczynowo jakieś regularne następstwo, są nie tylko częste, lecz wręcz wszechobecne. Kiedy po błyskawicy następuje grzmot lub po dalekim grzmocie ulewa i kiedy zdarzenia te zajdą w tej samej kolejności jedno po drugim, choćby tylko kilka razy, wówczas z przytłaczającym wprost prawdopodobieństwem można przyjąć, że wszystkie trzy zdarzenia pozostają ze sobą w związku przyczynowym. Jednakże spowodowanie jednego zdarzenia przez drugie zakłada zawsze przemianę dynamiczną w jakiej bądź formie. Także prawdopodobieństwo przypuszczenia, że określony łańcuch zdarzeń utrzymuje się za sprawą powiązania przyczynowego, wzrasta wraz z liczbą zaobserwowanych przypadków. Realium pozapodmiotowe, które fizyk stara się ująć twierdzeniem o zachowaniu energii, jest bez wątpienia tożsame z tym, które odzwierciedla przystosowanie w formie co najmniej dwóch różnych aparatów poznawczych: po pierwsze - w formie omawianej tutaj umiejętności wytwarzania reakcji warunkowych, a nawet w ogóle tworzenia skojarzeń, po drugie zaś - we właściwej ludzkiemu myśleniu formie kauzalności.

Reakcja wymijania u pantofelka i złożona centralna reprezentacja przestrzeni u najwyższych istot żywych stanowią przystowania do tej samej danej realnej, mianowicie do nieprzenikliwości ciał i do ich rozkładu w przestrzeni. Analogicznie wytwarzanie reakcji warunkowych i myślenie kauzalne są przystosowaniami do tego samego realium, mianowicie do zachowania energii i jej zdolności do przemiany.

Błędne jest mniemanie empirystów, jakoby myślenie kauzalne człowieka powstało jedynie za sprawą przyzwyczajenia i jakoby nasze propter hoc, nasze "wskutek tego, że", było tożsame z często przeżywanym i godnym zaufania post hoc, "z reguły potem". Aksjomatyczna natura naszego myślenia kauzalnego nigdzie nie ujawniła się tak jasno, jak w zdaniach, którymi James Prescott Joule rozpoczyna swoją klasyczną rozprawę o równoważniku cieplnym. Naiwnie zarazem i apodyktycznie powiada on tam, że absurdem byłoby przypuszczać, iż jakaś forma energii może zniknąć nie przemieniając się w inną, tym samym postuluje coś, czego następnie dowodzi, a więc wcale nie potrzebowałby postulować. Podobnie, aprioryczny charakter myślenia kauzalnego wyraża się w odwiecznym "dlaczego" każdego inteligentnego dziecka.

Kilkakrotnie była już mowa (Prol. 2. i n.) o tym, że działanie prostszych aparatów poznawczych można kontrolować ze stanowiska bardziej złożonych i że przy takiej kontroli ich doniesienia nigdy nie okazują się fałszywe, lecz zawsze tylko uboższe informacyjnie niż w aparatach wyższych. Ten sam stosunek zachodzi najwyraźniej pomiędzy reakcją warunkową i myśleniem kauzalnym. Uczenie się z sukcesów i w ogóle wszelkie tworzenie skojarzeń ujmują ze wszystkich faktów przemiany dynamicznej tylko jeden: że przyczyna poprzedza skutek w czasie. To wystarcza, by umożliwić organizmowi podjęcie ważnych życiowo przygotowań.


VI. 7. UCZENIE SIĘ MOTORYCZNE

Wiedeński zoolog Otto Storch był, o ile mi wiadomo, pierwszym, który wyraźnie docenił fakt, że adaptacyjną modyfikację w sektorze receptorycznym zachowania zwierząt spotyka się już na znacznie niższym szczeblu rozwoju niż w sektorze motorycznym. Poza omówionym, w pierwszym podrozdziale niniejszego rozdziału, bardzo prostym procesem uczenia się, wdrażaniem motorycznym, wszystko, co było powiedziane dotychczas o teleonomicznych zmianach zachowania dzięki uczeniu się, odnosi się do procesów receptorycznych, do "receptoryki nabytej" (Erwerbsrezeptorik) w terminologii Storcha: uczulanie, habituacja, nawyk, urazowe kojarzenie ucieczki z określonymi sytuacjami bodźcowymi, a także wzrost selektywności wrodzonych mechanizmów wywoławczych - są to wszystko procesy polegające na zmianach w aparatach receptorycznych.

Na czym więc zasadzają się najprostsze teleonomiczne modyfikacje sprawności motorycznych? Zdolność reakcji warunkowej do antycypowania, pozwalająca organizmowi odpowiedzieć na bodziec warunkowy przez podjęcie celowych, w sensie utrzymania gatunku, przygotowań do spotkania oczekiwanego bodźca bezwarunkowego, umożliwia mu zarazem wyuczenie się kolejności, w jakiej winien wykonać określone ruchy instynktowe, z których każdym dysponuje z przyrodzenia. Na przykładzie budowania gniazda przez szczura zapoznaliśmy się już z takim procesem uczenia się. Przypuszczam, że na tej samej zasadzie polega wszelkie uczenie się motoryczne, jeśli nie chodzi o zwykłe wdrażanie omówione w V.2, lecz o prawdziwą reakcję warunkową. W najprymitywniejszych przypadkach zestawiane sposoby poruszania się są całościowymi i jako takie łatwymi do rozpoznania ruchami instynktowymi, jak u budującego gniazdo szczura. Jeśli elementy ruchowe zestawione tym trybem stają się prostsze i jeśli maleje ich rozciągłość w czasie, wówczas powstaje o wiele wyraźniejsze wrażenie, że chodzi o naukę nowego sposobu poruszania się. Stosunkowo prostego przykładu jak powstaje ciąg ruchowy, który budzi w podanym sensie wrażenie jednolitego, dostarcza wyuczanie się drogi przez myszy. Obserwacja myszy, która uczy się przedostawać przez wysokościenny labirynt, unaocznia nam różnicę pomiędzy swobodnym ciągiem ruchów sterowanym informacją chwilową a wykonaniem utrwalonej, wyuczonej sekwencji; pokazują to na przykład filmy z tych procesów sporządzone w 1952 roku przez O. Koehlera i W. Dinglera. W nieznanym terenie zwierzę przebija się do przodu dosłownie krok za krokiem, macając wąsikami w prawo i w lewo i wciąż na krótko zawracając. Już jednak za trzecim czy czwartym powtórzeniem przebiega czasem szybciej jakiś kawałek drogi, ale wnet znów utyka i powraca do uprzedniej formy orientowania się w przestrzeni. Przy dalszych powtórzeniach pojawiają się nowe odcinki krótkotrwałego przyspieszenia w innych miejscach trasy, mnożą się i wydłużają, aż wreszcie zlewają się w punktach styku. Kiedy na koniec w szybkim biegu znikają wszystkie "spawy", nauka drogi jest zakończona. Teraz mysz przebiega całą trasę w jednej jedynej, płynnej sekwencji ruchów.

Zespalanie urywkowych ruchów lokomocyjnych, którymi zwierzę dysponuje każdym oddzielnie, następuje w rzeczy samej dzięki temu, że jedna reakcja warunkowa sprzęga się z drugą, kolejną. Każdy ruch przynosi pewną oczekiwaną sytuację bodźcową, która z jednej strony powiada organizmowi, że znajduje się jeszcze na właściwej drodze, z drugiej zaś wywołuje kolejny impuls motoryczny.

W książce, która stała się klasyczna, Die Orientierung der Tiere im Raum (Orientowanie się zwierząt w przestrzeni), Alfred Kuhn opisał pod pojęciem mnemotaksji i mnemicznej homofonii dokładnie ten właśnie rodzaj uczenia się i tę samą formę sensorycznej kontroli wyuczonego procesu motorycznego, ale tylko jako możliwość teoretyczną. Z różnych stron wysunięto wówczas zarzut, że gdyby te przypuszczenia były słuszne, zwierzę byłoby zmuszone biec dokładnie po raz wyuczonym tropie i traciłoby orientację zboczywszy choćby o krok. Ponieważ Kuhn nie znał żadnego zwierzęcia, które by spełniało te wymagania, usunął z następnego wydania rozdział o mnemotaksji i mnemicznej homofonii - niesłusznie, gdyż zwierzęta, o których tutaj mowa, na przykład rzęsorek rzeczek (neomys fodiens Pali.), zachowują się dokładnie tak, jak każe przewidywać jego teoria. Ze szczególną wyrazistością widać to wtedy, gdy takiemu stworzeniu faktycznie zdarzy się zboczyć z drogi lub gdy, eksperymentując, celowo zakłóci się homofoniczną zgodność pomiędzy utrwalonym na dobre następstwem ruchów zwierzęcia a konfiguracją trasy. Kiedy zabrałem z toru moich rzęsorków przeszkodę w kształcie wzniesienia, na które przywykły wskakiwać, by biec po nim dalej, zwierzątka skakały w odpowiednim miejscu w powietrze i siadały najpierw zdezorientowane na ziemi tam, gdzie przedtem stał zabrany przedmiot, mała skrzynka drewniana. Następnie moje rzęsorki zaczynały badać teren wąsikami, zawracały i najwidoczniej rozpoznawały odcinek, który przebiegły przed chwilą, nim nastąpiło zakłócenie. Teraz więc znów zbierały się w sobie, zawracały w poprzednim kierunku, puszczały się pędem - i w krytycznym miejscu raz jeszcze skakały w pustkę! Przypominały mi dziecko, które recytując wiersz w jakimś miejscu utyka i zaczyna na nowo od wcześniejszego ustępu, aby przebrnąć przez to miejsce "z rozpędu".

Można chyba przypuścić bezpiecznie, że także nauka bardziej skomplikowanych celowych form poruszania się odbywa się według zobrazowanych wyżej zasad. Wprawdzie w przypadku wyuczania się drogi chodzi niemal wyłącznie o liniowe sprzęganie poszczególnych elementów ruchu pochodzących z dziedzicznych koordynacji lokomocyjnych, nie widać jednak, dlaczego by tego samego rodzaju procesy nie miały sprawiać integracji cząstkowych ruchów równoczesnych.

Wyuczone sekwencje ruchów są "znane na pamięć" i różni autorzy określali taką wiedzę jako "kinestetyczną". Doniesienia zwrotne proprioreceptorów odgrywają na pewno znaczną rolę w opanowaniu ruchu "umianego", co właśnie sugeruje to złożone słowo greckie: kinesis - ruch, aisthanomai - czuję. Wyrażenie jest trafne również fenomenologicznie, gdyż istotnie w sposób dobrze opanowany poruszamy się przecież "na wyczucie". Z drugiej strony termin ten sugeruje, iż to właśnie proprioreceptoryczne obrazy wspomnieniowe umożliwiają nam dokładne powtórzenie takiej sekwencji ruchów, to przypuszczenie zaś jest prawdopodobnie niesłuszne. Erich v. Holst pokazał już przed laty, że również dowolnie wytwarzane koordynacje ruchowe podlegają prawu efektu magnetycznego i koordynacji centralnej [Zapewne błąd: powinno być "proporcjonalnej" - przyp. tłum.], co ostatnio potwierdzono wielokrotnie. Dzięki badaniom J. Ecclesa wiemy, że narządem, w którym dokonuje się koordynacja dobrze opanowanych ruchów, jest móżdżek.

Nawet na najwyższym poziomie nauka poruszania się, jak o tym będzie jeszcze trzeba pomówić dokładniej w podrozdziale o ruchach dowolnych, nie różni się zasadniczo od wyuczania się drogi przez ssaki niższe. Chodzi tu zawsze o zaprogramowane w gotowej formie i centralnie koordynowane sposoby poruszania się, którymi zwierzę dysponuje z przyrodzenia, i które przez uczenie się są jedynie integrowane w nowe całości. Wraz z filogenetycznym rozwojem zwierzęcych umiejętności uczenia się ruchów, rozmiary tych elementów motorycznych maleją. Nawet jednak przy ruchach w pełnym sensie dowolnych elementy ruchowe znajdują się znacznie powyżej płaszczyzny integracji odpowiadającej skurczowi włókna, nie ma wątpliwości, że najczęściej obejmują one jeszcze ściąganie się kilku całych mięśni synergicznych, tzn. działających w jednym kierunku, są wszakże dość małe, by używając ich równocześnie lub kolejno można było zestawić każdą niemal "melodię ruchów".

Jest dość pewne, że podłoże lokomocyjnych elementów ruchowych stanowi endogenna produkcja bodźców oraz koordynacja centralna. Sądzę, że ani uczenie się, ani w ogóle jakiekolwiek oddziaływanie nie są zdolne adaptacyjnie odmienić tego rodzaju fizjologicznych przebiegów i że to jedynie mnogość procesów, któreśmy nazwali uprzednio (r. IV. 10.) płaszczem odruchów, może się na nie nakładać, pośrednicząc pomiędzy nimi a wymaganiami, jakie stawia świat zewnętrzny. Przemawia wszak za tym przypuszczeniem również znana nam już okoliczność, że tam, gdzie pośrednictwo płaszcza odruchów jest niewystarczające, podstawowa koordynacja dziedziczna bynajmniej, by tak rzec, nie "mięknie" i nie daje się wyginać taksjami, lecz rozpada się na drobne fragmenty, z których każdy jest wprawdzie równie "sztywny", jak sus cwałującego rumaka, ale które właśnie z racji ich krótkości mogą łatwiej i w sposób bardziej wielostronny sprostać wymaganiom wynikającym z rozeznania w przestrzeni.

Niewątpliwie szczególna wartość wpojonego, dobrze opanowanego ruchu dla zachowania gatunku polega w pierwszym rzędzie na tym, że może się on toczyć nieopóźniany czasami reakcji.

Widać, jak bardzo sekwencja ruchów opanowana na pamięć różni się pewnością celu i szybkością od ciągu sterowanego krok po kroku przez mechanizmy orientacyjne, kiedy się próbuje w otwartym rewirze złowić jakieś zwierzę terytorialne, np. jaszczurkę lub rybę koralową. Dopóki zwierzę porusza się po wyuczonych, utartych trasach jest ono tak szybkie i nieomylne, że nie ma właściwie nadziei, by można je było złapać jakimś błyskawicznym chwytem lub zamachem siatki. Kiedy jednak uda się nam nagłym wypadem wprawić ściganą zwierzynę w taką panikę, że znajdzie się ona poza rejonem opanowanym dzięki wyuczeniu się dróg, wówczas damy z nią sobie zazwyczaj radę. Sądzę, iż właśnie korzyść, jaką w przedstawionym sensie daje wyuczanie się dróg, stanowiła w decydującej mierze o ciśnieniu selekcyjnym, które sprawiło, że u gatunków wspomnianego typu ekologicznego wykształciło się zachowanie terytorialne.

Nikt jeszcze nie próbował badać wyuczonych, wpojonych [Eingeschliffene - czyli dokładnie właśnie "wpojone", który to termin bywa niesłusznie i niepotrzebnie używany jako przekład gepragt - przyp. tłum.] sekwencji ruchowych zwierząt metodami, którymi w swoim czasie posłużył się Erich v. Holst, aby wykazać, że ruchy koordynowane centralnie są niezależne od procesów aferencyjnych. Zabieg "dezaferencji", czyli wyłączenia wszystkich nerwów doprowadzających, podejmowany przez Ericha v. Holsta, oznacza ze zrozumiałych względów tak ciężkie w ogóle uszkodzenie organizmu, że niewiele by dowodziło, gdyby poddane mu zwierzę nie potrafiło się potem poruszać w sposób wyuczony, który opanowało przed operacją. O ludziach chorych na tabes dorsalis, u których przestały funkcjonować zakończenia nerwowe donoszące o pozycji kończyn, tak zwane proprioreceptory położenia, wiadomo, że koordynacja ruchów jest u nich zakłócona w sposób istotny. Trzeba jednak mieć na uwadze, że człowiek jest niejako mistrzem świata w ruchach dowolnych, nad którymi się panuje i które są sterowane przez rozeznanie, i że wobec tego jest całkiem możliwe, iż kontrolowane aferencyjnie są u niego pewne sposoby poruszania się, podczas gdy ich odpowiedniki u zwierząt takiej kontroli nie podlegają.

Pomijam kwestię, czy wszystkie wyuczone sposoby poruszania się zwierząt i ludzi są fizjologicznie tej samej natury, mowa tu tylko o tego rodzaju wpojonych i wygładzonych w tysiąckrotnych powtórzeniach przebiegach ruchu, do których odnieść można wyrażenia ukształtowane w toku naturalnego rozwoju mowy potocznej, jak: "umie coś zrobić przez sen", "weszło mu w krew", "stało się drugą naturą", a także "całkiem automatycznie". Pozwolę sobie nadto przypuścić, że mechanizmy fizjologiczne takich sekwencji ruchowych są podobne do tych, na których opiera się opisane wyuczanie się drogi przez małe ssaki. Pytanie o te mechanizmy jest dlatego interesujące, że owe sekwencje wykazują pod wieloma względami zaskakujące podobieństwa z koordynacjami dziedzicznymi, a więc z ruchami instynktowymi.

Po pierwsze, w koordynacji ruchów wpojonych (eingeschlieffene), niejedno prawo, co wykazał już Erich v. Holst, obowiązuje zupełnie tak samo, jak w centralnej koordynacji wrodzonych sposobów zachowania. Tak więc w obu przypadkach rytmy rozmaitych, wplecionych w łączną koordynację ruchów elementarnych w ten sam sposób wpływają na siebie wzajem. Zjawiska "koordynacji proporcjonalnej" i "efektu magnetycznego", co do których odsyłam do prac v. Holsta, sprawiają dosłownie harmonijne współgranie poszczególnych rytmów w ten sposób, że dążą do ich wyfazowania w proporcjach dających się wyrazić małymi liczbami całkowitymi. Im lepiej się to udaje, tym stabilniejsza jest koordynacja rytmów. Sposoby poruszania się oporne wobec takich tendencji procesu centralnego koordynowania pozostają niestabilne, tzn. trudno jest je utrzymać, jak to wie każdy pianista, który ma jedną ręką grać triole, drugą zaś ósemki. To właśnie funkcje koordynacji proporcjonalnej i efektu magnetycznego nadają zarówno każdemu dobrze opanowanemu ruchowi wyuczonemu, jak i niezależnemu od procesów uczenia się ruchowi instynktowemu ową oszczędzającą wysiłku elegancką formę, która tak bardzo przemawia do naszego poczucia piękna.

Druga właściwość ruchu dobrze opanowanego, dzięki której przypomina on wrodzone koordynacje dziedziczne, polega na wielkiej odporności wobec wszelkich prób przekształcenia. Karl Buhler zwykł mawiać, że dla tego, co wyuczone, należałoby postulować jako właściwość definiującą, że może być znów zapomniane. Było to z pewnością pomyślane aforystycznie, ale ma głębszy sens, ponieważ, jak sadzę, stosuje się wyłącznie do "prawdziwego" uczenia się, natomiast nie dotyczy procesu nabywania, dzięki któremu powstają wpojone koordynacje ruchowe. Mam nieodparte wrażenie, że takich koordynacji w ogóle nie można nigdy zapomnieć całkowicie i że poprawki i dostosowanie w zewnętrznym przebiegu ruchu są raczej skutkiem już to nakładania się na siebie wcześniejszych sposobów zachowania, już to dodatkowych nabytków, niż zacierania dawnych przyzwyczajeń. Przemawiają za tym obserwacje, które poczynić można nieodmiennie np. na kierowcach, kiedy przesiadają się z jednego typu wozu na drugi. Jeśli jakieś ruchy zasługują na określenie "wpojonych" i "umianych przez sen", to właśnie ruchy naprawdę dobrego kierowcy. Kiedy taki kierowca jeździ przez długi czas tylko jednym wozem i następnie zostaje zmuszony do zmiany, sztywność tych ruchów ujawnia się bardzo wyraźnie. Gdy moja żona przesiadła się z samochodu z dźwignią zmiany biegów w podłodze na wóz z lewarkiem przy kierownicy, przez długi czas sięgała najpierw w próżnię po nie istniejącą dźwignię i dopiero potem w górę do lewarka. Ten okrężny gest stawał się stopniowo zaokrąglonym, z zamachem wykonywanym ruchem dłoni, który dla każdego, kto nie znał jego prehistorii, wyglądał afektowanie; ruch ten wciąż jeszcze całkiem się nie zatarł, kiedy wóz z lewarkiem przy kierownicy zasłabł ze starości i zastąpiony został nowym, znów z dźwignią w podłodze. Moja żona, która przez ponad 5 lat urągała na lewarki i nie mogła odżałować dźwigni, teraz nie potrafiła, jak się okazało, wyzbyć się po prostu koordynacji ruchowych zmiany biegów przy kierownicy. Pozostawiam czytelnikowi wykoncypowanie, jaką trasą wędruje teraz do dźwigni biegów dłoń mojej pani; po wszystkim, co tu zostało powiedziane, łatwo pojąć, że jest to ruch niesłychanie elegancki. Trenerzy sportowi dobrze znają zaciekły opór, jaki dobrze opanowane ruchy stawiają wszystkim wysiłkom, by je wyeliminować. Toteż nie lubią oni wcale, by podopieczny, który chce się nauczyć np. gry w tenisa czy sportowego pływania, dysponował już jakąś umiejętnością w tych dyscyplinach, nabytą w drodze samouctwa; takie umiejętności bowiem nie tylko nie są, z wyżej wyłożonych względów, pomocne, lecz stanowią trudną do przezwyciężenia przeszkodę w nauce koordynacji optymalnych, niezbędnych u prawdziwego zawodnika.

Trzecia i najosobliwsza zgodność pomiędzy ruchem wpojonym i koordynacją dziedziczną polega na tym, że po dłuższym nieużywaniu tak jednego, jak drugiego występuje wyraźnie zachowanie apetencyjne zmierzające do zrobienia z nich użytku. Jednym z najsilniejszych motywów, który każe ludziom tańczyć, jeździć na łyżwach i oddawać się uprawianiu innych sportów, jest skierowana ku całkiem określonemu mocno wpojonemu ruchowi apetencja o natężeniu rosnącym wraz ze stopniem opanowania ruchu i trudności związanych z jego wykonywaniem.

Podobną apetencję wykonywania ruchów trudnych, ale dobrze opanowanych wykazał H. Harlow u makaków, które nie nagradzane stale powtarzały "dla przyjemności" wyuczone manipulacje. "Rozkosz funkcjonowania", jak trafnie nazwał to zjawisko Karl Buhler, odgrywa najwyraźniej ważką rolę w powstawaniu dobrze opanowanych, mocno wpojonych sekwencji ruchowych. Wiemy z własnego doświadczenia, że każde uzupełnienie, każde wygładzenie występującej jeszcze "szorstkości" stanowi o wzroście przyjemności, wyraźnie dającym się zaobserwować. Wydoskonalenie ruchu jest samo dla siebie nagrodą; w książce Evolution and Modification of Behaviour pisałem o perfection-reinforcing mechanizm (mechanizmie samopotwierdzającego się doskonalenia).

Fenomenologicznie rzecz biorąc, dobre opanowanie mocno wpojonych ruchów wykazuje kilka jeszcze osobliwych właściwości, z których jedna przynajmniej jest bardzo istotna dla roli, jaka przypada ruchowi dowolnemu w zachowaniu eksploratywnym, o czym będzie mowa w następnym rozdziale. Właściwości te są na swój sposób sprzeczne. Z jednej bowiem strony dobre opanowanie ruchu wyuczonego jest w tak wielkim stopniu i tak wyłącznie sprawą podświadomych i nawet bezświadomych warstw naszej osoby, że usiłując świadomie śledzić za przebiegiem ruchu i kontrolować go, możemy w nim tylko przeszkadzać. Często, w warstwach dostępnych świadomości, nie wiemy nawet, co robimy i jak to robimy. Kiedy się od bardzo dawna nie wykonywało jakiegoś opanowanego ruchu, np. wybrawszy się na narty po raz pierwszy po dziesięcioletniej przerwie, człowiek myśli nawet, stojąc wysoko na zboczu, że w ogóle już nie umie jeździć, ale z chwilą gdy ruch się rozpocznie, potoczy się on ku naszemu zdumieniu równie gładko jak dawniej.

Z drugiej strony, przy dobrze przyswojonych sposobach poruszania się udaje się nam nierzadko wzbudzić w sobie tak żywe wyobrażenie kinestezji ich przebiegu, że wtedy samoobserwacja pozwala skonstatować szczegóły procesu, o których nasza świadomość już nie wie. Kiedy wnuczek zapytał mnie niedawno, który z dwóch większych pedałów w moim samochodzie porusza sprzęgło, a który hamulec, zmuszony byłem ze zdziwieniem stwierdzić, że po prostu tego nie wiem i musiałem uciec się do wspomnianego przed chwilą zabiegu, aby móc udzielić odpowiedzi.

Otóż jestem zdania, że powstawanie takich wyobrażeniowych obrazów własnych ruchów odgrywa ważną i nawet decydującą rolę w swoistym dla człowieka zróżnicowaniu centralnej reprezentacji danych przestrzennych i tym samym w naszym myśleniu pojęciowym. Czynność sterowanego rozeznaniem ujmowania, które jest w swej istocie macaniem końcami palców, zwłaszcza prawego palca wskazującego, stanowi wedle wszelkiego prawdopodobieństwa wstępny warunek pojmowania. Przemawia za tym ogromna rozległość połaci, która w korze kresomózgowia reprezentuje dłoń i palce pod względem sensorycznym i motorycznym oraz stosunek pól motorycznych do dróg piramidowych, najważniejszych dróg nerwowych ruchu dowolnego.

Nawet w formie najbardziej prymitywnej, jak w opisanym wyuczaniu się przez rzęsorka "na pamięć" pewnej sekwencji ruchów lokomocyjnych, nabywanie dobrze opanowanych koordynacji ruchowych jest aktem poznawczym i to niebywale skutecznym. Koordynacja dziedziczna może być z natury rzeczy przystosowana tylko do takich danych środowiska, co do których jest do przewidzenia, że napotka je każdy osobnik gatunku. "Wpojony" sposób ruchu wykazuje niejedną właściwość funkcjonalną znamienną również dla koordynacji dziedzicznej: jego przebiegu nie opóźniają czasy reakcji, przysługuje mu własne zachowanie apetencyjne, a zatem ma on rangę motywacji. Podobnie jak ruch instynktowy, wpojony sposób ruchu również jest "skrojony na miarę", nie tylko wszakże w odniesieniu do ogólnych potrzeb gatunku, lecz także wobec całkiem szczególnych warunków życia osobnika. Łatwo pojąć, jak wysoka jest wartość tego układu właściwości dla utrzymania gatunku. Najwyższa jest ona w przypadku zwierząt, które muszą dawać sobie radę w przestrzeni życiowej o złożonej strukturze i dużym urozmaiceniu. U istot nadrzewnych, które przemieszczają się za pomocą chwytających rąk i które zarazem są zazwyczaj zmuszone radzić sobie za pomocą wpojonego, dobrze opanowanego ruchu z drogą wśród gałęzi, w wyuczonej sekwencji ruchów musi być przygotowany każdy literalnie krok i każdy chwyt. Wielka dokładność przystosowania jest tym chwytnorękim drzewołazom niezbędna dlatego zwłaszcza, że cęgopodobna dłoń winna się domknąć wokół gałęzi we właściwej chwili i właściwym położeniu, jeśli ma utrzymać zwierzę. Spośród chwytnorękich drzewołazów jedynie powolne nocne małpiatki, jak lorisy i zachodnioafrykański lemur potto, mogą sobie pozwolić na powierzenie swej orientacji przestrzennej mechanizmom dostarczającym informacji chwilowej. Natomiast wszystkie szybko się poruszające, zwłaszcza zaś wszystkie skaczące małpiatki i małpy są skończonymi mistrzami dobrze opanowanego ruchu. W tym też tkwi jedna z przyczyn, dla których człowiek wziął swój ród z grupy takich właśnie istot.

Ponieważ nie widzę żadnej zasadniczej różnicy pomiędzy procesami, które uczestniczą w zwykłym wyuczaniu się drogi a tymi, które mają udział w nauce najbardziej złożonych ruchów dobrze opanowanych, nie wydaje mi się potrzebne postulować z gruntu różne procesy w centralnym systemie nerwowym dla wyjaśnienia uczenia się receptorycznego i motorycznego. To, co nowego powstaje w procesie nauki, zarówno w sferze receptorycznej, jak i motorycznej, zasadza się na nowych połączeniach. Innymi słowy: modyfikacja adaptacyjna zawsze prawdopodobnie dotyczy synaps i jest nader blisko spokrewniona z indukcją w rozumieniu Spemanna.


VI. 8. PRZYSTOSOWANIE MECHANIZMÓW UCZENIA SIĘ POD SELEKCYJNYM CIŚNIENIEM ICH FUNKCJONOWANIA

Wraz z wielką fulguracją nowego obwodu ze sprzężeniem zwrotnym, dzięki której dokonuje się nauka z sukcesów, końcowe ogniwa liniowego dotychczas łańcucha procesualnego otrzymały nową funkcję. Nim doszło do wielkiego wynalazku reakcji warunkowej, działaniu końcowemu przypadało jedynie bardzo proste zadanie: dopełnić ciągu ruchów zgodnie ze sztywnym programem "zamkniętym" oraz złożyć o tym meldunek zwrotny, wyłączając w ten sposób zachowanie apetencyjne. Już z nagłego, kryzysowego spadku pobudzenia po wykonaniu działania końcowego można wnosić, że taki meldunek zwrotny jest rzeczywiście przesyłany; eksperymentalnie dowiódł tego F. Beach, który u samca szympansa operacyjnie wyłączył meldunek zwrotny o opróżnieniu pęcherzyków nasiennych, przekazywany w procesie kopulacji.

Wiemy już (r. IV.10.), że wszystkie koordynacje dziedziczne mają tendencję do nieprzerwanego działania. Hamowanie centralnie koordynowanych ruchów jest pierwszą z funkcji, w których służbie powstały nadrzędne scentralizowane instancje w ośrodkowym systemie nerwowym. "Centra" te muszą zarazem, obok funkcji hamowania, posiadać umiejętność odhamowywania we właściwym biologicznie momencie każdego z nadzorowanych sposobów poruszania się, innymi słowy, muszą być w stanie przyjmować informację chwilową o tym, że taki korzystny moment nastąpił. Koordynacja dziedziczna, nadrzędny wobec niej ośrodek hamowania i mechanizm wywoławczy stanowią więc od razu funkcjonalną jedność. Heinroth tworząc pojęcie swoistego gatunkowo działania z popędu dostrzegł to z genialną wnikliwością.

Pierwotnie treścią meldunku przekazywanego do "centrum" przez koordynację dziedziczną jest tylko "program wypełniono", na co instancja nadrzędna każe ponownie włączyć hamowanie przed chwilą wstrzymane. Jedynie w wyjątkowych przypadkach działanie końcowe zaspokajające popęd ustaje wskutek "wybiegania się", tzn. wyczerpania się specyficznego dla jego czynności pobudzenia, jak np. przy śpiewie wielu ptaków, który stopniowo, powoli ucicha.

Jest bardzo prawdopodobne, że ciśnienie selekcji znalazło w mechanizmie omawianego tu prostego systemu podatne miejsce, co pozwoliło mu przetworzyć mechanizm meldunków o wykonaniu w mechanizm meldunków o wyniku. Od działania końcowego wymaga ta nowa funkcja znacznie większych świadczeń; jest ono jakby dzielnym żołnierzem, który dotąd potrafił jedynie meldować "rozkaz wykonano", teraz zaś ma się nagle wykazać umiejętnością składania najwyższej generalicji przemyślanych raportów o tym, jakie rezultaty przyniosła jego akcja, i nawet o tym, co generałowie zarządzili niesłusznie. Ta nowa sprawność wymaga mnóstwa informacji ekstero- i proprioceptorycznej, nadto zaś potrzebne są jeszcze mechanizmy, które dysponują dostateczną "wiedzą" filogenetyczną, by móc z wystarczającą pewnością odróżnić sukces od niepowodzenia.

Tak więc wynalazek reakcji warunkowej stawia nowe wymagania mechanizmowi działania końcowego; nie tylko musi powstać aparat, który składa bogaty informacyjnie meldunek o wyniku działania, lecz nadto wymagana jest energia nerwowa w ilościach niezbędnych, by doprowadzić wyraziście tę wiadomość do wszystkich, licznych i rozmaitych instancji centralnego systemu nerwowego, których funkcjonowanie ma ulec adaptacyjnej zmianie. Pod selekcyjnym ciśnieniem tych nowych funkcji w mechanizmach działania końcowego rozwinęły się specjalne struktury i fizjologiczne właściwości, których dawniejsi etologowie przez długi czas nie rozumieli poprawnie.

Zachowanie w systemie niepodatnym na uwarunkowanie, w rodzaju swoistego gatunkowo działania z popędu, przebiega bez widocznego wyakcentowania działania końcowego. Dotyczy to zwłaszcza tych łańcuchów zachowań, które jak kopulacja u wielu stawonogów funkcjonują w życiu osobnika tylko raz jeden. U zwierzęcia wykonującego działanie końcowe nie zauważa się bynajmniej żadnego specjalnego wzrostu ogólnego pobudzenia. W porównaniu z pełnym podniecenia tańcem godowym, jakim np. samczyk skaczela, pająka skaczącego, zabiega o samiczkę, samo dopełnienie kopulacji, stanowiące zakończenie łańcucha zachowań, wygląda wręcz sennie.

Nawet u bardzo podatnych na uczenie się pielęgnic, wysoce rozwiniętych ryb, które troszczą się o potomstwo, składanie ikry i zapłodnienie odbywa się bez żadnego zauważalnego wzrostu pobudzenia, przeciwnie, wstępne ceremonie kojarzenia się par, z ich tanecznymi poruszeniami i przepysznym kolorystycznie pokazem barw, zdradzają o wiele wyższe pobudzenie ogólne niż działanie końcowe. Jest w tym nadto wiele nauki, ryby uczą się rozpoznawać osobniczo i warunkiem trwałego związku, w którym odtąd żyją, jest właśnie ta osobnicza znajomość. Przyuczający wpływ ruchów kojarzenia się par jest najprawdopodobniej większy niż składania ikry i zapłodnienia; podobnie jak opiekując się potomstwem, samczyk przy zapłodnieniu robi swoje do tego stopnia "z obowiązku", że pewnej mojej współpracownicy obserwującej tarło Etroplus maculatus wyrwało się kiedyś wiekopomne zdanie: "To wygląda niemal na cnotliwość, jak on zbywa tę robotę."

Kiedy porównuje się spółkowanie w tym gatunku z działaniami ogiera lub w ogóle z docelowymi działaniami końcowymi istot wyższych, choćby z zabijaniem łupu przez drapieżne zwierzę czy z atakiem drapieżnego ptaka na zdobycz, wówczas te ostatnie sposoby zachowania wywołują u obserwatora nieodparte wrażenie rozgorzałego płomienia, którym podniecenie zda się spalać cały organizm. To wydatne pobudzenie ogólne ma najwidoczniej duże znaczenie dla wytworzenia czysto ilościowych warunków takiej mnogości i tak silnych impulsów nerwowych, jakie są niezbędne, by oddziałać na wszystkie nader liczne punkty centralnego systemu nerwowego, w których meldunek zwrotny działania końcowego ma indukować modyfikacje. Ten zatem fajerwerk ogólnego pobudzenia, ten - po stronie podmiotowej - pożar zmysłów nie jest bynajmniej niefunkcjonalnym epifenomenem, jakimś produktem ubocznym, lecz jest to nieodzowna składowa mechanizmu fizjologicznego, który potrafi uzyskiwać informacje z sukcesów i niepowodzeń.

Przy wszystkich systemach zachowań omawianego teraz typu natychmiast po meldunku o wykonaniu następuje gwałtowny spadek pobudzenia. Wobec jednak znaczenia "fajerwerku ogólnego pobudzenia", o którym była mowa, nader sztuczna wydaje mi się opinia, iżby tylko eliminacja stanu pobudzenia była przyczyną przyuczającego oddziaływania, jakie wywiera wypełnienie działania końcowego. Pogląd Hulla, że relief of tension, spadek napięcia, jest istotnym czynnikiem przyuczającym, słuszny w tak wielu innych przypadkach, jest w odniesieniu do docelowego działania końcowego na pewno fałszywy, o czym poucza najzwyklejsza samoobserwacja.

Kiedy mechanizm wywoławczy otrzymuje w ramach podatnego na warunkowanie systemu zachowań nowe funkcje cząstkowe różne od tych, jakie sprawował w systemie liniowym, niezdolnym do uczenia się, on również zostaje poddany bardzo odmienionemu ciśnieniu selekcji. To nowe ciśnienie selekcyjne stawia go pod niejednym względem wobec wymagań przeciwnych niż te, jakie stwarzało ciśnienie uprzednie, zmierzające do maksymalnej wybiórczości mechanizmu wywoławczego. W liniowym, niepodatnym na modyfikację łańcuchu zachowań wrodzony mechanizm wywoławczy jest dla działania z popędu jedyną instancją, która "wie" kiedy i gdzie działanie ma być wykonane. Nieodzowna w tym przypadku wybiórczość staje się nie tylko niepotrzebna, lecz wręcz niekorzystna, kiedy drugi proces uzyskiwania informacji podejmuje swą rolę "instruktażu". Ponieważ dopiero zwrotny meldunek działania końcowego zaspokajającego popęd powiadamia organizm, jaki moment, miejsce i obiekt są najkorzystniejsze dla użycia danego sposobu zachowania, niniejsza selektywność mechanizmu wykonawczego staje się czynnikiem pozytywnym. W konsekwencji, u blisko spokrewnionych zwierząt występuje nieraz bardzo różna selektywność analogicznych, a nawet homologicznych wrodzonych mechanizmów wywoławczych [Analogiczny - o tej samej  funkcji;  homologiczny - o tym samym pochodzeniu filogenetycznym - przyp. tłum.]. Wspominaliśmy już tutaj o nieselektywności wrodzonego mechanizmu wywoławczego, który u zdolnych do uczenia się ptaków krukowatych decyduje o doborze materiału do budowy gniazda. Natomiast u znacznie mniej, w sensie uczenia się, uzdolnionych estreld, czyli zięb ozdobnych (Estrildini) i tkaczy (Ploceini) znajomość wyłącznie nadającego się do budowy materiału, który u tych ptaków musi być przystosowany do wysoce zróżnicowanych ruchów przy konstruowaniu gniazda, jest całkowicie wrodzona, tak że nawet wiele z nich w ogóle wtedy dopiero nastraja się rozrodczo, kiedy napotyka odpowiednie bodźce kluczowe w postaci materiału na gniazdo.

Metoda reakcji warunkowej uzyskiwania informacji o obiekcie z formy wrodzonego sposobu poruszania się, przynosi poważną korzyść: następuje wybiórcze wyabstrahowanie tych właściwości obiektu, które są istotne dla skutecznego użycia podatnego na warunkowanie sposobu zachowania. Bardzo wiele zwierząt wyższych stosuje tę metodę przyuczania się w drodze prób i błędów do najkorzystniejszego, w każdym przypadku, z osiągalnych obiektów. Im większą rolę odgrywa ta metoda, tym bardziej skąpa może być, jak łatwo pojąć, znajomość obiektu zdeponowana we wrodzonym mechanizmie wywoławczym i nawet musi być z korzyścią dla zachowania gatunku, jeśli wrodzony mechanizm wywoławczy maksymalnie się upraszczając pozostawia jak najszersze pole procesowi uczenia się. Odtąd powinien on tylko udzielać młodemu osobnikowi "delikatnej wskazówki" co do najbardziej obiecującego kierunku podejmowanych prób. Jak podkreślałem już przedtem (r. VI.4.) i jak to jeszcze rozważymy dokładniej (r. VII.6. i n.), ta forma zachowania złożonego z prób i błędów jest z gruntu odmienna od zachowania eksploratywnego, czyli z udziałem ciekawości.

W czasach mojej młodości gdy uczono o sprzężeniu zwrotnym dawano nieśmiertelny przykład spłuczki klozetowej. Był to rezerwuar, w którym zawór wypuszczający wodę mógł jej wypływ zatrzymać dźwignią zakończoną pływakiem. Gdy wody przybierało pływak unosząc się przydławiał wypływ aż do całkowitego zablokowania strumienia gdyż śrubką na dławiku można było wyregulować przy jakim poziomie dopływ wody zamierał. Ponieważ rezerwuar zawierał syfonowy wypływ, można było również tak wyregulować strumień, by cały czas woda przez niego wyciekała. Wyregulować! Poziom wody był sygnałem zwrotnym sprzężenia, zaś śrubka służyła do regulacji.

Fascynujący jest dawany przez Lorenza opis mózgu, jako całych kaskad wielokrotnych regulatorów różnych czynności i pamięci tych czynności zamieniających te regulatory w homeostaty za sprawą zapisu w synapsach, jednak w czasach gdy to pisał myślano, że i spłuczka klozetowa i paluszki kręcące śrubką w naszym mózgu, to neurony. Lorenz nie wiedział, że za dwadzieścia lat przyjdzie rewolucja, która cały ten obraz przeorze do samych podstaw. Było to odkrycie drugiego mózgu, mózgu glejowego. W tym miejscu planowałem opisać jak zmienił się nasz obraz procesu nauki dzięki poznaniu roli komórek glejowych, ale na razie jest to po prostu niemożliwe. Narodziło się o wiele więcej pytań niż odpowiedzi. Poniżej zamieszczam dwa cytaty z książki Douglasa Fieldsa gorąco zachęcając równocześnie do jej przeczytania.


Układ nerwowy bezkręgowca ma się tak do układu nerwowego kręgowca jak szkolny kalkulator do superkomputera NASA. Co zadzi­wiające jednak, neurony w mózgu muchy działają tak samo jak neurony w twoim mózgu, często wykorzystując jako neuroprzekaźniki te same substancje chemiczne. Zasadnicza różnica między tymi dwoma grupa­mi zwierząt leży w komórkach glejowych, a dokładnie w komórkach glejowych wytwarzających mielinę (oligodendrocytach i komórkach Schwanna). Kręgowce mają komórki glejowe wytwarzające mielinę, bezkręgowce takich komórek nie mają. Ewolucja udziału komórek glejowych w funkcji układu nerwowego nie mogła mieć dalej idących konsekwencji.


Dzisiaj niemiecki patolog Rudolf Virchow bywa często wyszydzany za naiwne nazwanie tych komórek w roku 1856 „nerwowym klejem”. Oto komórki, które potrafią zbudować mózg płodu, pokierować po­łączeniami rosnących aksonów, by stworzyć w nim właściwe obwody, naprawić go, gdy zostanie uszkodzony, wyczuwać impulsy trzeszczące w aksonach i słyszeć synapsy, kontrolować sygnały wykorzystywane przez neurony do komunikacji z innymi neuronami na synapsach, do­starczać źródeł energii i substratów do produkcji neuroprzekaźników dla neuronów, łączyć synapsy i neurony na dużych obszarach w gru­py funkcjonalne, integrować i propagować informacje otrzymywane od neuronów przez swą własną prywatną sieć, uwalniać czynniki neurotoksyczne i neuroprotekcyjne, włączać synapsy i wyłączać synapsy z obwodów, przemieszczać się do i ze szpary synaptycznej, rodzić nowe neurony, komunikować się z układem naczyniowym i odpornościowym, izolować neuronalne linie łączności i kontrolować prędkość transmisji impulsów w ich obrębie. A niektórzy ludzie pytają: „Czy te komórki mogą mieć cokolwiek wspólnego z wyższymi funkcjami mózgu?” Jak mogłyby nie mieć?

"Paluszki glejowe", których jest w naszych głowach 10 razy więcej niż neuronów dopiero ujawniły swoje istnienie - ciekawe ile lat (a może nawet setek lat) zajmie nam zrozumienie jak sterują naszym umysłem. Douglas Fields zauważył filozoficznie, że ludzki mózg jest najbardziej skomplikowanym tworem we Wszechświecie. Zgadzam się z nim w zupełności.

Jest jeszcze jeden błąd w wywodach Lorenza do którego chciałbym się ustosunkować, mianowicie użycie przez niego słowa przyczynowość w rozdziale VI.6. Według niego aparaty poznawcze o różnych poziomach integracji, pozwalające zwierzęciu przygotować się na jakieś zdarzenie dzięki wychwyceniu cech zapowiedzi w pozornie nieistotnym bodźcu, działają na zasadzie porządkowania reakcji warunkowych. Doświadczenie zdobyte w życiu osobnika lub zgromadzone w genomie jest odzwierciedleniem nie tyle dostrzeżenia przyczyny, co skutkiem przystosowania tego aparatu poznawczego do przyrody, która jest przyczynowa w swej istocie. Czyli zauważamy przyczynę nie dlatego, że pozwala nam na to nasz mózg, a dlatego, że przyczynowa jest przyroda, która nam ten mózg filogenetycznie ukształtowała. Jednak to ukształtowanie w stosunku do człowieka i do wszystkich innych zwierząt ma zupełnie różne znaczenie z uwagi na to, że tylko człowiek potrafi operować językiem. Przyczyna dla człowieka i dla zwierzęcia ma zupełnie inne znaczenie funkcjonalne: u zwierzęcia odpowiada na pytanie "jak mam zareagować", a u człowieka "dlaczego". Lorenz o tym wie, ale nie zauważył iż operowanie językiem jest aparatem poznawczym istotnie wyżej zorganizowanym; pozwala irracjonalne przyczyny traktować jako logiczne.