VI. 1. NOWE SPRZĘŻENIE ZWROTNE
U wszystkich istot ze świata zwierzęcego, których centralny system
nerwowy osiągnął określony poziom zróżnicowania, tzn. u głowonogów,
raków, pajęczaków, owadów oraz kręgowców z człowiekiem włącznie,
występuje pewna umiejętność zdobywania wiedzy przerastająca sprawnością
wszelkie dotychczas omawiane mechanizmy poznawcze, mianowicie
umiejętność uczenia się w ściślejszym sensie. Ponieważ umiejętność tę
wykazuje tak wiele rozmaitych istot, psychologowie, którym biologia
była obca i którzy nie wiedzieli o konwergencji przystosowań,
zaopiniowali błędnie, że chodzi tu o jakiś prafenomen, o podstawową
formę wszelkiego zdobywania wiedzy i o jedyny wręcz element zachowania
w ogóle. W rzeczywistości aparatura nerwowa, stanowiąca podłoże
zdolności, o której mowa, ukształtowała się u każdego z wymienionych
typów zwierzęcych niezależnie od innych, dzięki przystosowaniu
konwergentnemu, tak samo jak niezależnie jeden od drugiego uzyskały one
oczy i kończyny.
Uczenie się z sukcesów i niepowodzeń było typową fulguracją w uprzednio
(r. II.2) wyłożonym sensie, która powstała dzięki wytworzeniu się
nowego połączenia pomiędzy istniejącymi i zdolnymi do niezależnego
funkcjonowania mechanizmami nerwowymi. Zapoznaliśmy się już przedtem z
działaniem każdego z tych mechanizmów składowych.
Zespół zachowań nazywany przez Heinrotha swoistym gatunkowo działaniem
z popędu składa się, jak już wiemy, z zachowania apetencyjnego, z
reakcji wrodzonego mechanizmu wywoławczego i z wykonania genetycznie
zaprogramowanego ciągu zachowań, aż do osiągnięcia zaspokajającej popęd
sytuacji końcowej. Ten łańcuch, złożony z trzech wyodrębnionych
procesów, stanowi podłoże, na którym rozwinęła się umiejętność
wszelkiego uczenia się z sukcesów i niepowodzeń (conditioning). Nowe
właściwości systemowe nadaje tej liniowej sekwencji procesów wynalazek
zaprawdę epokowy: końcowy rezultat procesualnego toku może teraz
wpływać zwrotnie na inicjujące ten tok sposoby zachowania i modyfikować
je.
Poszukiwawcze sposoby poruszania się, które w zachowaniu apetencyjnym
występowały mniej lub bardziej przypadkowo, zostają wskutek takiego
oddziaływania zwrotnego wzmocnione, jeśli wykonanie całego ciągu
przyniosło sukces sprzyjający utrzymaniu gatunku, w przeciwnym
natomiast razie słabną. Innymi słowy: sukces oddziałuje tak jak to, co
powszechnie zwiemy "nagrodą", niepowodzenie zaś tak jak "kara". W
literaturze anglojęzycznej wszystko, co prowadzi w ten sposób do
wzmocnienia, czyli do "przyuczenia" poprzedzającego zachowania, określa
się słowem reinforcement, którego używają też niestety psychologowie
piszący po niemiecku; odrzucają oni wyrażenia zrozumiałe w niemczyźnie
jako "subiektywistyczne". Ponieważ pojęcie reinforcement pochodzi od
Iwana Piotrowicza Pawłowa, poprosiłem jedną z moich współpracownic,
dobrze władającą rosyjskim, aby sprawdziła, kiedy ten autor użył owego
terminu po raz pierwszy, i jak to brzmiało po rosyjsku. Okazało się, że
wczesne prace, w których wielki fizjolog ukuł to pojęcie, pisał on po
niemiecku używając słów Verstarkung, verstarken ("wzmocnienie" i
"wzmacniać"). Nie wydaje mi się całkiem zadowalający taki dobór
niemieckiego terminu. Z tego, dzięki czemu dochodzi do skutku omawiany
tutaj proces uczenia się, zdamy sobie lepiej sprawę powiadając, że
sukces utwierdza (bestarkt) zwierzę w prowadzącym do niego zachowaniu.
Wraz z nowym sprzężeniem zwrotnym powstaje proces poznawczy, który w
jednym jedynym wykonaniu przynosi osobnikowi więcej trwałego przyrostu
wiedzy, i to co najmniej dwukrotnie więcej, niż w najkorzystniejszym
przypadku zdolna jest sprawić metoda genomu w toku jednej generacji,
gdyż w procesie tym informacje uzyskiwać można nie tylko z sukcesu, jak
to czyni genom, lecz także z niepowodzenia. Proces uczenia się, o który
tu chodzi, "nie gra" też w ciemno, jak genom, żonglując wszystkimi w
ogóle dostępnymi mu czynnikami, relewantnymi i nierelewantnymi, lecz
rozwój swój opiera na wypróbowanych wrodzonych hipotezach roboczych,
mianowicie tych, które są trwale wpisane w system zachowania wszystkich
zwierząt wyższych w formie mechanizmów zdobywających informację
chwilową, o czym traktował rozdział IV. Zachowanie podlegające
modyfikacji w wyniku sukcesów i niepowodzeń jest przez to z góry
nakierowane ku wyższemu prawdopodobieństwu sukcesu, nie przypadkiem "z
góry" znaczy po łacinie a priori. W podrozdziałach o zrozumieniu i
uczeniu się będzie jeszcze o tym mowa bardziej szczegółowo.
Wobec uzyskanej w ten sposób ogromnej sprawności nowego aparatu
poznawczego jasne jest, że wśród wyższych, szybko poruszających się
zwierząt sprostać konkurencji mogą jedynie te, które aparat ów
posiadają.
VI. 2. MINIMUM KOMPLIKACJI SYSTEMU
Z drugiej strony jasne jest również, wobec dotąd powiedzianego,
dlaczego u zwierząt jednokomórkowych i niższych wielokomórkowców, które
nie mają scentralizowanego systemu nerwowego, nie mogło w ogóle dojść
do uczenia się z sukcesów. Istnienie kilku i to niezbyt prostych
podsystemów o bardzo dobrze zorganizowanym działaniu stanowi oczywisty
warunek wstępny powstania systemu, który jest w stanie wykorzystać jako
źródło wiedzy sukces lub niepowodzenie określonego poprzedzającego
sposobu zachowania i potrafi przenieść zwrotnie rezultat takiego
wykorzystania na mechanikę owego sposobu zachowania, modyfikując ją.
Poznaliśmy te podsystemy i ich układ działania przy omawianiu swoistego
gatunkowo działania z popędu.
Stosunkowo najłatwiej można wyobrazić sobie mechanizm, który utwierdza
zwierzę w sposobach zachowania prowadzących po prostu do zaspokojenia
zapotrzebowania tkanek. Wystarczyłby tu jeden tylko "czujnik"
rejestrujący obecność lub brak niezbędnej do życia substancji i
składający meldunek aparatowi zachowania poprzedzającego. Jakoż
istnieją poszczególne przypadki realizacji tej najprostszej możliwości
prawdziwej reakcji warunkowej, na przykład według Dehtiera niektóre
muchy tak właśnie zdobywają pożywienie. W ogóle jednak u większości
systemów zachowania podatnych na adaptacyjną modyfikację przez uczenie
się w pełnym znaczeniu, muszą być spełnione trzy następujące warunki
wstępne.
Po pierwsze: sposób zachowania inicjujący całe działanie musi posiadać
program "szeroko otwarty", tzn. oferujący możliwość wielorakich
modyfikacji adaptacyjnych; wiemy już, że warunkiem wstępnym takiego
programu jest szczególnie wielki zasób informacji genetycznej.
Po drugie: forma, w jakiej w poszczególnym przypadku przebiegało
ostatnie wykonanie inicjujących członów działania, musi być w jakiś
sposób "protokołowana" czy "zapamiętywana" i to wspomnienie musi być
kontaktowane ze zwrotnym powiadomieniem o sukcesie.
Po trzecie: takie powiadomienie zwrotne musi być w dostatecznej mierze
godne zaufania. Działanie końcowe zaspokajające popęd,
consummatory act
w ujęciu Wallace'a Craiga, bądź też docelowa sytuacja bodźcowa w
przypadku apetencji do stanów spoczynku w rozumieniu Moniki
Meyer-Holzapfel muszą mieć w wewnętrznych i zewnętrznych procesach
receptorycznych charakterystykę tak jednoznaczną, by wykluczone było z
dostatecznym prawdopodobieństwem błędne powiadomienie o sukcesie lub
niepowodzeniu. Innymi słowy: aparat receptoryczny z powiadomieniem
zwrotnym musi mieć podobną sprawność, jak wrodzony mechanizm wywoławczy
(r. IV.8. i n.).
Prostszy model myślowy aparatu fizjologicznego, który sprawiałby
uczenie się z sukcesów (conditioning by reinforcement), jest
niewyobrażalny.
System zachowań zdolnych do takiego uczenia się nie może więc być nigdy
prostym "odruchem", jak to implikuje terminologia L P. Pawłowa.
Istnieją wprawdzie proste "odruchowe" reakcje unikania w rodzaju
omawianych w rozdziale V. 6, które dochodzą do skutku dzięki prostemu
skojarzeniu pomiędzy reakcją ucieczki i sytuacją bodźcową o nabytej
zdolności wywoławczej i które są powierzchownie podobne do obecnie
rozważanych procesów uczenia się. Nie znamy jednak ani jednego
przypadku, w którym udałoby się zmodyfikować adaptacyjnie jakiś system
zachowań przez przyuczenie, tzn. przez pozytywnie oddziaływające
"nagradzające" bodźce, jeśli nie uczestniczy w tym systemie zachowanie
apetencyjne. Już dawno temu wskazał na to E. C. Tolman.
Również w klasycznym przypadku warunkowego "odruchu" ślinienia się,
badanym przez I. P. Pawłowa, tresura nie umacnia wcale samego tylko
wspomnianego procesu odruchowego, przeciwnie, ślinienie się jest
jedynie drobnym fragmentem o wiele bardziej złożonego ciągu sposobów
zachowania, z których wszakże w klasycznym eksperymencie laboratoryjnym
większość została wyłączona przez prosty zabieg umieszczenia psa w tak
przemyślnej uprzęży, że pozbawiono go niemal kompletnie możliwości
ruchu. Mój nieżyjący już przyjaciel Howard Liddell, pracując gościnnie
w laboratorium Pawłowa, wywołał kiedyś niejakie zdziwienie swym
nieortodoksyjnym eksperymentem. Przyuczył on najpierw psa do bodźca
warunkowego polegającego na przyspieszaniu tempa stale tykającego
metronomu. Kiedy można już było liczyć, że pies będzie się ślinił w
odpowiedzi jak należy, Liddell uwolnił go z uwięzi. Na to pies podbiegł
zaraz do metronomu, który tykał sobie równomiernie, i podskakując,
łasząc się, merdając ogonem, skomląc, innymi słowy całym swym psim
zachowaniem wykazał, że oto prosi o jedzenie swego pana czy też
starszego towarzysza w sforze. Ślinił się przy tym gwałtownie, chociaż
metronom wcale nie przyspieszył uderzeń, bodźca warunkowego zatem nie
było. Wypraszanie jedzenia i wzajemne karmienie są to zachowania bardzo
rozpowszechnione u społecznie żyjących Canidae. Według Crislera już
jednoroczne wilki karmią obce młodsze szczenięta, u likaonów (Lycaon
pictus L.) osobnik, któremu powiodło się na polowaniu, karmi wszystkich
członków stada. Koordynacje dziedziczne proszenia są u obu tych
gatunków takie same jak u psa domowego. One to właśnie, nie zaś tylko
wydzielanie śliny, upostaciowują reakcję, którą uwarunkowano w
klasycznym eksperymencie!
Ani mi w głowie deprecjonować eksperymenty Pawłowa. Sztuczne
wydzielenie pojedynczej reakcji jest najzupełniej uprawnionym
zabiegiem, zwłaszcza jeśli zyskuje się dzięki temu tak dobre możliwości
badania ilościowego, jak przy ślinieniu się psa. Trzeba tylko tak
postępując zachować świadomość, że wycina się fragment z systemu. Nie
wolno w żadnym razie wyobrażać sobie, jak to się najwyraźniej przydarza
łacno ludziom skłonnym do analizy, że teraz system składa się już tylko
z wydzielonego fragmentu i że sam ten fragment wystarcza do zrozumienia
wszystkich właściwości całego systemu. Kiedy przyjmując punkt widzenia
analizy adekwatnej do systemów biologicznych spróbujemy przyjrzeć się
temu, co nam dziś wiadomo o występowaniu reakcji warunkowanych przez
utwierdzenie (reinforcement), potwierdza się najzupełniej przedstawiona
tutaj opinia: pozytywna tresura przez nagradzanie jest ważkim kryterium
"prawdziwej" reakcji warunkowej. W przytoczonym przez C. Foppę spisie
reakcji "dających się warunkować" znalazło się omyłkowo nieco
przypadków, w których reakcje unikania polegające na prostym
skojarzeniu pozorują prawdziwe conditioning.
VI. 3. W POSZUKIWANIU ENGRAMU
Nim zajmę się kwestią, w jakie partie całości systemowej modyfikowalnej
przez uczenie się ingeruje modyfikacja adaptacyjna i skąd pochodzi nowa
informacja, która to sprawia, chciałbym wypowiedzieć parę uwag ogólnych
o fizjologicznej naturze uczenia się i pamięci.
Dotychczasowe poszukiwania engramu, runicznego znaku pamięci
zapisywanego przez uczenie się, okazały się beznadziejnie niemal
bezskuteczne. K. S. Lashley nadał swemu błyskotliwemu odczytowi In
Search of the Engram (W poszukiwaniu engramu) podtytuł Thirty years of
frustration (Trzydzieści lat frustracji). W rzeczywistości cierpliwe
badania Lashleya przyniosły obok innych nader istotnych wiadomości
także i tę, że engram nie jest umiejscowiony w żadnym określonym
punkcie mózgowia, lecz zasadza się na organizacji wiążącej wszelkie
możliwe części mózgu. Po prawdzie, dziś nadal nie potrafimy powiedzieć,
jakie procesy fizjologiczne stanowią podłoże takiego engramu. To
wyjaśnia, dlaczego gdy tylko poznano genetyczne kodowanie informacji w
cząsteczkach łańcuchowych, zaraz tak wielu poważnych badaczy wystąpiło
z hipotezą, że podobna jest procedura utrwalania wiedzy nabywanej w
doświadczeniu osobniczym i gromadzonej w pamięci. Jednakże hipoteza ta
wzbudza bardzo poważne wątpliwości. Jeśli by była słuszna, znaczyłoby
to, że muszą istnieć dwa niezależnie od siebie funkcjonujące
mechanizmy, z których jeden natychmiast "zapisuje na taśmie" wszystkie
nadchodzące impulsy nerwowe, tzn. wytwarza z ich ciągu czasowego
przestrzenny układ odpowiedniej cząsteczki łańcuchowej szyfrującej
fakty swoim kodem. Drugi mechanizm musiałby umieć odczytywać ten kod i
przekładać go z powrotem na impulsy nerwowe skoordynowane czasowo i
przestrzennie. Pomijając ogólne nieprawdopodobieństwo, hipoteza ta nie
jest w stanie wyjaśnić, dlaczego u wszystkich znanych istot żywych
umiejętność uczenia się pozostaje w stosunku prostym do liczby komórek
w zwojach i w ogóle do rozmiarów oraz zróżnicowania centralnego systemu
nerwowego. Biochemicy wykazali ostatnio, że chemiczne kodowanie w
cząsteczkach łańcuchowych informacji nabywanej osobniczo jest
niemożliwością ze względów czasowych. Ponieważ okazało się również, że
w badaniach kontrolnych nie udaje się powtórzyć znacznej części
rezultatów, które zdawały się dowodzić, iż informację nabytą osobniczo
można przekazywać chemicznie, obstaję przy opinii, że wszelkie uczenie
się, przynajmniej w takim zakresie, w jakim warunkuje ono bardziej
złożone adaptacyjne modyfikacje zachowania, dokonuje się w synapsach,
tzn. przez wytwarzanie połączeń pomiędzy poszczególnymi elementami
nerwowymi oraz że te zmiany, jak już powiedziano (r. V.2. i n.), są
nader podobne do embriogenetycznych procesów indukcji. Nie przeczę
bynajmniej, że jakąś rolę w tych lokalnych zdarzeniach mogą odgrywać
zmiany w zakodowaniu cząsteczek łańcuchowych.
VI. 4. «INSTRUKTAŻ» WRODZONY
Otwarty program mechanizmów zachowania, który każdemu osobnikowi został
za sprawą filogenezy przekazany na drogę życia przez jego przodków,
jest zawsze, w sposób wypróbowany, tak skonstruowany, że jego
niedomknięte, wymienne partie odnoszą się do tych danych środowiska, o
których nie można wprawdzie przepowiedzieć ani jak wypadną, ani też
kiedy i gdzie wystąpią, lecz które są za życia osobnika na tyle stałe,
iż pożądane jest gromadzenie dotyczącej ich informacji. Pisklę gęsi
szarej dopiero co wyklute, nie może oczywiście wiedzieć, jak wyglądają
osobniki, za którymi ma przez całe miesiące biegać jako za rodzicami,
młoda zaś pszczoła nie może dysponować wrodzoną informacją o geografii
otoczenia jej ula. Umiejętności w rodzaju rozpoznawania osobniczo istot
własnego gatunku oraz wyuczania się drogi są dobrymi przykładami
gotowości do nabywania przez uczenie się takiej relewantnej
informacji, której nie mogą dostarczyć ani genom, ani mechanizmy
zdobywające informację chwilową.
Z drugiej strony, jak wiemy, właśnie program otwarty zakłada mnóstwo
informacji nabytej filogenetycznie i związanej w genomie. Transpozycja
tej informacji w sensowne zachowanie zwierzęcia następuje na drodze
innej niż rozwój morfogenetyczny. Wprawdzie na początek właśnie w
morfogenezie powstają na podstawie tej informacji całkiem określone
organizacje nerwowe, jak np. omówiona w r. V.6. wrodzona dyspozycja do
błyskawicznego kojarzenia jednego bardzo mocnego bodźca do ucieczki z
całą towarzyszącą sytuacją bodźcową. Również cała omawiana w rozdziale
VI.2 struktura aparatu utwierdzania przez sukces powstaje oczywiście na
podstawie informacji związanej w genomie. Jeśli nie chcemy wykraczać
poza ramy wyjaśnień naturalnych, jest niewyobrażalne, by transpozycja
związanej w genomie informacji w sensowne w rozumieniu utrzymania
gatunku zachowanie mogła się odbywać inaczej, niż poprzez
ukształtowanie realnych struktur systemu nerwowego i narządów
zmysłowych.
Właśnie ta strukturalizacja nadaje sensowny tok uczeniu się. Z niej
wywodzą się "instruktaże", które zapewniają, że otwarte miejsca w
rozmaitych programach wypełnione są w każdym przypadku w sposób
sensowny dla utrzymania gatunku. Jak to już było kilkakrotnie
podkreślane, same te struktury winny być jak najbardziej niepodatne na
modyfikujące zmiany, aby nie gubiły niczego z zawartej w nich
informacji wrodzonej. Jeśli w jakimś systemie sposobów zachowania jeden
podsystem jest bardzo podatny na modyfikację przez uczenie się, to
niechybnie warunkiem tej podatności jest dostateczna odporność na
modyfikacje innych podsystemów tak, by zagwarantowane było wykonanie
programu nauki modyfikowalnych części.
Jeśli nie chce się zakładać czynników pozanaturalnych, jak choćby
przedustawnej harmonii pomiędzy organizmem a środowiskiem, to aby
wyjaśnić ewidentną sprawność większości procesów uczenia się w
zachowywaniu gatunku, trzeba przyjąć istnienie wrodzonych mechanizmów
uczenia się. Również te "instruktaże" należą do warunków możliwości
doświadczenia, odpowiadających kantowskiej definicji tego, co
aprioryczne: wrodzone instruktaże są tym właśnie, co jest dane przed
wszelkim uczeniem się i dane być musi, aby uczenie się umożliwić.
Kiedy przyrodnik ma do czynienia z jakimś złożonym systemem sposobów
zachowania, który do sprawnego funkcjonowania wymaga adaptacyjnej
modyfikacji przez uczenie się, wówczas jest dla niego bardzo nęcącym
przedsięwzięciem wytropić w tym systemie miejsca zawierające utrwalony
genetycznie, otwarty program procesów uczenia się. Związana w genomie
informacja, która jest tu podstawą wszystkiego, może tkwić w
najrozmaitszych mechanizmach narządów zmysłowych i systemu nerwowego.
Może być na przykład skoncentrowana w mechanizmach czysto
receptorycznych. Przy tym typie zachowań, który Wallace Craig nazwał
awersjami, ja zaś za Moniką Meyer-Holzapfel wolę określić jako
apetencję do stanów spoczynku, filogenetycznie zaprogramowane procesy
receptoryczne powiadamiają organizm, że w świecie zewnętrznym "coś jest
nie tak". Może być za sucho, za wilgotno, za ciepło, za zimno, za
jasno, za ciemno, zasolenie wody może być zbyt duże lub zbyt małe,
biotop dawać zbyt skąpą osłonę lub zawierać zbyt wiele ograniczających
widoczność struktur itd., itp. Podniecenie motoryczne, w którym
znajduje się zwierzę, dopóki zachodzi "wzbudzająca awersję" sytuacja,
może przybierać najrozmaitsze formy i ogarniać różne poziomy
organizacji, od najprostszej kinezy aż po skomplikowane, nakierowane na
cel sposoby zachowania, do których należy uczenie się i rozeznanie
[Używany jest też termin: wgląd - przyp. tłum.]. Gdy zachodzi
modyfikacja adaptacyjna, dotyczy ona zawsze sposobów znajdowania drogi.
Tak dochodzi do wyuczania się drogi: są to prawdziwe reakcje warunkowe,
które najszybciej wyprowadzają organizm z zasięgu niepokojącego bodźca.
Podobnie rozpowszechniony i równie prosto zaprogramowany jest inny
jeszcze wrodzony typ powstawania reakcji warunkowych, dzięki któremu
zwierzę osiąga ważną zdolność utrzymywania stałych warunków wewnątrz
organizmu przez skierowane na zewnątrz zachowanie, tzw. zdolność
zabezpieczania homeostazy przez reakcje celowe. Wiemy z własnego
doświadczenia, że jeśli coś jest nie w porządku, w którymś z rozmaitych
obwodów regulacyjnych naszego ciała, otrzymujemy wówczas niezawodny o
tym meldunek. Ten meldunek "czujnika" może mieć charakter swoisty, jak
na przykład przy braku określonych substancji w tkankach.
Najpospolitszymi przykładami są głód i pragnienie. Najstarsi
behawioryści, jak Thorndike, byli zdania, że zaspokojenie
zapotrzebowania tkanek (tissue needs) jest najważniejszym z potwierdzeń
dających w efekcie samoprzyuczania się (Selbstdressuren). Nie stawiano
przy tym w ogóle pytania, skąd organizm jako całość, zwłaszcza jego
system nerwowy, ma "wiedzieć", czego mu brak i jakimi sposobami
zachowania mógłby temu brakowi zaradzić.
Innym przykładem mechanizmu, który - acz w nieco odmiennym sensie -
melduje o niepożądanym stanie rzeczy jest zmysł bólu. Jego szczególną
umiejętnością jest lokalizacja zakłócenia, dowiadujemy się od razu,
gdzie tkwi błąd i ból nie pozwala nam o tym zapomnieć. Jednakże spośród
meldunków o zaburzeniach homeostazy, nadsyłanych nam przez nasze ciało,
interesujące są zwłaszcza te, które są w małym stopniu zlokalizowane.
Nie potrafimy wówczas powiedzieć nic innego jak to, że jest nam
niedobrze. Np. przy jakiejś drobnej infekcji nie jesteśmy w ogóle w
stanie określić miejsca zaburzenia, nawet jeśli "czujemy się zdechle".
Kiedy natomiast komuś "chce się rzygać", wówczas informacja jest już
lepiej umiejscowiona i nieraz można nawet powiedzieć, dlaczego ów ktoś
źle się czuje. Najwyraźniej na tym właśnie polega wartość takiego
doniesienia dla zachowania gatunku. Jeśli np. złe samopoczucie wynikło
ze spożycia nadpsutego pokarmu, wówczas w drodze "swobodnego" - jak
mówią psychoanalitycy - "kojarzenia" przyjdzie nam na ogół na myśl
nieco podejrzana potrawa, którą jedliśmy poprzedniego dnia, i skoro
tylko to sobie uprzytomnimy, związek przyczynowy stanie się dla nas
subiektywnie pewny. Warunkowe reakcje unikania, które występują w
następstwie takich przeżyć, mogą się utrzymywać bardzo długo, nieraz
przez całe życie.
Wrodzony mechanizm uczenia się, który wytwarza te reakcje warunkowe
stosując złe samopoczucie jako "karę" i dobre jako potwierdzenie, może
być zaprogramowany bardzo ogólnie. Potrzebny mu jest jeden tylko, w
sensie techniki regulacji, czujnik w każdym z rozmaitych obwodów
regulacyjnych organizmu i wystarcza, by karał za każdą zmianę
oddalającą od wartości pożądanej, nagradzał zaś każde zbliżenie. Na tej
zasadzie polega w rzeczy samej mechanizm, który określa dobór diety u
wielu "euryfagów", tzn. zwierząt żywiących się rozmaitym, w szerokim
zakresie, pokarmem. Kurt Richter ustalił już przed wielu laty, że
szczury, którym podaje się rozmaite potrzebne im w pożywieniu
substancje w wielu różnych naczyniach - białka rozdzielano nawet przy
tym na poszczególne aminokwasy - biorą z każdej miseczki dokładnie
tyle, ile wymaga dobrze wyważona dieta. Ponieważ nie sposób, by szczur
mógł dysponować nabytą filogenetycznie informacją o tym, jakie
aminokwasy dają się zsyntetyzować w pożywne dla niego substancje
białkowe i ile każdego z nich trzeba, wiedza zwierzęcia musi pochodzić
skądinąd. Doniosłe rezultaty na temat zaprogramowania wrodzonego
mechanizmu uczenia się, który dostarcza szczurowi tej informacji,
przyniosły badania J. Garcii i F. R. Ervina. Szczura można przyuczyć
lub oduczyć przyjmowania określonych substancji pokarmowych jedynie
przeżyciami, których źródło tkwi w trzewiach. Wymienieni badacze
używali jako bodźców karnych zastrzyków apomorfiny wywołujących mdłości
i wymioty albo też promieniowania rentgenowskiego w dawkach
powodujących te same konsekwencje w postaci tzw. kociokwiku
porentgenowskiego. Bezskuteczne natomiast były wszelkie próby oduczenia
szczurów przyjmowania określonych substancji pokarmowych przy
zastosowaniu bodźców bólowych i innych najcięższych kar. Z drugiej
strony równie niemożliwe okazało się oduczenie zwierząt za pomocą
wspomnianych bodźców trzewnych jakiegokolwiek innego sposobu
zachowania, niż właśnie przyjmowania określonych pokarmów.
Zarówno przy adaptacyjnej modyfikacji zachowania apetencyjnego
zmierzającego do stanów spoczynku, jak i przy samoprzyuczaniu się do
określonych substancji pokarmowych, o którym dopiero co była mowa, na
pierwszy plan wysuwają się warunkowe reakcje unikania.
Uogólniający termin awersji, użyty przez Craiga, jest więc w pewnej
mierze usprawiedliwiony. Nigdy jednak nie można rozstrzygnąć
obiektywnie, czy zwierzę, które na przykład przepełza ze środowiska
chłodniejszego w cieplejsze, ucieka od chłodu czy też poszukuje ciepła;
właśnie dlatego bardziej mi odpowiada termin Moniki Meyer-Holzapfel.
Pewne jest przecież, że tak czy inaczej organizm znajduje się w stanie
podniecenia i że właśnie eliminacja podniecenia działa jak
potwierdzenie przyuczające. Jest to ów, uznany przez C.L.Hulla za
szczególnie ważny, typ potwierdzania przez spadek napięcia - relief of
tension.
Istnieją też modyfikowalne systemy zachowań, w których informacja
wrodzona tkwi nie tylko w receptorycznym mechanizmie wywoławczym,
analizującym sytuację bodźcową, lecz raczej w samej wywoływanej
koordynacji dziedzicznej. Dobry przykład stanowi budowanie gniazda
przez kawki (Coloeus monedula L.) oraz inne krukowate (Corvidae).
Stojąc w środku przyszłego gniazda ptak z materiałem budowlanym w
dziobie wykonuje swoisty dygocący ruch popychania, szerokim zamachem w
bok i nieco od siebie, wciskając i wbijając materiał w podłoże lub w
już uprzednio zbudowane części gniazda. Jeśli spotka się przy tym z
oporem, dygotanie wzmaga się, ciągłe zaś pchanie przechodzi w serię
energicznych, identycznie skierowanych uderzeń, które w skutkach
mechanicznych są dość podobne do ruchów wykonywanych wyciorkiem przez
człowieka czyszczącego fajkę, kiedy przy wprowadzaniu narzędzia do
przewodu natrafia ono na opór. Jeśli ptak przyniósł gałązkę lub podobny
przedmiot, materiał zostanie stopniowo wciśnięty i wreszcie, po długich
wysiłkach budowniczego, utkwi na dobre i nie będzre go już można ani
wyciągnąć, ani wepchnąć głębiej. Skoro to tylko nastąpi, ruchy
"popychającego dygotania" osiągają orgazmiczne maksimum i urywają się z
kryzysową nagłością. Ptak przestaje się teraz interesować przyniesionym
przedmiotem i chwilowo nawet w ogóle budową gniazda. Popychające
dygotanie, którego nagłe urwanie zaspokaja popęd, jest typowym
przykładem działania końcowego consummatory act, czyli działania
spełniającego lub konsumacyjnego w ujęciu Wallace'a Craiga.
W przeciwieństwie do wielu różnych ptaków śpiewających, kawki i inne
krukowate nie dysponują najwyraźniej żadną umiejscowioną w mechanizmie
wywoławczym informacją o tym, co się nadaje do budowy gniazda. Kiedy
odzywa się u nich po raz pierwszy popęd do budowania, znoszą
najbardziej nieprawdopodobne przedmioty i usiłują je umocować w
nadającym się do budowy gniazda miejscu, za pomocą popychającego
dygotania. O tym, które miejsce się nadaje, wiedzą w sposób wrodzony.
Widywałem kawki i kruki popychające takimi dygotkami odłamki szkła,
stare oprawki od żarówek, nawet kawałki lodu. Nie chciało się to
oczywiście trzymać, nie dochodziło do działania końcowego
zaspokajającego popęd. I oto ptak uczy się bardzo prędko używania tylko
takich przedmiotów, od których przy popychającym dygotaniu przychodzą
zwrotne meldunki, czyli "reaferencje" zaprogramowane we wrodzonym
mechanizmie uczenia się jako potwierdzenia. Wystarczają one, by
przyuczyć ptaka do wyboru materiałów, z których za pomocą ruchu
instynktowego może upleść konstrukcję szczególnie wytrzymałą. Zdarza
się czasem, że ten wrodzony instruktaż zawodzi, co wobec zwięzłości
informacji wrodzonej jest łatwe do pojęcia: drut lub skrawek blachy
dają oczywiście szczególnie mocne reaferencje, toteż bywa, że ptak
przyuczy się do tego materiału, który ze względu na swe przewodnictwo
cieplne jest biologicznie nieprzydatny. W pobliżu zakładów
przemysłowych metalowe gniazda nie są wcale rzadkością. Sprawa ta jest
przykładem odziaływania tzw. ponadnormalnego obiektu, reakcja na taki
obiekt ma, jak potem jeszcze zobaczymy, charakter przywary.
Bardziej skomplikowane są procesy uczenia się, dzięki którym następuje
u szczura zintegrowanie w jedną funkcjonalną całość rozmaitych ruchów
instynktowych budowy gniazda. Jak zdołał wykazać L. Eibl-Eibesfeldt,
każda z uczestniczących koordynacji dziedzicznych oddzielnie jest
całkowicie wrodzona. W jedynym przypadku jest też tak samo z
kolejnością tych koordynacji: szczur "wie" z przyrodzenia, że budowę
powinien rozpocząć od zbierania materiału daleko od przyszłego gniazda
i zanoszenia go następnie na miejsce. Szczury wyhodowane przez
Eibl-Eibesfeldta w klatkach, gdzie nie było żadnych dających się
przenieść przedmiotów, używały jako namiastki własnego ogona: najpierw,
daleko od zwykłego legowiska, brały go w zęby, zanosiły "do domu" i
starannie składały na właściwym miejscu. Ponieważ zamierzeniem było
eksperymentowanie z osobnikami pozbawionymi doświadczenia, trzeba było
powtórzyć tę próbę z takimi szczurami, którym we wczesnej młodości, na
długo przed rozbudzeniem się działań budowlanych, obcięto ogony. Kiedy
takim osobnikom już dorosłym dostarczono miękkich skrawków papieru,
natychmiast przystępowały do budowy. Te z nich, które miały w
niepoprzegradzanym pojemniku stałe preferowane legowisko, od razu tam
właśnie składały znoszone skrawki. U tych, które przed eksperymentem
układały się zazwyczaj na spoczynek to tu, to tam, trwało kilka minut,
nim zdecydowały się na jakieś określone miejsce budowy. Osłonięcie
jednego z narożników kawałkiem blachy o rozmiarze kilku centymetrów
kwadratowych spowodowało, że wszystkie poddane eksperymentowi zwierzęta
tam właśnie ulokowały budowę.
Działalność budowlana szczurów pozbawionych doświadczenia różniła się w
wymowny sposób od działalności normalnych zwierząt kontrolnych. Była
przede wszystkim o wiele bardziej wytężona. Niedoświadczone szczury
rzucały się wprost chciwie na materiał do budowy, co tłumaczyło się
spiętrzeniem nigdy nie odreagowanych ruchów instynktowych, a czego jak
najbardziej należało się spodziewać. Ważna różnica polegała jednak na
tym, że w działaniu szczurów poddanych eksperymentowi brakowało
kolejności koordynacji dziedzicznej, znamiennej dla osobników
doświadczonych w budowaniu gniazd. Szczur doświadczony przystępując do
budowy ogranicza się do znoszenia materiału dopóty, dopóki nie uzbiera
pokaźnego stosu. Wtedy obracając się wokół osi pionowej ściąga ten
materiał koncentrycznie ku sobie tak, że wokół środka gniazda wyrasta
pierścień ściany. Dopiero wówczas gdy ściana osiąga dostateczną
wysokość, doświadczone zwierzę przechodzi do tak zwanego "tapetowania",
które polega na ubijaniu i wygładzaniu przednimi łapkami wewnętrznej
powierzchni ściany. Szczury, z którymi eksperymentował Eibl-Eibesfeldt,
wykonywały od razu każdy z tych rodzajów ruchu w sposób doskonale
skoordynowany, również analiza filmu ze zwolnionymi zdjęciami nie
wykazała żadnych różnic w porównaniu z ruchami doświadczonych
współplemieńców. Brakowało jednak zupełnie wspomnianej uprzednio
kolejności, szczur przybiegał gorliwie z jednym papierowym skrawkiem i
złożywszy go zaraz wykonywał w powietrzu ruch wznoszenia lub
wygładzania, bez ładu i składu.
Modyfikowalny system jest w całości bardziej skomplikowany u szczura
niż u kawki, ale każdy z większości istniejących u nich wrodzonych
mechanizmów uczenia się funkcjonuje według tej samej zasady. W obu
przypadkach przyuczenie i utwierdzenie określonego następstwa ruchów
następuje za sprawą dwóch procesów. Po pierwsze, dzięki temu, że
koordynacja dziedziczna w tej formie może być źródłem nagradzającego
meldunku zwrotnego tylko w najzupełniej określonej, przewidzianej w
programie sytuacji w otoczeniu. Po drugie zaś dzięki samemu meldunkowi
o sukcesie lub niepowodzeniu, który składają mechanizmy ekstero- i
prawdopodobnie również prioprioceptoryczne.
Jest też prawdopodobne, że bezpośredni wpływ oduczający wywiera samo,
by tak rzec, spalenie na panewce ruchu instynktowego, który nie daje
żadnych reaferencji. W każdym razie przy bezpośredniej obserwacji
omawianych tutaj procesów uczenia się odnosi się wrażenie, że szczur o
wiele ładniej, i z o wiele większą satysfakcją, potrafi się delektować
ruchem wznoszenia ściany, kiedy materiał jest już na miejscu, oraz że
ruch tapetowania daje pełną satysfakcję dopiero wtedy, gdy ściana już
stoi.
Mając na uwadze czytelnika zainteresowanego teorią uczenia się zauważę,
iż procesy uczenia się, przy których duża część informacji wrodzonej
zlokalizowana jest nie w sektorze receptorycznym, lecz w samym sposobie
poruszania się skoordynowanym dziedzicznie, dają się podciągnąć pod
pojęcie "warunkowania sprawczego", czyli instrumentalnego (operant
conditioning) [Operant conditioning, czyli tzw. warunkowanie
instrumentalne jest terminem, którego związek z behawioryzmem Lorenz
podkreśla zachowując angielski - przyp. tłum.]. W tym przypadku
jednak nie sprowadza się ono do jakiegoś prostego ruchu o wielorakim
zastosowaniu, do, powiedzmy, drapania czy grzebania przednią
łapą, ruchu zatem mogącego z łatwością przynieść za którymś razem
potwierdzający sukces całkiem przypadkowo - jak to się dzieje choćby
przy pociśnięciu dźwigni w skrzynce Skinnera lub w jednej z
dawniejszych "sekreter", skrzynek z tajemnym mechanizmem - lecz polega
na wysoce zróżnicowanym ruchu instynktowym, który przydatny jest do
wykonywania jednego tylko swoistego zadania, właśnie tego, dla którego
się zrodził w filogenezie dysponującego nim gatunku.
W przypadku prostych sposobów poruszania się o wielorakim zastosowaniu
obowiązują prawidłowości sformułowane przez B. F. Skinnera dla procesu
uczenia, się, określanego przez niego jako typ R-conditioning
(warunkowanie R). Pierwsze z tych praw orzeka, iż siła warunkowania
instrumentalnego wzrasta, jeśli występuje po nim utwierdzająca sytuacja
bodźcowa. Drugie prawo orzeka, iż siła ta zmaleje, jeśli po
utwierdzonym już przez conditioning warunkowaniu instrumentalnym nie
wystąpi utwierdzający bodziec. Prawa te sprawdzają się, jeśli
warunkowanie instrumentalne jest tzw. reakcją narzędziową, jak
lokomocja lub inne proste sposoby poruszania się służące rozmaitym
popędom. Prawa te obowiązują jedynie częściowo wówczas, gdy
warunkowanie instrumentalne jest ruchem instynktowym, do którego
apetencja motywuje zwierzę. W tym przypadku zachowanie poprzedzające
zostanie wprawdzie na dalszą metę utwierdzone przez sukces, chwilowo
jednak będzie nawet wskutek niego radykalnie wygaszone. Najpierw
następuje zaspokojenie popędu. Dopiero po ponownym jego rozbudzeniu da
o sobie znać wpływ przyuczający. Natomiast brak potwierdzenia nie
skłania wcale zwierzęcia do rezygnacji z warunkowania instrumentalnego.
Ponieważ jest on koordynacją dziedziczną z autonomicznym napędem, brak
zaspokojenia ma ten tylko skutek, że zwierzę stara się o zaspokojenie
tego sposobu poruszania się w innych sytuacjach i na innych obiektach,
ale z rosnącą apetencją.
Uwydatnienie tych różnic ważne jest dlatego, że metodę prób i błędów,
którą opisaliśmy powyżej na przykładzie kawek i szczurów i którą
posługuje się w ten sam sposób bardzo wiele zwierząt, można by pomylić
z tak zwanym zachowaniem eksploratywnym, czyli z ciekawości, o którym
mowa będzie później.
Przy wyżej opisanych procesach ruch instynktowy wykonywany jest pod
naciskiem własnej, w nim samym tkwiącej motywacji, toteż zwierzę
wypróbowuje ten sposób poruszania się bez zmiany wobec najrozmaitszych
obiektów. Natomiast w przypadku zachowania z ciekawości we właściwym
sensie organizm - jak to przekonywająco przedstawiła Monika
Meyer-Holzapfel - wprawia w ruch motywacja najzupełniej odmiennego
rodzaju, niezależnie od popędowego ciśnienia poszczególnego ruchu
instynktowego. Nie jeden ruch instynktowy jest wówczas wypróbowany
wobec rozmaitych obiektów, lecz jeden obiekt jest poddawany po kolei
próbie wielu ruchów instynktowych, często całego repertuaru czynności,
jakim dysponuje zwierzę. Oba procesy uczenia tym różnią się od
klasycznego operant contitioning, że w tym ostatnim warunkowanie
instrumentalne reprezentowane jest przez ogólnie stosowalną reakcję
narzędziową, która może być wywołana pod ciśnieniem bardzo rozmaitych
motywacji.
Szczególnie interesującą i nieoczekiwaną lokalizację informacji
wrodzonej wykrył M. Konishi badając, jak formuje się pienie u młodych
ptaków śpiewających. O wielu gatunkach z tej grupy wiadomo, że pienie
zgodne we wszystkich szczegółach z normą gatunkową, ukształtuje się u
niedoświadczonego młodego osobnika tylko pod warunkiem, że usłyszy on
śpiew dorosłego współplemieńca. Podobnie badania J. Nicolai'a ujawniły
zdumiewający fakt, że niektóre ptaki, jak np. gil, uczą się wyłącznie
od ściśle określonych osobników, z którymi pozostają w równie ściśle
określonych i bardzo bliskich stosunkach społecznych. Wiedziano
również, że młode ptaki wielu gatunków, w których obowiązuje nauka
przez naśladownictwo, wybierają sobie za wzór własny śpiew gatunkowy
nawet wówczas, gdy słyszą dużo innych głosów ptasich i gdy głosy
współplemieńców nie są przy tym wcale ani najgłośniejsze, ani
najbardziej się wyróżniające. Oskar Heinroth zaobserwował poza tym, że
wyhodowane w izolacji młode z gatunków, w których niezbędny jest wzór
współplemieńca, w końcu, po długich próbach, potrafią jednak wydać
pienie w przybliżeniu zgodne z normą gatunkową. Heinroth przypuszczał,
że zachodzi "samonaśladowanie".
Odkrycia Konishiego przyniosły wyjaśnienie wszystkich tych zjawisk.
Ptaki, którym Konishi niszczył narząd słuchu w najwcześniejszej
młodości, wydawały jako dorosłe pienie złożone raczej ze szmerów, niż z
tonów i pozbawione jakiejkolwiek struktury. Tak samo było w przypadku
gatunków, w których u osobników podrastających w dźwiękoszczelnych
pomieszczeniach, ukształtowało się pienie wyraźnie rozpoznawalne
gatunkowo. Wynika stąd zdumiewający, ale nieodparty wniosek, że
pozbawiony doświadczenia ptak dysponuje receptorycznym wzorcem -
Konishi mówi o auditory template - swego swoistego gatunkowo pienia.
Cicho, jakby dla igraszki podśpiewując, ptak na podobieństwo
gaworzącego dziecka wypróbowuje najrozmaitsze kombinacje dźwięków i
zachowuje te, które najlepiej odpowiadają "majaczącemu" mu, gatunkowemu
szablonowi akustycznemu. Cichy przedśpiew, który nasi miłośnicy ptaków
tak ładnie nazwali "komponowaniem", ma więc charakter eksplorującej gry.
Omówione przykłady filogenetycznie zaprogramowanych mechanizmów uczenia
się wystarczająco ukazują trzy fakty ważne w kontekście niniejszej
książki.
Po pierwsze: dzięki odpowiedniej analizie eksperymentalnej można zawsze
w zasadzie wskazać, w którym podsystemie złożonego i podatnego na
modyfikację systemu zachowań tkwi informacja wrodzona, stanowiąca
rękojmię, że zwierzę przyuczy się do sposobów zachowania celowych w
sensie utrzymania gatunku.
Po drugie: nie można zrozumieć żadnego poszczególnego procesu uczenia
się nie znając całego systemu, którego modyfikację proces ten sprawia.
Po trzecie: niemożliwe są żadne wiążące orzeczenia, co działa
utwierdzająco - jako reinforcement - w uczeniu się w ogóle. Teoria
Thorndike'a, że istotnym potwierdzeniem jest zaspokojenie
zapotrzebowania tkanek, czy też teoria Hulla dopatrująca się istotnego
czynnika przyuczającego w odprężeniu nerwowym - relief of tension - są
trafne jedynie w odniesieniu do przypadków szczególnych. W każdym
poszczególnym przypadku uczenia się trzeba odrębnie badać fizjologiczną
naturę procesu utwierdzania.
VI. 5. MODYFIKOWALNE PODSYSTEMY I ICH ADAPTACYJNA ZMIENNOŚĆ
W rozważaniach powyższych, jeszcze gruntowniej zaś w książce Evolution
and Modification of Behaviour (Ewolucja i modyfikowanie zachowań,
Harvard University Press 1965), starałem się wykazać, iż nie sposób
przyjmować możliwości modyfikacji adaptacyjnej wszystkich w ogóle
występujących cząstkowych procesów zachowania, chyba że uciekniemy się
do witalistycznego założenia przedustawnej harmonii pomiędzy organizmem
a środowiskiem. Warunkiem wstępnym wszelkiej podatności na modyfikację,
jeśli ma się ona okazać wartościowa dla zachowania gatunku, jest w
sposób oczywisty obecność filogenetycznie powstałego programu
otwartego, i ponadto jeszcze mechanizmu uczenia się, również
zaprogramowanego filogenetycznie, w rodzaju omawianych w poprzednim
podrozdziale. Powszechna bez reszty plastyczność wszystkich sposobów
zachowania oznaczałaby z założenia nieskończoną mnogość zarówno
informacji filogenetycznej, jak i tych mechanizmów uczenia się, co jest
oczywiście nonsensem.
VI. 6. REAKCJA WARUNKOWA, PRZYCZYNOWOŚĆ I PRZEMIANA
DYNAMICZNA
Zdarza się nieraz, jak już wspomniano na wstępie, że aparaty
poznawcze o różnych poziomach integracji powstały najwyraźniej w
przystosowaniu do tej samej danej pozapodmiotowej. Czasem aparaty takie
przypadają w udziale, każdy oddzielnie, formom zwierzęcym o różnych
poziomach rozwoju, czasem znajdują się, funkcjonując niezależnie od
siebie, u jednego i
tego samego gatunku. Dotyczy to także aparatów, o których teraz będzie
mowa.
Najważniejsze z osiągnięć, które przyniosła umiejętność formowania
reakcji warunkowych, polega, jak to podkreślił E. C. Tolman w książce
Purposive Behaviour of Animals and Man (Zachowanie celowe u zwierząt i
człowieka) na tym, że pozwala ona organizmowi oceniać pewien określony
układ bodźców, sam w sobie biologicznie nierelewantny, jako zapowiedź
rychłego wystąpienia sytuacji w sensie życiowym ważnej i przygotować
się do niej.
Miałem niegdyś możność obserwować, jak półdzikie kozy w górach Armenii,
słysząc daleki jeszcze grzmot, przezornie podążały ku określonym
wydrążeniom skalnym, rozsądnie oczekując ulewy. Tak samo postępowały
słysząc huk odpalanych w pobliżu ładunków. Przypominam sobie dokładnie,
że właśnie obserwując te kozy, nagle uprzytomniłem sobie po raz
pierwszy jasno, iż w sytuacjach naturalnych z uformowania się reakcji
warunkowych wynika coś sensownego w rozumieniu zachowania gatunku tylko
wtedy, gdy bodziec warunkowy pozostaje w przyczynowym związku z
bezwarunkowym.
Niezawodnie regularne post hoc, od którego zależy wartość reakcji
warunkowej dla zachowania gatunku, nigdy nie zachodzi w wolnej
przyrodzie bez związków przyczynowych, które wówczas łatwo przejrzeć. W
zasadzie jednak związki takie istnieją także wówczas, gdy jakiś
eksperymentator regularnie uruchamia "dzwon obiadowy" przed karmieniem
pawłowowskiego psa. Oczywiście, przyczynowe zdeterminowanie w
zachowaniu badacza wymyka się jeszcze tymczasem naszej analizie.
Sądzę, że wykazując teleonomiczność reakcji warunkowej rzuca się
istotne światło na pewien błąd w empiryzmie Hume'a, który jest także
przedmiotem krytyki w książce Karla R. Poppera Objective Knowledge
(Wiedza obiektywna). Ze stanowiska czystej logiki niemożliwością jest,
jak pokazuje Hume, wnioskować o konieczności powtórzenia się
określonego następstwa zdarzeń nawet z dowolnie wielkiej liczby
precedensów; nie można też nawet wnosić, iżby prawdopodobieństwo
takiego domniemania rosło wraz z liczbą powtórzeń. W związku z tą tezą
logiczną Hume stawia następujące pytanie psychologiczne, skąd to się
bierze, że każdy rozumny człowiek oczekuje z wielką pewnością, iż
słońce wzejdzie również nazajutrz, iż upuszczony kamień spadnie na
ziemię i że w ogóle sprawy na świecie będą się nadal toczyć jak
dotychczas. Wielki empirysta odpowiada na to pytanie twierdząc, że
chodzi tu o skutek przyzwyczajenia - custom of habit - innymi słowy, że
dzięki wielokrotnemu powtarzaniu uruchomiony zostaje mechanizm
kojarzenia idei bez którego, powiada Hume, nie bylibyśmy w ogóle zdolni
żyć.
Jak pokazuje Popper, sprzeczność pomiędzy logiką i zdrowym rozsądkiem -
common sense - nie tylko kazała wielu myślicielom zwątpić o możliwości
wiedzy obiektywnej, lecz również samego Hume'a popchnęła ku wierze w
nieracjonalną epistemologię. Popper powiada o nim: "Powtarzanie nie ma
żadnej mocy dowodowej, chociaż panuje nad naszym życiem poznawczym czy
też naszym «pojmowaniem»; ten uzyskany przez Hume'a rezultat prowadzi
go do wniosku, że dowody bądź rozum odgrywają jedynie podrzędną rolę w
naszym pojmowaniu. Nasza «wiedza» zostaje zdemaskowana jako mająca
charakter przeświadczenia i to przeświadczenia nie dającego się
racjonalnie bronić, irracjonalnej wiary." ("His result that repetition
has no power whatever as an argument, although it dominates our
cognitive life or our «understanding» led him to the conclusion that
argument or reason plays only minor role in our understanding. Our
«knowledge» is unmasked as being not only of the nature of belief, but
of rationally indefensible belief - of an irrational faith.")
Chciałbym zacytować trzy zdania z przejrzystego wywodu, w którym Karl
Popper ukazuje wyjście z tej aporii; nawet wyrwane z kontekstu
dokumentują one zasadniczą zgodność pomiędzy wynikami logiki i
etologii. Popper pisze: "Rozróżnienie pomiędzy problemem logicznym i
psychologicznym, zawarte implicite w rozumowaniu Hume'a, uważam za
niezwykle doniosłe. Nie sądzę jednak, by zadowalający był pogląd Hume'a
na to, co ja jestem skłonny nazwać «logiką». Opisuje on, jakże jasno,
procesy ważnego wnioskowania, ale rozpatruje je jako «racjonalny»
proces umysłowy." ("I regard the distinction, implicit in Hume's
treatment, between a logical and a psychological problem as of the
utmost importance. But I do not think that Hume's view of what I am
inclined to call «logic» is satisfactory. He describes, clearly enough,
processes of valid inference, but he looks upon these as «rational»
mental process.")
Do zasad metodologicznych Poppera należy transponowanie wszelakiej
terminologii subiektywnej na obiektywizującą, kiedy tylko wchodzą w grę
problemy logiczne. Powiada on wprost: "Co jest prawdziwe w logice, jest
prawdziwe w psychologii." ("What is true in logic, is true in
psychology.") Ta zasada transponowalności - principle of transference -
pomiędzy subiektywnym i obiektywnym odpowiada ściśle przeświadczeniu
wyrażonemu przez nas w "Prolegomenach" o zasadniczej tożsamości
wszystkich procesów przeżywania z procesami fizjologicznymi.
Myślenie logiczne, nie inaczej niż formowanie reakcji warunkowych i
niezliczone inne procesy "psychologiczne", jest dokonaniem ludzkiego
aparatu światoobrazu, który jako całość pozostaje wobec danych
rzeczywistości pozapodmiotowej w owym stosunku odpowiedniości,
wielokrotnie już tu wspomnianym (Prol. 3.). Gorzki wniosek empiryzmu
Hume'a, iż naprawdę wszelka nasza wiedza jest jedynie najzupełniej
bezpodstawną wiarą, byłby tylko wtedy słuszny, gdyby słuszne było
zdanie: Nihil est in intellectu quod non antefuerat in sensu - nie ma
niczego w umyśle, czego by wpierw nie było w czuciu (percepcji
zmysłowej).
Wiemy już jednak, jak fałszywe jest to zdanie, wiemy, że ilekroć
następuje przystosowanie, jest to proces poznawczy oraz że dany nam a
priori aparat, dzięki któremu dopiero możliwe jest indywidualne
zdobywanie doświadczenia, sam już zakłada obecność mnóstwa informacji
uzyskanej filogenetycznie i nagromadzonej w genomie. Hume tego
wszystkiego jeszcze nie wie; behawioryści nie chcą tego wiedzieć.
Kiedy spotykamy się z powtarzalnością w zachodzeniu jakiegoś
określonego zdarzenia, każdego z nas coś przymusza przyjąć, że pomiędzy
poszczególnymi manifestacjami istnieje jakiegoś rodzaju związek, nie
dający się najpierw bliżej zdefiniować. Pamiętam dobrze, że jako uczeń
długo nie chciałem uwierzyć memu nauczycielowi, iż kiedy w ruletce
bardzo dużo razy wychodziło czerwone, to prawdopodobieństwo zatrzymania
się kulki przy następnym rzucie na czarnym nie wzrasta wraz z liczbą
powtarzających się wygranych czerwonego. Nauczyciel przekonał mnie w
końcu argumentem: "Popatrz, kółko nie przypomina sobie przecież, co
było poprzednio, każdy kolejny rzut jest znów taki sam jak pierwszy,
czarne i czerwone są w nim równie prawdopodobne." Rozmawiałem z bardzo
wieloma ludźmi, którzy zaobserwowali u siebie ten sam nie dający się
logicznie wyjaśnić przymus. Pytanie interesujące, ale niełatwo o
odpowiedź na nie: jaki to właściwie realny mechanizm przypisuje się
takimi oczekiwaniami kołu ruletki? Rzecz ma się bez mała tak, jakbyśmy
spodziewali się po nim, jak po żywej istocie, że po tak wielu
powtórzeniach zmęczy się stale tym samym sposobem zachowania i
zapragnie odmiany.
O wiele łatwiej odpowiedzieć na pytanie, dlaczego przeżywszy
kilkarotnie pewną sekwencję zdarzeń skłonni jesteśmy te z nich, które
zachodzą najpierw, traktować jako niezawodną zapowiedź późniejszych.
Taki przymus w myśleniu i zachowaniu byłby bezsensowny, gdyby
rzeczywistość pozapodmiotowa przypominała koło ruletki i jej zdarzenia
następowały po sobie, jak w ruletce, w rozkładzie przypadkowym.
Otóż w wolnej przyrodzie zdarzenia o czysto przypadkowym rozkładzie,
następujące po sobie na podobieństwo rozgrywek na ruletce, przytrafiają
się niezmiernie rzadko. Natomiast łańcuchy zdarzeń, w których rezultat
przemiany dynamicznej warunkuje przyczynowo jakieś regularne
następstwo, są nie tylko częste, lecz wręcz wszechobecne. Kiedy po
błyskawicy następuje grzmot lub po dalekim grzmocie ulewa i kiedy
zdarzenia te zajdą w tej samej kolejności jedno po drugim, choćby tylko
kilka razy, wówczas z przytłaczającym wprost prawdopodobieństwem można
przyjąć, że wszystkie trzy zdarzenia pozostają ze sobą w związku
przyczynowym. Jednakże spowodowanie jednego zdarzenia przez drugie
zakłada zawsze przemianę dynamiczną w jakiej bądź formie. Także
prawdopodobieństwo przypuszczenia, że określony łańcuch zdarzeń
utrzymuje się za sprawą powiązania przyczynowego, wzrasta wraz z liczbą
zaobserwowanych przypadków. Realium pozapodmiotowe, które fizyk stara
się ująć twierdzeniem o zachowaniu energii, jest bez wątpienia tożsame
z tym, które odzwierciedla przystosowanie w formie co najmniej dwóch
różnych aparatów poznawczych: po pierwsze - w formie omawianej tutaj
umiejętności wytwarzania reakcji warunkowych, a nawet w ogóle tworzenia
skojarzeń, po drugie zaś - we właściwej ludzkiemu myśleniu formie
kauzalności.
Reakcja wymijania u pantofelka i złożona centralna reprezentacja
przestrzeni u najwyższych istot żywych stanowią przystowania do tej
samej danej realnej, mianowicie do nieprzenikliwości ciał i do ich
rozkładu w przestrzeni. Analogicznie wytwarzanie reakcji warunkowych i
myślenie kauzalne są przystosowaniami do tego samego realium,
mianowicie do zachowania energii i jej zdolności do przemiany.
Błędne jest mniemanie empirystów, jakoby myślenie kauzalne człowieka
powstało jedynie za sprawą przyzwyczajenia i jakoby nasze propter hoc,
nasze "wskutek tego, że", było tożsame z często przeżywanym i godnym
zaufania post hoc, "z reguły potem". Aksjomatyczna natura naszego
myślenia kauzalnego nigdzie nie ujawniła się tak jasno, jak w zdaniach,
którymi James Prescott Joule rozpoczyna swoją klasyczną rozprawę o
równoważniku cieplnym. Naiwnie zarazem i apodyktycznie powiada on tam,
że absurdem byłoby przypuszczać, iż jakaś forma energii może zniknąć
nie przemieniając się w inną, tym samym postuluje coś, czego następnie
dowodzi, a więc wcale nie potrzebowałby postulować. Podobnie,
aprioryczny charakter myślenia kauzalnego wyraża się w odwiecznym
"dlaczego" każdego inteligentnego dziecka.
Kilkakrotnie była już mowa (Prol. 2. i n.) o tym, że działanie
prostszych aparatów poznawczych można kontrolować ze stanowiska
bardziej złożonych i że przy takiej kontroli ich doniesienia nigdy nie
okazują się fałszywe, lecz zawsze tylko uboższe informacyjnie niż w
aparatach wyższych. Ten sam stosunek zachodzi najwyraźniej pomiędzy
reakcją warunkową i myśleniem kauzalnym. Uczenie się z sukcesów i w
ogóle wszelkie tworzenie skojarzeń ujmują ze wszystkich faktów
przemiany dynamicznej tylko jeden: że przyczyna poprzedza skutek w
czasie. To wystarcza, by umożliwić organizmowi podjęcie ważnych życiowo
przygotowań.
VI. 7. UCZENIE SIĘ MOTORYCZNE
Wiedeński zoolog Otto Storch był, o ile mi wiadomo, pierwszym, który
wyraźnie docenił fakt, że adaptacyjną modyfikację w sektorze
receptorycznym zachowania zwierząt spotyka się już na znacznie niższym
szczeblu rozwoju niż w sektorze motorycznym. Poza omówionym, w
pierwszym podrozdziale niniejszego rozdziału, bardzo prostym procesem
uczenia się, wdrażaniem motorycznym, wszystko, co było powiedziane
dotychczas o teleonomicznych zmianach zachowania dzięki uczeniu się,
odnosi się do procesów receptorycznych, do "receptoryki nabytej"
(Erwerbsrezeptorik) w terminologii Storcha: uczulanie, habituacja,
nawyk, urazowe kojarzenie ucieczki z określonymi sytuacjami bodźcowymi,
a także wzrost selektywności wrodzonych mechanizmów wywoławczych - są
to wszystko procesy polegające na zmianach w aparatach receptorycznych.
Na czym więc zasadzają się najprostsze teleonomiczne modyfikacje
sprawności motorycznych? Zdolność reakcji warunkowej do antycypowania,
pozwalająca organizmowi odpowiedzieć na bodziec warunkowy przez
podjęcie celowych, w sensie utrzymania gatunku, przygotowań do
spotkania oczekiwanego bodźca bezwarunkowego, umożliwia mu zarazem
wyuczenie się kolejności, w jakiej winien wykonać określone ruchy
instynktowe, z których każdym dysponuje z przyrodzenia. Na przykładzie
budowania gniazda przez szczura zapoznaliśmy się już z takim procesem
uczenia się. Przypuszczam, że na tej samej zasadzie polega wszelkie
uczenie się motoryczne, jeśli nie chodzi o zwykłe wdrażanie omówione w
V.2, lecz o prawdziwą reakcję warunkową. W najprymitywniejszych
przypadkach zestawiane sposoby poruszania się są całościowymi i jako
takie łatwymi do rozpoznania ruchami instynktowymi, jak u budującego
gniazdo szczura. Jeśli elementy ruchowe zestawione tym trybem stają się
prostsze i jeśli maleje ich rozciągłość w czasie, wówczas powstaje o
wiele wyraźniejsze wrażenie, że chodzi o naukę nowego sposobu
poruszania się. Stosunkowo prostego przykładu jak powstaje ciąg
ruchowy, który budzi w podanym sensie wrażenie jednolitego, dostarcza
wyuczanie się drogi przez myszy. Obserwacja myszy, która uczy się
przedostawać przez wysokościenny labirynt, unaocznia nam różnicę
pomiędzy swobodnym ciągiem ruchów sterowanym informacją chwilową a
wykonaniem utrwalonej, wyuczonej sekwencji; pokazują to na przykład
filmy z tych procesów sporządzone w 1952 roku przez O. Koehlera i W.
Dinglera. W nieznanym terenie zwierzę przebija się do przodu dosłownie
krok za krokiem, macając wąsikami w prawo i w lewo i wciąż na krótko
zawracając. Już jednak za trzecim czy czwartym powtórzeniem przebiega
czasem szybciej jakiś kawałek drogi, ale wnet znów utyka i powraca do
uprzedniej formy orientowania się w przestrzeni. Przy dalszych
powtórzeniach pojawiają się nowe odcinki krótkotrwałego przyspieszenia
w innych miejscach trasy, mnożą się i wydłużają, aż wreszcie zlewają
się w punktach styku. Kiedy na koniec w szybkim biegu znikają wszystkie
"spawy", nauka drogi jest zakończona. Teraz mysz przebiega całą trasę w
jednej jedynej, płynnej sekwencji ruchów.
Zespalanie urywkowych ruchów lokomocyjnych, którymi zwierzę dysponuje
każdym oddzielnie, następuje w rzeczy samej dzięki temu, że jedna
reakcja warunkowa sprzęga się z drugą, kolejną. Każdy ruch przynosi
pewną oczekiwaną sytuację bodźcową, która z jednej strony powiada
organizmowi, że znajduje się jeszcze na właściwej drodze, z drugiej zaś
wywołuje kolejny impuls motoryczny.
W książce, która stała się klasyczna, Die Orientierung der Tiere im
Raum (Orientowanie się zwierząt w przestrzeni), Alfred Kuhn opisał pod
pojęciem mnemotaksji i mnemicznej homofonii dokładnie ten właśnie
rodzaj uczenia się i tę samą formę sensorycznej kontroli wyuczonego
procesu motorycznego, ale tylko jako możliwość teoretyczną. Z różnych
stron wysunięto wówczas zarzut, że gdyby te przypuszczenia były
słuszne, zwierzę byłoby zmuszone biec dokładnie po raz wyuczonym tropie
i traciłoby orientację zboczywszy choćby o krok. Ponieważ Kuhn nie znał
żadnego zwierzęcia, które by spełniało te wymagania, usunął z
następnego wydania rozdział o mnemotaksji i mnemicznej homofonii -
niesłusznie, gdyż zwierzęta, o których tutaj mowa, na przykład rzęsorek
rzeczek (neomys fodiens Pali.), zachowują się dokładnie tak, jak każe
przewidywać jego teoria. Ze szczególną wyrazistością widać to wtedy,
gdy takiemu stworzeniu faktycznie zdarzy się zboczyć z drogi lub gdy,
eksperymentując, celowo zakłóci się homofoniczną zgodność pomiędzy
utrwalonym na dobre następstwem ruchów zwierzęcia a konfiguracją trasy.
Kiedy zabrałem z toru moich rzęsorków przeszkodę w kształcie
wzniesienia, na które przywykły wskakiwać, by biec po nim dalej,
zwierzątka skakały w odpowiednim miejscu w powietrze i siadały najpierw
zdezorientowane na ziemi tam, gdzie przedtem stał zabrany przedmiot,
mała skrzynka drewniana. Następnie moje rzęsorki zaczynały badać teren
wąsikami, zawracały i najwidoczniej rozpoznawały odcinek, który
przebiegły przed chwilą, nim nastąpiło zakłócenie. Teraz więc znów
zbierały się w sobie, zawracały w poprzednim kierunku, puszczały się
pędem - i w krytycznym miejscu raz jeszcze skakały w pustkę!
Przypominały mi dziecko, które recytując wiersz w jakimś miejscu utyka
i zaczyna na nowo od wcześniejszego ustępu, aby przebrnąć przez to
miejsce "z rozpędu".
Można chyba przypuścić bezpiecznie, że także nauka bardziej
skomplikowanych celowych form poruszania się odbywa się według
zobrazowanych wyżej zasad. Wprawdzie w przypadku wyuczania się drogi
chodzi niemal wyłącznie o liniowe sprzęganie poszczególnych elementów
ruchu pochodzących z dziedzicznych koordynacji lokomocyjnych, nie widać
jednak, dlaczego by tego samego rodzaju procesy nie miały sprawiać
integracji cząstkowych ruchów równoczesnych.
Wyuczone sekwencje ruchów są "znane na pamięć" i różni autorzy
określali taką wiedzę jako "kinestetyczną". Doniesienia zwrotne
proprioreceptorów odgrywają na pewno znaczną rolę w opanowaniu ruchu
"umianego", co właśnie sugeruje to złożone słowo greckie: kinesis -
ruch, aisthanomai - czuję. Wyrażenie jest trafne również
fenomenologicznie, gdyż istotnie w sposób dobrze opanowany poruszamy
się przecież "na wyczucie". Z drugiej strony termin ten sugeruje, iż to
właśnie proprioreceptoryczne obrazy wspomnieniowe umożliwiają nam
dokładne powtórzenie takiej sekwencji ruchów, to przypuszczenie zaś
jest prawdopodobnie niesłuszne. Erich v. Holst pokazał już przed laty,
że również dowolnie wytwarzane koordynacje ruchowe podlegają prawu
efektu magnetycznego i koordynacji centralnej [Zapewne błąd: powinno
być "proporcjonalnej" - przyp. tłum.], co ostatnio potwierdzono
wielokrotnie. Dzięki badaniom J. Ecclesa wiemy, że narządem, w którym
dokonuje się koordynacja dobrze opanowanych ruchów, jest móżdżek.
Nawet na najwyższym poziomie nauka poruszania się, jak o tym będzie
jeszcze trzeba pomówić dokładniej w podrozdziale o ruchach dowolnych,
nie różni się zasadniczo od wyuczania się drogi przez ssaki niższe.
Chodzi tu zawsze o zaprogramowane w gotowej formie i centralnie
koordynowane sposoby poruszania się, którymi zwierzę dysponuje z
przyrodzenia, i które przez uczenie się są jedynie integrowane w nowe
całości. Wraz z filogenetycznym rozwojem zwierzęcych umiejętności
uczenia się ruchów, rozmiary tych elementów motorycznych maleją. Nawet
jednak przy ruchach w pełnym sensie dowolnych elementy ruchowe znajdują
się znacznie powyżej płaszczyzny integracji odpowiadającej skurczowi
włókna, nie ma wątpliwości, że najczęściej obejmują one jeszcze
ściąganie się kilku całych mięśni synergicznych, tzn. działających w
jednym kierunku, są wszakże dość małe, by używając ich równocześnie lub
kolejno można było zestawić każdą niemal "melodię ruchów".
Jest dość pewne, że podłoże lokomocyjnych elementów ruchowych stanowi
endogenna produkcja bodźców oraz koordynacja centralna. Sądzę, że ani
uczenie się, ani w ogóle jakiekolwiek oddziaływanie nie są zdolne
adaptacyjnie odmienić tego rodzaju fizjologicznych przebiegów i że to
jedynie mnogość procesów, któreśmy nazwali uprzednio (r. IV. 10.)
płaszczem odruchów, może się na nie nakładać, pośrednicząc pomiędzy
nimi a wymaganiami, jakie stawia świat zewnętrzny. Przemawia wszak za
tym przypuszczeniem również znana nam już okoliczność, że tam, gdzie
pośrednictwo płaszcza odruchów jest niewystarczające, podstawowa
koordynacja dziedziczna bynajmniej, by tak rzec, nie "mięknie" i nie
daje się wyginać taksjami, lecz rozpada się na drobne fragmenty, z
których każdy jest wprawdzie równie "sztywny", jak sus cwałującego
rumaka, ale które właśnie z racji ich krótkości mogą łatwiej i w sposób
bardziej wielostronny sprostać wymaganiom wynikającym z rozeznania w
przestrzeni.
Niewątpliwie szczególna wartość wpojonego, dobrze opanowanego ruchu dla
zachowania gatunku polega w pierwszym rzędzie na tym, że może się on
toczyć nieopóźniany czasami reakcji.
Widać, jak bardzo sekwencja ruchów opanowana na pamięć różni się
pewnością celu i szybkością od ciągu sterowanego krok po kroku przez
mechanizmy orientacyjne, kiedy się próbuje w otwartym rewirze złowić
jakieś zwierzę terytorialne, np. jaszczurkę lub rybę koralową. Dopóki
zwierzę porusza się po wyuczonych, utartych trasach jest ono tak
szybkie i nieomylne, że nie ma właściwie nadziei, by można je było
złapać jakimś błyskawicznym chwytem lub zamachem siatki. Kiedy jednak
uda się nam nagłym wypadem wprawić ściganą zwierzynę w taką panikę, że
znajdzie się ona poza rejonem opanowanym dzięki wyuczeniu się dróg,
wówczas damy z nią sobie zazwyczaj radę. Sądzę, iż właśnie korzyść,
jaką w przedstawionym sensie daje wyuczanie się dróg, stanowiła w
decydującej mierze o ciśnieniu selekcyjnym, które sprawiło, że u
gatunków wspomnianego typu ekologicznego wykształciło się zachowanie
terytorialne.
Nikt jeszcze nie próbował badać wyuczonych, wpojonych [Eingeschliffene
- czyli dokładnie właśnie "wpojone", który to termin
bywa niesłusznie i niepotrzebnie używany jako przekład gepragt - przyp.
tłum.] sekwencji ruchowych zwierząt metodami, którymi w swoim czasie
posłużył się Erich v. Holst, aby wykazać, że ruchy koordynowane
centralnie są niezależne od procesów aferencyjnych. Zabieg
"dezaferencji", czyli wyłączenia wszystkich nerwów doprowadzających,
podejmowany przez Ericha v. Holsta, oznacza ze zrozumiałych względów
tak ciężkie w ogóle uszkodzenie organizmu, że niewiele by dowodziło,
gdyby poddane mu zwierzę nie potrafiło się potem poruszać w sposób
wyuczony, który opanowało przed operacją. O ludziach chorych na tabes
dorsalis, u których przestały funkcjonować zakończenia nerwowe
donoszące o pozycji kończyn, tak zwane proprioreceptory położenia,
wiadomo, że koordynacja ruchów jest u nich zakłócona w sposób istotny.
Trzeba jednak mieć na uwadze, że człowiek jest niejako mistrzem świata
w ruchach dowolnych, nad którymi się panuje i które są sterowane przez
rozeznanie, i że wobec tego jest całkiem możliwe, iż kontrolowane
aferencyjnie są u niego pewne sposoby poruszania się, podczas gdy ich
odpowiedniki u zwierząt takiej kontroli nie podlegają.
Pomijam kwestię, czy wszystkie wyuczone sposoby poruszania się zwierząt
i ludzi są fizjologicznie tej samej natury, mowa tu tylko o tego
rodzaju wpojonych i wygładzonych w tysiąckrotnych powtórzeniach
przebiegach ruchu, do których odnieść można wyrażenia ukształtowane w
toku naturalnego rozwoju mowy potocznej, jak: "umie coś zrobić przez
sen", "weszło mu w krew", "stało się drugą naturą", a także "całkiem
automatycznie". Pozwolę sobie nadto przypuścić, że mechanizmy
fizjologiczne takich sekwencji ruchowych są podobne do tych, na których
opiera się opisane wyuczanie
się drogi przez małe ssaki. Pytanie o te mechanizmy jest dlatego
interesujące, że owe sekwencje wykazują pod wieloma względami
zaskakujące podobieństwa z koordynacjami dziedzicznymi, a więc z
ruchami instynktowymi.
Po pierwsze, w koordynacji ruchów wpojonych (eingeschlieffene),
niejedno prawo, co wykazał już Erich v. Holst, obowiązuje zupełnie tak
samo, jak w centralnej koordynacji wrodzonych sposobów zachowania. Tak
więc w obu przypadkach rytmy rozmaitych, wplecionych w łączną
koordynację ruchów elementarnych w ten sam sposób wpływają na siebie
wzajem. Zjawiska "koordynacji proporcjonalnej" i "efektu
magnetycznego", co do których odsyłam do prac v. Holsta, sprawiają
dosłownie harmonijne współgranie poszczególnych rytmów w ten sposób, że
dążą do ich wyfazowania w proporcjach dających się wyrazić małymi
liczbami całkowitymi. Im lepiej się to udaje, tym stabilniejsza jest
koordynacja rytmów. Sposoby poruszania się oporne wobec takich
tendencji procesu centralnego koordynowania pozostają niestabilne, tzn.
trudno jest je utrzymać, jak to wie każdy pianista, który ma jedną ręką
grać triole, drugą zaś ósemki. To właśnie funkcje koordynacji
proporcjonalnej i efektu magnetycznego nadają zarówno każdemu dobrze
opanowanemu ruchowi wyuczonemu, jak i niezależnemu od procesów uczenia
się ruchowi instynktowemu ową oszczędzającą wysiłku elegancką formę,
która tak bardzo przemawia do naszego poczucia piękna.
Druga właściwość ruchu dobrze opanowanego, dzięki której przypomina on
wrodzone koordynacje dziedziczne, polega na wielkiej odporności wobec
wszelkich prób przekształcenia. Karl Buhler zwykł mawiać, że dla tego,
co wyuczone, należałoby postulować jako właściwość definiującą, że może
być znów zapomniane. Było to z pewnością pomyślane aforystycznie, ale
ma głębszy sens, ponieważ, jak sadzę, stosuje się wyłącznie do
"prawdziwego" uczenia się, natomiast nie dotyczy procesu nabywania,
dzięki któremu powstają wpojone koordynacje ruchowe. Mam nieodparte
wrażenie, że takich koordynacji w ogóle nie można nigdy zapomnieć
całkowicie i że poprawki i dostosowanie w zewnętrznym przebiegu ruchu
są raczej skutkiem już to nakładania się na siebie wcześniejszych
sposobów zachowania, już to dodatkowych nabytków, niż zacierania
dawnych przyzwyczajeń. Przemawiają za tym obserwacje, które poczynić
można nieodmiennie np. na kierowcach, kiedy przesiadają się z jednego
typu wozu na drugi. Jeśli jakieś ruchy zasługują na określenie
"wpojonych" i "umianych przez sen", to właśnie ruchy naprawdę dobrego
kierowcy. Kiedy taki kierowca jeździ przez długi czas tylko jednym
wozem i następnie zostaje zmuszony do zmiany, sztywność tych ruchów
ujawnia się bardzo wyraźnie. Gdy moja żona przesiadła się z samochodu z
dźwignią zmiany biegów w podłodze na wóz z lewarkiem przy kierownicy,
przez długi czas sięgała najpierw w próżnię po nie istniejącą dźwignię
i dopiero potem w górę do lewarka. Ten okrężny gest stawał się
stopniowo zaokrąglonym, z zamachem wykonywanym ruchem dłoni, który dla
każdego, kto nie znał jego prehistorii, wyglądał afektowanie; ruch ten
wciąż jeszcze całkiem się nie zatarł, kiedy wóz z lewarkiem przy
kierownicy zasłabł ze starości i zastąpiony został nowym, znów z
dźwignią w podłodze. Moja żona, która przez ponad 5 lat urągała na
lewarki i nie mogła odżałować dźwigni, teraz nie potrafiła, jak się
okazało, wyzbyć się po prostu koordynacji ruchowych zmiany biegów przy
kierownicy. Pozostawiam czytelnikowi wykoncypowanie, jaką trasą wędruje
teraz do dźwigni biegów dłoń mojej pani; po wszystkim, co tu zostało
powiedziane, łatwo pojąć, że jest to ruch niesłychanie elegancki.
Trenerzy sportowi dobrze znają zaciekły opór, jaki dobrze opanowane
ruchy stawiają wszystkim wysiłkom, by je wyeliminować. Toteż nie lubią
oni wcale, by podopieczny, który chce się nauczyć np. gry w tenisa czy
sportowego pływania, dysponował już jakąś umiejętnością w tych
dyscyplinach, nabytą w drodze samouctwa; takie umiejętności bowiem nie
tylko nie są, z wyżej wyłożonych względów, pomocne, lecz stanowią
trudną do przezwyciężenia przeszkodę w nauce koordynacji optymalnych,
niezbędnych u prawdziwego zawodnika.
Trzecia i najosobliwsza zgodność pomiędzy ruchem wpojonym i koordynacją
dziedziczną polega na tym, że po dłuższym nieużywaniu tak jednego, jak
drugiego występuje wyraźnie zachowanie apetencyjne zmierzające do
zrobienia z nich użytku. Jednym z najsilniejszych motywów, który każe
ludziom tańczyć, jeździć na łyżwach i oddawać się uprawianiu innych
sportów, jest skierowana ku całkiem określonemu mocno wpojonemu ruchowi
apetencja o natężeniu rosnącym wraz ze stopniem opanowania ruchu i
trudności związanych z jego wykonywaniem.
Podobną apetencję wykonywania ruchów trudnych, ale dobrze opanowanych
wykazał H. Harlow u makaków, które nie nagradzane stale powtarzały "dla
przyjemności" wyuczone manipulacje. "Rozkosz funkcjonowania", jak
trafnie nazwał to zjawisko Karl Buhler, odgrywa najwyraźniej ważką rolę
w powstawaniu dobrze opanowanych, mocno wpojonych sekwencji ruchowych.
Wiemy z własnego doświadczenia, że każde uzupełnienie, każde
wygładzenie występującej jeszcze "szorstkości" stanowi o wzroście
przyjemności, wyraźnie dającym się zaobserwować. Wydoskonalenie ruchu
jest samo dla siebie nagrodą; w książce Evolution and Modification of
Behaviour pisałem o perfection-reinforcing mechanizm (mechanizmie
samopotwierdzającego się doskonalenia).
Fenomenologicznie rzecz biorąc, dobre opanowanie mocno wpojonych ruchów
wykazuje kilka jeszcze osobliwych właściwości, z których jedna
przynajmniej jest bardzo istotna dla roli, jaka przypada ruchowi
dowolnemu w zachowaniu eksploratywnym, o czym będzie mowa w następnym
rozdziale. Właściwości te są na swój sposób sprzeczne. Z jednej bowiem
strony dobre opanowanie ruchu wyuczonego jest w tak wielkim stopniu i
tak wyłącznie sprawą podświadomych i nawet bezświadomych warstw naszej
osoby, że usiłując świadomie śledzić za przebiegiem ruchu i kontrolować
go, możemy w nim tylko przeszkadzać. Często, w warstwach dostępnych
świadomości, nie wiemy nawet, co robimy i jak to robimy. Kiedy się od
bardzo dawna nie wykonywało jakiegoś opanowanego ruchu, np. wybrawszy
się na narty po raz pierwszy po dziesięcioletniej przerwie, człowiek
myśli nawet, stojąc wysoko na zboczu, że w ogóle już nie umie jeździć,
ale z chwilą gdy ruch się rozpocznie, potoczy się on ku naszemu
zdumieniu równie gładko jak dawniej.
Z drugiej strony, przy dobrze przyswojonych sposobach poruszania się
udaje się nam nierzadko wzbudzić w sobie tak żywe wyobrażenie
kinestezji ich przebiegu, że wtedy samoobserwacja pozwala skonstatować
szczegóły procesu, o których nasza świadomość już nie wie. Kiedy
wnuczek zapytał mnie niedawno, który z dwóch większych pedałów w moim
samochodzie porusza sprzęgło, a który hamulec, zmuszony byłem ze
zdziwieniem stwierdzić, że po prostu tego nie wiem i musiałem uciec się
do wspomnianego przed chwilą zabiegu, aby móc udzielić odpowiedzi.
Otóż jestem zdania, że powstawanie takich wyobrażeniowych obrazów
własnych ruchów odgrywa ważną i nawet decydującą rolę w swoistym dla
człowieka zróżnicowaniu centralnej reprezentacji danych przestrzennych
i tym samym w naszym myśleniu pojęciowym. Czynność sterowanego
rozeznaniem ujmowania, które jest w swej istocie macaniem końcami
palców, zwłaszcza prawego palca wskazującego, stanowi wedle wszelkiego
prawdopodobieństwa wstępny warunek pojmowania. Przemawia za tym ogromna
rozległość połaci, która w korze kresomózgowia reprezentuje dłoń i
palce pod względem sensorycznym i motorycznym oraz stosunek pól
motorycznych do dróg piramidowych, najważniejszych dróg nerwowych ruchu
dowolnego.
Nawet w formie najbardziej prymitywnej, jak w opisanym wyuczaniu się
przez rzęsorka "na pamięć" pewnej sekwencji ruchów lokomocyjnych,
nabywanie dobrze opanowanych koordynacji ruchowych jest aktem
poznawczym i to niebywale skutecznym. Koordynacja dziedziczna może być
z natury rzeczy przystosowana tylko do takich danych środowiska, co do
których jest do przewidzenia, że napotka je każdy osobnik gatunku.
"Wpojony" sposób ruchu wykazuje niejedną właściwość funkcjonalną
znamienną również dla koordynacji dziedzicznej: jego przebiegu nie
opóźniają czasy reakcji, przysługuje mu własne zachowanie apetencyjne,
a zatem ma on rangę motywacji. Podobnie jak ruch instynktowy, wpojony
sposób ruchu również jest "skrojony na miarę", nie tylko wszakże w
odniesieniu do ogólnych potrzeb gatunku, lecz także wobec całkiem
szczególnych warunków życia osobnika. Łatwo pojąć, jak wysoka jest
wartość tego układu właściwości dla utrzymania gatunku. Najwyższa jest
ona w przypadku zwierząt, które muszą dawać sobie radę w przestrzeni
życiowej o złożonej strukturze i dużym urozmaiceniu. U istot
nadrzewnych, które przemieszczają się za pomocą chwytających rąk i
które zarazem są zazwyczaj zmuszone radzić sobie za pomocą wpojonego,
dobrze opanowanego ruchu z drogą wśród gałęzi, w wyuczonej sekwencji
ruchów musi być przygotowany każdy literalnie krok i każdy chwyt.
Wielka dokładność przystosowania jest tym chwytnorękim drzewołazom
niezbędna dlatego zwłaszcza, że cęgopodobna dłoń winna się domknąć
wokół gałęzi we właściwej chwili i właściwym położeniu, jeśli ma
utrzymać zwierzę. Spośród chwytnorękich drzewołazów jedynie powolne
nocne małpiatki, jak lorisy i zachodnioafrykański lemur potto, mogą
sobie pozwolić na powierzenie swej orientacji przestrzennej mechanizmom
dostarczającym informacji chwilowej. Natomiast wszystkie szybko się
poruszające, zwłaszcza zaś wszystkie skaczące małpiatki i małpy są
skończonymi mistrzami dobrze opanowanego ruchu. W tym też tkwi jedna z
przyczyn, dla których człowiek wziął swój ród z grupy takich właśnie
istot.
Ponieważ nie widzę żadnej zasadniczej różnicy pomiędzy procesami, które
uczestniczą w zwykłym wyuczaniu się drogi a tymi, które mają udział w
nauce najbardziej złożonych ruchów dobrze opanowanych, nie
wydaje mi się potrzebne postulować z gruntu różne procesy w centralnym
systemie nerwowym dla wyjaśnienia uczenia się receptorycznego i
motorycznego. To, co nowego powstaje w procesie nauki, zarówno w sferze
receptorycznej, jak i motorycznej, zasadza się na nowych połączeniach.
Innymi słowy: modyfikacja adaptacyjna zawsze prawdopodobnie dotyczy
synaps i jest nader blisko spokrewniona z indukcją w rozumieniu
Spemanna.
VI. 8. PRZYSTOSOWANIE MECHANIZMÓW UCZENIA SIĘ POD SELEKCYJNYM
CIŚNIENIEM ICH FUNKCJONOWANIA
Wraz z wielką fulguracją nowego obwodu ze sprzężeniem zwrotnym, dzięki
której dokonuje się nauka z sukcesów, końcowe ogniwa liniowego
dotychczas łańcucha procesualnego otrzymały nową funkcję. Nim doszło do
wielkiego wynalazku reakcji warunkowej, działaniu końcowemu przypadało
jedynie bardzo proste zadanie: dopełnić ciągu ruchów zgodnie ze
sztywnym programem "zamkniętym" oraz złożyć o tym meldunek zwrotny,
wyłączając w ten sposób zachowanie apetencyjne. Już z nagłego,
kryzysowego spadku pobudzenia po wykonaniu działania końcowego można
wnosić, że taki meldunek zwrotny jest rzeczywiście przesyłany;
eksperymentalnie dowiódł tego F. Beach, który u samca szympansa
operacyjnie wyłączył meldunek zwrotny o opróżnieniu pęcherzyków
nasiennych, przekazywany w procesie kopulacji.
Wiemy już (r. IV.10.), że wszystkie koordynacje dziedziczne mają
tendencję do nieprzerwanego działania. Hamowanie centralnie
koordynowanych ruchów jest pierwszą z funkcji, w których służbie
powstały nadrzędne scentralizowane instancje w ośrodkowym systemie
nerwowym. "Centra" te muszą zarazem, obok funkcji hamowania, posiadać
umiejętność odhamowywania we właściwym biologicznie momencie każdego z
nadzorowanych sposobów poruszania się, innymi słowy, muszą być w stanie
przyjmować informację chwilową o tym, że taki korzystny moment
nastąpił. Koordynacja dziedziczna, nadrzędny wobec niej ośrodek
hamowania i mechanizm wywoławczy stanowią więc od razu funkcjonalną
jedność. Heinroth tworząc pojęcie swoistego gatunkowo działania z
popędu dostrzegł to z genialną wnikliwością.
Pierwotnie treścią meldunku przekazywanego do "centrum" przez
koordynację dziedziczną jest tylko "program wypełniono", na co
instancja nadrzędna każe ponownie włączyć hamowanie przed chwilą
wstrzymane. Jedynie w wyjątkowych przypadkach działanie końcowe
zaspokajające popęd ustaje wskutek "wybiegania się", tzn. wyczerpania
się specyficznego dla jego czynności pobudzenia, jak np. przy śpiewie
wielu ptaków, który stopniowo, powoli ucicha.
Jest bardzo prawdopodobne, że ciśnienie selekcji znalazło w mechanizmie
omawianego tu prostego systemu podatne miejsce, co pozwoliło mu
przetworzyć mechanizm meldunków o wykonaniu w mechanizm meldunków o
wyniku. Od działania końcowego wymaga ta nowa funkcja znacznie
większych świadczeń; jest ono jakby dzielnym żołnierzem, który dotąd
potrafił jedynie meldować "rozkaz wykonano", teraz zaś ma się nagle
wykazać umiejętnością składania najwyższej generalicji przemyślanych
raportów o tym, jakie rezultaty przyniosła jego akcja, i nawet o tym,
co generałowie zarządzili niesłusznie. Ta nowa sprawność wymaga mnóstwa
informacji ekstero- i proprioceptorycznej, nadto zaś potrzebne są
jeszcze mechanizmy, które dysponują dostateczną "wiedzą"
filogenetyczną, by móc z wystarczającą pewnością odróżnić sukces od
niepowodzenia.
Tak więc wynalazek reakcji warunkowej stawia nowe wymagania
mechanizmowi działania końcowego; nie tylko musi powstać aparat, który
składa bogaty informacyjnie meldunek o wyniku działania, lecz nadto
wymagana jest energia nerwowa w ilościach niezbędnych, by doprowadzić
wyraziście tę wiadomość do wszystkich, licznych i rozmaitych instancji
centralnego systemu nerwowego, których funkcjonowanie ma ulec
adaptacyjnej zmianie. Pod selekcyjnym ciśnieniem tych nowych funkcji w
mechanizmach działania końcowego rozwinęły się specjalne struktury i
fizjologiczne właściwości, których dawniejsi etologowie przez długi
czas nie rozumieli poprawnie.
Zachowanie w systemie niepodatnym na uwarunkowanie, w rodzaju swoistego
gatunkowo działania z popędu, przebiega bez widocznego wyakcentowania
działania końcowego. Dotyczy to zwłaszcza tych łańcuchów zachowań,
które jak kopulacja u wielu stawonogów funkcjonują w życiu osobnika
tylko raz jeden. U zwierzęcia wykonującego działanie końcowe nie
zauważa się bynajmniej żadnego specjalnego wzrostu ogólnego pobudzenia.
W porównaniu z pełnym podniecenia tańcem godowym, jakim np. samczyk
skaczela, pająka skaczącego, zabiega o samiczkę, samo dopełnienie
kopulacji, stanowiące zakończenie łańcucha zachowań, wygląda wręcz
sennie.
Nawet u bardzo podatnych na uczenie się pielęgnic, wysoce rozwiniętych
ryb, które troszczą się o potomstwo, składanie ikry i zapłodnienie
odbywa się bez żadnego zauważalnego wzrostu pobudzenia, przeciwnie,
wstępne ceremonie kojarzenia się par, z ich tanecznymi poruszeniami i
przepysznym kolorystycznie pokazem barw, zdradzają o wiele wyższe
pobudzenie ogólne niż działanie końcowe. Jest w tym nadto wiele nauki,
ryby uczą się rozpoznawać osobniczo i warunkiem trwałego związku, w
którym odtąd żyją, jest właśnie ta osobnicza znajomość. Przyuczający
wpływ ruchów kojarzenia się par jest najprawdopodobniej większy niż
składania ikry i zapłodnienia; podobnie jak opiekując się potomstwem,
samczyk przy zapłodnieniu robi swoje do tego stopnia "z obowiązku", że
pewnej mojej współpracownicy obserwującej tarło Etroplus maculatus
wyrwało się kiedyś wiekopomne zdanie: "To wygląda niemal na cnotliwość,
jak on zbywa tę robotę."
Kiedy porównuje się spółkowanie w tym gatunku z działaniami ogiera lub
w ogóle z docelowymi działaniami końcowymi istot wyższych, choćby z
zabijaniem łupu przez drapieżne zwierzę czy z atakiem drapieżnego ptaka
na zdobycz, wówczas te ostatnie sposoby zachowania wywołują u
obserwatora nieodparte wrażenie rozgorzałego płomienia, którym
podniecenie zda się spalać cały organizm. To wydatne pobudzenie ogólne
ma najwidoczniej duże znaczenie dla wytworzenia czysto ilościowych
warunków takiej mnogości i tak silnych impulsów nerwowych, jakie są
niezbędne, by oddziałać na wszystkie nader liczne punkty centralnego
systemu nerwowego, w których meldunek zwrotny działania końcowego ma
indukować modyfikacje. Ten zatem fajerwerk ogólnego pobudzenia, ten -
po stronie podmiotowej - pożar zmysłów nie jest bynajmniej
niefunkcjonalnym epifenomenem, jakimś produktem ubocznym, lecz jest to
nieodzowna składowa mechanizmu fizjologicznego, który potrafi uzyskiwać
informacje z sukcesów i niepowodzeń.
Przy wszystkich systemach zachowań omawianego teraz typu natychmiast po
meldunku o wykonaniu następuje gwałtowny spadek pobudzenia. Wobec
jednak znaczenia "fajerwerku ogólnego pobudzenia", o którym była mowa,
nader sztuczna wydaje mi się opinia, iżby tylko eliminacja stanu
pobudzenia była przyczyną przyuczającego oddziaływania, jakie wywiera
wypełnienie działania końcowego. Pogląd Hulla, że relief of tension,
spadek napięcia, jest istotnym czynnikiem przyuczającym, słuszny w tak
wielu innych przypadkach, jest w odniesieniu do docelowego działania
końcowego na pewno fałszywy, o czym poucza najzwyklejsza samoobserwacja.
Kiedy mechanizm wywoławczy otrzymuje w ramach podatnego na warunkowanie
systemu zachowań nowe funkcje cząstkowe różne od tych, jakie sprawował
w systemie liniowym, niezdolnym do uczenia się, on również zostaje
poddany bardzo odmienionemu ciśnieniu selekcji. To nowe ciśnienie
selekcyjne stawia go pod niejednym względem wobec wymagań przeciwnych
niż te, jakie stwarzało ciśnienie uprzednie, zmierzające do maksymalnej
wybiórczości mechanizmu wywoławczego. W liniowym, niepodatnym na
modyfikację łańcuchu zachowań wrodzony mechanizm wywoławczy jest dla
działania z popędu jedyną instancją, która "wie" kiedy i gdzie
działanie ma być wykonane. Nieodzowna w tym przypadku wybiórczość staje
się nie tylko niepotrzebna, lecz wręcz niekorzystna, kiedy drugi proces
uzyskiwania informacji podejmuje swą rolę "instruktażu". Ponieważ
dopiero zwrotny meldunek działania końcowego zaspokajającego popęd
powiadamia organizm, jaki moment, miejsce i obiekt są najkorzystniejsze
dla użycia danego sposobu zachowania, niniejsza selektywność mechanizmu
wykonawczego staje się czynnikiem pozytywnym. W konsekwencji, u blisko
spokrewnionych zwierząt występuje nieraz bardzo różna selektywność
analogicznych, a nawet homologicznych wrodzonych mechanizmów
wywoławczych [Analogiczny - o tej samej funkcji;
homologiczny - o tym samym pochodzeniu filogenetycznym - przyp.
tłum.]. Wspominaliśmy już tutaj o nieselektywności wrodzonego
mechanizmu wywoławczego, który u zdolnych do uczenia się ptaków
krukowatych decyduje o doborze materiału do budowy gniazda. Natomiast u
znacznie mniej, w sensie uczenia się, uzdolnionych estreld, czyli zięb
ozdobnych (Estrildini) i tkaczy (Ploceini) znajomość wyłącznie
nadającego się do budowy materiału, który u tych ptaków musi być
przystosowany do wysoce zróżnicowanych ruchów przy konstruowaniu
gniazda, jest całkowicie wrodzona, tak że nawet wiele z nich w ogóle
wtedy dopiero nastraja się rozrodczo, kiedy napotyka odpowiednie bodźce
kluczowe w postaci materiału na gniazdo.
Metoda reakcji warunkowej uzyskiwania informacji o obiekcie z formy
wrodzonego sposobu poruszania się, przynosi poważną korzyść: następuje
wybiórcze wyabstrahowanie tych właściwości obiektu, które są istotne
dla skutecznego użycia podatnego na warunkowanie sposobu zachowania.
Bardzo wiele zwierząt wyższych stosuje tę metodę przyuczania się w
drodze prób i błędów do najkorzystniejszego, w każdym przypadku, z
osiągalnych obiektów. Im większą rolę odgrywa ta metoda, tym bardziej
skąpa może być, jak łatwo pojąć, znajomość obiektu zdeponowana we
wrodzonym mechanizmie wywoławczym i nawet musi być z korzyścią dla
zachowania gatunku, jeśli wrodzony mechanizm wywoławczy maksymalnie się
upraszczając pozostawia jak najszersze pole procesowi uczenia się.
Odtąd powinien on tylko udzielać młodemu osobnikowi "delikatnej
wskazówki" co do najbardziej obiecującego kierunku podejmowanych prób.
Jak podkreślałem już przedtem (r. VI.4.) i jak to jeszcze rozważymy
dokładniej (r. VII.6. i n.), ta forma zachowania złożonego z prób i
błędów jest z gruntu odmienna od zachowania eksploratywnego, czyli z
udziałem ciekawości.