Manifest Fizyki Naiwnej.doc

(65 KB) Pobierz
Manifest fizyki naiwnej

Manifest fizyki naiwnej

 

Ogród wciąż ofiarowywał swoje gąszcza zielsk, poczerniałą kapustę, łodygi kwiatów; a dom swoje obszary zimna i ciepła, mroczne kąty i gadające deski, rejony zgrozy i błogosławione azyle, a prócz tego niewyczerpany zasób przedmiotów i ornamentów, które się składały, spinały, trzeszczały i wzdychały, otwierały i zamykały.

 

Laurie Lee, „Jabłecznik i Rosie

Tłum. Krystyna Tarnowska

1.  Wprowadzenie

 

              Sztuczna inteligencja jest pełna „zabawkowych problemów” – małych, sztucznych aksjomatyzacji bądź zagadek, zaprojektowanych po to, by ćwiczyć umiejętności różnych programów rozwiązujących problemy oraz języków czy systemów reprezentacyjnych. W dziedzinie tej bardzo potrzeba jakichś niezabawkowych światów, na których można by poeksperymentować. W tym tekście przedstawiam propozycję skonstruowania pewnej formalizacji sporej porcji zdroworozsądkowej wiedzy o codziennym fizycznym świecie: o przedmiotach, kształcie, przestrzeni, ruchu, substancjach (stałych i płynnych), czasie itp.

              Poniżej naszkicuję tę propozycję. Odróżnię ją od niektórych innych, w powierzchowny sposób podobnych. Omówię niektóre z ogólnych kwestii, które się rodzą. Będę argumentował za moją propozycją, twierdząc, że to należy zrobić, że to można zrobić, i powiem, jak to zrobić. Po drodze przedstawię zarys teorii znaczenia, którą propozycja zakłada, i przeprowadzę krytykę niektórych innych.

 

2. Streszczenie propozycji

 

              Propozycja dotyczy skonstruowania formalizacji dużej części zwykłej codziennej wiedzy o świecie fizycznym. Taka formalizacja mogłaby być na przykład zbiorem asercji w formalnym rachunku logicznym pierwszego rzędu lub zbiorem „jednostek” KRL czy też programem w języku Microplanner albo jedną z wielu innych rzeczy. Propozycja nie polega na tym, by rozwinąć nowy formalizm do wyrażenia tej wiedzy. Choć zdajemy sobie sprawę, że przebijanie się przez formalizmy może stać się w pewnym momencie konieczne, wierzymy, że istniejące, zrozumiałe formalizmy mają wiele niezbadanych jeszcze możliwości. Propozycja nie polega na tym, by napisać program, który może rozwiązywać zadania lub planować czynności lub cokolwiek wewnątrz formalizmu. Chociaż jest ważne, by mieć na uwadze kwestie kontroli i poszukiwań –mówiąc krócej, kwestie obliczeniowe – proponujemy rozmyślnie odwlec szczegółowe rozpatrzenie implementacji. Poważną pracę nad kwestiami reprezentacji w AI zbyt często sprowadza na manowce lub całkowicie uniemożliwia przedwczesna troska o kwestie obliczeniowe.

              Formalizm, który proponujemy, powinien mieć następujące cechy (będziemy je dłużej opisywać później):

              1. Ogólność. Powinien obejmować cały zakres codziennych zjawisk fizycznych, nie może dotyczyć na przykład tylko świata klocków. W pewnym ważnym sensie świat (nawet świat codzienny) jest nieskończenie bogaty w możliwe zjawiska, więc ogólność ta nigdy nie będzie doskonała. Mimo to powinniśmy próbować zapełnić wszystkie główne dziury albo przynajmniej je zidentyfikować.

              2. Dokładność. Powinien być w rozsądnym stopniu szczegółowy. Takie cechy, na przykład klocka w świecie klocków, jak kształt, tworzywo, waga, sztywność i tekstura powierzchni powinny być dostępne jako pojęcia z opisu świata klocków oraz jako stosunki podparcia. Ponieważ świat jest nieskończenie szczegółowy, doskonała dokładność jest znowu niemożliwa. Powinniśmy jednak sięgnąć dalej niż w zwykłych, niedokładnych aksjomatyzacjach „zabawkowych problemów”, w których, na przykład, stosunek dwóch klocków, z których jeden jest „nad” drugim, jest jedynie częściowym uporządkowaniem [...].

              3. Gęstość. Stosunek faktów do pojęć musi być względnie wysoki. Inaczej mówiąc, jednostki muszą mieć wiele wejść (slots). Formalizacje o małej gęstości są w pewnym sensie banalne – nie mówią wystarczająco wiele o pojęciach, które zawierają, aby dokładnie ustalić znaczenie. Czasem, dla szczególnych celów, może to być zaletą, na przykład w badaniach podstawowych, dla nas jednak nie jest.

              4. Jednorodność. Dla całej formalizacji powinna istnieć wspólna formalna struktura (język, systemy, itp.) taki, żeby połączenia inferencyjne między różnymi częściami (aksjomatami, ramy odniesienia, ....) były wyraźnie widoczne, a rozdzielenia na subformalizacje nie były przesądzone przy podjęciu decyzji o użyciu jednego formalizmu dla jednego obszaru i innego dla innego obszaru.

[...]

              Jestem przekonany, że posiadającą te własności formalizację fizyki naiwnej da się skonstruować w rozsądnie bliskiej przyszłości. Później wyjaśnię powody tego optymizmu. Ważne jednak, by jasno odróżnić tę propozycję od niektórych innych, z którymi może zostać pomylona, gdyż niektóre z nich wydają się dużo mniej efektywnie obliczalne.

 

3. Czym propozycja nie jest

 

              (a) Nie proponuję stworzenia programu komputerowego, takiego jak jakiś program do rozwiązywania zadań czy system rozumienia języka naturalnego mający za cel reprezentację, który w jakiś sposób „korzystałby” z formalizmu. Od czasu do czasu chce się ulec pokusie robienia takich pokazów. [...] Niebezpiecznie łatwo wyciągnąć wniosek, że skoro ma się program, który (w jakimś sensie) działa, to jego reprezentacja jego wiedzy musi być mniej lub bardziej (w jakimś sensie) poprawna. Niestety, małe kompromisy i uproszczenia, których potrzeba, by program działał w rozsądnej ilości pamięci lub w rozsądnym czasie, mogą często sprawić, że reprezentacja będzie jeszcze mniej zadowalająca, niż mogłaby być.

[...]

              Podkreślam tę kwestię, gdyż w AI panuje przekonanie, że badania, które dość szybko nie kończą się jakimś działającym programem są w pewnym stopniu niepotrzebne lub przynajmniej mocno podejrzane. To może być w części przyczyną niepowodzenia naprawdę poważnych prac w dziedzinie reprezentacji i mnożenia się programów i metod, które dobrze (a czasem słabo) działają w banalnie małych obszarach, są natomiast całkowicie ograniczone przez czynniki skali, przez co nie mówią nam nic o myśleniu o realistycznie skomplikowanych światach. [...]

              (b) Nie proponuję rozwinięcia nowego formalizmu lub języka po to, by spisać w nim całą tę wiedzę. Jestem zdania (jak moi koledzy już pewnie się domyślili), że logika pierwszego rzędu jest odpowiednim podstawowym środkiem przekazu reprezentacji. Od razu jednak chciałbym to uściślić.

[...]

              Po trzecie, logika pierwszego rzędu jest prawie na pewno niewystarczająco bogata i będzie musiała być rozszerzona. [...] Spodziewam się, że takie rozwinięcia pojawią się w naturalny sposób w wyniku trudności w używaniu formalizmu, a ponieważ uważam, że próby przewidywania z góry takich trudności są niebezpieczne, nie będę próbował.

[...]

8. Niektóre możliwe wiązki i ich pojęcia

 

              W tym rozdziale zarysuję kilka konkretnych pomysłów wiązek pojęciowych. To tylko szkice, w dodatku niewyraźne – pełniejsze opisy pojawią się ostatecznie w innym opracowaniu. Nie chcę sugerować, że jest to wyczerpująca lista.

              Jest całkiem prawdopodobne, że wiele z niżej naszkicowanych przypadków nie jest wiązkami w jakimkolwiek rzeczywistym sensie. Przy bliższej analizie mogą się na przykład rozpadać na kawałki lub ujawnić się mogą nowe połączenia, które rozmyją ich brzegi. Mimo to sądzę, że są dobrym punktem wyjścia dla naszych badań.

Skale pomiaru

              Musimy umieć wyrazić ilości takie jak rozmiar, zakres, ilość (cieczy albo proszku), waga, lepkość, itp. Wydają się to być własności rzeczy. Możemy jednak mierzyć na przykład wagę w funtach albo kilogramach, musimy więc wprowadzić pojęcie różnych skal do mierzenia tej samej fizycznej ilości. Moglibyśmy mieć różne funkcje z przedmiotów na, powiedzmy, liczby wymierne, i nazywać je wagą w funtach i wagą w kilogramach, itp., byłoby to jednak dziwaczne, nienaturalne, i nie wspierałoby bardzo gęstego zbioru aksjomatów. Myślę, że powinniśmy wprowadzić pojęcie „abstrakcyjnej przestrzeni” wag (rozmiarów, ilości), tak, aby waga było funkcją z przedmiotów na wagi, a funty (itp.) funkcjami z liczb wymiernych na wagi. Moglibyśmy wtedy napisać:

                            waga (Fred) = funty (150.32) = kilogramy (68.25)

              Te przestrzenie miernicze wag, rozmiarów, itp. mają, jak sądzę, własną teorię. Mają prawdopodobnie strukturę przestrzeni tolerancji (Zeeman 1962), tzn. mają skończoną „ziarnistość”. Są to pojęcia przybliżenia, bliskości, „typowej” miary różnych rodzajów (normalnej wielkości dla słonia), nierówności i innych związanych z tym kwestii, a – jak sądzę – wiele z tego jest niezależne od konkretnej mierzonej przez nas ilości.

              Warto w tym miejscu wspomnieć o pewnej kwestii. Często mówi się, że „zdrowy rozsądek” wymaga innej, rozmytej (fuzzy) logiki. Przykłady podawane dla poparcia tego poglądu mówią zawsze o rozmytych skalach mierzenia albo przestrzeniach mierniczych. Uważam, że pewne rozmycie może istotnie tu występować, ale nie jest to argumentem wspierającym mówienie o rozmytych wartościach prawdziwościowych.

[...]

Wewnątrz i na zewnątrz

              Weźmy pod uwagę następujący zbiór pojęć: (wewnątrz), (na zewnątrz), (drzwi, portal, okno, brama, wejście, wyjście), (ściana, granica, pojemnik), (przeszkoda, bariera), (obejście, przejście).

              Sądzę, że te słowa wskazują na wiązkę powiązanych pojęć, które są dla fizyki naiwnej fundamentalne. Ta wiązka dotyczy dzielenia przestrzeni trójwymiarowej na części mające fizyczne granice, sposobów, w jakie te części mogą być ze sobą połączone i tego, jak przedmioty, ludzie i ciecze mogą dostawać się z jednego takiego miejsca do drugiego.

              Istnieje kilka powodów, dla których sądzę, że ta wiązka jest ważna. Jednym jest to, że po prostu tak się wydaje. Innym powodem jest, że te pojęcia, szczególnie pojęcie „przejścia” (way throgh) i kłopoty mogące się przy tym pojęciu pojawić, sprawiają wrażenie rozpowszechnionych tematów w folklorze i legendach, i wspierają wiele częstych analogii. Inny powód to fakt, że te pojęcia pojawiają się często, gdy mowa o innych wiązkach, szczególnie o cieczach i o historiach (patrz poniżej). Jeszcze inny – że są u podstaw ważnych teorii matematycznych, np. teorii homotopii. Głównym powodem jest jednak to, że bycie zawartym ogranicza przyczynowość. Jednym z głównych powodów bycia w pokoju jest chęć izolacji od oddziaływań przyczynowych działających na zewnątrz bądź powstrzymania osób wewnątrz pokoju od wydostania się na zewnątrz (odpowiednio: schronić się przed deszczem, omówić spisek). Świadomość tego, jakie rodzaje barier są skuteczne przeciwko odpowiedniego rodzaju wpływom wydaje się jedną z najbardziej użytecznych umiejętności przy rozwiązywaniu „problemu ramy odniesienia”.

              Ciekawe jest porównanie tych pojęć z pojęciami kształtu. Przestrzeń interesuje nas tu jako miejsce, w którym się jest: miejsce do poruszania się, na przykład. W opisie kształtu, przestrzeń to przestrzeń zajmowana przez substancję. Jest mimo to wiele pojęć użytecznych w obu obszarach.

[...]

 

10. Dlaczego należy to zrobić

 

              Przyjmuję za oczywiste, że konstruowanie programu, o którym można powiedzieć, że jest zdroworozsądkowy, musi w końcu polegać na jakiejś formalizacji zdroworozsądkowej wiedzy takiej jak fizyka naiwna (i oczywiście także psychologia naiwna, epistemologia naiwna itp.). Nie wszyscy się z tym zgodzą – ci, na przykład, którzy wierzą w to, że prosta jednorodna procedura uczenia wykaże w końcu inteligencję – ich przedteoretyczne założenia różnią się jednak tak bardzo od przejawianych przez większość badaczy pracujących nad AI, że lepiej, jak sądzę, traktować ich pracę jako należącą do zasadniczo innego obszaru. Nie będę, w każdym razie, analizował tutaj dalej tej konkretnej kwestii.

[...]

 

11. Dlaczego da się to zrobić

 

Inne zastrzeżenie względem propozycji naiwnej fizyki polega na utrzymywaniu, że jest ona absurdalnie ambitna: nie wiemy wystarczająco wiele o formalizacjach, aby zabierać się za tak wielkie zadanie reprezentacjonistyczne, zajmie to wieki, itp. W końcu jedyną odpowiedzią na takie zastrzeżenia jest podjęcie wysiłku i odniesienie sukcesu, więc jedyne, co mogę zrobić, to wyliczyć moje powody do optymizmu. Są cztery.

Pierwszy opiera się na moich niedawnych doświadczeniach z problemem „cieczy”, który długo uważałem za jeden z najtrudniejszych problemów w „teorii reprezentacji” (Hayes 1975). Pomysł kwantyfikowania kawałków przestrzeni (zdefiniowanych przez granice fizyczne) raczej niż kawałków cieczy umożliwia, ku mojemu zdziwieniu, całkiem szybkie rozwiązanie zasadniczych problemów. Główną kwestią było tu znalezienie prawidłowej procedury zindywidualizowania płynnego przedmiotu: kryterium, za pomocą którego można odnosić się do takiej rzeczy. Uważam, że podobna troska o kryteria indywidualizacji może doprowadzić do postępu również w innych wiązkach. McCarthy (prywatna korespondencja 1977) rozpoczął, na przykład, nowe podejście do formalizacji epistemicznych opartych na indywidualizacji „pojęć”, tj. myśli w ludzkich głowach.

Drugim powodem do optymizmu jest naszkicowana powyżej idea historii. Wierzę, że formalizacje świata fizycznego były latami krępowane przez nieadekwatną ontologię zmiany i działania, i że historie dostarczą sposobu ominięcia tej zasadniczej przeszkody. Trzeci powód opiera się na omówionej już metodologii nieprogramowania. Mówiąc wprost: prawie nikt nie spróbował zbudować dużej, adekwatnej heurystycznie formalizacji. Możemy odkryć, gdy zostaniemy uwolnieni od konieczności implementowania działających programów, że będzie łatwiej, niż się spodziewamy.

Czwarty powód polega na tym, że istnieje oczywista metodologia, za pomocą której można tego dokonać, a metodologia ta w ostatnich latach okazała się bardzo skuteczna na różnych polach.

 

12. Jak to zrobić

 

Istnieje wypróbowany i prawdziwy sposób wydobywania wiedzy z ludzkich głów do formalizacji. Wewnątrz AI został on nazwany „inżynierią wiedzy” (knowledge engineering) przez Feigenbauma (1977); w zasadzie ta sama technika używana jest przez lingwistów. Działa tak: w konsultacji z „ekspertem” (to znaczy z istotą ludzką, której głowa zawiera wiedzę: wiadomo, że zawiera, gdyż umie ona wykonać interesujące nas zadanie), buduje się wstępną formalizację, opartą na jego introspekcyjnym opisie tego, czym ta wiedza w głowie jest. Ta formalizacja następnie działa w szczególny sposób i jej działanie porównywane jest z działaniem eksperta. Zwykle działa raczej słabo. Ekspert, obserwując w szczegółach to zachowanie formalizacji, często jest w stanie bardziej dokładnie wskazać nieadekwatności w swoim pierwszym introspekcyjnym opisie i może przedstawić bardziej szczegółową, poprawioną wersję. Zostaje to sformalizowane, skrytykowane, poprawione, i tak dalej. Zwykle ekspert, stale konfrontowany z formalnymi konsekwencjami swoich introspekcji, poprawia z czasem swoją zdolność szczegółowej introspekcji.

W „inżynierii wiedzy” ekspert jest specjalistą z jakiejś dziedziny, a formalizacja jest zwykle zbiorem reguł warunek-działanie, które można przeprowadzić na odpowiednim interpretatorze: w pewnym sensie bardzo modularny program. W lingwistyce formalizacja jest pewnego rodzaju gramatyką, która przypisuje struktury syntaktyczne do zdań, a ekspert jest osobą władającą danym językiem jako swoim ojczystym; w rzeczywistości, zwykle ekspertem jest sam lingwista. W obu przypadkach technika okazała się bardzo skuteczna.

Uważam, że ten proces formalizacji, konfrontacji z intuicją i poprawiania, można także użyć do rozwoju naiwnej fizyki. Jest to domena, w której wszyscy jesteśmy ekspertami w wymaganym znaczeniu. Działanie formalizacji jest tu wzorcem wnioskowań, które podtrzymuje. Działanie jest adekwatne gdy „eksperci” zgadzają się, że wszystkie i tylko bezpośrednie, wiarygodne konsekwencje wynikają z aksjomatów formalizacji. (Istnieje w zasadzie słabe pojęcie adekwatności; silniejsze pojęcie polegałoby na tym, że derywacje wiarygodnych konsekwencji byłyby także wiarygodne. Próba użycia tego silniejszego pojęcia pociąga za sobą zasadnicze problemy metodologiczne, skoro wymaga posiadania introspekcji „drugiego stopnia”. Lingwistyka posiada dokładnie analogiczne pojęcie silnej adekwatności dla teorii gramatycznej, i napotyka takie same trudności metodologiczne). Wydaje się spójne, żeby zaangażowanych było kilku „ekspertów”, gdyż przy pracy w pojedynkę łatwo przegapić pewne oczywiste rozróżnienia.

Idealny sposób na osiągnięcie sukcesu to stworzenie komisji. Każdemu członkowi przypisane zostaje coś, co wygląda na wiązkę, i dokonuje on próby sformalizowania go. Członkowie mówią sobie nawzajem, co oczekują od innych wiązek: w ten sposób wiązka „historii” będzie potrzebowała trochę pojęć „kształtu” [...] itd. Dość często częściowe formalizacje zostają złożone razem podczas spotkania grupy, krytykowane przez innych członków (w ich zdroworozsądkowych rolach „ekspertów”) i testowane na adekwatność. [...]

Na początku formalizacje nie muszą być o wiele więcej niż uważnie wyrażonymi zdaniami angielskimi. Można na przykład dokonać znacznego postępu w kwestiach ontologicznych bez formalizowania czegokolwiek. Dość prędko trzeba będzie jednak wyrazić intuicje w sposób formalny. Myślę, że należy tu być liberalnym w kwestii dopuszczenia wolnego wyboru języka formalnego. [...]

Jest kilka innych sposobów znajdowania wiązek pojęciowych. Na przykład: szukanie w słowniku; wybieranie konkretnej domeny (gotowanie, mierzenie objętości różnych substancji) i próbowanie opisania tego; szczegółowa analiza jakiej codziennej czynności (np. rozkładanie prześcieradła na łóżku poprzez złapanie za dwa rogi i rozpostarcie: czemu to działa?). Myślę, że te i inne czynności są dobrymi punktami wyjścia.

 

13. Czy to jest nauka?

 

Powstanie zarzut, że próba sformalizowania wiedzy w sposób abstrakcyjny, tzn. oddzielony od konkretnej modalności sensorycznej albo domeny zadaniowej, jest nienaukowa, gdyż nie zakłada jasnych kryteriów sukcesu bądź porażki. Na czym polegałaby porażka? Jeśli nie da się odpowiedzieć na to pytanie, to fizyka naiwna jest czystą krytyką literacką.

Myślę, że jest to dobry zarzut, i wymaga bardziej adekwatnej odpowiedzi, niż jestem w tym momencie w stanie dać. Problem w tym, że z formalizacją zawsze gdzieś się dochodzi: kto ma powiedzieć, że nie dotarło się wystarczająco daleko? Można tylko powiedzieć, jak sądzę, że przewodnikiem jest wspólna ludzka intuicja. Jeśli istnieją „oczywiste” fakty fizyczne, których nie można „łatwo” albo „w naturalny sposób” wywieść z aksjomatów, znaczy to, że trzeba wykonać więcej pracy. Można zastosować zwykłe naukowe kryteria „elegancji”, „ekonomii”, itp. do porównania konkurujących formalizacji. (Wszystkie słowa w cudzysłowach domagają się dalszej dyskusji, której tu się nie podejmuję). Warto zauważyć, że lingwistyka znajduje się dokładnie w takim samym położeniu, i wije się na haczyku metodologii: oceny wiarygodności fizycznej i elementarnej przyczynowości są z pewnością równie pewne, jak oceny gramatyczności dokonywane przez native speakerów; a są z pewnością w dużej mierze niezależne od kulturalnych i językowych granic, można więc pewnie bardziej na nich polegać jako na danych źródłowych. (Co może sugerować, że powinniśmy pożyczyć rozróżnienie na kompetencję i wykonanie, aby się chronić przed behawioralnym odrzuceniem; sztuczka ta wiązałaby się jednak z dużymi problemami).

Byłoby miło, gdyby fizyka naiwna mogła być bliżej połączona z masą danych dostępnych teraz w psychologii Piageta dotyczącej rozwoju pojęć fizycznych w dzieciństwie (choć, jak się wydaje, nic w niej nie jest niekontrowersyjne). Z pewnością zgodność z tymi danymi powinna być narzucona formalizacji naiwnej fizyki. Jest to jednak bardzo słaby warunek, gdyż dane te są zgodne z wieloma różnymi teoriami rozwoju i nie są zwykle wystarczająco szczegółowe, aby rozróżnić jedną od drugiej (patrz Prazdny 1978, nieco uwag w tym kierunku). Miałbym nadzieję, że stworzenie naiwnej fizyki ukazałoby jakiś nowy mechanizm zmian rozwojowych w pojęciowych strukturach. W pewnym stopniu już się to dzieje, gdyż budowanie formalizacji jest często kwestią rozwijania (w dokładnie właściwym znaczeniu) częściowych formalizacji, które już się ma.

 

Patrick J. Hayes

 

Przełożył Piotr Pietrzak

 

...
Zgłoś jeśli naruszono regulamin