ALPHA C. CHIANC
Alpha C. Chiang Professor of Economics The University of Connecticut Fundamental Methods o f Mathematical Economics Third Edition McGraw-Hill,Inc., New York, St. Louis, San Francisco, Auckland,. Bogota, Caracas, Lisbon, London, Madrid, Mexico, Milan, Montreal, New Delhi, Paris, San Juan, Singapore, Sydney, Tokyo, Toronto
Copyright © 1984, 1974, 1967 by McGraw-Hill, Inc. All Rights Reserved
Okładkę i stronę tytułową projektował Michał Maryniak Redaktor Grażyna Leciak Redaktor techniczny Jolanta Czapska Korekta Zespół
TYTUŁ WYDANY PRZY WSPÓŁPRACY US1A, WASHINGTON, D.C. AMERICAN EMBASSY, WARSAW MINISTERSTWA EDUKACJI NARODOWEJ
© Copyright for the Polish edition by Państwowe Wydawnictwo Ekonomiczne, Warszawa 1994
O d a u t o r a ..........................................................................................................................
Część pierwsza. Wprowadzenie 1. N atura ekonom ii m a te m a ty c z n e j..........................................................................
1.1. Ekonomia matematyczna i niematematyczna..................... 1.2. Ekonomia matematyczna a ekonometria.............................................................................
2. M odele e k o n o m ic z n e
................................................................................
Składniki modelu matematycznego . . ....................... Zbiór liczb rzeczywistych .......................... Pojęcie zb io ru ................. Relacje i funkcje................................... Typy fu n k cji....................................................................... Funkcje więcej niż jednej zmiennej niezależnej ................................................ Poziomy ogólności...........................................................
2.1. 2.2. 2.3. 2.4. 2.5. 2.6. 2.7.
Część druga. Analiza statyczna (analiza równowagi) ISBN 83-208-0942-8 Printed in Poland Państwowe Wydawnictwo Ekonomiczne Warszawa 1994 r. Wyd. I. Zlec. 13/93 Skład i łamanie — Pracownia Poligraficzna FOTOSKŁAD, Warszawa, til. Oleandrów 5 m. 8 Druk i Oprawa — DSP, Zakład w Płońsku
3. A naliza rów now agi w e k o n o m ii......................................................
3.1. 3.2. 3.3. 3.4. 3.5.
Znaczenie równowagi........................................................................................................... Częściową równowaga rynkowa — model liniow y....................... Częściowa równowaga rynkowa — model nieliniowy . . ................................................ Ogólna równowaga rynkow a................. Równania w analizie dochodu narodowego . . ...............................................................
4. M odele liniow e i algebra m a c ie rz y .......................................................
4.1.
. ., ..........................................................................
6 SPIS TREŚCI 4.2. 4.3. 4.4. 4.5. 4.6.
Działania na m acierzach..................................................................................................................... ■ Uwagi o działaniach na w ektorach........................ 78 Własności przemienności, łączności i rozdzielności . ....................................... 86 Macierze jednostkowe i macierze z ero w e............................................................................ 89 93 Transpozycje i odwrotności m acierzy....................................
5.
M o d e le lin io w e i a lg e b ra m a c ie rz y (c ią g d a ls z y ) . . . . . . . . . . . . . . . .
5.1. 5.2. 5.3. 5.4. 5.5. 5.6. 5.7. 5.8.
Warunki nieosobliwości m acierzy......................................................................................... Testowanie nieosobliwości za pomocą wyznacznika ........................................ Podstawowe własności wyznaczników....................................... Znajdowanie macierzy odw rotnej.................................................- ....................................... Wzór C ram era.......................................................................................................................... Zastosowanie do modeli rynku i dochodu narodow ego....................................................... Modele nakładów i wyników L eontiew a......................................................... Ograniczenia analizy statycznej..............................................................................................
.
6. S tatyka p o rów naw cza i p o jęcie p o c h o d n e j
10.1. 10.2. 10.3. 10.4. 10.5. 10.6. 10.7.
6.1. 6.2. 6.3. 6.4. 6.5. 6 .6 . 6.7.
....................................
Natura statyki porównawczej......................................................................... Stopa zmian i pochodna................................................................ Pochodna i nachylenie k rzy w ej............................................................................................... Pojęcie g ran icy .................................................................................. Dygresja o nierównościach i wartościach bezwzględnych . ................................. Twierdzenia o g ran icy ............................i ............................................................................... Ciągłość i różniczkowalnośó funkcji . ................................................
7. R eguły ró żniczkow ania i ich zastosow anie w analizie statyki porów naw czej
7.1. 7.2. 7.3. 7.4. 7.5. 7.6.
' Reguły różniczkowania dla funkcji jednej zm iennej............................................................. Reguły różniczkowania dotyczące dwu lub większej liczby funkcji tej samej zmienej . . Reguły różniczkowania dotyczące funkcji o różnych argum entach..................... ■ • • • ■ Różniczkowanie cząstkow e..................................................................................................... Zastosowania analizy statyki porównawczej .......................................... Uwagi o wyznacznikach Jacobiego...................................................................
8. A naliza statyki porów naw czej dla m odelu z ogólnym i f u n k c ja m i
8.1. 8.2. 8.3. 8.4. 8.5. 8 .6 . 8.7.
Różniczki ........................................... Różniczki zup ełn e................................................... Reguły dotyczące różniczek............................................. Pochodne zup ełn e......................................................................................................... Pochodne funkcji niejaw nej................................. . . ............................................................... Statyka porównawcza dla modeli z ogólnymi funkcjam i.................................................... Ograniczenia statyki porównawczej.........................................................
Część czwarta. Problemy optymalizacji ..........................
...................................................
Natura funkcji wykładniczych ....................... Naturalne funkcje wykładnicze a problem w zrostu.................. Logarytm y.................. Funkcje logarytmiczne............................. Pochodne funkcji wykładniczej i logarytmicznej .............. Optymalny wybór momentu działania.............................. Dalsze zastosowania pochodnych funkcji wykładniczych i logarytmicznych ..............
11. O p ty m a liz a c ja w p rz y p a d k u w ię c e j n iż je d n e j z m ie n n e j d ecy zy jn ej . . .
11.1 Różniczkowe wersje warunków optymalności ................................................. 11.2. Wartości ekstremalne funkcji dwu zmiennych ............................................................... 11.3. Zagadnienia dotyczące form kwadratowych..................................................................... 11.4. Funkcje celu zawierające więcej niż dwie zm ienne.......................................... 11.5. Warunki drugiego rzędu w odniesieniu do wklęsłości iwypukłości................... 11.6. Zastosowania ekonomiczne.................................................................. 11.7. Aspekty optymalizacji związane ze statyką porównawcżą................................. ¡.: . .
12. O p ty m a liz a c ja p rz y w a ru n k ach w p o sta c i r ó w n a ń ..........................................
12.1. 12.2. 12.3. 12.4. 12.5. 12.6. 12.7. 12.8.
Wpływ warunków ograniczających . . . : ........................................................................ Znajdowanie wartości stacjonarnych................................................................................. Warunki drugiego rzędu . . . . . . ............ ... . .. ................... Quasi-wklęsłośó i ąuasi-wypukłośó . . .- V.: . . . . . . . . . . .. . ................. Maksymalizacja użyteczności i popyt konsumpcyjny . ..................... Funkcje jednorodne..........................................'. .......................................................... Kombinacja nakładów zapewniająca minimalny koszt .. ...................... Kilka uwag końcowych .................
Część piąta. Analiza dynamiczna ..........................................
Dynamika i całkowanie......................................... Całki nieoznaczone................. Całki oznaczone.................................................................................................................. Całki niewłaściwe ................................. . . ' . .................................. Pewne ekonomiczne zastosowania c a łe k ........................................................................... Modeł wzrostu D om ara......................................................................................................
14. C z a s c ią g ły . R ó w n a n ia ró ż n ic z k o w e p ie rw s z e g o rz ę d u : ...........................
13. D y n a m ik a ek o n o m ic z n a i ra c h u n e k c a łk o w y . 13.1. 13.2. 13.3. 13.4. 13.5. 13.6.
14.1.
9. O ptym alizacja: szczególna odm iana analizy rów now ag i .
Wartości optymalne i ekstremalne . .; .............. Względne maksimum i minimum: test wykorzystującypierwsząpochodną . . . . . . . . Pochodne drugiego i wyższych rzędów ...................................... ..................... Test wykorzystujący drugą pochodną Dygresja o szeregach Maclaurina i Taylora ..................... Test wykorzystujący n-tą pochodną dla ekstremum względnego funkcji jednej zmiennej .
10. F u n k c je w y k ła d n ic z e i lo g a ry tm ic z n e . . . .
Część trzecia. Analiza statyki porównawczej
9.1. 9.2. 9.3. 9.4. 9.5. 9.6.
Liniowe równania różniczkowe pierwszego rzędu o stałych współczynnikach i stałym wyrazie w olnym .......................................................................................... 469
14.2. 14.3. 14.4. 14.5. 14.6. 14.7.
Dynamika cen rynkow ych........................... ........................................................................ Zmienny współczynnik i zmienny wyraz wolny . .......................................................... Zupełne równania różniczkowe........................................................................................... Nieliniowe równania różniczkowe pierwszego rzędu i pierwszego sto p n ia..................... Jakościowe podejście graficzne..................... ...................................................... ... Model wzrostu S o lo w a....................... r . . . . . . .... . . . . . . . .......... ...................
15. R ó w n a n ia ró ż n ic z k o w e w y ż sz y c h rz ę d ó w
15.1. Liniowe równania różniczkowe drugiego rzędu o stałych współczynnikach i stałym wyrazie w olnym ............ ... ........................................................................................... 15.2. Liczby zespolone i funkcje k o ło w e............................................................................ 15.3. Analiza przypadku pierwiastków zespolonych...................................................... ... 15.4. Model rynku z oczekiwaniami cenowymi . . . . / ............................................................. 15.5. Współzależność inflacji i bezrobocia................... ......................................................... 15.6. Równania różniczkowe ze zmiennym wyrazem w olnym ........................................... ... 15.7. Liniowe równania różniczkowe wyższych rzęd ó w .............................................................
16. C z a s d y sk re tn y . R ó w n a n ia ró ż n ic o w e p ie rw s z e g o r z ę d u ..............................
16.1. 16.2. 16.3. 16.4. 16.5. 16.6.
547 Czas dyskretny, przyrosty i równania różnicowe............................................... Rozwiązywanie równania różnicowego pierwszegorz ę d u ................................... ............... 549 Dynamiczna stabilność równowagi..................................................................................... 555 Model pajęczyny......................................................................................................................559 Model rynku z zapasami . .............................. .................................................................. 563 Nieliniowe równania różnicowe— jakościowe podejście graficzne . : ............... ... 567
1 7 . R ó w n a n ia ró ż n ic o w e w y ż sz y c h rz ę d ó w .
.........................................................
17.1. Liniowe równania różnicowe drugiego rzędu o stałych współczynnikach i stałym wyrazie w olnym ................................................................................................................... 17.2. Model Samuelsona współzależności mnożnika i akceleratora.......................................... 17.3. Inflacja i bezrobocie w czasie dyskretnym......................................................................... 17.4. Uogólnienia dla zmiennego wyrazu wolnego i równań wyższych rzędów .....................
1 8 . U k ła d y ró w n a ń ró ż n ic z k o w y c h i r ó ż n i c o w y c h ................................................
18.1. 18.2. 18.3. 18.4. 18.5. 18.6. 18.7.
Geneza układów dynamicznych........................................................................................... Rozwiązywanie układu równąó dynamicznych ......................................................... Dynamiczne modele nakładów i wyników....................................................................... ... Jeszcze raz o mpdelu inflacji i bezrobocia . i . .....................................; ........................ Diagramy fazowe dla dwu zmiennych . , ............ ............................................................ Linearyzacja nieliniowego układu rówriań różniczkowych................................................ Ograniczenia analizy dynamicznej.....................................................................................
Część szósta. Programowanie matematyczne 19. P ro g ra m o w a n ie 19.1. 19.2. 19.3. 19.4.
lin io w e ............................................................................. ..................
Proste przykłady programowania liniowego Ogólne sformułowanie zagadnienia programowania liniowego Zbiory wypukłe i programowanie liniowe . . . . . . . . .. Metoda simpleks: znajdowanię punktów wierzchołkowych
............ ... : ..................... ..............................
19.5. Metoda simpleks: znajdowanie optymalnego punktu wierzchołkowego........................... 19.6. Dalsze uwagi o metodzie sim pleks........................................................ .
20. P rogram ow anie liniow e (k o n ty n u a c ja )...............................................................
20.1. 20.2. 20.3. 20.4.
D ualność..................... Ekonomiczna interpretacja zagadnienia dualnego ............................. Analiza działalności: poziom m ik ro .................................................................................... Analiza działalności: poziom m ak ro .................................................................................
21. P rogram ow anie 21.1. 21.2. 21.3. 21.4. 21.5. 21.6. 21.7.
.........................
Natura programowania nieliniowego................................................................................. Warunki Kuhna-Tuckera...................................................................................................... Kwalifikacja ograniczeń...................................................................................................... Twierdzenie Kuhna-Tuckera o warunku dostatecznym: programowanie w klęsłe Twierdzenie Arrowa-Enthovena o warunku dostatecznym: programowanie ąuasi-wklęsle Zastosowania ekonomiczne................................................................................................ Ograniczenia programowania matematycznego..................................................................
m a te m a ty c z n e ................................................
B ibliografia ...................................................................
O dpow iedzi do w ybranych ć w ic z e ń .........................................................................
Indeks-słowniczek ............................ ......................................................................................
Książka ta adresowana jest do studentów ekonomii, którzy pragną poznać podstawowe metody matematyczne niezbędne do zrozumienia współczesnej literatury ekonomicznej. Starałem się w niej przeciwstawić dość powszechnej opinii, że studiowanie matematyki jest czymś podobnym do łykania gorzkich pigułek, czymś koniecznym i nieuniknionym, ale bardzo nieprzyjemnym. Takie nastawienie do matematyki wynika — jak sądzę — z nieodpowied niego sposobu jej wykładania. Zdarza się, że wyjaśnienia podawane są w sposób zbyt skrótowy i przez to niejasny, co może wywołać wśród studentów całkowicie nieuzasadnione przekona nie, że brak im zdolności niezbędnych do zrozumienia materiału. Motywację do nauki może również osłabić zbyt sformalizowany styl wykładu, nie odwołujący się do przykładów i możliwości zastosowań. W niniejszej pracy usiłowałem uniknąć tych błędów i — w miarę możliwości — cierpliwie wyjaśniałem wszystkie Zawiłe kWestie. Celowo przyjąłem styl nieformalny i — mówiąc językiem informatyki — „przyjazny” wobec użytkownika. Przez cały czas starałem się antycypować pytania, jakie mogą nasuwaó się studentom podczas lektury i odpowiadać na nie. Aby uwydatnić znaczenie matematyki dla ekonomii, starałem się najpierw ukazać problemy analizy ekonomicznej, potem przedstawić niezbędne do ich rozwiązania techniki matematyczne, a następnie zilustrować to przykładami modeli ekonomi cznych. Metody matematyczne wprowadzałem stopniowo — od elementarnych do bardziej skomplikowanych. Tam gdzie było to możliwe, wyniki algebraiczne poparłem ilustracjami graficznymi. Zamieściłem również ćwiczenia, które mają służyó lepszemu zrozumieniu i utrwaleniu materiału. Książka obejmuje następujące główne typy analizy ekonomicznej: statyka (analiza równowagi), statyka porównawcza, zagadnienia optymalizacji (jako szczególny typ statyki), dynamika oraz programowanie matematyczne (jako szczególny rodzaj optymalizacji). W celu ich przedstawienia wprowadziłem w należytej kolejności następujące metody matematyczne: algebrę liniową, rachunek różniczkowy i całkowy, równania różniczkowe, równania róż nicowe i zbiory wypukłe.
Ze względu na wielką liczbę przykładowych modeli ekonomicznych — makro i mikro — książka powinna okazać się przydatna dla tych Czytelników, którzy mają przygotowanie matematyczne, ale potrzebny jest im przewodnik w drodze od matematyki do ekonomii. Z tego samego powodu książka może służyć nie tylko jako podręcznik do wykładów z metod matematycznych, lecz również jako lektura uzupełniająca do wykładów z teorii makro ekonomicznej, mikroekonomicznej, oraz wzrostu ekonomicznego i rozwoju.
Pisząc tę książkę zaciągnąłem dług wdzięczności u wielu osób. Zrozumiały sam przez się jest wielki dług wobec matematyków i ekonomistów, których idee zostały tu przedstawione. Przy poprzednich dwu wydaniach niniejszej książki korzystałem z komentarzy i sugestii osób, których nazwiska podaję w porządku alfabetycznym: Nancy F. Barrett, Thomas Birnberg, E.J.R. Booth, Roberta Grower Carey, Emily Chiang, Lloyd R. Cohen, Harald Dickson, John C.H. Fei, Roger N. Folsom, Jack Hirchleifer, James C. Hsiao, Ki-Jun Jeong, Marc Nerlove, J. Frank Sharp, Dennis Starleaf i Chiou-Nan Yeh. Do obecnego wydania następujące osoby (w porządku alfabetycznym) były uprzejme udzielić mi cennych sugestii: E.J.R. Booth, Charles JS. Butler, Gary Comell, Warren L. Fisher, Dennis R. Heffley, George Kondor, William F. Lott, Paul B. Manchester, Peter Morgan, Allan G. Sleeman i, last but not least, Henry Y. Wan, Jr. Wszystkim serdecznie dziękuję. Ponieważ nie wszystkie uwagi uwzględniłem, od powiedzialność za efekt końcowy spada na mnie. W szczególności ponownie zdecydowałem nie włączać do książki kilku rozdziałów dotyczących optymalizacji dynamicznej. Jest to temat, który — aby mógł być właściwie przedstawiony — wymaga osobnego tomu. W końcu pragnę wyrazić moją wielką wdzięczność dla Gaił Gavert z McGraw-Hill Book Company za jej cierpliwą współpracę i mistrzowskie potraktowanie skomplikowanego manuskryptu.
Sugestie dotyczące wykorzystania książki Idealnym sposobem studiowania tej książki byłoby ścisłe trzymanie się podanej kolejności, ze względu na to, żę stopniowo wprowadzałem coraz to bardziej skomplikowane narzędzia matematyczne. Jedynym ważnym wyjątkiem jest to, że można czytać najpierw część piątą (Analiza dynamiczna) albo część szóstą (Programowanie matematyczne). Możliwe są również inne niewielkie zmiany kolejności czytania. Po przestudiowaniu algebry macierzy (rozdz. 5) można bez trudu przejść do programowania liniowego (rozdz. 19 i 20). Podobnie, po przestudiowaniu optymalizacji przy warunkach w postaci równań (rozdz. 12) można przejść od razu do programowania nieliniowego (rozdz. 21); można również wcześniej przestudiować programowanie liniowe. Czytelnik, dla którego statyka porównawcza nie jest najważniejszym obszarem zaintere sowań, może pominąć analizę statyki porównawczej dla modeli w postaci ogólnej (rozdz. 8) i przeskoczyć z rozdz. 7 do rozdz. 9. W takim przypadku będzie musiał pominąć również podrozdz. 11.7 i część podrozdz. 12.5 dotyczącą statyki porównawczej. A lp h a C. Chiang
1. NATURA EKONOMII MATEMATYCZNEJ
Ekonomia matematyczna nie jest wyodrębnioną gałęzią ekonomii w takim sensie, w jakim są np. finanse publiczne albo handel międzynarodowy. Jest to raczej pewne podejście do analizy ekonomicznej, przy którym ekonomista stosuje symbole matematyczne do zapisu zagadnienia i korzysta ze znanych twierdzeń matematycznych. Przedmiotem analizy może być teoria mikro- lub makroekonomiczna, finanse publiczne, ekonomia miejska itp. Stosując termin ekonomia matematyczna w najszerszym możliwym znaczeniu, mo żemy powiedzieć, że każdy elementarny podręcznik ekonomii jest podręcznikiem eko nomii matematycznej w takim zakresie, w jakim wykorzystuje się w nim metody geome tryczne do uzyskiwania wyników teoretycznych. Jednak w zasadzie ekonomia matematycz na oznacza przypadki, w których stosuje się aparat matematyczny wykraczający poza prostą geometrię,' taki jak algebra macierzy, rachunek różniczkowy i całkowy, równania różniczkowe, równania różnicowe itp. Celem tej książki jest zaznajomienie Czytelnika z najbardziej podstawowymi aspektami tych metod, które można spotkać w bieżącej literaturze ekonomicznej.
1.1. EKONOMIA MATEMATYCZNA I NIEMATEMATYCZNA Ponieważ ekonomia matematyczna jest po prostu pewnym podejściem do analizy ekonomicz nej, więc nie powinna i nie różni się od ekonomii niematematycznej w sposób zasadniczy. Celem dowolnej analizy teoretycznej, niezależnie od przyjętej metody, jest zawsze wy prowadzenie zbioru wniosków lub twierdzeń z danego zbioru założeń lub postulatów poprzez proces wnioskowania. Główna różnica między ekonomią matematyczną i niematematyczną polega na tym, że w tej pierwszej założenia i wnioski są wyrażone za pomocą symboli matematycznych i równań, a nie słów i zdań; ponadto podczas procesu wnioskowania zamiast
ograniczać się do zwykłej logiki rozumowania, możemy czerpać z obfitych zasobów istniejących twierdzeń matematycznych. Zważywszy, że słowa i symbole są w istocie równoważne (świadczy o tym fakt, że symbole są zwykle definiowane za pomocą słów), nie ma wielkiego znaczenia, czy wybrano jedne, czy drugie. Ale jest sprawą bezsporną, że symbole są wygodniejsze do stosowania w rozumowaniu dedukcyjnym, a na pewno bardziej sprzyjają zwięzłości i precyzji sformułowań. Nie jest też tak bardzo istotne, czy zastosujemy zwykłe zasady rozumowania, czy logikę matematyczną. Matematyka ma jednak tę zaletę, że zmusza analityków do jawnego formułowania założeń przyjmowanych na każdym etapie rozumowania. Ponieważ twierdzenia matematyczne są zwykle formułowane w postaci .jeśli — to ” , więc aby wykorzystać do swoich celów część twierdzenia zaczynającą się od „to” (czyli tezę), analitycy muszą najpierw upewnić się, czy część zaczynająca się o d , jeśli” (założenie) zgadza się z przyjętymi w jawny sposób założeniami. Zgadzając się z tymi stwierdzeniami, można mimo to zapytać, czemu konieczne jest wyjście poza metody geometryczne. Otóż chociaż metoda geometryczna ma tę wielką zaletę, że jest poglądowa, to jednak podlega poważnym ograniczeniom związanym z liczbą wymiarów. Na przykład przy graficznym przedstawianiu krzywych obojętności przyjmuje się standardowe założenie, że dostępne dla konsumenta są tylko dwa dobra. Takie upraszczające założenie, niechętnie przyjmowane, jest wymuszone przez fakt, że narysowanie trój wymiarowego wykresu jest niezmiernie złożone, a konstrukcja wykresu czterowymiarowego lub o większej liczbie wymiarów jest fizyczną niemożliwością. Aby zajmować się ogólnym przypadkiem 3 ,4 lub n dóbr, musimy odwołać się do bardziej „giętkiego” narzędzia, jakim są równania. Powinno to zachęcać do studiowania metod matematycznych wykraczających poza geometrie. Reasumując widzimy, że podejście matematyczne ma wiele zalet: . 1) stosowany „język” jest bardziej zwięzły i precyzyjny, 2) można korzystać z bogactwa twierdzeń matematycznych, 3) ponieważ niezbędnym warunkiem stosowania twierdzeń matematycznych jest for mułowanie wszystkich przyjętych założeń w jawny sposób,, chroni nas to przed nieporo zumieniami i błędami, jakie mogłyby powstać przy przyjęciu pewnych milczących za łożeń, 4) pozwala na badanie ogólnego przypadku n-wymiarowego. Mimo tych zalet, można czasem spotkać się z poglądem, że teoria wyprowadzona matematycznie jest nieuchronnie nierealistyczna. Jest to jednak pogląd fałszywy. W istocie epitet „nierealistyczna” nie może być wykorzystywany do krytykowania teorii ekonomicznej w ogólności, niezależnie od tego, czy przyjęto w niej podejście matematyczne, czy też nie. Teoria jest bowiem wyabstrahowana ze świata rzeczywistego. Jest środkiem wyodrębnienia jedynie najbardziej istotnych czynników i powiązań, umożliwiającym nam studiowanie istoty danego zagadnienia. Zatem stwierdzenie, że „teoria nie jest realistyczna” , nie może być przyjęte jako uzasadniona krytyka. Wynika stąd logicznie, że jest pozbawione sensu traktowanie jednego z ujęć teorii jako „nierealistycznego’ ’. Na przykład teoria firmy w warunkach czystej konkurencji jest równie nierealistyczna jak teoria firmy w warunkach niedoskonałej konkurencji i nie ma przy tym znaczenia, czy teorie te są formułowane matematycznie, czy też nie.
Podsumowując, podejście matematyczne moglibyśmy porównać do „środka transportu’’, który szybko przenosi nas od zbioru postulatów (punkt startu) do zbioru wniosków (cel podróży). Zdrowy rozsądek podpowiada nam, że jeśli mamy się udać do miejsca odległego 0 dwie mile, najprawdopodobniej wolelibyśmy tam pojechać niż pójść piechotą, chyba że mamy nadmiar wolnego czasu lub chcemy rozprostować nogi. Podobnie teoretyk, który chce szybciej uzyskać wyniki, uzna, że jest wygodniej „pojechać” pojazdem technik matematycz nych odpowiednich do tego właśnie celu. Najpierw trzeba oczywiście przejść „kurs jazdy’’, ale ponieważ nabyte w ten sposób umiejętności będą służyły przez długi czas, więc niezbędne nakłady czasu i wysiłku stanowią rzeczywiście dobrą inwestycję. Dla poważnego „kierowcy” — kontynuując metaforę — konieczna jest pewna liczba solidnych lekcji matematyki. Oczywiście niemożliwe jest przedstawienie w jednym tomie wszystkich narzędzi matematycznych stosowanych przez ekonomistów. Skoncentrujemy się zatem tylko na najbardziej podstawowych i najbardziej niezbędnych z punktu widzenia ekonomii. Opanowanie ich pozwoli z pewnością zrozumieć większość fachowych artykułów publikowanych w takich periodykach, jak „American Economic Review” , „Quarterly Journal o f Economics” , „Journal of Political Economy” , „Review of Economics and Statistics” 1 „Economic Journal” . Ci, którzy dzięki tej książce poważnie zainteresują się ekonomią matematyczną, mogą następnie przejść do bardziej gruntownego i zaawansowanego studiowa nia matematyki.
1.2. EKONOMIA MATEMATYCZNA A EKONOMETRIA Termin „ekonomia matematyczna’.’ bywa niekiedy mylony z terminem „ekonometria” . Jak implikuje „metryczna” część tej ostatniej nazwy, ekonometria zajmuje się głównie mierze niem danych ekonomicznych. Obejmuje zatem przede wszystkim badanie obserwacji empirycznych za pomocą statystycznych metod estymacji i testowania hipotez. Ekonomia matematyczna stosuje natomiast matematykę .do czysto teoretycznych aspektów analizy ekonomicznej, bez uwzględniania takich problemów statystycznych, jak błędy pomiaru badanych zmiennych. W tym tomie ograniczymy się do ekonomii matematycznej. Oznacza to, że będziemy się koncentrować na zastosowaniu matematyki do rozumowania dedukcyjnego, a nie do badań indukcyjnych i w rezultacie będziemy się zajmować przede wszystkim materiałem teoretycz nym, a nie empirycznym. Jest to oczywiście kwestia wyboru zakresu rozważań i nie oznacza, że ekonometria miałaby być mniej ważna. Badania empiryczne i analizy teoretyczne są często komplementarne i wzajemnie się wspierają. Z jednej strony teorie muszą być poddane procesowi sprawdzenia na podstawie danych empirycznych, zanim będzie można stosować je z pełnym zaufaniem. Z drugiej strony badania statystyczne potrzebują przewodnika w postaci teorii ekonomicznej, w celu określenia najbardziej odpowiednich i obiecujących kierunków poszukiwań. Klasycznym przykładem wzajemnego uzupełniania się badań teoretycznych i empirycz nych są badania zagregowanej funkcji konsumpcji. Teoretyczna praca Keynesa dotycząca funkcji konsumpcji prowadziła do statystycznej estymacji skłonności do oszczędzania. Statystyczne odkrycia Kuznetsa i Goldsmitha dętw sace relatywnej długookresowej stałości skłonności do oszczędzania (w przeciw ienjp&łe do tego, czego można by oczekiwać ria 2 — Podstawy...
podstawie teorii Keynesa), spowodowały z kolei udoskonalenie teorii zagregowanej konsump cji przez Duesenberry’ego, Friedmana i innych1. W pewnym sensie można jednak uważać ekonomię matematyczną za bardziej pod stawową, a to ze względu na to, że do przeprowadzenia sensownych badań statystycznych i ekonomicznych nieodzowna jest dobra podstawa teoretyczna — najlepiej w ujęciu matematycznym. Dlatego problematyka niniejszego tomu powinna okazać się użyteczna nie tylko dla tych, którzy interesują się ekonomią matematyczną, lecz również dla szukających podbudowy teoretycznej dla dalszych badań ekonometrycznych.
2. MODELE EKONOMICZNE
1 John M. Keynes, The General Theory o f Employment, Interest and Money, Harcourt, Brace and Company, Inc., Nowy Jork 1936, Book UL; Simon Kuznets, National Income: A Summary o f Findings, National Bureau of Economic Research, 1946, s. 53; Raymond Goldsmith, A Study o f Saving in the United' States, 1.1, Princeton University Press, Princeton, N J. 1955, rozdz. 3; James S. Duesenbeny, Income, Saving, and the Theory o f Consumer Behaviour, Harvard University Press, Cambridge, Mass. 1949; Milton Friedman, A Theory o f the Consumption Function, National Bureau of Economic Research, Princeton University Press, Princeton, N.J. 1959.
Jak wspomniano wcześniej, każda teoria ekonomiczna jest wyabstrahowana ze świata rzeczywistego. Przede wszystkim niezmierna złożoność rzeczywistości ekonomicznej powo duje, że nie jest możliwe jednoczesne zrozumienie wszystkich wzajemnych zależności. Co więcej, nie wszystkie te zależności są jednakowo ważne dla zrozumienia badanego przez nas zjawiska ekonomicznego. Sensowną procedurą jest zatem wybranie tych czynników i zależno ści, które uważamy za podstawowe i odpowiednie dla naszego modelu, i skupienie uwagi tylko na nich. Taki celowo uproszczony schemat analityczny nazywamy modelem ekonomicznym. Stanowi on szkicową i przybliżoną reprezentację rzeczywistej ekonomii.
2.1. SKŁADNIKI MODELU MATEMATYCZNEGO ....
Model ekonomiczny jest po prostu teoretyczną strukturą i nie ma istotnego powodu, dla którego miałby być matematyczny. Jeśli jednak model je st matematyczny, to zwykle składa się z układu równań opisujących jego strukturę. Równania te wyrażają pewne zależności między pewnymi zmiennymi i nadają w ten sposób matematyczną postać przyjętym założeniom ekonomicznym. Następnie, korzystając z odpowiednich operacji matematycz nych, wysuwa się zbiór wniosków logicznie wynikających z przyjętych założeń.
Zmienne, stałe i parametry Zmienna jest to coś, czego wielkość może się zmieniać, tzn. coś, co może przyjmować różne wartości. W ekonomii często stosowanymi zmiennymi są: praca, zysk, przychód, koszt, dochód narodowy, konsumpcja, inwestycje, import, eksport itd. Ponieważ każda zmienna może przyjmować różne wartości, więc musi być reprezentowana przez symbol, a nie przez konkretną liczbę. Na przykład cenę możemy oznaczyć symbolem P, zysk — symbolem n, przychód — symbolem F, koszt — symbolem C, dochód narodowy — symbolem Y. Gdy
jednak napiszemy P = 3 lub C= 13, wtedy „zamrażamy” te zmienne na ustalonym poziomie (w odpowiednio dobranych jednostkach). Na podstawie właściwie skonstruowanego modelu ekonomicznego można obliczyć wartości rozwiązań dla pewnego zbioru zmiennych, np. wyznaczyć poziom ceny za pewniający równowagę rynkową lub poziom produkcji maksymalizujący zysk. Zmienne, których wartości określamy na podstawie modelu, są znane jako zmienne endogeniczne (generowane od wewnątrz). Model może również zawierać zmienne określone przez siły zewnętrzne w stosunku do modelu, czyli takie zmienne, których wartości są dane i ustalone. Zmienne takie są nazywane zmiennymi egzogenicznymi (generowanymi z zewnątrz). Należy podkreślić, że zmienna, która w jednym modelu jest endogeniczna, w innym może być egzogeniczna. Na przykład przy analizowaniu kształtowania się rynkowej ceny pszenicy (P) zmienna P powinna być endogeniczna, ale w ramach teorii konsumenta P będzie z punktu widzenia indywidualnego konsumenta należeć do danych, musi więc być uważana za zmienną egzogeniczną. Zmienne często pojawiają się wraz z ustalonymi liczbami, czyli stałymi, jak np. w wyrażeniu 1P lub 0,5/?. Slala jest to wielkość, która się nie zmienia, a zatem jest antytezą zmiennej. Gdy dołączymy stalą do pewnej zmiennej, często nazywamy ją współczynnikiem tej zmiennej. Współczynnik może jednak być oznaczony symbolem, a nie liczbą. Naprzyklad możemy przyjąć symbol a na oznaczenie pewnej stałej i w naszym modelu napisać aP zamiast 0,7P, aby osiągnąć wyższy stopień ogólności (por. podrozdz. 2.7). Symbol a jest bardzo osobliwy — ma on reprezentować pewną stałą, ale ponieważ nie jest to konkretna liczba, więc może przyjmować dowolną wartość! Jest to więc stała, która jest zmiennal Aby podkreślić jej szczególny status, nazywamy ją stałą parametryczną (lub po prostu parametrem). Należy podkreślić, że chociaż parametrowi można nadawać różne wartości, jednak z punktu widzenia modelu jest on dany. Właśnie dlatego czasem mówi się „stała” , nawet wtedy, gdy stała — o którą chodzi — jest parametryczna. Pod pewnym względem parametry przypominają nieco zmienne egzogeniczne: tak jak i one są z punktu widzenia modelu ustalone. Niektórzy autorzy obejmują obie te kategorie nazwą: parametry. Parametry na ogół oznacza się symbolami a, b, c lub odpowiednimi literami alfabetu greckiego: a, fi, y. Ale oczywiście dopuszczalne są również inne symbole. Jeśli chodzi o zmienne egzogeniczne, to aby móc je odróżnić od zmiennych endogenicznych, przyjmujemy zwyczaj dołączania indeksu 0 do wybranego symbolu. Na przykład jeśli P oznacza cenę, to P0 oznacza cenę ustaloną egzogenicznie.
również jest dopuszczalny. Na przykład całkowity zysk jest definiowany jako nadwyżka całkowitego przychodu nad całkowitym kosztem, co możemy zapisać: J ts R -C . Równanie behawioralne (behavioral equation) określa natomiast sposób, w jaki za chowuje się zmienna w reakcji na przyrosty innych zmiennych. Może to dotyczyć albo zachowania ludzi (np. związki struktury zagregowanej konsumpcji z dochodem narodowym), albo innych jednostek (np. sposób, w jaki całkowity koszt reaguje na zmiany poziomu produkcji firmy). Szeroko rozumiane równania behawioralne mogą być używane do opisu ogólnych instytucjonalnych uwarunkowań modelu, obejmujących aspekty technologiczne (np. funkcja produkcji) i prawne (np. struktura podatków). Zapisanie równania behawioral nego jest zawsze poprzedzone przyjęciem określonych założeń dotyczących sposobu zachowania rozważanej zmiennej. Rozważmy funkcje kosztu: (2.1)
gdzie Q oznacza ilość produktu. Równania te mają różną postać, opisują zatem różne warunki produkcji. Dla (2.1) koszt stały (czyli wartość C, gdy 2 = 0 ) jest równy 75, podczas gdy dla (2.2) jest równy 110. Koszt zmienny jest również różny. W (2.1) dla każdego jednostkowego przyrostu wartości Q mamy jednakowy przyrost wartości C o 10, w (2.2) natomiast w miarę jak 2 wzrasta o kolejne jednostki, C będzie się zwiększał kolejno o coraz to większe ilości. Jest jasne, że przyjętym dla modelu założeniom nadajemy postać matematyczną przede wszystkim poprzez specyfikację postaci równań behawioralnych. Równanie trzeciego typu, tzn. warunek równowagi (equilibrium condition) występuje tylko wtedy, gdy nasz model dotyczy pojęcia równowagi. Warunek równowagi jest mia nowicie równaniem opisującym niezbędne warunki osiągnięcia równowagi. Dwa najbar dziej znane w ekonomii warunki równówagi to: oraz:
które odnoszą się odpowiednio do równowagi w modelu rynku oraz w modelu dochodu narodowego w najprostszej postaci. Ponieważ równania tego typu nie są ani definicyjne, ani behawioralne, więc stanowią osobną klasę.
2.2. ZBIÓR LICZB RZECZYWISTYCH Równania i tożsamości Zmienne mogą występować niezależnie, ale nie staną się naprawdę interesujące dopóty, dopóki nie będą związane ze sobą równaniami lub nierównościami. Zajmiemy się tu jedynie równaniami. W zastosowaniach ekonomicznych możemy rozróżnić trzy typy równań: równanie definicyjne, behawioralne i warunki równowagi. Równanie definicyjne (definitional equation) ustanawia tożsamość dwu wyrażeń, które mają dokładnie ten sam sens. W takim równaniu często używany jest znak identyczności = (czytaj: jest identycznie równe) zamiast zwykłego znaku równości =, chociaż ten ostatni
Równania i zmienne są istotnymi składnikami modelu matematycznego. Ponieważ wartości, jakie przyjmują zmienne ekonomiczne, są zwykle liczbowe, więc należy powiedzieć kilka słów o systemie liczb. Zajmiemy się tutaj jedynie tzw. liczbami rzeczywistymi. Takie liczby, jak 1, 2, 3, ... nazywamy liczbami naturalnymi (positive integers); są one najczęściej używane przy liczeniu. Ich ujemne odpowiedniki -1 , -2 , -3 , ... są nazywane ujemnymi liczbami całkowitymi; można ich używać np. do oznaczenia temperatur poniżej zera. Liczba 0 (zero) jako jedyna liczba nie jest ani dodatnia, ani ujemna. Wszystkie dodatnie i ujemne liczby całkowite oraz zero stanowią jeden zbiór zwany zbiorem wszystkich liczb całkowitych.
Liczby całkowite nie wyczerpują oczywiście zasobu wszystkich możliwych liczb. Mamy 2 4 7 bowiem ułamki, jak - , - i - , które — umieszczone na osi — znajdą się pomiędzy liczbami 1 2 całkowitymi. Mamy też ujemne ułamki, np. —- , —- . Razem z ułamkami dodatnimi tworzą one zbiór wszystkich ułamków. Powszechną właściwością wszystkich ułamków jest to, że każdy z nich może byó wyrażony jako stosunek dwu liczb całkowitych; ułamki zatem kwalifikują się do nazwy liczby wymierne (rational numbers — w tym zastosowaniu rational oznacza ratio-nal: ratio — stosunek, proporcja). Ale liczby całkowite są również wymierne, bo każda hczba całkowi ta n może byó traktowana jako proporcja n/l . Zbiór wszystkich liczb całkowitych i zbiór wszystkich ułamków tworzą razem zbiór wszystkich liczb wymiernych. Po wprowadzeniu pojęcia liczb wymiernych, w naturalny sposób powstaje koncepcja liczb niewymiernych — liczb, które nie mogą być wyrażone jako proporcje par liczb. Jednym z przykładów jest hczba 'j2 = 1,4142..., która jest nieokresowym i nieskończonym roz winięciem dziesiętnym. Innym jest specjalna stała 7t = 3,1415... (reprezentująca stosunek obwodu koła do jego średnicy), która też jest nieokresowym nieskończonym rozwinięciem dziesiętnym, co jest charakterystyczne dla wszystkich liczb niewymiernych. Każda liczba niewymierna umieszczona na podziałce znajdzie się pomiędzy dwiema liczbami wymiernymi, a zatem — podobnie jak ułamki wypełniają miejsca pomiędzy liczbami całkowitymi — hczby niewymierne wypełniają przerwy pomiędzy liczbami wymiernymi. Rezultatem tego procesu wypełniania jest kontinuum liczb, które są tzw. liczbami rzeczywis tymi. To kontinuum stanowi zbiór wszystkich liczb rzeczywistych, często oznaczony symbo lem R. Gdy zbiór R zaznaczymy na linii prostej, mówimy o tej prostej jako o prostej rzeczywistej. Na rys. 2.1 zaznaczono (w omówionej kolejności) wszystkie zbiory liczbowe uporząd kowane według wzajemnego zawierania. Gdy odczytamy ten diagram od dołu do góry, zobaczymy schemat klasyfikacyjny podziału zbioru liczb rzeczywistych na kolejne podzbiory składowe. Rysunek ten przedstawia strukturę zbioru liczb rzeczywistych.
2.3. POJĘCIE ZBIORU Użyliśmy już kilkakrotnie słowa „zbiór” . Ponieważ pojęcie zbioru jest podstawowe dla wielu gałęzi matematyki współczesnej, więc pożądane jest zapoznanie się przynajmniej z głównymi jego aspektami.
Oznaczenie zbioru Zbiór jest po prostu zestawem pewnych różnych obiektów. Obiekty te mogą stanowić grupę różnych liczb lub jakichkolwiek innych rzeczy czy osób. Na przykład wszyscy studenci uczęszczający na pewien wykład z ekonomii mogą być uważani za zbiór, podobnie jak trzy hczby całkowite 2, 3 i 4 mogą utworzyć zbiór. Obiekty zawarte w zbiorze nazywamy elementami zbioru. Istnieją dwa sposoby zapisu zbioru: przez wyliczenie (énumération) i przez opis (description). Jeśli S ma oznaczać zbiór złożony z elementów 2, 3 i 4, możemy go zapisać, wyliczając jego elementy. 5 = {2, 3 ,4 }. Ale jeśli I oznacza zbiór wszystkich dodatnich liczb całkowitych, to wyliczenie staje się trudne. Możemy wówczas po prostu opisać elementy w następujący sposób: / = { r|z jest dodatnią liczbą całkowitą}, co odczytujemy, jak następuje: „7 jest zbiorem wszystkich x (liczb) takich, że x jest dodatnią hczbą całkowitą” . W obu tych przypadkach do zapisania zbioru użyto nawiasów klamrowych { }. Przy oznaczeniu opisowym po symbolu elementu zawsze ustawia się pionową kieskę (lub dwukropek) dla oddzielenia opisu elementów.. Jako kolejny przykład podamy zapis zbioru wszystkich liczb rzeczywistych większych od 2 r mniejszych od 3: J = {.r|2 <.r < 5} ;
Liczby rzeczywiste nie są jedynymi liczbami stosowanymi w matematyce. Oprócz zmiennych „rzeczywistych” istnieją również liczby „urojone” , które mają związek z pier wiastkami kwadratowymi z liczb ujemnych. Pojęcie to omówimy w rozdz. 15.
tutaj nawet zdanie opisujące elementy zbioru jest zapisane symbolicznie. Zbiór o skończonej liczbie elementów, np. zbiór S, nazywamy zbiorem skończonym. Podane wyżej zbiór)' / i J są przykładami zbiorów nieskończonych, gdyż każdy z nich ma nieskończenie wiele elementów. Zbiory skończone są zawsze przeliczalne, to znaczy ich elementy można policzyć jeden po drugim w kolejności 1 ,2 ,3 ,.:. Zbiory nieskończone mogą być albo przeliczalne (jak zbiór /), albo nieprzeliczalne (jak zbiór J ). W tym drugim przypadku nie ma sposobu na powiązanie elemćntów zbioru z liczbami naturalnymi, a zatem zbiór jest nieprzeliczalny. Należenie do zbioru jest oznaczone symbolem e (pochodzącym od greckiej litery epsilon E dla „elementu” ), który czytamy: „jest elementem zbioru” . Zatem dla dwu zbiorów określonych powyżej możemy napisać: 2 e S,
ale oczywiście 8 ć S (czytamy: „8 nie jest elementem zbioru S ”). Jeśh do oznaczenia zbioru
wszystkich liczb rzeczywistych użyjemy, symbolu R, to stwierdzenie „x jest pewną liczbą rzeczywistą” może być po prostu wyrażone jako: xeR .
Związki pomiędzy zbiorami Gdy porównujemy dwa zbiory, możemy zaobserwować między nimi różne rodzaje związków. Jeśli się tak zdarzy, że dwa zbiory S, i S2 mają jednakowe elementy: S ,= { 2 ,7 ,f l ,/ }
znajdujemy w sumie 23 - 32 zbiory. W przypadku ogólnym, jeśli zbiór ma n elementów, to można z tych elementów utworzyć w sumie 2" zbiorów *. Trzeci możliwy typ relacji występuje wtedy, gdy dwa zbiory nie mają żadnych wspólnych elementów. W tym przypadku mówimy o tych dwu zbiorach, że są rozłączne (disjoint). Na przykład zbiór wszystkich dodatnich liczb całkowitych i zbiór wszystkich ujemnych liczb całkowitych są rozłączne. Czwarty możliwy typ relacji występuje wtedy, gdy dwa zbiory mają pewne elementy wspólne, a pewne elementy właściwe dla każdego z nich. W tym przypadku dwa zbiory nie są ani równe, ani rozłączne, ani też żaden z nich nie jest podzbiorem tego drugiego.
Działania na zbiorach to mówimy, że 5, i S2 są równe (5j = 52). Zauważmy, że kolejność występowania elementów w zbiorze jest bez znaczenia. Jeśli chociaż jeden element jest inny, dwa zbiory nie są równe. Inny rodzaj związku polega na tym, że jeden zbiór może byó podzbiorem innego zbioru. Jeśli mamy dwa zbiory: S = { 1 , 3 ,5 , 7 ,9 }
to T jest podzbiorem S, gdyż każdy element T jest również elementem S. Bardziej formalne sformułowanie jest takie: T jest podzbiorem S wtedy i tylko wtedy, gdy „xe T " implikuje „ x e .S '\ Używając symboli zawierania zbiorów c (jest zawarty w zbiorze) i 3 (zawiera), możemy zapisać: TaS
SmT.
Może się tak zdarzyć, że dwa zbiory są nawzajem swymi podzbiorami. Jednak gdy to nastąpi, możemy być pewni, że te dwa zbiory są równe. Zapiszemy to formalnie: 5 , c 5 2 i S2c=Si wtedy i tylko wtedy, gdy St = S2. Symbol e wyraża zatem relację indywidualnego elementu względem zbioru, a symbol c wiąże podzbiór ze zbiorem. Na przykład ną rys. 2.1 zbiór wszystkich liczb całkowitych jest podzbiorem zbioru wszystkich liczb wymiernych, a zbiór wszystkich liczb wymiernych jest podzbiorem zbioru wszystkich liczb rzeczywistych. De podzbiorów można utworzyć z pięciu elementów zbioru S= {1, 3, 5, 7, 9}? Przede wszystkim każdy indywidualny element zbioru S można potraktować jako oddzielny pod zbiór S, czyli {1}, {3} itd. Ale tak samo jest z parą, trójką lub czwórką tych elementów, np. {1, 3}, {1, 5}, .. ., {3, 7, 9}. Sam zbiór S (z wszystkimi jego pięcioma elementami) może być traktowany jako jeden ze swoich własnych podzbiorów — każdy element 5 jest elementem 5, a zatem sam zbiór S spełnia definicję podzbioru. Jest to oczywiście przypadek graniczny, w którym otrzymujemy „największy” możliwy podzbiór S, a mianowicie sam zbiór S. Druga skrajność — „najmniejszy” możliwy podzbiór S — jest to zbiór nie zawierający żadnych elementów. Taki zbiór nazywamy zbiorem pustym (nuli set lub empty set) i oznaczamy symbolem 0 lub { }. Powód, dla którego traktujemy zbiór pusty jako podzbiór S, jest nader interesujący: jeśli zbiór pusty nie jest podzbiorem S (0
Gdy dodajemy, odejmujemy, mnożymy, dzielimy lub wyciągamy pierwiastek kwadratowy z pewnej liczby, to wykonujemy działania matematyczne. Zbiory różnią się od liczb, ale też można wykonywać na nich pewne operacje matematyczne. Trzy podstawowe operacje, jakie tu omówimy, obejmują sumę (union), iloczyn (intersection) i dopełnienie (complement) zbiorów. Suma dwu zbiorów A i B oznacza utworzenie nowego zbioru zawierającego te elementy (i tylko te elementy), które należą do A lub do B, lub zarówno do A, jak i do B. Suma zbiorów jest oznaczona symbolem u (A u fi). Przykład 1. Jeśli A = {3, 5, 7} i fi = {2, 3, 4, 8},
A u fi = {2, 3, 4, 5, 7, 8}.
Przykład 1 ilustruje przypadek, gdy dwa zbiory A i fi nie są ani równe, ani rozłączne i żaden z nich nie jest podzbiorem drugiego. Przykład 2. Odwołując się ponownie do rys. 2.1, widzimy, że sumą zbioru wszystkich liczb całkowitych i zbioru wszystkich ułamków jest zbiór wszystkich liczb wymiernych. Podobnie, suma zbioru liczb wymiernych i zbioru liczb niewymiernych daje zbiór wszystkich liczb rzeczywistych. N. Przecięcie (intersection) dwu zbiorów A i fi lub iloczyn zbiorów A i fi, lub część wspólna A i fi jest zbiorem zawierającym te i tylko te elementy, które należą zarówno do A, jak i do fi. Część wspólna dwu zbiorów jest oznaczona symbolem n (A n f i — czytaj: iloczyn zbiorów A i fi). Przykład 3. Dla zbioru A i fi z przykł. 1 możemy zapisać: A n B = {3}.
1 Gdy dany jest zbiór o n elementach {a, b, c , m o ż e m y najpierw podzielić jego podzbiory na dwie kategorie: jedną — zbiorów zawierających element a i drugą — nie zawierających. Każda z tych dwu kategorii może byó dalej podzielona na dwie podkategorie: jedną — zbiorów zawierających ele ment b i drugą — nie zawierających. Zauważmy, że rozpatrując drugi element b podwajamy liczbę kategorii w klasyfikacji z 2 do 4 (= 22). Rozważenie na tej samej zasadzie elementu c zwiększy całkowitą liczbę kategorii do 8(=23). Gdy weźmiemy pód uwagę wszystkie n elementy, wówczas całkowita liczba kategorii stanie się równa łącznej liczbie podzbiorów, czyli 2 ".
Przykład 4. Jeśli A = {-3, 6, 10} i fi = {9, 2,7,4},to A n B = 0 . Zbiory A i fi są rozłączne, wobec tego ich przecięcie jest zbiorem pustym -— żaden element nie jest wspólny dla A i fi. Jest oczywiste, że przecięcie jest pojęciem bardziej ograniczającym niż suma zbiorów. Dla pierwszego przyjmowane są tylko elementy wspólne dla A i fi, podczas gdy dla drugiego przynależenie do A lub fi jest wystarczające, aby ustanowić przynależność do sumy zbiorów. Symbole operatorów n i u — które, nawiasem mówiąc, mają taki sam status ogólny jak symbole V”, +, : itd. — oznaczają odpowiednio „i” oraz „lub” . Zobaczymy to jaśniej po porównaniu następujących formalnych definicji iloczynu i sumy: Iloczyn:
Zanim wprowadzimy pojęcie dopełnienia zbioru, określmy pojęcie zbioru uniwersalnego (universal set). Gdyby w toku naszych rozważań jedynymi stosowanymi liczbami były liczby ze zbioru pierwszych siedmiu dodatnich liczb całkowitych, to moglibyśmy odwoływać się do tego zbioru jako do zbioru uniwersalnego U. Wtedy dla danego zbioru, powiedzmy A = (3, 6, 7}, możemy zdefiniować inny zbiór A (czytaj: „dopełnienie zbioru A” ) jako zbiór zawierający wszystkie liczby ze zbioru uniwersalnego U, które nie należą do zbioru A. Zapiszemy to następująco: A = { x \x e U i r iA } = {1, 2, 4, 5}.
Na rys. 2.2 przyciemniony obszar na diagramie (a) przedstawia nie tylko A u f i, lecz także fi u A. Analogicznie na diagramie (b) mały przyciemniony obszar jest wizualną reprezentacją nie tylko A n f i, lecz także fi n A. Można to zapisać formalnie jako tzw. prawo przemienności (sumy lub iloczynu): A u fi = fiu A ;
A = {7, 8, 9}.
Przykład 6. Co jest dopełnieniem dla U ? Ponieważ każdy rozważany obiekt (liczba) jest włączony do zbioru uniwersalnego, więc dopełnienie zbioru U musi być puste. Zatem {/ = 0 . Sum a
A n B = BnA.
Zauważmy, że symbol u oznacza „lub” , symbol n oznacza „i” , a symbol dopełnienia - oznacza „nie” . Przykład 5. Jeśli U = {5, 6, 7, 8, 9} i A = {5, 6},
Trzy typy działań na zbiorach są uwidocznione na trzech diagramach (rys. 2.2), znanych jako diagramy Venna. Na diagramie (a) punkty z górnego kola tworzą zbiór A, punkty z dolnego kola tworzą zbiór fi. Suma zbiorów A i fi składa się więc z obszaru przyciemnionego obejmującego oba kola. Na diagramie (b) przedstawiono te same dwa zbiory (kola). Ponieważ ich przecięcie powinno zawierać tylko punkty wspólne dla obu zbiorów, więc tylko nakładająca się (przyciemniona) część dwu zbiorów spełnia definicję. Na diagramie (c), jeżeli punkty prostokąta są zbiorem uniwersalnym, a A jest zbiorem punktów koła, to dopełnie niem A zbioru A będzie zaciemniony obszar poza kołem ..
a b =b a .
Aby znaleźć sumę trzecb zbiorów A, fi, i C, najpierw ustalamy sumę dowolnych dwu zbiorów, a następnie łączymy otrzymany zbiór z trzecim. Podobna procedura może być zastosowana do operacji przecięcia. Wyniki są zilustrowane na rys. 2.3. Jest ciekawe, że A u fi uC
kolejność, w jakiej wybieramy zbiory do tego działania, nie ma znaczenia. Fakt ten prowadzi do reguły łączności (dla sum i przecięć): A v ( B u C )= :(A v B ) k j C, A r \( B n C ) = (A n B) n C.
6. Sprawdzić regułę rozdzielności za pomocą diagramów Venna.
7. Wyliczyć wszystkie podzbiory zbioru {a, b, c}.
a ■{b •ę) = (a ■b) ■c.
Istnieje również wzór stosowany wtedy, gdy jednocześnie występują sumy i przecięcia. Jest to prawo rozdzielności (sumy i przecięcia): A u (B n C) = (A u B) n (A U C), A n (B u C ) = (A n B )u (A n C ).
8. Wyliczyć wszystkie podzbiory zbioru S = { 1, 3, 5, 7}. De ich jest? 9. Przykład 6 pokazuje, że 0 jest dopełnieniem U. Ale ponieważ zbiór pusty jest podzbiorem dowolnego zbioru, 0 musi być podzbiorem U. Skoro termin „dopełnienie zbioru l f ’ implikuje istnienie nie w U, podczas gdy termin „podzbiór U " implikujeistnienie w U, wydaje się paradoksalne, że 0 spełnia oba stwierdzenia. Jak rozwiązać ten paradoks?
Przypomina to regułę algebraiczną a-(b+ c) = ( a b ) + (a- c). Przykład 7. Sprawdzić prawo rozdzielności dla danych zbiorów A = {7,5}, B = {3,6,7} i C = {2, 3}. Aby sprawdzić pierwszą część reguły, znajdujemy osobno wyrażenia po lewej i prawej stronie: . lewa strona:
( A u B ) n ( A u C) = {3, 4, 5, 6, 7} n (2, 3, 4, 5} = {3, 4, 5}.
Ponieważ obie strony dają ten sam wynik, więc reguła została dla tych zbiorów spraw dzona. Powtarzając tę samą procedurę dla drugiej reguły, mamy: lewa strona:
1. Zapisać następujące stwierdzenia za pomocą symboli teorii zbiorów: (a) zbiór wszystkich liczb rzeczywistych większych od 27; (b) zbiór wszystkich liczb rzeczywistych większych od 8, ale mniejszych od 73. 2. Które z poniższych stwierdzeń jest prawdziwe dla zbiorów Sj = {2, 4, 6}; S2 = {7, 2, 6}; 53 = {4, 2,6} i Ą = {2, 4}: ( a ) S 1 = S2; ( b ) 5 ,= /? ; ( c) 5 s 52;
Nasze rozważania na temat zbiorów były sprowokowane przez użycie tego terminu w odniesieniu do różnych rodzajów liczb. Jednakże zbiory mogą równie dobrze odnosić się do obiektów innych niż liczby. W szczególności możemy mówić o zbiorach „par uporząd kowanych” — które teraz zdefiniujemy — co doprowadzi nas do ważnych pojęć relacji i funkcji.
zatem druga reguła też jest sprawdzona.
2.4. RELACJE I FUNKCJE
(g) (h) 0 c S 2; (i) S,=>{1,2}.
Zapisując zbiór {a, b}, nie troszczymy się o porządek, w jakim pojawiają się elementy a i b, ponieważ z definicji {a, b} = {b, a}. Para elementów a i b jest w tym przypadku parą nieuporządkowaną (unordered pair). Gdy jednak kolejność a i b jest istotna, możemy zapisać dwie różne pary uporządkowane (a, b) i (b, a), które mają tę właściwość, że (a, b) ^ (b, a), chyba że a = b. Podobne koncepcje dotyczą zbioru liczącego więcej niż dwa elementy; w takich przypadkach odróżniamy uporządkowane i nieuporządkowane trójki, czwórki, piątki itd. (triple, quadruple, quintuple). Uporządkowane pary, trójki itd. łącznie nazywamy zbiorami uporządkowanymi (ordered sets). ' Przykład 1. Aby pokazać wiek i wagę każdego studenta w grupie, możemy utworzyć pary uporządkowane (l, / ) , w których pierwszy element wskazuje wiek (w latach), a drugi wagę (w funtach). Wtedy (19, 127) i (127, 19) będą oczywiście oznaczały całkiem co innego. Ponadto ta druga para uporządkowana raczej nie będzie pasowała do żadnego studenta.
3. Dla czterech zbiorów podanych w poprzednim zadaniu znaleźć: (a) 5 , u ó 2; (b) S 1
(e) Si n S 2n S i \ (f) 5Ju 5 1u 5 4.
4. Które z następujących stwierdzeń są prawdziwe: (a) (b) (c) (d)
(e)A n 0 = 0; (f) A n t / = A; (g) ‘d opełnieniem A jest A.
5. Dla danych A = {4, 5, 6}; B = {3, 4, 6, 7} i C - {2, 3, 6} sprawdzić regułę rozdzielności.
Przykład 2. Gdy mówimy o zbiorze pięciu finalistów zawodów, wówczas porządek, w jakim są wymienione ich nazwiska, nie ma znaczenia i tworzą one piątkę nieuporząd kowaną. Ale po zaklasyfikowaniu ich przez sędziów na kolejne miejsca, lista ich nazwisk staje się piątką uporządkowaną. Pary uporządkowane, podobnie jak dowolne inne obiekty, mogą być elementami zbioru. Rozważmy prostokątny (kartezjański) układ współrzędnych na płaszczyźnie (rys. 2.4), gdzie osie x i y przecinają się pod kątem prostym i dzielą płaszczyznę na cztery ćwiartki (quadrants). Płaszczyzna xy jest nieskończonym zbiorem punktów, a każdy z nich reprezentuje parę
uporządkowaną, której pierwszym elementem jest wartość x, a drugim wartość y. Oczywiście punkt oznaczony (4,2) jest różny od punktu oznaczonego (2,4); zatem porządekjest tu istotny.
(2. 4) 4
jest to zbiór trójek uporządkowanych. Ponadto, jeśli każdy ze zbiorów x, y i z składa się ze wszystkich liczb rzeczywistych, to iloczyn kartezjański będzie odpowiadał zbiorowi wszyst kich punktów w trójwymiarowej przestrzeni. Może być on oznaczony przez R x R x R lub prościej R 3. W dalszym ciągu będziemy przyjmować, że wszystkie zmienne będą miały wartości rzeczywiste, a zatem będziemy na ogół rozważać R 2, R 3, ..., R".
Po tej wizualnej interpretacji jesteśmy przygotowani do rozważenia procesu generowania par uporządkowanych. Przypuśćmy, że dla dwu zbiorów x = (1, 2} i y = {3, 4} chcemy utworzyć wszystkie możliwe pary uporządkowane o pierwszym elemencie wziętym ze zbio ru x i drugim wziętym ze zbioru y. Rezultatem będzie oczywiście zbiór czterech par uporządkowanych (1,2); (1,4); (2,3) i (3,4). Zbiór ten nazywamy iloczynem kartezjańskim (od nazwiska Kartezjusza) zbiorów x i y i oznaczamy x x y . Ważne jest, aby pamiętać, że podczas gdy x i y są zbiorami liczb, to ich iloczyn kartezjański jest zbiorem par uporządkowanych. Wyliczając elementy zbioru lub opisując je możemy wyrazić iloczyn kartezjański jako: lub:
kartezjańskim (2.3) i zbiorem punktów w prostokątnym układzie współrzędnych na płaszczyź nie istnieje wzajemnie jednoznaczna odpowiedniość. Uzasadnienie dla zapisu x x y jest teraz łatwo dostrzegalne; możemy powiązać go z przecinaniem się osi x i osi y na rys. 2.4. Prostszym sposobem wyrażenia zbioru x x y jest zapisanie go wprost jako R x R ; jest on powszechnie oznaczany również jako R 2. Rozszerzając to pojęcie, możemy również zdefiniować iloczyn kartezjański trzech zbiorów x, y i z:
Ponieważ każda para uporządkowana wiąże wartość y z wartością x, więc każdy zestaw par uporządkowanych — każdy podzbiór iloczynu kartezjańskiego (2.3) — będzie ustanawiał relację między x i y. Dla danej wartości x relacja ta będzie wyznaczać jedną lub więcej war tości y. Dla wygody będziemy zapisywać elementy x x y ogólnie jako (x, y), a nie jako (a, b) — jak to zrobiliśmy w (2.2) — gdzie x i y są zmiennymi. Przykład 3. Zbiór {(x, y) |y = 2x} jest zbiorem par uporządkowanych zawierającym na przykład (1, 2) ; (0, 0) i (-1 , -2 ). Ustanawia on relację, ajego graficzny odpowiednik— jak to widać na rys. 2.5 — jest to zbiór punktów leżących na prostej y = 2x.
x x y = {(1, 3), (1 ,4 ), (2, 3), (2,4)} x x y = {(a, b ) \a e x i b e y}.
Ostatnie wyrażenie może w istocie być przyjęte jako ogólna definicja iloczynu kartezjańskiego dla dowolnych danych zbiorów x i y. Aby rozszerzyć nasze spojrzenie na tę kwestię, niech teraz zbiory x i y obejmują wszystkie liczby rzeczywiste. Wtedy otrzymany iloczyn kartezjański: (2.3)
będzie reprezentował zbiór wszystkich par uporządkowanych o wartościach rzeczywistych. Ponadto każda para uporządkowana odpowiada jednemu jedynemu punktowi na płaszczyźnie współrzędnych kartezjańskich z rys. 2.4 i, odwrotnie, każdy punkt na płaszczyźnie współrzęd nych również odpowiada jedynej parze uporządkowanej w zbiorze x x y . Ze względu na tę podwójną jednoznaczność mówimy, że między zbiorem par uporządkowanych w iloczynie
Przykład 4. Zbiór {(x, y) | y < x}, który składa się z par uporządkowanych, takich jak (1,0); (1, 1) i (1, -4 ), ustanawia inną relację. Na rys. 2.5 zbiór ten odpowiada zbiorowi wszystkich punktów w obszarze przyciemnionym, które spełniają nierówność y ś x . Zauważmy, że dla danej wartości x może się zdarzyć, że nie da się określić jednoznacznie wartości y na podstawie relacji. W przykł. 4 przedstawiono trzy pary uporządkowane spełniające daną relację, dla których x = 1, a y przyjmuje różne wartości: 0,1 i -4 . Graficznie oznacza to, że dwa lub więcej punktów dotyczących relacji może leżeć na tej samej linii pionowej na płaszczyźnie xy. Jest to pokazane na rys. 2.5, gdzie wiele punktów przyciem nionego obszaru (reprezentującego relację y < x ) leży na przerywanej linii pionowej oznaczonej x = a. W szczególnym przypadku może jednak być tak, że dla każdej wartości x istnieje tylko jedna odpowiadająca jej wartość y. Jest tak w przykł. 3. W takim przypadku mówimy, że y jest funkcją x i oznaczamy to przez y = f(x), co czytamy „y równa się /o d x ’ ’ (zauważmy: f( x ) nie oznacza / razy x). Funkcja jest zatem zbiorem par uporządkowanych o tej właściwości, że każda wartość x określa wartość y w sposób jednoznaczny2. Powinno być jasne, że funkcja musi być relacją, ale relacja nie musi być funkcją. Mimo iż definicja funkcji wymaga, aby dla każdego x odpowiadające mu y było jedyne, to odwrotny warunek nie jest wymagany. Innymi słowy, więcej niż jedna wartość x ma prawo być związana z tą samą wartością y. Możliwość ta jest zilustrowana na rys. 2.6, gdzie obie wartości i x2 ze zbioru x są powiązane z tą samą wartością y0 ze zbioru y za pomocą funkcji: y = f(x ).
■ /:* - » :y. gdzie strzałka oznacza odwzorowanie, a lite ra / symbolicznie określa regułę odwzorowania. Ponieważ/reprezentuje szczególną regułę odwzorowania, więc do oznaczenia innej funkcji, jaka może się pojawić w tym samym modelu, należy używać innego oznaczenia funkcji. Symbole (p o za /) używane zwykle w tym celu to g, F, Q, litery greckie
, II. Na przykład obydwie zmienne y i z mogą być funkcjami x, ale jeśli jedną funkcję zapiszemy jako y = /(z), to druga powinna być zapisana jako z - g(x) lub z =
Funkcja jest nazywana również odwzorowaniem (mapping) lub przekształceniem (transformation); oba słowa oznaczają działanie wiązania jednej rzeczy z inną. W stwierdzeniu y = f i x ) operator funkcyjny / może zatem być interpretowany jako oznaczający regułę, za pomocą której zbiór x jest odwzorowany (przekształcony) w zbiór y. Możemy więc zapisać: 2 Ta definicja funkcji odpowiada temu, co w dawniejszej terminologii było nazywane funkcją jednowartościową (single-valued function). To, co dawniej nazywano funkcją wielowartościową, teraz nazywamy relacją.
W modelach ekonomicznych równania behawioralne zwykle występują jako funkcje. Ponieważ większość zmiennych w takich modelach jest z natury ograniczona do rzeczywis tych wartości nieujemnych3, więc ich dziedziny są również tak ograniczone. Dlatego właśnie 3 Mówimy raczej „nieujemne” niż „dodatnie” , gdy dopuszczalne są wartości równe zeru. 3 — Podstawy...
większość ilustracji geometrycznych jest rysowana tylko w pierwszej ćwiartce. W ogólności nie będziemy się kłopotać określaniem dziedziny każdej funkcji w każdym modelu ekonomicznym. Jeśli nie podano żadnej specyfikacji, to należy rozumieć, że każda dziedzina (i przeciwdziedzina) będzie zawierała tylko takie liczby, dla których funkcja ma sens ekonomiczny. Przykład 5. Całkowity koszt dzienny C w pewnej firmie jest funkcją jej dziennej produkcji C = 150 + 7(2- Firma ta ma granicę wydajności równą 100 jednostkom produk tu dziennie. Co jest dziedziną i przeciwdziedziną funkcji kosztu? Ponieważ Q może się zmieniać jedynie od 0 do 100, więc dziedzina jest zbiorem wartości: 0 < Q < 100 lub bardziej formalnie: dziedzina = {¡210 ^ Q £ 100}. Jeśli chodzi o przeciwdziedzinę, to ponieważ wykres funkcji jest linią prostą, z minimalną wartością C równą 150 (gdy ¡2 = 0) i maksymalną wartością C równą 850 (gdy Q = 100), mamy zakres = {C| 150 < 850}. Uwaga! Wartości ekstremalne dla przeciwdziedziny funkcji nie zawsze muszą wy stępować tam, gdzie osiągane są ekstremalne wartości dla dziedziny.
Ćwiczenie 2.4 1. Dla danych Si = {3, 6, 9}; (a) 5[X S2\
S2 = {a, b} i S3 = {m, n} znaleźć iloczyny kartezjańskie: (c) S3x 5 ,.
2. Na podstawie informacji z poprzedniego ćwiczenia znaleźć iloczyn kartezjański St x S 2x S 3. 3. Czy jest — w ogólnym przypadku — prawdą, że 5, x S2 = S2 x 5,? Przy jakich założeniach te dwa iloczyny kartezjańskie będą zawsze równe? 4. Czy każdy z podanych obiektów narysowany w prostokątnym układzie współrzędnych reprezentuje funkcję: (a) okrąg;
(c) prostokąt.
5. Dziedziną funkcji y = 5 + 3x jest zbiór {x\ 1 < x £ 4}. Znaleźć przeciwdziedzinę tej funkcji i zapisać ją jako zbiór. 6. Jaka będzie przeciwdziedzina funkcji y = - x 2, jeśli dziedziną jej jest zbiór wszystkich nieujemnych liczb rzeczywistych?
2.5. TYPY FUNKCJI Wyrażenie y = f ( x ) jest ogólnym stwierdzeniem, że odwzorowanie jest możliwe, ale rzeczywista reguła odwzorowania nie jest przez to ujawniona. Rozważmy teraz kilka szczególnych typów funkcji, z których każdy reprezentuje inny sposób odwzorowania.
Funkcje stałe Funkcja, której zbiór wartości składa się tylko z jednego elementu, jest funkcją stałą. Jako przykład przytoczymy funkcję: y = f(x) = 7, która może być alternatywnie zapisywana jako y = 7 lubf( x ) = 7 i której wartość pozostaje ta sama niezależnie od wartości x. Na płaszczyźnie współrzędnych taka funkcja będzie przedstawiona przez poziomą linię prostą. W modelach dochodu narodowego, gdy inwestycje (/) są wyznaczane egzogenicznie, funkcja inwestycji może mieć postać I - 100 milionów dolarów lub 1 = co stanowi przykład funkcji stałej.
Funkcja wielomianowa Funkcja stała jest w istocie „zdegenerowanym” przypadkiem tego, co jest znane jako fitnkcja wielomianowa (polynomial function). Słowo „wielomian” oznacza „wieloskładnikowy” i funkcja wielomianowa jednej zmiennej x ma postać ogólną: (2.4)
w której każdy składnik zawiera współczynnik i potęgę zmiennej x o nieujemnym wykładniku całkowitym (jak to zostanie później wyjaśnione, możemy napisać: x l = x i x° = 1, zatem pierwsze dwa składniki można zapisać odpowiednio jako a 0x° i a lx i). Zauważmy, że zamiast symboli a , b ,c , .. . zastosowaliśmy do współczynników symbole z subskryptami: a 0, a lt ..., a„. Jest to umotywowane dwiema okolicznościami: (1) możemy oszczędzać oznaczenia, gdyż w ten sposób tylko litera a jest „zużywana” ; (2) subskrypt pomaga odnaleźć położenie współczynnika w całym równaniu, np. w (2.4) a 2 jest współczynnikiem przy x 2 itd. W zależności od wartości liczby całkowitej n (która określa najwyższą potęgę a:), mamy kilka podklas funkcji wielomianowych: gdy gdy gdy gdy
[funkcja stała] [funkcja liniowa] [funkcja kwadratowa] [funkcja trzeciego stopnia]
i tak dalej. Wpisane na górze wskaźniki potęg nazywamy wykładnikami (exponents). Najwyższa występująca tu potęga, czyli wartość n, jest często nazywana stopniem (degree) funkcji wielomianowej; funkcja kwadratowa jest wielomianem drugiego stopnia, a funkcja sześcienna jest wielomianem trzeciego stopnia4. Porządek, w jakim różne składniki poja wiają się na prawo od znaku równości, jest nieistotny; mogą być ustawione według ma lejącej kolejności potęg. Zamiast symbolu y po lewej stronie znaku równości, możemy na pisać f(x ). Wykresem funkcji liniowej na płaszczyźnie współrzędnych będzie linia prosta, jak to pokazano na rys. 2.8(a). Gdy x = 0, wówczas ze wzoru funkcji liniowej otrzymujemy y = a0, a zatem para uporządkowana (0, a 0) leży na tej prostej. Wyznacza ona tzw. punkt przecięcia z osią y (ang. „y intercept” lub vertical intercept), ponieważ w tym właśnie punkcie oś 4 W różnych właśnie przytoczonych równaniach ostatni współczynnik (a„) jest zawsze z założenia różny od zera, gdyż w przeciwnym razie funkcja zdegenerowałaby się do wielomianu niższego stopnia.
pionowa przecina prostą. Drugi współczynnik (a,) mierzy nachylenie (lub stromiznę wzrostu) naszej prostej. Oznacza to, że jednostkowy wzrost wartości x spowoduje zwiększenie y o ilość równą a,. Wykres pokazany na rys. 2.8(a) odpowiada przypadkowi, gdy a , > 0, dotyczącemu dodatniego nachylenia prostej, a zatem linii wznoszącej się; gdy < 0, linia będzie opadająca. Wykresem funkcji kwadratowej jest parabola — z grubsza rzecz biorąc jest to krzywa mająca jedno wygięcie. Przykładowa ilustracja na rys. 2.8(b) została sporządzona przy założeniu, że a 2jest ujemna. Gdy a 2 > 0, wówczas ramiona krzywej skierowane są ku górze, a rysunek przypomina dolinę, a nie wzgórze. Wykres funkcji trzeciego stopnia ma na ogół dwa wygięcia, co pokazano na rys. 2.8(c). Funkcje te będą często używane w omawianych poniżej modelach ekonomicznych.
w której y jest zapisany jako proporcja dwu wielomianów, jest nazywana funkcją wymierną (rational, co pochodzi od ratio — proporcja). Zgodnie z tą definicją każda funkcja wielomianowa musi być funkcją wymierną, gdyż zawsze może być wyrażona jako proporcja względem 1, która jest funkcją stałą. Szczególna funkcja wymierna o ciekawych zastosowaniach w ekonomii to funkcja: a y =x
której wykresem jest prostokątna hiperbola (rectangular hyperbola) pokazana na rys. 2.8(d). Ponieważ w tym przypadku iloczyn obu zmiennych jest zawsze ustaloną stałą, więc funkcja ta może być używana do reprezentowania specjalnej funkcji popytu — z ceną P i ilością Q zaznaczonymi odpowiednio na jednej i na drugiej osi — dla której całkowity wydatek PQ jest stały dla wszystkich poziomów cen. Jest to krzywa popytu z jednostkową elastycznością w każdym jej punkcie. Innym zastosowaniem jest krzywa przeciętnego kosztu stałego (Average Fixed Cost — AFC). Jeśli AFC jest zaznaczony na jednej osi, a produkcja Q na drugiej, to krzywa AFC musi być prostokątną hiperbolą, ponieważ AFC ■Q (= całkowity koszt stały) jest ustaloną stałą. Hiperbola prostokątna wykreśloną według wzoru xy = a nigdy nie dotknie osi, nawet jeśli przedłużymy ją w nieskończoność w górę i w prawo. Krzywa przybliża się do osi asymptotycznie: gdy y staje się bardzo duże, krzywa będzie coraz to bardziej przybliżała się do osi y, ale nigdy naprawdę jej nie osiągnie, i podobnie na osi x. Osie stanowią asymptoty tej funkcji.
Funkcje niealgebraiczne Dowolna funkcja wyrażona w terminach wielomianów i pierwiastków, albo pierwiastków (takich jak pierwiastek kwadratowy) z wielomianów, jest funkcją algebraiczną. Zgodnie z tym
wszystkie funkcje omówione do tej pory są algebraiczne. Funkcja taka, jak y = Vx2+ 3 nie jest wymierna, ale jest algebraiczna. Funkcje wykładnicze, takie jak y = bx, w których zmienna niezależna występuje w wykładniku, są niealgebraiczne. Blisko z nimi związane funkcje logarytmiczne, takie jak y = log4x, też są niealgebraiczne. Te dwa typy funkcji zostaną szczegółowo omówione w rozdz. 10, ale ich typowe wykresy są pokazane na rys. 2.8(e) i (f). Innym rodzajem funkcji niealgebraicznej jest funkcja trygonometryczna (lub kołowa), którą omówimy w rozdz. 15 w związku z analizą dynamiczną. Należy tu dodać, że funkcje niealgebraiczne są również znane pod bardziej ezoteryczną nazwufunkcji transcendentalnych.
Dygresje dotyczące wykładników Omawiając funkcje wielomianowe, wprowadziliśmy termin wykładniki na oznaczenie wskaźników potęgi, do jakiej podnosiliśmy zmienną (lub liczbę). Wyrażenie 62 oznacza, że 6 ma być podniesione do drugiej potęgi, to znaczy 6 ma być pomnożone przez siebie, czyli 6 2 = 6 • 6 = 36. Ogólnie definiujemy:
daje sama reguła II. Gdy m = 2 i n = 5, mamy: x2
(x * 0 ).
Podniesienie (niezerowej) liczby do potęgi minus n jest wzięciem odwrotności jej n-tej potęgi. Inne specjalne zastosowanie reguły II dotyczy przypadku, gdy m = n: x m~" = x m~m= x°. Aby zinterpretować znaczenie podnoszenia liczby x do potęgi zerowej, możemy zapisać xm wyrażenie x m~m zgodnie z powyższą regułą II i wynikiem będzie: — = 1. Możemy więc xm wywnioskować, że każda (niezerowa) liczba podniesiona do potęgi zerowej jest rów na 1 (wyrażenie 0° jest niezdefiniowane). Możemy to wyrazić jako następną regułę:
i jako szczególny przypadek x l = x . Z ogólnej definicji wynika, że wykładniki spełniają następujące reguły:
Dopóki zajmujemy się funkcjami wielomianowymi, potrzebne są nam jedynie nieujemne całkowite wykładniki potęg. Jednakże dla funkcji wykładniczych wykładnik jest zmienną, która może również przyjmować wartości niecałkowite. Aby zinterpretować liczbę taką, jak
(np. x 3 ■x 4= x 7).
(x * 0 ).
X m . X* =
■ ...
■ ...
■ ...
Reguła II X np. - j = x
i 1 x 2 • x 1= x i =x.
\ l ' 1 Ponieważ x 2 pomnożone przez siebie daje x, więc x 2 musi być pierwiastkiem ■ ■ i kwadratowym z x. Podobnie można wykazać, że x 2 jest pierwiastkiem sześciennym z x. Ogólnie możemy zatem sformułować następującą regułę: Reguła V
x" = Vx. = x ■X
ponieważ n czynników w mianowniku skróciło się z n czynnikami w liczniku. Zauważmy, że przypadek n = 0 jest wykluczony w sformułowaniu reguły, ponieważ dlax = 0 wyrażenie x m/x" zawierałoby dzielenie przez zero, które jest niezdefiniowane. Co będzie, jeśli m < n, powiedzmy m = 2 i n = 5? W tym przypadku otrzymujemy, zgodnie z regułą n , x m~" = x~3, czyli ujemną potęgę x. Co to oznacza? Odpowiedź w istocie
Reguła VI {xm)n = x"m. Reguła VII x my m = (xy)m.
40 WPROWADZENIE dwuwymiarowej w punkt z należący do przedziału prostej (tzn. punkt przestrzeni jedno wymiarowej), np. odwzorowuje punkt (xlt y j) w punkt z^ lub (x^, yj) w z2 na rys. 2.9 (a).
Ćwiczenie 2.5 1. Sporządzić wykresy funkcji: (a) y = 8 + 3x; L
(c) y = 3x+ 12.
W każdym przypadku zakładamy, że dziedzina składa się tylko z nieujemnych liczb rzeczywistych. 2. Jaka jest główna różnica między (a) i (bj z ćw. 1? Jak ta różnica jest odzwierciedlona na wykresie? Jaka jest główna różnica między (a) i (c)? Jak się uwidacznia w ich wykresach? 3. Sporządzić wykresy funkcji: (a) y = - x 2+ 5 x - 2 ;
ze zbiorem - 5 < x < 5 jako dziedziną. Jeśli wiadomo, że znak współczynnika przy x 2 określa kształt wykresu funkcji kwadratowej, to czy wykres będzie przedstawiał „wzgó rze” , czy „dolinę’’? Na podstawie naszego przykładu odpowiedzieć, który znak jest związany z „pagórkiem” ? Podać intuicyjne wyjaśnienie.
4. Narysować wykres funkcji y = 36/x, zakładając, że zarówno x , jak i y mogą przyjmować jedynie dodatnie wartości. Założyć następnie, żę obie zmienne mogą przyjmować również wartości ujemne; jak należy zmodyfikować wykres, aby odzwierciedlał tę zmianę wartości? 5. Uprościć następujące wyrażenia: (a) x 4 ■x 15; 6. Znaleźć:
( c ) x 3 -y 3 -z 3.
(b) (x2 • x 2) /x 5.
7. Pokazać, że x» = Vx'" = CVx)” . Określić reguły wykorzystywane W każdym działaniu. 8. Udowodnić regułę VI i regułę VII.
2.6. FUNKCJE WIĘCEJ NIŻ JEDNEJ ZMIENNEJ NIEZALEŻNEJ Rysunek 2.9
Do tej pory rozważaliśmy jedynie funkcje jednej Zmiennej niezależnej y = /( x ). Obecnie pojęcie funkcji rozszerzymy na przypadek dwu lub więcej zmiennych niezależnych. Dla dattej funkcji: z = g ( x ,y ) dana para Wartości x i y będzie jednoznacznie określać wartość zmięnnej zależnej. Przykładami takiej funkcji są: Z - a x + by
z - a ^ + a x l + a 2x 2+ b t y + b 2y 2.
Funkcja y =/(x ) odwzorowuje punkt dziedziny w punkt obrazu; funkcją g robi dokładnie to samo, Jednakże dziedziną w tym przypadku nlę jest Zbiór liczb, ale zbiór par uporząd kowanych (x, y ), ponieważ Wartość Z możemy określić jedynie wtedy, gdy podane są Wartości Obu zmiennych x i y. Funkcja g jest zatem odwzorowaniem punktu należącego, do przestrzeni
Jeśli pionowa oś z jest ustawiona prostopadle do płaszczyzny xy, tak jak to uczyniono na rys. 2.9(b), to otrzymujemy przestrzeń trójwymiarową, w której funkcja g ma następującą reprezentację graficzną: dziedziną funkcji będzie pewien podzbiór punktów płaszczyzny xy, a wartość funkcji (wartość z) dla danego punktu dziedziny — powiedzmy (zj.y ,) — może być wskazana przez wysokość linii pionowej umieszczonej w tym punkcie. Związek między trzema zmiennymi jest zatem pokazany przy użyciu trójki uporządkowanej (Xj, y,, z,), która jest konkretnym punktem w przestrzeni trójwymiarowej. Miejsce geometryczne takich uporządkowanych trójek, które będzie miało postać p o w ierzch n i, stanowić będzie wykres funkcji g. Tak więc funkcja y = /( x ) jest zbiorem par uporządkowanych, a funkcja z = g (x , y) jest zbiorem uporządkow anych trójek. W modelach ekonomicznych będziemy mieli wiele okazji do stosowania tego typu funkcji. Jednb z zastosowań dotyczy funkcji produkcji. Jeżeli
produkcja jest określona przez zużywane ilości kapitału (K ) i pracy (L), to funkcję produkcji możemy zapisać w ogólnej postaci Q = Q (K, L). Możliwość dalszego uogólnienia na przypadek trzech lub więcej zmiennych niezależ nych jest teraz oczywista. Za pomocą funkcji y = h(u, u, w) możemy np. odwzorować punkt w przestrzeni trójwymiarowej (u¡, v u w,) w punkt w przestrzeni jednowymiarowej (y t). Taka funkcja może np. oznaczać, że użyteczność konsumenta jest funkcją jego konsumpcji trzech różnych dóbr; funkcja ta określa zatem odwzorowanie z trójwymiarowej przestrzeni dóbr do jednowymiarowej przestrzeni użyteczności. Ale tym razem sporządzenie wykresu funkcji jest fizyczną niemożliwością, bo do zaznaczenia czwórek uporządkowanych potrzebny byłby czterowymiarowy diagram, a świat, w którym żyjemy, jest tylko trójwymiarowy. Niemniej jednak, ze względu na analogię geometryczną, możemy wciąż odwoływać się do uporząd kowanej czwórki (uj, v¡, Wj.yj), jako do „punktu” w czterowymiarowej przestrzeni. Miejsce geometryczne takich punktów będzie stanowiło (niemożliwy do wykreślenia) wykres funkcji y = h (u ,v ,w ), który nazywamy hiperpowierzchnią. Terminy punkt i hiperpowierzchnia przenoszą się również na ogólny przypadek przestrzeni n-wy miarowej. Funkcje więcej niż jednej zmiennej mogą być również klasyfikowane według różnych typów. Na przykład funkcja postaci: y = alx l + a2x 2 + ...+ a nxn jest funkcją liniową; charakteryzuje ją to, że każda zmienna jest podniesiona tylko do pierwszej potęgi. Funkcja kwadratowa obejmuje pierwsze i drugie potęgi jednej lub większej liczby zmiennych niezależnych, ale suma wykładników zmiennych pojawiających się w każdym pojedynczym czynniku nie może być większa niż dwa. Zauważmy, że zamiast oznaczać zmienne niezależne przez x, u, v, w itd. przeszliśmy do oznaczeń x l,x 2, ...,x„. Ten ostatni zapis, podobnie jak system współczynników z indeksami, jest oszczędniejszy i ułatwia obliczanie liczby zmiennych objętych funkcją.
2.7. POZIOMY OGÓLNOŚCI Przy rozpatrywaniu różnych typów funkcji wprowadziliśmy, nie zaznaczając tego w jawny sposób, przykłady funkcji o różnych poziomach ogólności. W niektórych przypadkach zapisywaliśmy funkcje w postaci: y = 7;
itd.
Zapis ten nie tylko określa współczynniki numeryczne, lecz również wskazuje szczegóło wo, czy funkcja jest stała, liniowa, czy kwadratowa. Jeśli chodzi o wykresy, każda taka funkcja określa jednoznacznie jedyną krzywą. Ze względu na to, że funkcje te są zapisane w postaci numerycznej, otrzymane dla nich rozwiązania modeluibędą również liczbami. Wada takiego zapisu polega na tym, że jeśli chcemy wiedzieć, jak zmienią się nasze wnioski analityczne, gdy przyjmiemy inny zestaw współczynników numerycznych, to musimy za każdym razem całe rozumowanie przeprowadzać od początku. Zatem wyniki otrzymane na podstawie konkret nych funkcji mają bardzo niewielki poziom ogólności. Na ogólniejszym poziomie dyskusji i analizy mamy funkcje postaci: y = a;
itd.
Ponieważ użyto tu parametrów, więc każda funkcja reprezentuje nie pojedynczą krzywą, ale całą rodzinę krzywych. Funkcja y = a obejmuje np. nie tylko przypadki szczególne y = 0; y = 1; y = 2, lecz również y = ^ ; y = - 5 ... ad infinitum.'Dla funkcji parametrycznych wynik operacji matematycznych również będzie zapisany parametrycznie. Wyniki są bardziej ogólne w tym sensie, że nadając różne wartości parametrom pojawiającym się w rozwiązaniu modelu, można otrzymać całą rodzinę szczegółowych odpowiedzi bez konieczności powtarzania procesu rozumowania od nowa. Aby osiągnąć jeszcze wyższy poziom ogólności, możemy uciec się do ogólnego zapisu funkcji y = /( x ) lub z = g(x, y). Taki zapis może oznaczać dowolną funkcję — liniową, kwadratową, wykładniczą lub trygonometryczną. Analityczny wynik oparty na tak ogólnym sformułowaniu będzie miał zatem najszersze zastosowanie. Jednakże, jak zobaczymy poniżej, aby otrzymać wyniki mające sens ekonomiczny, często trzeba nakładać pewne ograniczenia jakościowe na ogólne funkcje wbudowane w model. Mogą to być ograniczenia polegające na tym, że funkcja popytu ma wykres o ujemnym nachyleniu, albo że funkcja konsumpcji ma wykres o nachyleniu dodatnim mniejszym niż 1. W podsumowaniu stwierdzamy, że struktura matematycznego modelu ekonomicznego jest teraz jasna. W ogólnym przypadku będzie on złożony z układu równań, które mogą być definicyjne, behawioralne lub mające postać warunków równowagi5. Warunki behawioralne mają zwykle postać funkcji, które mogą być liniowe lub nieliniowe, numeryczne lub parametryczne i mogą zawierać jedną lub wiele zmiennych niezależnych. Właśnie poprzez te warunki analityczne założenia przyjęte w modelu zostają wyrażone matematycznie. A zatem przy rozwiązywaniu problemu analitycznego pierwszy krok polega na wybraniu odpowiednich zmiennych — zarówno egzogenicznych, jak i endogenicznych — które mają być włączone do modelu. Następnie musimy przełożyć na język równań zbiór wybranych założeń analitycznych dotyczących ludzkich, instytucjonalnych, technologicznych, prawnych i innych behawioralnych aspektów środowiska wpływających na działanie zmiennych. Dopiero wtedy można podjąć próbę uzyskania zbioru wniosków, dzięki stosownym matematy cznym działaniom i przekształceniom, i nadania im odpowiedniej interpretacji ekonomicznej.
5 Nierówności mogą również występować jako ważny składnik modelu, ale nie będziemy się nimi na razie zajmować.
3. ANALIZA RÓWNOWAGI W EKONOMII
Procedura analityczna przedstawiona w poprzednim rozdziale zostanie w pierwszym rzędzie zastosowana do tego, co jest nazywane analizą statyczną lub analizą równowagi. W tym celu trzeba koniecznie wyjaśnić, co oznacza „równowaga” .
3.1. ZNACZENIE RÓWNOWAGI Podobnie jak każdy termin ekonomiczny, równowaga może być zdefiniowana na różne sposoby. Według jednej definicji, równowaga jest „pewną konstelacją wybranych powiąza nych zmiennych, tak dostosowanych do siebie, że w modelu, który stanowią, nie przeważa żadna wewnętrzna tendencja do zmiany” Kilką słów w tej definicji zasługuje na szczególną uwagę. Po pierwsze, słowo „wybrane’ ’ podkreśla fakt, że istnieją też zmienne, które wskutek wyboru dokonanego przez analityka nie zostały włączone do modelu. Zatem równowaga może mieć znaczenie tylko w odniesieniu do szczególnego zbioru wybranych zmiennych. Jeśli natomiast model zostanie rozszerzony o dodatkowe zmienne, położenie równowagi znalezione dla mniejszego modelu nie jest stanem równowagi dla modelu większego. Po drugie, słowo „powiązane” sugeruje, że aby otrzymać równowagę, wszystkie zmienne w modelu muszą być w „stanie spoczynku” (state of rest). Ponadto stan spoczynku każdej zmiennej musi być zgodny ze stanem spoczynku każdej innej zmiennej. W przeciwnym przypadku pewna zmienna lub pewne zmienne będą się zmieniały i w ten sposób spowodują zmiany pozostałych zmiennych na zasadzie reakcji łańcuchowej i nie będzie można powiedzieć, że istnieje równowaga. Po trzecie, słowo „wewnętrzny” implikuje, że przy definiowaniu równowagi stan spoczynku, o jakim mówimy, powstaje jedynie wskutek zrównoważenia wewnętrznych sił 1 Fritz Machlup, Equilibrium and Disequilibrium: Misplaced Concreteness and Disguised Politics, „Economic Journal” 1958, marzec, s. 9 (przedrukowane w książce: F. Machlup, Essays on Economic Semantics, Prentice-Hall, Inc., Englewood Cliffs, N.J. 1963).
modelu, podczas gdy siły zewnętrzne są z założenia ustalone. Oznacza to, że parametry i zmienne egzogeniczne są przy przekształcaniu modelu traktowane jako stałe. Jeżeli w rzeczywistości czynniki zewnętrzne zmieniają się, może w rezultacie powstać nowy stan równowagi zdefiniowany dla nowych wartości parametrów. Nowe wartości równowagi są znów ustalone i pozostają nie zmienione. Równowaga dla pewnego określonego modelu jest zatem sytuacją, którą charakteryzuje brak tendencji do zmian. Jest to powód, dla którego analiza równowagi (a bardziej szczegółowo — badanie, jaki jest stan równowagi) jest nazywana analizą statyczną. Fakt, że równowaga implikuje brak tendencji do zmian, mógłby nasunąć wniosek, że stanowi ona pożądany albo wręcz idealny stan rzeczy. Taki wniosek jest niesłuszny. Mimo że pewne położenie równowagi może reprezentować stan pożądany i cel, do którego należy dążyć (np. do maksymalizacji zysku z punktu widzenia firmy), to jednak inne położenie równowagi może być całkiem niepożądane, a więc być czymś, czego należy unikać (np. położenie równowagi dochodu narodowego przy niepełnym zatrudnieniu). Jedyna zasadna interpretacja jest taka, że równowaga jest to sytuacja, która — jeśli zostanie osiągnięta — będzie miała tendencję do odtwarzania się, przeciwstawiając się wszelkim zmianom sił zewnętrznych. Pożądany rodzaj równowagi, który będziemy nazywać równowagą celu (goal equili brium), będzie rozważany w częściach 4 i 6 jako problem optymalizacji. W tym rozdziale ograniczymy się do rodzaju równowagi powstającej nie w wyniku jakiegokolwiek świadome go dążenia do określonego celu, ale z nieosobowego albo ponadosobowego procesu interakcji i dostosowania sił ekonomicznych. Przykładami są: równowaga osiągana przez rynek przy danych warunkach popytu i podaży oraz równowaga dochodu narodowego przy danych warunkach konsumpcji i schematach inwestycji (investment patterns).
i QP- Aby na nie odpowiedzieć, zakładamy, że Qd jest malejącą liniową funkcją P (gdy P rośnie, wówczas Qd maleje), a Q, jest rosnącą liniową funkcją P (gdy P rośnie, rośnie również Qj) z zastrzeżeniem, że podaż nie istnieje dopóty, dopóki cena nie przekroczy pewnego ustalonego dodatniego poziomu. W sumie model będzie zawierał jeden warunek równowagi oraz dwa równania behawioralne, które rządzą odpowiednio popytową i podażową stroną rynku. W sposób matematyczny możną to zapisać następująco: (3.1)
(c, d > 0).
Parametry a, b, c i d pojawiają się w dwóch funkcjach liniowych i są dodatnie. Punkt przecięcia wykresu funkcji popytu z osiąy jest w punkcie a (por. np. 3.1), a jego nachylenie jest równe ~b (jest ujemne, jak to jest wymagane). Funkcja podaży ma również wymagane nachylenie, gdyż d jest dodatnie, ale je j punkt przecięcia z osią pionową jest — jak widać — ujemny i znajduje się w punkcie - c . Dlaczego chcieliśmy określić taki ujemny punkt przecięcia z osią pionową? Otóż czyniąc tak, zmuszamy funkcję podaży, aby miała dodatni punkt przecięcia z osią poziomą w punkcie P l i w ten sposób spełniała uczynione wcześniej zastrzeżenie, że podaż nie pojawi się dopóty, dopóki cena nie będzie dodatnia i dostatecznie wysoka.
3.2. CZĘŚCIOWA RÓWNOWAGA RYNKOWA — MODEL LINIOWY W modelu równowagi statycznej standardowy problem dotyczy znajdowania zbioru takich wartości zmiennych endogenicznych, które będą spełniały warunki równowagi dla modelu. Gdy ustalimy te wartości, w rezultacie zidentyfikujemy stan równowagi. Zilustrujemy to za pomocą tzw. modelu częściowej równowagi, czyli modelu wyznaczenia ceny na izolowanym rynku.
Konstruowanie modelu Zakładamy, że rozważamy tylko jedno dobro, więc wystarczy uwzględnić w modelu jedynie trzy zmienne: wielkość popytu na dobro (Qd), wielkość podaży dobra (Qj) i jego cenę (P). Dość dobra określamy w funtach na tydzień, a jego cenę w dolarach. Po wybraniu zmiennych naszym następnym krokiem jest przyjęcie pewnych założeń dotyczących działania rynku. Przede wszystkim musimy wyspecyfikować warunek równowagi. Standardowe założenie jest takie, że równowaga na rynku powstaje wtedy i tylko wtedy, gdy popyt jest równy podaży (Q d~Q ,~ 0), to znaczy wtedy i tylko wtedy, gdy na rynku nie występują ani braki, ani nadwyżki badanego dobra. Ale to natychmiast wywołuje pytanie: jak są określone same Qd
Czytelnik powinien zauważyć, że w przeciwieństwie do zwykłej praktyki, na osi pionowej na rys. 3.1 została zaznaczona ilość, a nie cena. Jest to jednak zgodne z konwencją matematyczną umieszczania na osi pionowej zmiennej zależnej. W innej, opisanej poniżej sytuacji, gdy na krzywą popytu patrzy się z punktu widzenia firmy jako na krzywą opisującą średni przychód, AR = P = f( Q d), możemy zamienić osie i zaznaczyć P na osi pionowej. Dla tak skonstruowanego modelu następnym krokiem jest otrzymanie wartości rozwiązań dla trzech zmiennych endogenicznych: Qd, Qs i P. Wartości rozwiązań, oznaczone Qd, 4 — Podstawy...
Q, i P są to te wartości, które spełniają jednocześnie trzy równania z (3.1), tzn. są to wartości, które podstawione do trzech równań czynią z nich układ prawdziwych stwierdzeń. W kontekś cie modelu równowagi wartości te mogą być też nazywane wartościami równowagi dla wspomnianych zmiennych. Ponieważ jednak Qd = Qt , więc można je zastąpić pojedynczym symbolem Q. Zatem rozwiązanie równowagi dla modelu może być oznaczone po prostu przez parę uporządkowaną (P, Q). W przypadku gdy rozwiązanie nie jest jednoznaczne, każda z wielu par uporządkowanych może spełniać układ równań; zbiór rozwiązań będzie wtedy miał więcej niż jeden elem ent Jednak taka sytuacja nie może pojawić się w modelu liniowym takim, jaki obecnie omawiamy.
Rozwiązanie przez eliminację zmiennych Jednym ze sposobów znajdowania rozwiązania układu równań jest sukcesywne eliminowanie zmiennych i równań przez podstawienie. W (3.1) model zawiera trzy równania z trzema zmiennymi. Jednakże ze względu na to, że wartości Qj i Qs są równe na mocy warunku równo wagi, możemy przyjąć Q = Qd = Q, i przepisać model w następującej, równoważnej postaci:
Ponieważ mianownik (b+ d) jest dodatni, więc aby Q było dodatnie, licznik (a d —bc) również musi być dodatni. Zatem model ten, aby mieć sens ekonomiczny, powinien zawierać dodatkowy warunek, że ad > bc. Znaczenie tego warunku jest widoczne na rys. 3.1. Wiadomo także, że P i Q dla modelu rynku mogą być wyznaczone graficznie w punkcie przecięcia krzywych popytu i podaży. Żeby Q> 0, punkt przecięcia musi znajdować się powyżej osi poziomej, co z kolei wymaga, aby nachylenie i punkty przecięcia z osiami dwu krzywych spełniały pewne ograniczenia dotyczące ich wielkości względnych. Ograniczenie to, zgodnie z (3.5), to ad> bc, przy założeniu, że b i d są dodatnie. Przecięcie krzywych podaży i popytu na rys. 3.1 jest pojęciem w istocie nie odbiegającym od przecięcia pokazanego na diagramie Venna na rys. 2.2(b). Jest tylko jedna różnica: zamiast punktów leżących w dwu różnych kołach mamy tu punkty leżące na dwu prostych. Oznaczmy zbiór punktów na krzywych popytu i podaży odpowiednio przez D i S. Wtedy, stosując symbol Q (= Qd = Qj), możemy zapisać dwa zbiory i ich przecięcie jako: D = {(P ,Q )\Q = a - b P } , S = { (P ,Q ) \Q = -c + d P } ,. D n S = (P, Q).
redukując w ten sposób układ do dwu równań względem dwu zmiennych. Ponadto, przez podstawienie pierwszego równania do drugiego w (3.2), model może być zredukowany do jednego równania względem jednej zmiennej:
Zbiór, który jest częścią wspólną, zawiera w tym przypadku tylko jeden element: parę uporządkowaną (P, Q). Równowaga rynkowa jest jedyna.
a - b P = - c + dP, a po odjęciu od obu stron równania (a+dP) i pomnożeniu przez -1 otrzymujemy: (3.3)
(b + d ) P - a + c .
Rezultat ten można też otrzymać bezpośrednio z (3.1), podstawiając drugie i trzecie równanie do pierwszego. Ponieważ b + d # 0, więc wolno podzielić obie strony równania (3.3) przez (b+ d). Wynik jest wartością rozwiązania dla P: -
(14) Zauważmy, że P — zgodnie z zasadą przyjętą dla rozwiązań — jest wyrażone całkowicie za pomocą parametrów, które reprezentują dane modelu, a zatem P jest jednoznacznie określoną wartością. Zauważmy też, że P jest dodatnie (cena musi być dodatnia), ponieważ wszystkie parametry są dodatnie na mocy specyfikacji modelu. Aby znaleźć wartość równowagi Q (= Qj = Q,) odpowiadającą wartości P, podstawimy po prostu (3.4) do dowolnego równania (3.2), a następnie rozwiążemy otrzymane równanie. Podstawiając (3.4) np. do funkcji popytu, otrzymamy: _ (3.5)
p, b(a+ć) a (b + d )-b (a + c) a d - b c Q = a ------------ = ----------------------- = ---------- , b+ d b +d b+ d
co znów jest wyrażeniem zawierającym jedynie parametry.
1. Dla danego modelu rynku: Qd —ßj> fia = 24 - 2P, Q, = -5 + J P _ znaleźć P i ß : (a) przez eliminację zmiennych; (b) za pomocą wzorów (3.4) i (3.5) (stosować ułamki, a nie rozwinięcia dziesiętne). \ 2. Niech funkcje popytu i podaży będą następujące: ( a ) O r = 5 1 -3 P , (b) Qd = 30- 2 P , ß , = 6 P -1 0 ; ß , = - 6 + 5P. Znaleźć P i ß przez eliminację zmiennych (stosować ułamki, a nie rozwinięcia dziesiętne). 3. Zgodnie z (3.5), aby ß było dodatnie, konieczne jest, aby wyrażenie (a d -b c ) miało taki sam znak jak (b+ d). Sprawdzić, czy ten warunek jest rzeczywiście spełniony przez modele z poprzednich dwu zadań. 4. Jeśli w liniowym modelu rynku (b + d) = 0, to czy można znaleźć rozwiązanie równowagi stosując (3.4) i (3.5)? Dlaczego można lub dlaczego nie można? 5. Jeśli w liniowym modelu rynku (b + d ) = 0, to czy można wywnioskować, jakie będzie położenie krzywych popytu i podaży na rys. 3.1? Co można zatem powiedzieć o roz wiązaniu równowagi?
3.3. CZĘŚCIOWA RÓWNOWAGA RYNKOWA — MODEL NIELINIOWY Zastąpimy liniowy popyt w modelu izolowanego rynku przez kwadratową funkcję popytu, a funkcję podaży pozostawimy liniową. Jeśli zastosujemy współczynniki liczbowe, a nie parametry, możemy otrzymać następujący model: Qd = Qs> Q* = 4 - P2,
G, = 4 P -1 Podobnie jak poprzednio, układ trzech równań (3.6) może być zredukowany do jednego równania przez eliminację zmiennych: 4 - P 2= 4 P - l lub: (3.7)
P 2+ 4 P - 5 = 0.
Jest to równanie kwadratowe, ponieważ wyrażenie po lewej stronie jest kwadratową funkcją zmiennej P. Główna różnica między równaniem kwadratowym a liniowym jest taka, że to pierwsze ma dwa rozwiązania. Rysunek 3.2
Równanie kwadratowe a funkcja kwadratowa Przed omówieniem metody rozwiązania trzeba przeprowadzić jasne rozróżnienie między dwoma terminami: równanie kwadratowe i funkcja kwadratowa. Zgodnie z wcześniejszymi ustaleniami wyrażenie P 2+ 4 P ~ 5 stanowi funkcję kwadratową, powiedzmy / (P). Możemy więc napisać: (3.8)
/( P ) = P 2+ 4 P - 5 . Wzór (3.8) jest określeniem reguły odwzorowania P w /(P ), a mianowicie: p f( p )
...
W tabelce uwzględniliśmy jedynie dziewięć wartości P; w praktyce można je wybierać spośród wszystkich wartości P należących do dziedziny funkcji. Zapewne to jest przyczyną, że rzadko mówimy o „rozwiązaniu” rów nania/(P) = P 2+ 4 P —5, gdyż zwykle oczekujemy, że „wartości rozwiązań” będzie niewiele, a tutaj mogą wystąpić wszystkie wartości P . Można zatem traktować każdą parę uporządkowaną w powyższej tabeli — np. (-6 ,7 ); (-5 ,0 ):— jako rozwiązanie (3.8), gdyż każda taka para uporządkowana rzeczywiście spełnia to równanie. Ponieważ można napisać nieskończenie wiele takich par uporządkowanych — po jednej dla każdej wartości P — więc istnieje nieskończenie wiele rozwiązań (3.8), co obrazuje parabola na rys. 3.2.
W (3.7), gdzie przyrównaliśmy funkcję kwadratową/(P) do zera, sytuacja jest już inna. Z m ien n a/(P ) = 0 znika i w wyniku tego otrzymaliśmy równanie kwadratowe2 jednej zmiennej P . Teraz, gdy /(P ) jest ograniczone do wartości równej zeru, tylko niektóre war tości P mogą spełniać (3.7) i stanowić wartości rozwiązań, mianowicie takie, w których parabola na rys. 3.2 przecina oś poziomą i dla których/(P) jest równe 0. Zwróćmy uwagę, że tym razem wartości rozwiązań są to wartości P, a nie pary uporządkowane. Wartości rozwiązań dla P często są nazywane pierwiastkami równania kw adratow ego/(P) = 0 lub miejscami zerowymi kwadratowej funkcji f(P ). Na rys. 3.2 są dwa takie punkty przecięcia, mianowicie (1, 0) i (-5 , 0). Tak jak jest to wymagane, drugi element każdej z tych par uporządkowanych (rzędna odpowiedniego punktu) okazuje się być równa zeru: /( P j = 0 w obu przypadkach. Pierwszy element każdej pary uporządkowanej (odcięta punktu) jest wartością rozwiązania dla P. Mamy tu dwa rozwiązania: Ą =1
ale tylko pierwsze jest ekonomicznie dopuszczalne, gdyż ujemne ceny są wykluczone. Omawiane rozróżnienie między funkcją kwadratową i równaniem kwadratowym może być rozszerzone również na przypadekwielomianów innych niż kwadratowe. Na przykład równanie trzeciego stopnia powstaje po przyrównaniu funkcji trzeciego stopnia do zera.
Równanie (3.7) zostało rozwiązane graficznie, ale dopuszczalna jest też metoda algebraiczna. W przypadku ogólnym dla równania kwadratowego postaci:
Jedna z metod graficznego rozwiązywania badanego modelu została przedstawiona na rys. 3.2. Ponieważ przy wyprowadzaniu równania kwadratowego wyeliminowano zmienną oznaczającą ilość, więc na podstawie tego rysunku można wyznaczyć jedynie P. Jeśli interesuje nas znajdowanie jednocześnie P i Q, musimy zastosować diagram z Q na jednej osi i P na drugiej, o konstrukcji podobnej do rys. 3.1. Jest to zilustrowane na rys. 3.3. Nasze zadanie oczywiście znów polega na znalezieniu części wspólnej dwu zbiorów punktów, a mianowicie:
jego dwa rozwiązania można otrzymać za pomocą wzoru na pierwiastki trójmianu kwa dratowego:
D = {(P, Q)\Q = 4 - P 2}, S = {<,P,Q)\Q = 4 P ~ \} .
gdzie część + znaku ± daje x lt a część - znaku ± daje Ten szeroko stosowany wzór może być wyprowadzony na podstawie postępowania znanego jakd „uzupełnienie kwadratu” . Najpierw dzieląc każdy składnik w (3.9) przez a, otrzymujemy równanie: o b c . x2+ - x + - = 0. a a c b2 Odejmując - od obu stron równania i dodając do nich , otrzymujemy: b b 2 b2 c x + "a i + 74a1 = 74arj —a • Lewa strona jest teraz „pełnym kwadratem’ ’, a zatem równanie może być wyrażone jako: bV
" • i* * — W końcu odejmując b ila od obu stron, otrzymujemy wynik (3.10). Stosując wzór do (3.7), gdzie a - 1; b = 4; c = - 5 i x = P, znajdujemy pierwiastki: -
co zgadza się z rozwiązaniem graficznym pokazanym na rys. 3.2. Ponownie odrzucamy P2 = —5 z przyczyn ekonomicznych i, po opuszczeniu indeksu 1, piszemy po prostu P = 1. Gdy mamy już tę informację, możemy łatwo wyznaczyć wartość równowagi Q z drugiego lub trzeciego równania (3.6); jest nią Q = 3.
Jeśli nie nałożono żadnych warunków na dziedzinę ani na zbiór wartości, przecięcie zbiorów będzie zawierało dwa elementy:
D n i= {(l, 3), (-5,-21)}; pierwszy leży w pierwszej ćwiartce, a drugi (nie narysowany) w trzeciej ćwiartce. Jeśli jednak dziedzina i obraz są ograniczone (mają być nieujemne), to możemy przyjąć jedynie pierwszą parę uporządkowaną (1, 3). Położenie równowagi jest wtedy znów jednoznaczne.
Funkcje wielomianowe wyższych stopni x3 = - c 3 itd. Wyniki te można zwięźlej wyrazić za pomocą indeksu (subskryptu i): Jeśli układ równań (simultaneous equations) redukuje się nie do równania liniowego, takiego jak (3.3)3 lub do równania kwadratowego, takiego jak (3.7), ale do równania sześciennego (wielomian trzeciego stopnia) lub do równania czwartego stopnia (z wielomianem czwartego stopnia), znalezienie rozwiązań może być trudniejsze. Pożyteczną metodą jest rozkładanie funkcji na czynniki. Na przykład równanie x s- x 2- 4 x + 4 może być zapisane jako iloczyn trzech czynników: ( x - l ) , (x+2) i ( x -2 ). Zatem równanie sześcienne:
X j - - c , ( t= 1, 2, ..., n).
Mimo iż napisano tu tylko jedno równanie, fakt, że subskrypt i może przyjmować n różnych wartości, oznacza, że w sumie mamy tu n równań. Zatem użycie indeksu umożliwia bardzo zwięzły sposób formułowania stwierdzeń.
1. Znaleźć graficznie miejsca zerowe następujących funkcji: (a) /(x ) = x 2- 7x +10; (b) g(x) = 2 x2- 4 x - 16.
może być zapisane po rozłożeniu na czynniki jako: ( x - l ) ( x + 2 ) ( x - 2 ) = 0.
2. Rozwiązać poprzednie zadanie za pomocą wzorów na pierwiastki trójmianu kwadratowego.
Aby iloczyn po lewej stronie był równy zeru, przynajmniej jeden z trzech czynników iloczynu musi być równy zeru. Przyrównując do zera po kolei każdy z czynników, otrzymujemy: x - 1= 0
4. Znaleźć funkcję trzeciego stopnia, która ma pierwiastki 7, - 2 i 5.
x - 2 = 0.
Te trzy równania dadzą trzy pierwiastki równania sześciennego, a mianowicie: Xj — 1,
3. Rozwiązać następujące równanie wielomianowe metodą rozkładu na czynniki: (a) P 2+ 4 P ~ 5 = 0 [zob. (3.7)]; (c) x 3- 7 x 2+ 1 4 x - 8 = 0; (b) x 3+ 2x2- 4 x - 8 = 0; (d) x 3- 3 x 2- 4 x = 0.
x 3 ■2 .
Sztuka polega oczywiście na znalezieniu odpowiedniego sposobu rozkładu na czynniki. Nie istnieją niestety ogólne reguły i musi to pozostać kwestią prób i błędów. Dane równanie wielomianowe n-tego stopnia /(x) = 0 ma dokładnie n pierwiastków, które można znaleźć w następujący sposób. Najpierw próbujemy znaleźć stałą c, taką, że/(x ) jest podzielna przez (x+c,). Iloraz /(x)/(x+ c,) będzie funkcją wielomianową niższego, (n -l)-sze g o stopnia; nazwijmy ją g(x). Wynika stąd, że:
5. Znaleźć rozwiązania równowagi dla każdego z następujących modeli: (a) (b) & , = & . Qd = 3 - P 2, & = 8 - P 2, Q, = 6 P -4 ; QS = P2- 2. 6. Warunek równowagi rynkowej Qd = Qs jest często wyrażony w równoważnej alternatyw nej postaci Qd- Q s = 0, która ma interpretację ekonomiczną: „nadwyżkowy popyt jest równy zeru” . Czy (3.7) reprezentuje tę drugą wersję warunku równowagi? Jeśli nie, podać odpowiednią ekonomiczną interpretację dla (3.7).
/(x) = (x+c,)g(x). g(jt) A teraz spróbujemy znaleźć stałą c2 taką, że g (x) jest podzielne przez (x + cj). Doraz------
będzie funkcją wielomianową niższego, (n-2)-giego stopnia; nazwijmy ją h{x). Ponieważ g(x) = (x+cj)h(x), więc wynika stąd, że: / ( x ) = ( x + c ,) g ( x ) = ( x + c ,) ( x + C 2)/z(x).
Metodą powtarzania procesu można zredukować pierwotny wielomian n-tego stop nia fix ) do iloczynu dokładnie n czynników: f i x ) = ( x + c l) ( x + c j ) .. . (x+c„),
który przyrównany do zera daje dokładnie n pierwiastków. Na przykład przyrównując pierwszy czynnik do zera otrzymujemy x ,= - c ,. Podobnie inne czynniki dają x2 = —c2,
3 Równanie (3.3) może być traktowane jako wynik przyrównywania do zera funkcji liniowej
(b+d)P- (a+c).
3.4, OGÓLNA RÓWNOWAGA RYNKOWA Podrozdziały 3.3 i 3.4 dotyczyły modelu izolowanego rynku, na którym Qd i Qs dla pewnego dobrą były funkcjami ceny tylko tego dobra. W rzeczywistym świecie żadne jednak dobro nie prowadzi takiej „pustelniczej” egzystencji, dla każdego dobra istnieje zwykle wiele substytutów i dóbr komplementarnych. Zatem bardziej tealistyczny obraz funkcji popytu na dobro powinien uwzględniać wpływ nie tylko ceny tego właśnie dobra, lecz również większości, jeśli nie Wszystkich, powiązanych z nim dóbr. Tak samo jest dla funkcji podaży. Gdy tylko w modelu pojawią się ceny innych dóbr, jego struktura musi zostać poszerzona tak, aby mogła daWać wartości równowagi również dla pozostałych cen. W wyniku tego zmienne wyrażające ceny i ilości wielu dóbr muszą wejść do modelu jako zmienne endogeniczne. W modelu izolowanego rynku warunek równowagi składał się tylko z jednego równania Qó- Q,’ czyli E s Qd- Q , = Q, gdzie E oznacza nadwyżkowy popyt. Gdy jednocześnie rozważa się wiele współzależnych zmiennych, równowaga wymaga, aby nie było nadwyżkowego popytu dla żadnego dobra występującego W modelu. Gdyby chociaż jedno dobro podlegało nadwyżkowemu popytowi, wówczas dostosowanie ceny tego
dobra musiałoby wpłynąć na wielkości popytu i podaży pozostałych dóbr, powodując w ten sposób zmiany cen. W konsekwencji, taki warunek równowagi dla modelu rynku n dóbr będzie obejmował n równań, po jednym dla każdego dobra, postaci:
co może być rozwiązane przez dalszą eliminację zmiennych. Z pierwszego równania wynika, że P2 = - ( c 0+ ciP l)/c2. Podstawiając tę wartość do drugiego równania i rozwiązując je, otrzymujemy:
0 = 1 , 2 ....... n).
Jeśli istnieje rozwiązanie, to będą istniały zbiory cen P, i odpowiadające im ilości 2 , takie, że wszystkie n równań w warunkach równowagi będą jednocześnie spełnione.
1= c1 ^ T c°% .
Zauważmy, że P 2 — tak jak to powinno być dla wartości rozwiązania — jest wyrażona jedynie za pomocą parametrów modelu. W podobny sposób znajdujemy cenę równowagi drugiego dobra równą:
Model rynku dwu dóbr (3.15) Aby zilustrować to zagadnienie, omówimy prosty model, w którym występują tylko dwa powiązane ze sobą dobra. Dla uproszczenia przyjmujemy, że funkcje podaży i popytu dla obu dóbr są liniowe. W ujęciu parametrycznym taki model może być zapisany jako: 2.1 —2,1 = 0> 2.1 = nQ+ U |/)1+U2^>2» (3.12)
/ )2 = C°y i~ Cl7° . c f l z - c 2yx
Aby jednak te dwie wartości miały sens, trzeba nałożyć na model pewne warunki. Po pierwsze, ponieważ dzielenie przez zero jest nieokreślone, więc musimy założyć, że wspólny mianownik (3.14) i (3.15) jest różny od zera, tzn. że c,y2 + c2y,. Po drugie, aby zapewnić dodatniość, licznik musi mieć taki sam znak jak mianownik. Po znalezieniu cen równowagi można z łatwością obliczyć wartości równowagi Q ,i Q2 ; przez podstawienie (3.14) i (3.15) do drugiego (lub trzeciego) równania i piątego (lub szóstego) równania z (3.12). Te wartości rozwiązań będą oczywiście wyrażone za pomocą parametrów (rzeczywiste ich obliczenie zostawiamy Czytelnikowi jako ćwiczenie).
2 .2 = A , + / M ’l+ /M > 2 .
gdzie współczynniki a i b odnoszą się do funkcji podaży i popytu pierwszego dobra, a współczynniki a i ¡i — do funkcji drugiego dobra. Nie określiliśmy znaków współczyn ników, ale w trakcie rozważań wprowadzimy pewne warunki wstępne dla wyników sensownych ekonomicznie. Ponadto w następnym przykładzie numerycznym poczynimy pewne uwagi dotyczące znaków, jakie trzeba nadać współczynnikom. Rozwiązywanie układu (3.12) rozpoczniemy od eliminacji zmiennych. Podstawiając równania drugie i trzecie do pierwszego (dla pierwszego dobra), a równania piąte i szóste do czwartego (dla drugiego dobra), redukujemy model do dwu równań z dwiema zmiennymi: (3 13)
(.ao- b 0)+ (a i - b l)P l +(a2- b 2)P2 = 0, ( a o- ^ o ) + ( a I - ^ . + ( a 2 - ^ 2 = 0-
Te równania stanowią wersję (3.11) dla dwu dóbr otrzymaną po podstawieniu funkcji popytu i podaży do dwu równań wyrażających warunki równowagi. Chociaż jest to prosty układ tylko dwu równań, obejmuje on aż dwanaście parametrów i przekształcenia algebraiczne będą trudne, jeśli nie wprowadzimy pewnego rodzaju skrótów. Określmy więc skrótowe oznaczenia:
Przykład liczbowy Załóżmy, że funkcje popytu i podaży mają następującą postać liczbową: 2.1 = 1 0 - 2 P j + P 2, (3.16)
Jakie będzie rozwiązanie dla osiągnięcia równowagi? Przed udzieleniem odpowiedzi na to pytanie przyjrzyjmy się współczynnikom liczbowym. Dla każdego dobra 2„- zależy tylko od Pj, a 2 „ jest natomiast funkcją obu cen. Zauważmy, że — zgodnie z naszymi oczekiwaniami — P, ma ujemny współczynnik we wzorze na 2 ,i, a współczynnik przy P2jest dodatni. Fakt, że wzrost ceny P2 sprzyja wzrostowi QJl sugeruje, że te dwa dobra są dla siebie substytutami. Rola P, w funkcji Qdl ma podobną interpretację. Dla tych współczynników oznaczenia skrótowe c, i y będą przyjmowały następujące wartości:
c i = a, - b , Y = a i~Pi
Teraz (3.13) przyjmuje postać — po przeniesieniu składników c0 i y0 na prawą stronę znaku równości:
c0 = 1 0 - ( - 2 ) = 12; 7o= 1 5 - ( - 1 ) = 16;
c, = - 2 - 3 = - 5 ; 1 -0 = 1 ;
c2= l - 0 = l ; y2 = - l - 2 = -3 .
Podstawiając te wartości bezpośrednio do (3.14) i (3.15), otrzymujemy:
ANALIZA RÓWNOWAGI W EKONOMII 61
60 ANALIZA STATYCZNA
wszystkich n cen, powyższy układ równań można zapisać jako:
a kolejne podstawienie P¡ i P2 do (3.16) daje: 64 1 2i = y = 9 -
E fP \, P2, ..., P„) = 0
_ 85 1 fi2 = y = 1 2 - .
oraz
Okazało się zatem, że wszystkie wartości równowagi zgodnie z wymogami są dodatnie. Aby zachować dokładne wartości P¡ i P2 tak, aby można było ich używać w dalszym obliczeniu <2j i fi2, radzimy zapisywać je w postaci ułamków, a nie rozwinięć dziesiętnych. Czy moglibyśmy graficznie wyznaczyć ceny? Odpowiedź brzmi: tak. Z (3.13) wynika jasno, że model dla dwu dóbr może być zapisany w postaci dwu równań względem dwu zmiennych P¡ i P2. Dla danych współczynników liczbowych wykresy obu równań mogłyby być wykreślone na płaszczyźnie współrzędnych P\P2, a punkt przecięcia dwu krzywych wskazałby nam T\ i P2.
Przypadek n zmiennych W dotychczasowych rozważaniach ograniczyliśmy się do przypadku dwu dóbr, czyli do analizy równowagi częściowej. Obecnie przechodzimy do analizy równowagi globalnej. Przy włączeniu do modelu większej liczby dóbr będzie w nim więcej zmiennych i więcej równań, które będą dłuższe i bardziej skomplikowane. Jeśli wszystkie dobra w gospodarce zostaną włączone do ogólnego modelu rynku, rezultatem będzie walrasowski rodzaj modelu równowagi ogólnej, w którym nadwyżkowy popyt na każde dobro jest traktowany jako funkcja cen wszystkich dóbr w gospodarce. Niektóre ceny mogą oczywiście mieć zerowe współczynniki; nie odgrywają one roli przy określaniu nadwyżkowego popytu na pewne dobro. Na przykład w funkcji nadwyżkowego popytu na fortepiany cena prażonej kukurydzy może z powodzeniem mieć współczynnik zerowy. W ogólnym przypadku jednak, dla n dóbr, możemy wyrazić funkcje popytu i podaży w następujący sposób (stosując Q¿¡ i firijako oznaczenia funkcji zamiast f i g): (3.17) fili —
p 2’ H W •••> E„)
(1 = 1,2, ...,« ).
Ze względu na indeks, te dwa równania reprezentują całość złożoną z 2n równań zawartych w modelu (funkcje té nie muszą być liniowe). Ponadto sam warunek równowagi Składa się Z układu n równań: (3.18)
f i„ -fi„ = 0
(i=
1, 2.........n).
Gdy dodamy (3.18) do (3.17), model stanie się zupełny. Powinniśmy zatem rozważać wszystkie równania. Po podstawieniu (3.17) do (3.18) model można zredukować do układu jedynie n równań współzależnych: Q J P t, P2, .... P J - Q H(PV P2, .... P J = 0
(¿ = 1, 2,
Rozwiązanie tego układu n równań, jeśli rzeczywiście istnieje, wyznacza n cen równowagi Pt, a wówczas fi, mogą być obliczone z funkcji popytu lub podaży.
Rozwiązanie układu równań ogólnych Jeśli model zawiera współczynniki liczbowe, tak jak w (3.16), to wartości równowagi dla zmiennych też będą zapisane w postaci liczb. Na ogólnym poziomie, jeśli model je st zapisany za pomocą stałych parametrów, jak w (3.12), wartości równowagi będą również zależały od parametrów i będą miały postać „formuły” , jak np. w (3.14) i (3.15). Jeśli jednak dla zwiększenia ogólności nawet postać funkcji nie zostanie w modelu wyspecyfikowana, tak jak w (3.17), sposób wyrażenia wartości rozwiązań z konieczności również będzie niezmiernie ogólny. Z doświadczenia z modelami parametrycznymi wiemy, że wartość rozwiązania jest zawsze wyrażeniem zapisanym przy użyciu parametrów. Dla modelu z ogólnymi funkcjami zawierającego w sumie — powiedzmy — m parametrów (a x, a ^ , a j , gdzie m nie musi być koniecznie równe n, można oczekiwać, że n cen równowagi będzie przyjmować ogólną postać analityczną: (3.19)
/ > = / > „ n2, ..., a j
(i= 1, 2, ..., n).
Jest to symboliczny zapis, który oznacza, że wartość rozwiązania dla każdej zmiennej (tutaj: ceny) jest funkcją zestawu wszystkich parametrów modelu. Ponieważ jest to bardzo ogólne stwierdzenie, więc rzeczywiście nie dostarcza ono zbyt szczegółowej informacji 0 rozwiązaniu. Ale przy ogólnym analitycznym podejściu do niektórych typów zadań nawet taki sposób wyrażania rozwiązania okaże się pożyteczny. Zapisanie takiego rozwiązania jest łatwe. Występuje tu jednak pewna pułapka: wyrażenie w (3.19) jest uzasadnione wtedy i tylko wtedy, gdy jedyne rozwiązanie rzeczywiście istnieje, gdyż w takim i tylko w takim przypadku możemy przyporządkować uporządkowanej m-tce ( au a 2, ..., a j określoną wartość ceny P,. Ale, niestety, nie istnieje żaden powód, aby zakładać a priori, że każdy model będzie automatycznie dawać jednoznaczne rozwiązania. W związku z tym należy podkreślić, że proces „liczenia równań i niewiadomych’’ nie jest wystarczającym sprawdzeniem. Bardzo proste przykłady powinny nas przekonać, że równa liczba równań 1niewiadomych (zmiennych algebraicznych) nie musi gwarantować istnienia jednoznacznego rozwiązania. Rozważmy trzy układy równań: ,3.20)
’ ;> os x+ y= 9;
(3.21)
2" + ^ 21’ 4x+2y = 24;
»).
Ponadto, ponieważ Ei = Qd¡—Q„, gdzie E¡ również musi być koniecznie funkcją
(i= 1, 2, ..., n).
6 2 ANALIZA STATYCZNA
2 r + 3y = 58, (3.22)
y = 18, x + y = 20.
W (3.20), pomim o że dwie niewiadome są powiązane dokładnie dwoma równaniami, nie ma jednak żadnego rozwiązania. Tak się złożyło, że te dwa równania są sprzeczne, gdyż jeśli suma x i y jest równa 8, to nie może być jednocześnie równa 9. W (3.21) dwa równania są funkcjonalnie zależne (functionally dependent), co oznacza, że jedno może być otrzymane (i wynika) z drugiego (drugie równanie jest równe podwojonemu pierwszemu równaniu). W konsekwencji jedno równanie jest zbędne i może być usunięte z układu, co pozostawi tylko jedno równanie z dwiema niewiadomymi. Rozwiązaniem będzie wtedy równanie y = 12—2x, które nie daje jednoznacznie określonej pary uporządkowanej (x, y), ale nieskończoną liczbę par, w tym (0, 12), (1, 10), (2, 8) itd., z których każda spełnia równanie. W końcu przypadek (3.22) obejmuje więcej równań niż jest niewiadomych, ale para uporządkowana (2, 18) stanowi jego jednoznaczne rozwiązanie. Powodem jest to, że ze względu na występowanie funkcjonalnej zależności między równaniami (pierwsze jest równe sumie drugiego i po dwojonego trzeciego), mamy w rezultacie tylko dwa niezależne, niesprzeczne równania z dwiema niewiadomymi. Te proste przykłady powinny wystarczyć do podkreślenia znaczenia niesprzeczności i funkcjonalnej niezależności jako dwu wstępnych warunków zastosowania metody liczenia równań i niewiadomych. W ogólnym przypadku, aby stosować tę metodę, trzeba sprawdzić, że: (1) spełnienie każdego z równań modelu nie będzie wykluczało spełnienia innego i (2) żadne równanie nie jest zbędne. Na przykład w (3.17) można spokojnie założyć, że n funkcji popytu i n funkcji podaży jest od siebie niezależnych, gdyż każda powstała z innego źródła: każdy popyt z decyzji grupy konsumentów i każda podaż z decyzji grupy firm. Zatem każda funkcja służy do opisu jednego aspektu sytuacji rynkowej i żadna z nich nie jest zbędna. Można też założyć ich wzajemną zgodność. W dodatku, równania warunków równowagi w (3.18) też są niezależne i przypuszczalnie zgodne. Wobec tego rozwiązanie analityczne zapisane w (3.19) może być.traktowane jako uzasadnione4. Dla modeli o równaniach współzależnych istnieją systematyczne metody sprawdzania istnienia jednoznacznego (albo określonego) rozwiązania. Metody te będą obejmowały, dla modeli liniowych, zastosowanie pojęcia wyznacznika, które zostanie wprowadzone w rozdz. 5. W przypadku modeli nieliniowych taki test będzie również wymagał znajomości tzw. pochodnych cząstkowych i szczególnego rodzaju wyznacznika zwanego wyznacznikiem Jacobiego, który zostanie omówiony w rozdz. 7 i 8.
ANALIZA RÓWNOWAGI W EKONOMII 63
Ćwiczenie 3.4 1. Wyprowadzić krok po kroku rozwiązanie (3.13), sprawdzając w ten sposób wyniki (3.14) i (3.15). . 2. Zapisać (3.14) i (3.15), stosując oryginalne parametry z modelu (3.12). 3. Funkcje popytu i podaży dla modelu rynku dwu dóbr są następujące: B m = 1 8 - 3 P t + P2, G , = -2 + 4 P ,; j
Qd2~ 1 2 + P ,- 2 P 2, Qs1 = -2 + 3 P 2.
Znaleźć Pt i Q, (i = 1, 2). Używać ułamków, a nie rozwinięć dziesiętnych.
3.5. RÓWNANIA W ANALIZIE DOCHODU NARODOWEGO Analiza statyczna była do tej pory ograniczona do modeli rynku w różnych ujęciach — liniowych i nieliniowych, dla jednego dobra i wielu dóbr, modelu szczegółowego i ogólnego. Ma ona jednak oczywiście zastosowania również w innych obszarach ekonomii. Jako prosty przykład możemy przytoczyć znany keynesowski model dochodu narodowego. (3.23)
l ~ C + I' y G° C = a+ bY
(a> 0 ,
0 < b < 1),
gdzie Y i C oznaczają — odpowiednio — zmienne endogeniczne: dochód narodowy i wydatki na konsumpcję, a 70 i G0 reprezentują egżogenicznie określone inwestycje i wydatki rządowe. Pierwsze równanie jest warunkiem równowagi (dochód narodowy = całkowitym wydatkom). Drugie, funkcja konsumpcji, jest behawioralne. Parametry a i b w funkcji konsumpcji oznaczają wydatki na konsumpcję autonomiczną oraz krańcową skłonność do oszczędzania Jest całkiem jasne, że te dwa równania z dwiema zmiennymi endogenicznymi nie są ani funkcjonalnie zależne od siebie, ani sprzeczne ze sobą. Będziemy zatem .w stanie znaleźć wartości równowagi dla dochodu i wydatków na konsumpcję P i Ć, wyrażone w zależności od parametrów a i b oraz egzogenicznych zmiennych /„ i G0. Podstawienie drugiego równania do pierwszego zredukuje (3.23) do pojedynczego równania z jedną zmienną Y: Y = a + b Y + I0+G0 (1 - b ) Y = a + I 0+G0. Wartość Y dla rozwiązania (dochód narodowy równowagi) jest zatem równa;
4 W taki właśnie sposób Léon Walras podchodził do problemu istnienia ogólnej równowagi
rynkowej. W najnowszej literaturze przedmiotu można znaleźć pewną liczbę skomplikowanych matematycznie dowodów istnienia równowagi na wolnym rynku w określonych warunkach ekonomicz nych. Ale stosowana jest tam zaawansowana matematyka. Najłatwiejszy do zrozumienia jest, jak się wydaje, dowód podany w rozdziale 13 pracy R. Dorfmana, P.A. Samuelsona i R.M. Solowa, Linear Programming and Economie Analysis, McGraw-Hill Book Company, Nowy Jork 1958. Dowód ten należy przeczytać po przestudiowaniu części 6 niniejszej książki.
(3.24) '
f = — Io+- ^ 1- b
oraz— co należy podkreślić — jest wyrażona całkowicie przy użyciu parametrów i zmiennych egzogenicznych, tj. danych modelu. Podstawienie (3.24) do drugiego równania dla (3.23) daje poziom równowagi wydatków konsumpcyjnych:
64 ANALIZA STATYCZNA
(3.25)
^ , Li> b(a + I0+G0) C =a+6r = a+ — —— 1 -fc
a ( l~ b )+ b ( a + I 0+G0) a + b(I0+G0) ------— -— — = — :— , l-b 1 -0
co znów jest wyrażone całkowicie za pomocą danych. Zarówno ?, jak i C mają w mianowniku wyrażenie (1 - b ) , niezbędne zatem — dla uniknięcia dzielenia przez zero — jest ograniczenie b r t 1. Ponieważ zakładaliśmy, że i (krańcowa skłonność do konsumpcji) jest dodatnim ułamkiem, więc to ograniczenie jest automatycznie spełnione. Ponadto aby P i C były dodatnie, liczniki w (3.24) i (3.25) muszą być dodatnie. Ponieważ egzogeniczne wydatki I0 i G0 są zwykle dodatnie, podobnie jak para m etru (punkt przecięcia funkcji konsumpcji z osią pionową), więc znak wyrażeń w liczniku też okaże się dodatni. Jako sprawdzenie naszych rachunków możemy dodać wyrażenie dla C w (3.25) do (J0+ G0) i zobaczyć, czy otrzymana suma jest równa wyrażeniu dla P w (3.24). Jeśli tak, to wartości Ć i P rzeczywiście spełniają warunki równowagi i rozwiązanie jest poprawne. Model ten jest oczywiście skrajnie uproszczony, ale można również skonstruować inne modele wyznaczania dochodu narodowego, o różnych stopniach złożoności i wyrafinowania. W każdym jednak przypadku zasady stosowane przy konstrukcji i analizie modelu są identyczne z omówionymi. Z tego powodu nie będziemy tu prezentować kolejnych przykładów. Bardziej ogólny model dochodu narodowego, obejmujący jednoczesną równo wagę na rynku pieniężnym i rynku dóbr, zostanie omówiony w podrozdz. 8.6.
Ćwiczenie 3.5
■
____________________
1. Dany jest następujący model: y = c + / 0+ G 0, C = a + b (Y -T ) T = d + tY
(a >0; (d > 0 ;
0 < h < 1), 0 < / < 1).
[T: podatki] [i: stopa podatku dochodowego]
a. De jest tu zmiennych endogenicznych? b. Znaleźć P, f i C. 2. Niech będzie dany model dochodu narodowego: Y = C + I0+ G , C = a + b ( Y - T 0) (u > 0 ; 0 < b < l ) , G -g Y (0 < g < l). a. Zidentyfikować zmienne endogeniczne. b. Podać sens ekonomiczny parametru G. c. Znaleźć dochód narodowy dla równowagi. d. Jakie ograniczenia dla parametrów są niezbędne dla istnienia rozwiązania? 3. Znaleźć P i C z następującego modelu: Y = C + I0+G0, C = 2 5 + 6 Y i, /o = 16, G0 =14.
4. MODELE LINIOWE I ALGEBRA MACIERZY
Dla modelu (3.1), w którym występowało tylko jedno dobro, znalezienie P i fi za pomocą wzorów (3.4) i (3.5) było względnie proste, mimo dużej liczby występujących tam parametrów. W miarę włączania do modelu coraz większej liczby zmiennych, wzory stają się niewygodne i nieporęczne. Dlatego właśnie już dla przypadku dwu dóbr zastosowaliśmy skrócony zapis, dzięki czemu wzory (3.14) i (3.15) mogły być podane we względnie zwięzły sposób. Nie próbowaliśmy tworzyć modeli dla trzech lub czterech dóbr, nawet w wersji liniowej, przede wszystkim dlatego, że nie mieliśmy jeszcze do dyspozycji metody odpowiedniej do manipulowania dużym układem równań współzależnych. Taką metodę znajdziemy dzięki algebrze macierzy, która jest tematem tego i następnego rozdziału. Algebra macierzy ma wiele zastosowań. Po pierwsze, zapewnia zwięzły sposób zapisu układu równań, nawet wyjątkowo dużego. Po drugie, umożliwia sprawdzanie istnienia rozwiązania za pomocą obliczania wyznacznika — pojęcia blisko związanego z macierzą. Po trzecie, pozwala na znajdowanie tego rozwiązania (jeśli ono istnieje). Ponieważ układy równań spotykamy nie tylko w analizie statycznej, lecz również w analizach statyki porównawczej i dynamiki oraz w zagadnieniach optymalizacji, niemal w każdym z następnych rozdziałów znajdzie się mnóstwo zastosowań algebry macierzy. Trzeba jednakże na wstępie wspomnieć o pewnej pułapce. Algebra macierzy ma zastosowanie tylko do układów równań liniowych. Jak realistyczny jest opis rzeczywistych związków ekonomicznych przy użyciu równań liniowych, zależy oczywiście od natury badanych związków. W wielu przypadkach, nawet jeśli założenie o liniowości powoduje w pewnym stopniu rezygnację z realizmu, przyjęty związek liniowy może być takim przybliżeniem rzeczywistego związku nieliniowego, że jego zastosowanie jest uzasadnione. W innych przypadkach można zwiększyć dokładność opisu dzięki przyjęciu oddzielnego przybliżenia liniowego dla każdego segmentu zależności nieliniowej, jak to pokazano na rys. 4.1. Załóżmy, że krzywa ciągła na rys. 4.1 jest rzeczywistym związkiem nieliniowym. Liniowa aproksymacja w postaci ciągłej linii prostej w pewnych punktach bardzo odchyla się od tej krzywej. Jeśli jednak podzielimy dziedzinę na trzy regiony ru r2 i r3, to uzyskamy znacznie dokładniejsze przybliżenia liniowe (przerywane linie proste) w każdym przedziale. 5 — Podstawy...
MODELE LINIOWE I ALGEBRA MACIERZY 67
6 6 ANALIZA STATYCZNA
W układzie (4.1) zmienna rą pojawia się tylko w kolumnie położonej najbardziej na lewo i, ogólnie, zmienna Xj pojawia się tylko w y-tej kolumnie po lewej stronie znaku równości. Symbol parametru z dwoma indeksami dy reprezentuje współczynnik pojawiający się w i-tym równaniu przypisany do y-tej zmiennej. Na przykład a2l Jest współczynnikiem w drugim równaniu przypisanym do zmiennej X|. Parametr dlt który nie jest przypisany do żadnej zmiennej, reprezentuje wyraz wolny w i-tym równaniu. Na przykład di jest wyrazem wolnym w pierwszym równaniu. Wszystkie subskrypty oznaczają położenia zmiennych i parametrów w układzie równań (4.1).
Macierze jako uporządkowania W układzie równań (4.1) występują zasadniczo trzy typy składowych. Pierwszy to zbiór współczynników aiJy drugi to zbiór zmiennych x u x„ i ostatni to zbiór wyrazów wolnych d u --.,d m. Jeśli uporządkujemy te trzy zbiory jako trzy prostokątne tablice i oznaczymy je odpowiednio jako A, x i d (bez subskryptów), to otrzymamy:
Rysunek 4.1
W innych przypadkach, zachowując nieliniowość modelu, możemy przeprowadzić transformację zmiennych tak, aby otrzymać związek liniowy, który będziemy stosować. Na przykład nieliniową funkcję:
•• • «1/1
Xi
a 2\ « 2 2 •• • «2/1
X2
«11
(4.2)
A=
możemy z łatwością przekształcić, przez zlogarytmowame obu stron, w funkcję. log y = log a+ b logx,
.
(4.4)
Model rynkowy dla dwu dóbr (3.12) może być zapisany — po wyeliminowaniu zmiennych oznaczających ilości — jako układ dwu równań liniowych, jak w (3.130CiPi+C2P2- -C o , .
gdzie parametry co i Yopojawiają się po prawej strome znaku równości. W przypadku ogólnym układ m równań z n niewiadomymi (*i, x 2 x„) można rówmeż zapisać według takiego schematu: . "v-
i4-1)
a2’i X’l + a22x2+ ...+ a 2llxn = d2. &ml Xl Hm2X2~t~••- "I"«mnX„
dm .
dm
6x1+3x2+ xy—22,
4.1. MACIERZE I WEKTORY
a u Xi + a i2x 2 + ...+ a lnx n = d l ,
Xn
« m 2 •• • «m/T
d2
Podamy prosty przykład. Dla danego układu równań liniowych:
możemy napisać:
\
d =
.
która jest liniowa względem dwu zmiennych (log y) i (log x). (Logarytmy zostaną szczegóło wo omówione w rozdziale 10.) Reasumując, założenie o liniowości — często przyjmowane w ekonomii może w pewnych przypadkach być całkiem rozsądne i uzasadnione. Zajmijmy się zatem studiowa niem algebry macierzy.
1 lP l+ h P 2 --l0 ,
'd i :
«m l
y = a r ’’
« 12
(4.3)
x,+4x2—2x3=12, •4x[- x2+5x2= 10
6 3 r A = 1 4 -2 4 -1 3
Xl x= x2 ; X}_
22 d = 12 10
Każda z trzech tablic w (4.2) lub (4.4) stanowi macierz. Macierz jest zdefiniowana jako prostokątna tablica (array) liczb, parametrów lub zmiennych. Jej składniki nazywamy elementami macierzy. Są one zwykle zawarte w nawia sach kwadratowych, jak w (4.2), albo czasami w nawiasach okrągłych lub podwójnych liniach pionowych || ||. Zauważmy, że w macierzy A (macierzy współczynników układu równań) elementy są rozdzielone nie przecinkami, lecz pustymi odstępami. Macierz A może być w uproszczony sposób zapisana jako: A =[atji
f t= l, 2 Kj= 1. 2
/n ï n )'
Ponieważ położenie każdego elementu macierzy jest jednoznacznie ustalone przez subskrypt, więc każda macierz jest zbiorem uporządkowanym.
6 8 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 69
. -
Jak zapiszemy wektor wyrazów wolnych?
Liczba wierszy i liczba kolumn macierzy określają w y m ia r m a c ie r z y . Ponieważ ma cierz A w (4.2) zawiera ~m wierszy i n kolumn, więc mówimy, że ma wymiar t n x n (czytaj: m na ń). Trzeba pamiętać, że liczba wierszy zawsze poprzedza liczbę kolumn; je st to zgodne ze sposobem, w jaki są uporządkowane dwa subskrypty W szczególnym przypadku, gdy m==n, macierz nazywamy m a c ierzą kwadratową-, zatem macierz A 'w (4.4) jest macierzą kwadratową 3 x 3 . ' : Niektóre macierze mogą mieć tylko jedną kolumnę, tak jak x i d w (4.2) lub w (4.4). Takim macierzom nadajemy specjalną nazwę wektorów kolumnowych, W (4.2) wymiar x jest równy n x l , a wymiar d jest równy m x 1; w (4.4) oba wektory x i d mają wymiary 3 x 1. Gdybyśmy uporządkowali zmienne xj w poziomą tablicę, wówczas otrzymalibyśmy ma cierz 1 x n, którą nazywamy wektorem wierszowym. Wektor wierszowy dla odróżnienia ód wektora kolumnowego zapisujemy przy użyciu symbolu z primem: x' = [x1 Xi ... x j .
.
-i; . /
■
4.2. DZIAŁANIA NA MACIERZACH Zdefiniujemy najpierw równość macierzy. Powiemyćże dwie macierze A = [«,,] i B = [bij] śą równe wtedy i tylko wtedy, gdy mają ten sam wymiar i mają takie same elementy w odpowiednich miejscach. Innymi słowy A = B wtedy i tylko wtedy, gdy = by dla wszystkich wartości i i j. Zatem na przykład: 4
Ax = d. W istocie, jeśli A, x i d mają znaczenie nadane im w (4.2), to ogólny układ równań w (4.1) może być zapisany jako Ax = d. Zwięzłość tego zapisu jest zatem niezwykła. Jednakże równanie Ax = d prowokuje do zadania przynajmniej dwóch pytań. Jak mnożymy przez siebie dwie macierze A i x? Co rozumie się przez równość Ax = d? Ponieważ macierze obejmują całe bloki liczb, więc znane operacje algebraiczne określone dla pojedynczych liczb nie mają bezpośredniego zastosowania i trzeba podać nowy zbiór reguł postępowania.
2
3]
4
o j"
2
3~
*
"2 o‘ 1
Trzeba podkreślić, że wektor (wierszowy lub kolumnowy) jest po prostu n-tką uporządkowaną i jako taki może być interpretowany jako punkt «-wymiarowej przestrzeni. Z drugiej strony m x n macierz A może być interpretowana jako zbiór uporządkowa ny m wektorów wierszowych lub jako zbiór uporządkowany n wektorów kolumnowych. Idee te zostaną rozwinięte później. Sprawą dla nas pilniejszą jest to, w jaki sposób zapis macierzowy może nam umożliwić, jak obiecano, wyrażenie układu równań w zwarty sposób. Używając macierzy określonych w (4.4), możemy wyrazić układ równań (4.3) po prostu jako:
.
2. Przepisać układ równań (3.12) w postaci (4.1) ze zmiennymi uporządkowanymi w na stępującej kolejności: <2*,, Qsu Q n , Qn, Pt, Pi- Zapisać macierz współczynników, wektor zmiennych i wektor wyrazów wolnych.
X
7’
y.
A
Jeśli np.
, to oznacza, że x = 7 i y = 4.
Dodawanie i odejmowanie macierzy Dwie macierze można dodawać wtedy i tylko wtedy, gdy mają ten sam wymiar. Gdy ten "warunek jest spełniony, wówczas mówimy, że~macierze mają zgodne wymiaryurhdźTtwiające dodawanie. W tym przypadku dodawanie macierzy A = [atJ] i B = [by] jest określone jako dodawanie każdej pary odpowiednich elementów. < .X .
Przykład 1. 4
9
2
1
0 1
w .r
fo
Wektory jako szczególne macierze
’4 + 2
p
7.
2+0
+
9 + 0'
6
9
1+7
2
8
Przykład 2.
Ćwiczenie 4.1
'
1. Przepisać układ równań (3-1) w postaci (4.1) i pokazać, że jeśli zmienne są uporządkowane w kolejności Qd, Q, i P, to macierz współczynników będzie równa: • .
P u a 12 P u ¿12 a u + ¿ u Ul2 + ¿12
Możemy podać Ogólną regułę: 1
-1
1 0 0
0 b
1
~d _
la.ji + [fcy]-[Cy],
gdzie
. , Cy-O y+by.
■
;• Zauważmy, że macierz [cy], będąca sumą, musi mieć taki sam wymiar jak macierze składowe [a0] i [by].
70
MODELE LINIOWE I ALGEBRA MACIERZY 71
a n a l iz a s t a t y c z n a
Operacja odejmowania A —B jest określona wtedy i tylko wtedy, gdy A iB mają taki sam wymiar. Działanie to prowadzi do wyniku: . nl, , . _ .....
Mnożenie dwu macierzy jest uzależnione od spełnienia wymagania dotyczącego wymiaru (skalar można pomnożyć przez macierz o dowolnym wymiarze). ■ /r> •' Załóżmy, że dla danych macierzy A i B chcemy znaleźć iloczyn AB. Warunek zgodności wymiarów dla mnożenia jest taki, że kolum now y wymiar macierzy A („wiodącej” macierzy wyrażenia AB) musi być równy w ierszow em u wymiarowi macierzy B („zamykającej” macierzy). Na przykład jeśli:
[dIJ] - [ b iJ] = [diJ\, -
2 °.
" l9 -6 2 -1
3 -8 0 -3
13 -5" t U1)
6 8 ! 3
19 3'
1
Przykład 3. -
Operacja odejmowania A —B może być alternatywnie traktowana jako operacja dodawa nia macierzy A i innej macierzy (—1) B. To z kolei nasuwa pytanie, co rozumie się przez mnożenie macierzy przez liczbę (w tym przypadku przez -1 ).
Mnożenie macierzy przez skalar Aby pomnożyć macierz przez liczbę lub — w terminologii algebry macierzy — przez skalar, mnożymy każdy element tej macierzy przez dany skalar. Przykład 4.
7
3 -1 0 5
21 -7 0 35_
Przykład 5.
1 . an
«12
- tfll 2
2
a22
- <721 - an
a2\
- tf 12 2
e-i (4.5) ia
* r A —[fln (1x2)
Przykład 6. an «12 di’ «21 «22 d2
-« u
-« ! 2 - d ,'
-Û21
—«22 - d 2
fln x i + oi2 x2 = d t,
•
- d
B—
^ !2
^> 3
(2 x 3) |_£>21
022
Ó 23 J
_
, ,r
V ę,
c,2 Cu],
Każdy element macierzy C — która jest wynikiem mnożenia — oznaczony przez ctJjest zdefiniowany jako suma iloczynów elementów /-tego w iersza macierzy A i elementów y-tej k o lu m n y macierzy B. Aby znaleźć np. Cu i musimy wziąć p ie rw szy w iersz z A (gdyż i = 1 ) i p ie r w szą k o lu m n ę z B (gdyż j = 1) — jak to pokazano na górnym schemacie ryś. 4.2 — i następnie kolejno połączyć elementy w pary, wymnożyć każdą parę i obliczyć sumę uzyskanych iloczynów. A więc: (4.6)
Zauważmy, że jeśli macierz po lewej stronie zawiera współczynniki i wyrazy wolne układu równań:
i fliJ;
to iloczyn AB jest zdefiniowany, gdyż A ma d w ie kolum ny, a B ma dwa w iersze — odpowiednie liczby ich wierszy i kolumn są rów ne1. Możemy to sprawdzić przez porównanie drugiej liczby we wskaźniku wymiaru dla A, którym jest (1 x 2), z pierwszą liczbą we wskaźniku wymiaru dla B, którym jest (2 x 3). Iloczyn dla macierzy w przestawionej kolejności BA nie je st natomiast w tym przypadku zdefiniowany, gdyż B (która jest teraz macierzą wiodącą) ma trzy kolumny, a A (druga macierz) ma tylko jeden wiersz; zatem warunek zgodności wymiarów jest naruszony. W ogólnym przypadku, jeśli A ma wymiar m x n, a B ma wymiar p x . q , to iloczyn macierzy AB będzie określony wtedy i tylko wtedy, gdy n = p . Jeśli iloczyn macierzy AB jest określony, to jego wymiar będzie równy m x q — iloczyn ma tę samą liczbę w ierszy, co macierz wiodąca A i tę samą liczbę kolum n, co macierz zamykająca B. Dla macierzy podanych w (4.5) AB będzie miał wymiar 1 x 3 . ' Określmy dokładną procedurę mnożenia. Przedstawimy ją na przykładzie macierzy A i B z (4.5). Ponieważ iloczyn AB istnieje i oczekujemy, że będzie miał wymiar 1 x 3 , więc możemy napisać (stosując symbol C, a nie c' dla wektora wierszowego), że: A B -C = [c ,i
Przykłady te wyjaśniają nazwę skalar, gdyż „skaluje” on (zwiększając lub zmniejszając) macierz przez pewną wielokrotność- Skalar może oczywiście być również liczbą ujemną.
-1
Mnożenie macierzy
Cu = nu bu + « 12 b2l.
Podobnie dla cl2, bierzemy p ierw szy w iersz z A (gdyż / = 1) i dru g ą kolum nę z B (gdyż j = 2) i obliczamy wskazaną sumę iloczynów — zgodnie z dolnym schematem na rys. 4.2 — jak następuje: (4.60
Ci2 = aii b i2+a\2 b22. .
.
.
.
f
&l\ x l + «22 x2 = d2, to mnożenie przez skalar - 1 sprowadza się do mnożenia obu stron obu równań przez - 1 i w ten sposób zmieniony zostanie znak każdego składnika w całym układzie.
1 Macierz A, która jest wektorem wierszowym, zwykle bywa oznaczana przez a. Używamy tutaj symbolu A, aby podkreślić fakt, że objaśnioną regułę mnożenia stosuje się ogólnie do macierzy, a nie tylko do iloczynu jednego wektora i jednej macierzy.
7 2 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 73
Tym samym sposobem otrzymamy również: (4.6")
C13= On fci3 + fli2 ¿23-
-r
,. .
........... r
•
i
■
Przykład 7. Dla danych macierzy: A=
Niezbędnym warunkiem takiego łączenia elementów w paiy jest, jak widać, zgodność wymiaru kolumnowego macierzy wiodącej z wymiarem wierszowym macierzy zamykającej.
(2x2)
3
5’
4
6
i
B= . ,(2x2)
-1
O*
_4
7_
■■i; ■■ '
i ■
’
znaleźć AB. Iloczyn AB jest oczywiście określony i będzie miał wymiar 2 x 2 : 3 ■(—1)+5 • 4
3 -0 + 5 -7
4 • (-!) +6 4
17
,.V£3
-O
AB =
20
1
35 42_
Przykład 8. Dla danych macierzy: '1 A= 2 (3x2) 4
3' 8 0.
r -,
i
5
B=
9
(2x1) '.t..'.
;
,i ‘
znaleźć AB. Tym razem macierz, która jest iloczynem, powinna mieć wymiar 3 x 1 , czyli jest wektorem kolumnowym: 1 -5 + 3 - 9 ' A = 2 •5 + 8 •9 .4 5 + 0 - 9 .
-
'3 2 ' 82 .20.
Przykład 9. Dla danych macierzy:
Rysunek 4.2
0
Procedura mnożenia zilustrowana ną rys. 4.2 może być również opisana za pomocą pojęcia iloczynu wewnętrznego, (inner product) dwu wektorów. Dla danych wektorów n-elementowych u = [i^ u2 . .. w„] i v = [Vi t>2 . , ; w j, uporządkowanych jako dwa wier sze lub jako dwie kolumny, lub jako wiersz i kolumna, ich iloczyn, oznaczany u • y, jest zdefiniowany jako: \ : .i,. u • Vii=« ! « ! + 'u iV i +
.+ « ,* > ,'•
V
' " C .- :
w:!./-; 1
'
Jest to suma iloczynów odpowiadających sobie elementów, a więc iloczyn wewnętrzny dwu wektorów jest skaląrem. Jeśli np. po zrobieniu zakupów zapiszemy wektor ilości zakupionych dóbr i wektor ich cen (w odpowiednim porządku), to ich iloczyn wewnętrzny da pam całkowity koszt zakupu. Zauważmy, że pojęcię iloczynu wewnętrznego nie jest objęte warunkiem zgodności wymiarów, gdyż uporządkowanie dwu wektorów jako wierszy lub kolumn hle ma znaczenia. Stosując te pqjęcia, możemy opisać element Cy w iloczynie macierzy C - ĄB po prostu jako iloczyn wewnętrzny i-tego wierszą macierzy wiodącej A i j-tej kolumny macierzy zamykającej B. Przyglądając się rys. 4,2, możemy łatwo stwierdzić prawdziwość tego opisu. Regułę mnożenia opisaną powyżej stosuje się równię dobrze wtedy, gdy wymiary A i B są inne niż Wpowyższym przykładzie, a jedynym, warunkiem wstępnym jest zgodność wymiarów.
'3 . -1 A= 1 0 (3x3) 4 0
2 3 2
_1
3
~5
Ï5
1
7
5
10
B = -1 (3x3) o
2
1
5
'To
i
znaleźć AB. Ta sama reguła mnożenia daje teraz bardzo specyficzną macierz: 0+1 + 0
AB = 0 + 0 + 0
0+0 + 0
3
1 4
5 5+ 5
l 6 - + 0+ 5
5
4
4
5
5
- + 0+ -
9 7 2 ,To_ To”"ÏÔ 3
3
—+ 0 10 10 12 2 —+ 0 To 10
1 0 0' — - 0 1 0
.0 0 1.
Ta ostatnia macierz — macierz kwadratowa z jedynkami na głównej przekątnej (biegnącej z północnego zachodu na południowy wschód) i zerami wszędzie poza tym — stanowi przykład ważnego rodzaju macierzy znanej jako macierz jednostkowa.
MODELE LINIOWE I ALGEBRA MACIERZY 75
7 4 ANALIZA STATYCZNA
Przykład 10. Obliczymy teraz iloczyn Ax dla macierzy A i wektora x określonych w (4.4). Otrzymujemy wektor kolumnowy o wymiarze 3 x 1 : '6
Ax = 1 .4
1'
3 4
-2
-1
1.
V
'6 x i+ 3 x 2+ x 3~
x2 =
*1+4*2- 2 x3 _4Xi~ *2 + 5*3.
X3.
0x3)
0x1)
'
0x1)
Powtórzmy: iloczyn po prawej stronie jest wektorem kolumnowym, mimo korpulentnego wyglądu. Gdy Ax = d, wówczas (por. (4.4)): ' 6*1+ 3x2+ *3
'2 2 '
X1+ 4*2 —2*3 = 12 .4 x i~ x2+5*3.
. 10.
co — zgodnie z definicją równości macierzy — jest równoważne podanemu w (4.3) całemu układowi równań. Notacja macierzowa Ax = d , ze względu na warunek zgodności wymiarów, wymaga uporządkowania zmiennych r„ w wektor kolumnowy, nawet jeśli zmienne te w pierwotnym układzie równań były zapisane w linii poziomej. Przykład I I . Prosty model dochodu narodowego z dwiema zmiennymi endogenicznymi Y i C: Y = C+Zo+Go, C = a+bY, można zapisaó według standardowego schematu (4.1), jak następuje:
Problem dzielenia Macierze, podobnie jak liczby, mogą być poddawane działaniom dodawania, odejmowania i mnożenia — przy zachowaniu warunków zgodności— jednak nie jest możliwe dzielenie jednej macierzy przez drugą. To znaczy, że nie możemy napisać A/B. Dla dwu liczb a i b iloraz a lb (dla b * 0) może być alternatywnie zapisany jako ab -1 lub b~'a, gdzie b~' reprezentuje o d w ro tn o ść liczby b. Ponieważ ab~' = b~'a, więc wyrażenie ilorazowe aJb może być użyte do reprezentowania zarówno ab~ ', jak i b~'a. Przypadek macierzy jest odmienny. Stosując pojęcie odwrotności dla macierzy, możemy w pewnych przypadkach (omówionych poniżej) zdefiniować macierz B"1, która jest odwrotna do macierzy B. Ale z warunku zgodności wymiarów wynika, że jeśli AB"1jest określona, to nie ma gwarancji, że B"‘A jest również określona. Nawet jeśli oba. iloczyny AB"1 i B“‘A są rzeczywiście określone, to wcale nie muszą reprezentować tej samej macierzy. Zatem wyrażenie A/B nie mogłoby być jednoznaczne i musimy go unikać. Zamiast tego musimy określić, czy chodzi nam o AB"1, czy o B_1A — pod warunkiem, że odwrotność B"1 rzeczywiście istnieje i że rozpatrywany iloczyn macierzy jest określony. Macierze odwrotne omówimy później. ■
Dygresja dotycząca zapisu z symbolem X Użycie zapisu z subskryptami nie tylko pomaga w określeniu położenia parametrów i zmiennych, lecz również ułatwia skrótowy zapis sum składników, jakie powstają w trakcie mnożenia macierzy. W zapisie sumacyjnym korzysta się z greckiej litery Z (sigma, dla „sumy” ), Aby wyrazić np. sumę Xi, x 2 i x 3 , możemy napisać: \
Y—C —1q+G o,
_
3 X i + X 2+ X 3 =
-b Y + C = a .
•'
'
V
Z * ) ,
,= 1
Zatem macierz współczynników A, wektor zmiennych x i wektor stałych d są równe: A= (2x2)
1 -1 -b 1
'
;
x= (2x1)
V c
;
d=
(2x1)
/o+ Gg a
Sprawdźmy, czy układ ten można zapisać w postaci równania Ax = d. Zgodnie z regułą mnożenia macierzy mamy: ’ i -b
-r 1
V
lT + ( - l ) C
C
- b Y + lC
z -c ‘ r bY+ C
co czytamy: suma Xj dla j przebiegającego od liczby 1 do 3. Symbol j , zwany indeksem X j reprezentuje skła d n ik (ten, który mamy dodawać) i jest w istocie funkcją j . Oprócz litery j do oznaczenia indeksów sumowania stosuje się zwykle litery i lub k, jak np.: su m o w a n ia , przyjmuje jedynie wartości całkowite. Wyrażenie
Z
Xi
¡=3
= X 3 + X ą + X 5 + X6 + X 1 ,
'
n
X *it= *o+ X | + . ..+ * „. zatem równanie macierzowe Ax = d daje: ' Y -C ' -b Y + C
lo+Go a
Ponieważ równość macierzy oznacza równość odpowiednich elementów, więc równanie Ax = d reprezentuje właśnie pierwotny układ równań (4.1) wyrażony zgodnie z powyższym schematem. .
*= o
Zapis z symbolem 2 może być z łatwością stosowany w przypadkach, gdy składnik x jest poprzedzony współczynnikiem lub gdy każdy składnik sumy jest podniesiony do pewnej całkowitej potęgi. Na przykład możemy napisać: 3
.
3
Z ax. = a xi + a x 2+ a x 3 = a (x, + x 2+ x 3) = a Z x ,, .
2=1
MODELE LINIOWE I ALGEBRA MACIERZY 77
7 6 ANALIZA STATYCZNA
znaleźć: X OjXj = fli-t, + a2 x 2+ a 3 x3 , •7=1
(a) A + B;
X a,-^ = flo-*0+ a i*1+ a2a2+... ■+a„ x? = a<>+ a i*+ a 2 X1 + . . . + a„x". /=o : , _i ■ ' ,r_ ................ ......................... ' ‘ ■'* ' ' n Ostatni przykład pokazujew szczególności, że wyrażenie X aix ‘ może być stosowane
(b) C - A ;
'2 A= 3
8 0 ,
5 jako skrócony zapis ogólnej funkcji wielomianowej (por. (2.4)). Na marginesie warto wspomnieć, że gdy kontekst rozważań nie pozostawia wątpliwości co do zakresu sumowania, można używać samego symbolu Z bez indeksu (Zx,) lub tylko z literą oznaczającą indeks ( Z * , ) , . .. ' i Zastosujemy teraz zapis £ do mnożenia macierzy. W (4.6), (4.60 i (4.6") każdy element iloczynu macierzy C = AB jest zdefiniowany jako suma składników, którą możemy teraz zapisać w następujący sposób: . ' "j * *■'
2 011 = 011611+ 012621= X o i* 6t i, . *=1
’
*=1 .' • .
2
•
-- .
. . . . . . .
1z, ł
013 = 2211613+ 2212623= I a u ba . *=1 W każdym przypadku pierwszy subskrypt Cy jest taki sam, jak pierwszy subskrypt 221*; a drugi subskrypt Cy jest taki sam, jak drugi subskrypt bkj w wyrażeniu z Z. Indeks k jest niejako „niemym” wskaźnikiem: służy do wskazania, którą konkretnie parę elementów mnożymy, ale nie pojawia się w symbolu Cy. " Rozszerzając to na mnożenie macierzy A = [22,*] o wymiarze m x n i macierzy B = [6y] o wymiarze n x p, możemy zapisać elementy iloczynu macierzy AB = C = [o(J] o wymiarze m x p jako: oí 1 — X a \k b íú
....
O12— X n it ^ t 2 - .. ,
*=1
*-=1
A ,
lub ogólniej: n
Cij
8
C=
7
2
6
3
1 0 0 4 3 0
5
4
0' 2 4.
3
(a) X a,;
(c) X bx,\
(b) X 22, z,; i =5
(d) X 22,d
(e) X X ( * + 0 2. i =0 \\
6. Zapisać następujące wyrażenia za pomocą notacji Z: (a) x 1(x1- l ) + 2 x 2 ( x 2 - l ) + 3 x i (x3:- l ) ; ' (b) 222f e + 2)+223 (xą + 3) + 224(2:5+4); 1 1 1 ” ^ -■ ■ ( c ) - + - 5+ . . . + ( x * 0 ); . .. X x2 . X? (X * 0).
7.
Wykazać prawidłowość następujących stwierdzeń: i n \ n+1. X x¿ ~bXnk 1 X X[, v2=0 , 2=0
(b) X ab ¡yj = 22 X bjyy, J= 1 J=i n
1. Dla danych macierzy: B=
0 3
3’ -2
11 U
9
0 3 2
X
Ćwiczenie 4.2
6
3
8 0 3 2 0 0 1 (c) 4 2 -7 .3 5 '4 - V . .... ; ‘7 6 5 l" (b) ; • (d) [22 6 cj 0 2 5 3 0 4 0 .1 1. 5. Rozwinąć następujące wyrażenia sumacyjne:
(a)
;
0
4. Znaleźć następujące iloczyny macierzy (w każdym przypadku dopisać pod każdą macierzą wskaźnik wymiaru):
(d) 1 + - + . . . + 1
To ostatnie równanie reprezentuje jeszcze inny sposób ustalenia określonej powyżej reguły mnożenia macierzy. +
- l"
1
2
2= 1, 2, ..., m
X 22,1 6*7
4
B=
3. Czy dla macierzy podanych w przykładzie 9 jest określony iloczyn BA? Jeśli tak, obliczyć ten iloczyn. Czy w tym przypadku mamy AB - BA?
7 = 1 , 2, • • P
A=
(d) 4B+2C.
a. Czy AB jest określone? Obliczyć AB. Czy można obliczyć BA? Dlaczego? -■ b. Czy BC jest określone? Obliczyć BC. Czy CB jest określone? Jeśli tak, obliczyć CB. • Czy to prawda, że BC = CB? ; ' '' " '"!{■' "■ * ‘ :
(a)
2 C12 = d \ \ 612 + 2212622 = Xoi*6*2,
(c) 3A;
2. Dane są macierze:
8
3"
6
1
(c) X
n ( X j + y j ) =
7=1 .
n' '
X ^ + 'L y j : y -i 7 —1 .
MODELE LINIOWE I ALGEBRA MACIERZY 7 9
7 8 ANALIZA STATYCZNA
43 . UWAGI O DZIAŁANIACH NA WEKTORACH Powyżej przedstawiliśmy wektory jako szczególny rodzaj macierzy. Można więc wykonywać na nich wszystkie omówione operacje. Trzeba tu dodać kilka uwag dotyczących działań na wektorach, ponieważ mają one szczególne wymiary. ,
Mnożenie wektorów Iloczyn wektora kolumnowego u o wymiarze m x 1 i wektora wierszowego V o wymiarze 1 x n daje macierz uy* o wymiarze m x n.
Przykład 3. Dla danego wektora wierszowego u' = [3 6 9] znaleźć u'u. Ponieważ u jest po prostu wektorem kolumnowym z elementami takimi samymi jak w u', tylko ustawionymi pionowo, więc mamy : T3-
u'u = [3 6 9]
przy czym opuściliśmy nawiasy kwadratowe w macierzy po prawej stronie. Oznacza to, że iloczyn u'u daje sumę kwadratów elementów wektora u. Ogólnie, jeśli u' = [u, u2 . . . u„], to u'u będzie sumą kwadratów (skalarem) elemen tów u/. u' u =
Przykład 1. Dla danych u =
3 -1 2 !
3-4 2-4
2-5
3 2
12 8
15" 10
Ponieważ każdy wiersz w u oraz każda kolumna w V składają się tylko z jednego elementu, więc każdy element uy7okazuje się być pojedynczym iloczynem, a nie sumą iloczynów. Iloczyn u y ' jest macierzą 2 x 3 , chociaż „wystartowaliśmy” jedynie od dwu wektorów. Z drugiej strony, jeżeli dane są wektor kolumnowy u' o wymiarze 1 x n oraz wektor wierszowy v o wymiarze n x 1, to iloczyn u'v będzie miał wymiar 1 x 1 . , }
Przykład 2. Dla danych u' = [3 4] i v = u'y
K? + H? + . . ; + II2= X « ? . 1 2 " jT i J
i / = [ 1 4 5] otrzymamy iloczyn:
t
uv/ =
= 32+ 6 2+ 9 2,
mamy:
= [3 • 9 + 4 • 7] = [55].
Jak widać, u'v jest macierzą, mimo że stanowi tylko jeden element. Jednakże macierze o wymiarach 1 x 1 przy dodawaniu i mnożeniu zachowują się dokładnie tak samo, jak skalary: [4]+ [8] = [12], tak jak 4 + 8 = 12 i [3] [7] = [21], tak jak 3 ■7 = 2 1 . ... ...... Ponadto macierze 1 x 1 nie mają żadnych własności, jakich nie miałyby skalary. Istnieje jednoznaczna odpowiedniość między zbiorem wszystkich skalarów a zbiorem wszystkich macierzy 1 x 1 , których elementy są skalarami. Z tego powodu możemy zdefiniować u'v jako skalar odpowiadający macierzy o wymiarze 1 x 1 będącej iloczynem. Zgodnie z tym dla powyższego przykładu możemy napisać u'v = 55. Taki iloczyn nazywamy iloczynem skalarnym 2. Pamiętajmy jednak, że macierz 1 x 1 może być traktowana jako skalar, ale skalar nie może być dowolnie zastąpiony przez macierz 1 x 1, jeśli mają być przeprowadzone dalsze obliczenia, chyba że spełnione są warunki zgodności wymiarów. 2 Pojęcie iloczynu skalarnego jest zatem pokrewne pojęciu iloczynu wewnętrznego dwu wekjorów o tej samej liczbie elementów w każdym z nich, który także daje skalar. Przypomnijmy jednak, że iloczyn wewnętrzny jest wyłączony z warunku zgodności wymiarów dla mnożenia, zatem możemy go zapisać u ■v. W przypadku iloczynu skalarnego (oznaczonego bez kropeczki między dwoma symbolami wektorów) możemy wyrazić go jedynie jako wektor wierszowy pomnożony przez wektor kolumnowy, z wektorem wierszowym jako pierwszym.
Gdybyśmy obliczyli iloczyn wewnętrzny u ■u (lub u '. uO, otrzymalibyśmy oczywiście dokładnie taki sam wynik. Ważne jest, aby odróżniać uy* (jest to macierz o wymiarach większych niż 1 x 1) od u ' y (macierz 1 x 1 , czyli skalar). Pamiętajmy, że iloczyn skalamy musi mieć wektor wierszowy jako macierz wiodącą i wektor kolumnowy jako macierz zamykającą; w innym przypadku iloczyn nie może mieć wymiaru 1 x 1.
Geometryczna interpretacja działań na wektorach Wspomniano wcześniej, że kolumnowy lub wierszowy wektor o n elementach (od tej pory będziemy go nazywać n-wektorem) może być traktowany jako n-tka, a zatem jako punkt w n-wymiarowej przestrzeni (ód tej pory będziemy ją nazywać n-przestrzenią). Rozważmy tę ideę. Na rys. 4.3(a) punkt (3, 2) jest zaznaczony w 2-przestrzeni i jest nazwany u. Jest to "3l geometryczny odpowiednik wektora u - ^ lub wektora u' = [3 2]; oba wektory wyznaczają jedną i tę samą parę uporządkowaną. Strzałka (skierowany odcinek prostej) narysowana od początku układu (0,0) do punktu u będzie określała jedyną prostoliniową trasę pozwalającą osiągnąć u, a zaczynającą się w początku układu. Ponieważ taki jedyny wektor istnieje dla każdego punktu, więc możemy traktować wektor u jako reprezentowany graficznie albo przez punkt (3, 2), albo przez odpowiednią strzałkę. Taka strzałka, która wychodzi ź początku układu (0, 0) jak wskazówka zegara, o określonej długości i określonym położeniu, jest nazywana wektorem wodzącym (radius vector). Dzięki tej nowej interpretacji wektora można nadać sens geometryczny: (a) mnożeniu wektora przez skalar, (b) dodawaniu i odejmowaniu wektorów i ogólnej (c) tzw. liniowej kombinacji wektorów. ”6 l
= 2u, to otrzymana strzałka będzie się nakładać 4 na poprzednią, ale będzie dwa razy dłuższa. W istocie mnożenie wektora u przez dowolny skalar k będzie dawało nakładającą się strzałkę, ale ostrze strzałki będzie przesunięte, chyba że k = 1. Jeśli mnożnik skalamy jest równy k> 1, to strzałka będzie wydłużona (przeskakiwana Jeśli na rys. 4.3(a) narysujemy wektor
80 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 81
nych wektorów może być zatem otrzymana geometrycznie jako przekątna równoległóboku. • Ponadto ta metoda może nam dać różnicę wektorów v - u, gdyż ta ostatnia jest równoważna sumie V i ( - l ) u . Na rys. 4.3(d) najpierw odtwarzamy wektory v i - u z diagramów (c) i (b), a następnie konstruujemy równoległobok. Otrzymana przekątna reprezentuje różnicę we ktorów V - U . ;■ ... ,v- - V . v. -: Wystarcza proste rozszerzenie powyższych wyników, aby zinterpretować geometrycznie kombinację liniową (tzn. liniową sumę lub różnicę) wektorów. Rozważmy prosty; przykład: 3v+2u = 3
'f _4_
+2
3 2
=
9’
16
Mnożenie przez skalar wymaga przemieszczenia strzałek dla obu wektorów v i u, dodawanie natomiast wymajga konstruowania równoległoboku. Poza tymi dwiema pod stawowymi operacjami graficznymi, w liniowej kombinacji wektorów nie ma hic nowego. Jest to prawdą nawet wtedy, gdy kombinacja liniowa ma więcej składników: ,
'L k lVi = k l Vi +k2V2+k3V3+ . . . + knV„,
i= i
.....
gdzie ^ tworzą zbiór liczb, a symbole, z subskryptami u,- oznaczają zbiór wektorów. Aby utworzyć tę sumę, dodajemy najpierw pierwsze dwa składniki, a potem otrzymaną sumę dodajemy do trzeciego i tak dalej, dopóki nie uwzględnimy wszystkich składników.
Liniowa zależność Mówimy, że zbiór wektorów ...,v „ jest liniowo zależny wtedy i tylko wtedy, gdy do wolny z nich może być wyrażony jako ..liniowa kombinacja pozostałych; w przeciwnym przypadku są one liniowo niezależne. Przykład 4. Trzy wektory Vi =
2'
7 waż v3 jest liniową kombinacją V! i v2:
Rysunek 4 3
w górę), jeśli 0 < k< 1, to strzałka będzie skrócona (przeskalowana w dół), a jeśli k = 0, to strzałka „skurczy się’’ do punktu w początku układu współrzędnych, który reprezentuje wektor " ‘o l ' . V ■ : V" ' 7 zerowy . Ujemny mnożnik skalamy zmieni kierunek strzałki. Jeśli wektor u pomnożymy
3 v ! - 2 v2 =
6
2
4
21
16
5
, v2 =
8
i v3 =
4' 5
są liniowo zależne, ponie-
= v3.
To ostatnie równanie można alternatywnie zapisać jako: 3 v1- 2 v2- y3 = 0,
np. przez - 1 , to otrzym am y-u =
T
7
, co jest zilustrowane na rys. 4.3(b) jako strzałka o tej gdzie 0 =
samej długości, co u, ale przeciwnym zwrocie. Rozważmy dodawanie dwu wektorów v =
i u=
Suma v + u =
reprezentuje wektor zerowy.
może być
wykreślona jako strzałka przerywana na rys. 4.3(c). Jeśli skonstruujemy równoległobok z dwoma wektorami u i v (ciągłe strzałki) jako dwoma bokami, to okaże się, że przekątna równoległobaku jest dokładnie strzałką reprezentującą sumę wektorów v + u . Suma dowol-
Przykład 5. Dwa wektory wierszowe v ' = [5 12] i v ' = [10 24] są liniowo zależne, ponieważ: 2 v ' = 2 [5 12] = [10 24] = v '. 6 — Podstawy...
8 2 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 83
Fakt, że jeden wektor jest wielokrotnością drugiego, ilustruje najprostszy przypadek kombinacji liniowej. To ostatnie równanie może być zapisane alternatywnie jako: ' i
gdzie 0 ' reprezentuje zerowy wektor wierszowy [0 0]. Po wprowadzeniu wektorów zerowych, liniowa zależność może być zdefiniowana w następujący sposób: zbiór m-wfektorów v,v’.: .; V* jest liniowo zóleiny wtedy i tylko wtedy, gdy istnieje zbiór skalarów k\, . .. , k„ (nie wszystkie zerowe) taki, że: E k ,v , = 0;
l= \
(m x l)
.
,
1
ści rozważmy dwa wektory [1 0] i [0 1], które nazywamy wektorami jednostkowymi (unit vectors). Pierwszy z nich rysujemy jako strzałkę leżącą na osi poziomej, a drugi jako strzałkę leżącą na osi pionowej. Ponieważ są one liniowo niezależne, więc mogą tworzyć bazę dla przestrzeni dwuwymiarowej i — rzeczywiście — myślimy o przestrzeni dwuwymiarowej jako rozpiętej przez jej dwie osie, które są przedłużonymi ’wersjami dwu wektorów jednostkowych. Podobnie trójwymiarowa przestrzeń wektorowa jest zbiorem wszystkich 3-wektorów i musi być rozpięta na trzech liniowo niezależnych 3-wektorach. Jako przykład rozważmy zbiór trzech wektorów jednostkowych:
. '
jeśli natomiast równanie to może być spełnione tylko wtedy, gdy £¿ = 0. dla wszystkich i, to wektory są liniowo niezależne. Pojęcie liniowej zależności dopuszcza również łatwą interpretację geometryczną. Dwa wektory u i 2 u — z których jeden jest wielokrotnością drugiego — są oczywiście zależne. Geometrycznie, na rys. 4.3(a), ich strzałki leżą na tej samej linii prostej. To samo jest prawdą dla dwu zależnych wektorów u i - u na rys. 4.3(b). W przeciwieństwie do nich dwa wektory u i v na rys. 4.3(c) są liniowo niezależne, ponieważ niemożliwe jest wyrażenie jednego jako wielokrotności drugiego. Geometrycznie, ich strzałki nie leżą na jednej linii prostej. Gdy rozważamy więcej niż dwa wektory w dwuwymiarowej przestrzeni, pojawia się istotny wniosek: gdy tylko znajdziemy dwa liniowo niezależne wektory w przestrzeni dwuwymiarowej (powiedzmy u i v), wszystkie pozostałe wektory tej przestrzeni mogą być wyrażone jako liniowe kombinacje tych wektorów (u i v). Na rys. 4.3(c) i (d) pokazano już, jak można wyznaczyć dwie proste kombinacje liniowe v + u i v - u . Ponadto wydłużając, skracając, odwracając dane wektory u i v i łącząc je w rozmaite równoległoboki, możemy wygenerować nieskończoną liczbę nowych wektorów, która wyczerpie zbiór wszystkich 2-wektorów. Z tego powodu każdy zestaw trzech lub więcej 2-wektorów (trzech lub więcej wektorów w 2-przestrzeni) musi być liniowo zależny. Dwa z nich mogą być niezależne, ale trzeci musi być liniową kombinacją pierwszych dwóch.
(4.7)
1' e,= 0 ; 0.
o; e2 = 1 ; 0.
.1 .
gdzie każdy e, jest wektorem, w którym na i-tym miejscu jest jedynka, a na pozostałych są zera. Te trzy wektory są oczywiście liniowo niezależne; istotnie, ich trzy strzałki leżą na trzech osiach 3-przestrzeni na rys. 4.4. Zatem rozpinają one 3-przestrzeń, co implikuje, że cała 3-przestrzeń (w naszym przypadku R 3) może być generowana przez te jednostkowe wektory. T
Na przykład wektor
może być traktowany jako liniowa kombinacja e !+ 2 e 2+ 2 e3.
Geometrycznie możemy najpierw wektory e! i 2 e2— wykreślone na rys. 4.4 — dodać metodą
Przestrzeń wektorowa Zbiór wszystkich 2-wektorów generowanych przez rozmaite kombinacje liniowe dwu niezależnych wektorów u i v tworzy dwuwymiarową przestrzeń wektorową. Ponieważ zajmujemy się jedynie wektorami o elementach rzeczywistych, więc ta przestrzeń wektorowa to nic innego jak R 2, czyli przestrzeń dwuwymiarowa, o której przez cały czas mówimy. Przestrzeń dwuwymiarowa nie może być wygenerowana przez pojedynczy 2-wektor, ponieważ „liniowe kombinacje” tego ostatniego mogą utworzyć jedynie zbiór wektorów leżących na pojedynczej linii prostej. Generowanie 2-przestrzeni nie wymaga więcej niż dwóch liniowo niezależnych 2-wektorów — w każdym razie byłoby niemożliwe znaleźć więcej niż dwa. O dwu liniowo niezależnych wektorach u i y mówimy, że rozpinają przestrzeń dwuwymiarową. Mówimy, też, że tworzą one pewną bazę dla przestrzeni dwuwymiarowej. Zwróćmy uwagę, że powiedzieliśmy: pewną bazę, a nie — jedyną bazę, gdyż każda para 2-wektorów może być jedną z baz, jeśli tylko wektory te są liniowo niezależne. W szczególno
'0 ' e3= 0
( 1.
Rysunek 4.4
2 , 0)
84 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 85
równoległoboku, aby otrzymać wektor reprezentowany przez punkt (1, 2, 0) na płasz czyźnie xix 2, a potem dodać ten wektor do 2e3 — za pomocą równoległoboku skon struowanego na zaciemnionej pionowej płaszczyźnie — aby otrzymać pożądany wynik końcowy (1 ,2 ,2 ). . c : ./v . i Dalsze rozszerzenie dla «-przestrzeni powinno być oczywiste. Przestrzeń n-wymiarowa może być zdefiniowana jako zbiór wszystkich «-wektorów. Mimo iż nie da się tego wykreślić, możemy jednak myśleć o «-przestrzeni jako o przestrzeni rozpiętej na wszystkich n («-elementowych) wektorach jednostkowych, które, są liniowo niezależne. Każdy n-wektor, będący uporządkowaną n-tką, reprezentuje punkt w «-przestrzeni lub strzałkę rozciągniętą od początku układu (tzn. «-elementowego wektora zerowego) do wspomnianego punktu. Każdy dany zbiór « liniowo niezależnych n wektorów jest w istocie zdolny do wygenerowania całej «-przestrzeni. Ponieważ w naszych rozważaniach każdy element «-wektora ma być liczbą rzeczywistą, więc ta «-przestrzeń jest w istocie R \ Przestrzeń n-wymiarowa, o której mówiliśmy, jest nazywana n-wymiarową przestrzenią euklidesową (na cześć Euklidesa). Aby wyjaśnić to pojęcie, musimy zdefiniować pojęcie odległości między dwoma wektorami. Dla każdej pary wektorów u i v w danej przestrzeni odległość od punktu u do punktu u jest pewną funkcją o wartościach rzeczywistych:
Wynik ten jest zgodny z twierdzeniem Pitagorasa-, długość przeciwprostokątnej trójkąta prostokątnego jest równa (dodatniemu) pierwiastkowi kwadratowemu sumy kwadratów długości pozostałych dwu boków. Jeśli przyjmiemy, że u i t / s ą równe (6, 4) i (3, 2) i zaznaczymy nowy punkt w jako (6, 2), to rzeczywiście otrzymamy trójkąt prostokątny 0 długościach poziomego i pionowego boku równych odpowiednio -3 i 2 i długości przeciwprostokątnej (odległość pomiędzy u i w) równej a/3^+22 = -\/l3. Funkcja odległości euklidesowej może też być wyrażona jako pierwiastek kwadratowy iloczynu skalarnego dwu wektorów. Ponieważ U i v oznaczają dwie h-tki (rą, . . . , a„) 1 (¿ i, . . . , b„), możemy więc zapisać wektor kolumnowy u - v o elementach ay - b x, a2- b2, . .. , a „ -b n. To, co pojawia się pod pierwiastkiem w funkcji euklidesowej odległości, jest oczywiście sumą kwadratów tych elementów, którą w świetle przykładu 3 (str. 79) można zapisać jako iloczyn skalamy ( u - v ) '( u - y ) .. Mamy zatem: d ( u , v) = V (u -v )'(u -v ).
Ćwiczenie 4.3
d = d ( u , v ),
o następujących własnościach: (1) gdy u i v pokrywają się ze sobą, odległość jest zerowa, (2) gdy dwa punkty są różne, odległość ód u do v i od V do u wyraża się identyczną dodatnią liczbą rzeczywistą, (3) odległość między u i v nigdy nie jest dłuższa niż odległość od u do w (punktu różnego od u i v) plus odległość od w do u. Wyrazimy to symbolicznie: d{u, i>) = 0
(dla m= i>),
v) = d (v ,
u)> 0
d(u,
v ) ś d ( u , w)+ d{w, v )
(a) uv'; (b) uwV
(e) u'v; (f) w'x;
(g) u'u; (h) Vx.
2. Mamy dane wektory:
(dla u-*v),
■
przy czym wartość pierwiastka kwadratowego jest dodatnia. Jak można łatwo sprawdzić, ta szczególna funkcja odległości spełnia wszystkie trzy własności wymienione powyżej. W zastosowaniu do dwuwymiarowej przestrzeni przedstawionej na rys. 4.3(a) znajdujemy odległość pomiędzy dwoma punktami (6, 4) i (3, 2):
x=
A
;
y=
; .....z=
1 i
Ostatnia własność jest znana jako nierówność trójkąta, gdyż trzy punkty u, v i w będą zwykle tworzyły trójkąt. Gdy pewna przestrzeń wektorowa ma zdefiniowaną funkcję odległości spełniającą po wyższe trzy własności, jest nazywana przestrzenią metryczną (metric space). Zauważmy jednak, że odległość d(u, v ) została omówiona powyżej tylko ogólnie. W zależności od szczególnej postaci nadanej funkcji d można otrzymać rozmaite przestrzenie metryczne. Tak zwana przestrzeń euklidesową jest pewnym szczególnym rodzajem przestrzeni metrycznej, z funkcją odległości określoną następująco: Niech punkt u będzie n-tką (alt a2, . . . . a„), a punkt i» niech będzie n-tką (¿i, b2, . . . , /?„); wtedy euklidesową funkcja odległości jest następująca:
2 ; L16.
X¡
s
w=
_
r -
■ 3"
(dla w * u , v).
d(u, V) = yj(al - b ,) 2+(a2- b 2f + . . . + ( « „ - b„f,
(c) xx'; (d) Vu;
s
d(u,
1. Dla danych u '= [5 2 ;3 ] ;V = [ 3 1 9]; V = [7 5 8] i V = [ją, x2 x3] zapisać wektory kolumnowe u, v, w i x oraz znaleźć: i .
Zi Zl_
a. Które z następujących iloczynów są określone:'w'x, x'y/, xy', y'y, zz', y>V, x ■y? b. Znaleźć wszystkie te iloczyny, które są określone. ,o v ; 3. Kupiono n towarów w ilościach Q\, . .. , Qn po cenach P t P„. Jak można wyrazić całkowity koszt zakupu: (a) w notacji z Z; (b) w notacji wektorowej? 4. Dla danych dwu niezerowych wektorów W! i w2 kąt 9 (0° < 6< 180°), jaki one tworzą, jest związany z iloczynem skalarnym w( w2 (= w2 W]) w następujący sposób:
I
ostrym ] , . prostym 1 ^ y 1^ rozwartym] ^ ^
° w,'w2
Sprawdź to, obliczając iloczyn skalamy dla każdej z następujących par wektorów (por. rys. 4.3 i 4.4):
8 6 ANALIZA STATYCZNA
-2_
5. Dla danych u = (a) 2v; (b) u + v ; 6.
~5 1
(e) Wi = 2
,
2.
'1 ' w2 = 2 0.
Dodawanie macierzy Dodawanie macierzy jest zarówno przemienne, jak i łączne. Wynika to z faktu, że dodawanie macierzy polega jedynie na dodawaniu odpowiednich elementów macierzy i stąd, że kolejność, w jakiej dodajemy odpowiadające sobie elementy każdej pary, nie ma znaczenia. Nawiasem mówiąc, operacja odejmowania A - B może być traktowana po prostu jako operacja dodawania A + (-B ), a zatem oddzielne jej omawianie nie jest konieczne. : Reguły przemienności i łączności mogą być sformułowane w następujący sposób:
ł -*“
1v =
0' 3
(c) u - v ; (d) v - u ;
znaleźć graficznie następujące wektory: (e) 2 u + 3 v ; (f) 4 u - 2 v .
9"
Ponieważ 3-przestrzeń jest rozpięta na trzech wektorach jednostkowych zdefiniowanych w (4.7), więc każdy inny 3-wektor może być wyrażony jako liniowa kombinacj a e ! e 2 i e3. Pokazać, że następujące 3-wektory mogą być tak wyrażone: "2" 15" - 1" 0 ; (d) 3 2 (a) ; (b) ; (c) .8. 0. . 1. . 9.
7. Jaka jest odległość pomiędzy następującymi punktami w trójwymiarowej przestrzeni euklidesowej? . ■ < (a) (3, 2, 8) i (0, - 1 , 5); (b) (9, 0, 4) i (2, 0, -4 ). 8. Nierówność trójkąta jest zapisana przy użyciu znaku nieostrej nierówności <, a nie ścisłej nierówności <. W jakich okolicznościach będzie spełniona część nierówności „=” ?
Dowód: A + B = [a,7] + [b,j\ = [a,j+bu] = [/>,7+ćz,7] = B +A .
Przykład 1. Dla danych A =
'3 l' ° 2
6 2 i B=
3 4
znajdujemy, że A + B = B + A
9 3' 3 6
Reguła łączności: (A + B) + C = A + (B + C). Dowód: (A + B ) + ę = [a0 + h 7] + [cl7] = [¿¡,7+/>,7+ c 7] = [,,+c„] = A + (B + C). '3' '2 ~9 Przykład 2. Dla danych v 1 = A , v2 = 1 , v3 = c otrzymujemy: 4 1 5 2"
5
5
(Vi + V2) - V 3 =
1
ro ” o 1
9. Wyrazić długość wektora wodzącego v w «-wymiarowej przestrzeni euklidesowej (tzn. odległość od początku układu do punktu v ) jako: (a) skalar, (b) iloczyn skalamy; (c) iloczyn wewnętrzny.
Reguła przemienności: A + B = B + A .
1
-3"
(c) Wi =
T
'- i -2_
1
“
to
(b) Wi '=
MODELE LINIOWE I ALGEBRA MACIERZY 87
co jest równe:
4.4. WŁASNOŚCI PRZEMIENNOŚCI, ŁĄCZNOŚCI I ROZDZIELNOŚCI W zwykłej algebrze dotyczącej liczb działania dodawania i mnożenia posiadają następujące własności przemienności, łączności i rozdzielności: przemienność dodawania:
a+ b = b+a,
przemienność mnożenia:
ab = ba,
łączność dodawania: łączność mnożenia: rozdzielność mnożenia względem dodawania:
v, + (v2- v 3) =
3" 4
+
"
i
-4
—
’l0" 0
W zastosowaniu do liniowej kombinacji wektorów fciVi + . . . + k„v„ reguła ta pozwala nam na wybranie dowolnej pary składników dodawanych do siebie lub takiej, w której drugi składnik ma być odejmowany od pierwszego, bez uwzględnienia kolejności, w jakiej składniki są zapisane.
(,a+ b)+ c = a+ (b+ c), (ab)c = a(bc),
Mnożenie macierzy
a{b+ ć) = ab+ac. Mnożenie macierzy nie jest przemienne, to znaczy:
Odwoływaliśmy się do tych własności przy omawianiu podobnie nazwanych reguł dotyczących sumy i części wspólnej zbiorów. Większość spośród tych własności stosuje się również do działań na macierzach. Ale nie wszystkie — ważnym wyjątkiem jest przemienność mnożenia.
A B * BA. Jak to poprzednio wyjaśniono, nawet gdy AB jest określone, to BA nie musi być określone, ale nawet jeśli oba iloczyny są określone, to na ogół AB * BA.
88 ANALIZA STATYCZNA
Przykład 3. Niech A =
'l
2
3
4
S3 II
MODELE LINIOWE I ALGEBRA MACIERZY 89
0
-l"
6
7J
; wtedy:
A (B + C) = A B+A C,
_
AB =
BA =
1 0+2 -6
1 •( -l) + 2 - 7
12
13
3 0+4- 6
3 - (-1) 4- 4 - 7
24
25
01-1-3
0-2-1-4
-3
-4
61+7-3
6-2+7-4
27
40
'
= Przykład 5. Jeśli X x=
*i
i
A =
*2.
x'Ax = x'(Ax) = U, x2]
« 11
0
0
«22
u « 11*1 «22*2
■
, to:
= «11*1+022*2’
która jest „ważoną” sumą kwadratów, w przeciwieństwie do prostej sumy kwadratów równej x'x. Dokładnie taki sam wynik otrzymujemy dla:
(x/A)x = [aur1 «22 *2 ]
*i
- an x \ + «22*2*
l_*2j
Mnożenie macierzy jest również rozdzielne.
B=
-1
7
8
4
i
C=
3
4
1 9
sprawdzić, że: (a) (A +B ) + C = A + (B + C); (b) ( A + B ) - C = A + (B -C ). 2. Odejmowanie macierzy B może być traktowane jako dodawanie macierzy (—1) B. Czy przemienność dodawania pozwala nam na stwierdzenie, ż e A - B = B - A ? Jeśli nie, jak należy poprawić to stwierdzenie? 3. Sprawdzić łączność mnożenia dla następujących macierzy: T c= 0 0 2 1 3 2 7 4. Udowodnić, że dla dowolnych skalarów g i k : 5
3_
B=
(a) * ( A e B )= * A + * B ; (b) (g + k ) A = g A + kA .
1 r-
(nX p )
6' » 4
0
(m x n)
3 2
1
Przy tworzeniu iloczynu ABC, warunek zgodności wymiaru macierzy musi oczywiście być spełniony przez każdą parę sąsiednich macierzy. Jeśli A ma wymiar m x n, a C p x q, to zgodność wymiarów wymaga, aby B miała wymiar n x p :
1. Dla danych:
00
Reguła łączności: (AB) C = A (BC) - ABC.
Ćwiczenie 4.4
,
jeśli k jest skalarem. Mnożenie macierzy, mimo iż na ogół nie jest przemienne, jest łączne.
C
[mnożenie z lewej strony przez A] [mnożenie z prawej strony przez A]
W każdym przypadku warunki zgodności wymiarów dla dodawania i dla mnożenia muszą być zachowane.
kA = A k,
B
.
(B + C) A = B A + CA.
Przykład 4. Niech u' ma wymiar 1 x 3 (wektor wierszowy); wtedy odpowiedni wektor kolumnowy u musi mieć wymiar 3 x 1 . Iloczyn u'u będzie miał wymiar 1 x 1, ale iloczyn uu' będzie 3 x 3 . Zatem, co oczywiste, u'u * uu'. Ze względu na ogólną regułę AB A BA często stosuje się terminy: pomnożyć z lewej strony (premultiply) i pomnożyć z prawej strony (postmultiply), aby wskazać kolejność mnożenia. W iloczynie AB mówimy, że B jest pomnożona z lewej strony przez A, a A jest pomnożona z prawej strony przez B. Istnieją jednak interesujące wyjątki od reguły AB * BA. Jednym jest przypadek, gdy A jest macierzą kwadratową, a B jest macierzą jednostkową. Innym jest przypadek, gdy A jest odwrotnością B, tzn. gdy A = B '1. Oba zostaną rozważone później. Trzeba tu również podkreślić, że mnożenie macierzy przez skalar spełnia regułę przemienności, a zatem:
A
Reguła rozdzielności
;
■
0' 3 1. ,
i
^
5. Udowodnić, że (A + B )(C + D ) = A C + A D + B C + B D .': 6. Gdyby w macierzy A z przykładu 5 wszystkie cztery elementy były różne od zera, czy x'Ax wciąż byłby równy ważonej sumie kwadratów? Czy wciąż miałaby zastosowanie reguła łączności mnożenia?
4.5, MACIERZE JEDNOSTKOWE I MACIERZE ZEROWE Macierze jednostkowe Nawiązaliśmy wcześniej do nazwy macierz jednostkowa. Jest to macierz kwadratowa (powtórzmy: kwadratowa) z jedynkami na głównej przekątnej i zerami na wszystkich pozostałych miejscach. Jest oznaczana symbolami I lub I„, gdzie subskrypt n służy do
SM) ANALIZA’STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 91
oznaczania wymiaru wierszowego (i kolumnowego). Zatenr
1
o
1
0
0
1
Obie te macierze mogą być oznaczone symbolem I. Znaczenie tego szczególnego rodzaju macierzy polega na tym, że pełni ona rolę podobną do tej, jaką liczba 1 odgrywa w algebrze skalarów. Dla każdej liczby a mamy 1 • a = a • 1 = a. Podobnie dla dowolnej macierzy A mamy:
3 , wtedy: 3
1 o
0
1
1 2 2 0
3 3
2 0
3 3
■ _ '1
r 0 0' 1 2 1 0 _ 2 0 0 1.
_ 1 AI = 2
0 0
1 2 2 0
3 = A ,: 3
A
I
B = (A I)B = A
A = o.
(q x m ) ( m x n )
(q x n )
Przykład 2.
-, 3 = A. 3
A+0=
Ou Ou
0 On + 0 022
0 0
an 021
0\2 = A. Ö22
Przykład 3. On A 0 = (2x3)(3xl) On
On
Û13 a23
On
0 = 0 . (2x1) 0
.0.
Macierz zerowa po lewej stronie jest wektorem zerowym o wymiarze 3 x 1, a macierz po prawej stronie jest wektorem zerowym o wymiarze 2 x 1. , .
B,
(mX tt)(nXp)
co pokazuje, że obecność lub nieobecność I nie wpływa na wynik iloczynu. Zwróćmy uwagę, że zgodność wymiarów jest zachowana niezależnie od tego, czy I występuje w iloczynie, czy też nie.' -...... .............. Interesujący przypadek (4.8) występuje wówczas, gdy A = I„, gdyż wtedy mamy: AI„ = (I„)2 = I„,
'
, .. •
co oznacza, że macierz jednostkowa podniesiona do kwadratu jest równa tej macierzy. Uogólnieniem tego wyniku jest:
Osobliwości algebry macierzowej Mimo wyraźnych podobieństw między algebrą macierzy i algebrą skalarów, przypadek macierzy charakteryzuje się pewnymi osobliwościami będącymi przestrogą dla nas, aby nie „pożyczać” wszystkich reguł z algebry skalarów bez zastanowienia. Widzieliśmy już, że w algebrze macierzy na ogół AB ^ BA. Spójrzmy na dwie inne osobliwości algebry macierzy. Po pierwsze, w przypadku skalarów równanie ab = 0 zawsze implikuje, że a lub b jest równe zeru, ale w mnożeniu macierzy tak nie jest. Mamy zatem:
( * = 1 ,2 ,...) .
Macierz jednostkowa pozostaje nie zmieniona po pomnożeniu jej przez siebie dowolną liczbę razy. Każda macierz o tej własności (mianowicie AA = A) nazywana jest macierzą idempotentną.
AB =
2 4 1 2
-2
1O
(iB)* = in
(m X p )
Należy podkreślić, że przy mnożeniu macierz zerowa po lewej stronie znaku równości i macierz zerowa po prawej stronie znaku równości mogą mieć różne wymiary.
Ponieważ A ma wymiar 2 x 3 , więc mnożenie A z lewej i z prawej strony przez I wymaga macierzy jednostkowych o różnych wymiarach, mianowicie odpowiednio I2 i I3. W przypadku gdy A jest macierzą stopnia n, można stosować tę samą macierz I„, więc (4.8) przyjmuje postać I„A = AI„ , co stanowi wyjątek od reguły mówiącej, że mnożenie macierzy nie jest przemienne. Szczególna natura macierzy jednostkowej sprawia, że w trakcie procesu mnożenia można ją zostawić lub wyrzucić, nie zmieniając wyniku mnożenia. Wynika to wprost z (4.8). Przypominając prawo łączności, mamy na przykład: (m x n ) ( n x m ) ( n x p )
0 0 o’ 0 = (2x3) 0 0 0_
i
A + 0 = 0 + A = A, (mxn) (mxit) (mxn) (mxn) (mxn) A 0 = 0 0 (m xn)(nx p)
1__ IA
1 2 2 0
0 0 0 0
=
i tak dalej. Kwadratowa macierz zerowa jest idempotentną, ale prostokątna nie. (Dlaczego?) Macierze zerowe podlegają następującym regułom działań (przy założeniu zgodności wymiarów) w odniesieniu do dodawania i mnożenia: j •
IA = AI = A.
Przykład 1. Niech A =
0
(2x2)
1
(4.8)
Podobnie jak macierz jednostkowa I odgrywa rolę liczby 1, tak macierz zerowa — oznaczona przez 0 —: odgrywa rolę liczby 0. Macierz zerowa jest po prostu macierzą, której wszystkie elementy są równe zeru. W przeciwieństwie do I macierz zerowa nie musi być kwadratowa. Można zatem napisać:
4 1
0
o
1
Ł =
1
I3 = 0 0
O o
1 '0
Macierze zerowe
0
0
= 0,
chociaż ani A, ani B nie są macierzami zerowymi.
9 2 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 93
Po drugie, dla skalarów równanie cd = ce (dla c * 0) implikuje, że d = e . Nie jest to prawdą dla macierzy. Gdy dane są: ' : ;:nj' V -2 1 i i 2 3 ; -t E = D= C= 3 2 6 9 - . *’ 2i/t 1 2 wówczas: 5 15
CD = C E =
8 24
4.6. TRANSPOZYCJE I ODWROTNOŚCI MACIERZY Gdy wiersze i kolumny macierzy A są zamienione miejscami — tak, że jej pierwszy wiersz staje się pierwszą kolumną i vice versa — otrzymujemy transpozycją macierzy A, którą oznaczamy przez A ' lub Ar. _Symbol prim nie jest nowy; używaliśmy go wcześniej do odróżniania wektora wierszowego od wektora kolumnowego. W nowo wprowadzonej terminologii wektor wierszowy x' stanowi transpozycję wektora kolumnowego x. Górny indeks T w alternatywnym oznaczeniu jest oczywiście skrótem od słowa transpozycja.
mimo że D * E . Te dziwne wyniki w istocie dotyczą tylko szczególnej klasy macierzy, znanych jako macierze osobliwe, których przykładami są macierze A, B i C (macierze te zawierają wiersz, który jest wielokrotnością innego wiersza). Przykłady takie pokazują, jakie można napotkać pułapki przy nieuzasadnionym rozszerzaniu twierdzeń algebraicznych na operacje macierzowe.
Przykład 1. Dane są macierze: A =
(2x3)
3 8 1 0
-9 4
i
B =
(2X2)
3 4 1 7
możemy zamienić wiersze i kolumny i napisać:
(3x2)
-9
Dane są: -1 0
A=
8
b=
-2
x=
3. Jaki jest wymiar macierzy zerowej otrzymanej w następujących przykładach: (a) pomnożyć A z lewejstrony przezmacierz zerowąo wymiarze 4 x 2 ; (b) pomnożyć A z prawej strony przezmacierzzerową o wymiarze 3 x 6 ; (c) pomnożyć b z lewej strony przez macierz zerową o wymiarze 4 x 3 ; (d) pomnożyć x z prawej stropy prze? macierz żerową O wytniarze 1x5. 4. Pokazać, że macierz diagonalna, tzn, fnąęięrz postąci: au
0
0
022
0
o
i:.
0
o
może być idempotentpa tylko, wtedy, gdy każdy ęlement ńą przekątnej jest równy 1 lub Q, De numerycznie różniących się idempotćptnych diagonalnych macierzy o wymiarach n x n może być skonstruowanych z powyższej macierzy? ,
B' =
i
(2x2)
4
3 4
i 1 7
Z definicji wynika, że jeśli macierz A ma wymiar m x n, to jej transpozycja A ' musi mieć wymiar n x m . Macierz kwadratowa n x n ma transpozycję o tym samym wymiarze.
1. Obliczyć: (a) A l; (b) IA ; (c) Ix; (d) xT Wskazać wymiar macierzy jednostkowej używanej w każdym przypadku. 2. Obliczyć: (a) A b; (c) xTA; (b) A lb ; (d) x'A . Czy dostawienie macierzy I w (b) wpłynęło na wynik z (a)? Czy usunięcie macierzy I w (d) wpłynęło na wynik w (c)?
r
1 O
A' =
OO
,3
Ćwiczenie 4.5
Przykład 2. Jeśli C =
i
1 0 D' = 0 3 4 7
9
-1
2
0
i D=
to C ' =
9 -1
2 0
4 7 2
Tutaj wymiar każdej transpozycji jest taki sam jak wymiar macierzy pierwotnej. Widzimy, że D ' nie tylko ma wymiar taki sam, jak D, lecz również pierwotny układ elementów. Fakt, że D ' = D jest skutkiem tego, że elementy macierzy są położone symetrycznie względem głównej przekątnej. Jeśli potraktujemy główną przekątną D jako lustro, to elementy położone na północny wschód od niej są dokładnymi odbiciami elementów leżących na południowy zachód; zatem pierwszy wiersz ma elementy identyczne z pierwszą kolumną i tak dalej. Macierz D stanowi przykład szczególnej klasy macierzy kwadratowych znanych jako macierze symetryczne. Innym przykładem takich macierzy jest macierz jednostkowa I, która, jako macierz symetryczna, ma transpozycję I ' = I.
Własności transpozycji Transpozycję charakteryzują następujące własności: (4.9)
(A')' = A,
*
94 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 95
(4.10)
(A + B )' = A ' + B',
(4.11)
(AB)' = B'A'.
1.
/
•);
.h
.
Pierwsza własność oznacza, że transpozycja transpozycji jest to macierz pierwotna —• wniosek raczej oczywisty. Druga własność może być wypowiedziana tak: transpozycja sumy jest sumą transpozycji.
Przykład 3. Jeśli A =
i A '+ B '=
4 9 1 0
2 0
4 9
1 0
7 1
i B= 6 1
2 7
0 6 , to: (A + B )'= 16 1
1 1
ł
6 1
16 1
16 1
Trzecia własność mówi, że transpozycja iloczynu jest iloczynem transpozycji ustawio nych w odwrotnej kolejności. Aby zrozumieć, dlaczego kolejność musi być odwrotna, zbadajmy zgodność wymiarów iloczynów po obu stronach (4.11). Jeśli przyjmiemy, że A ma wymiar m x n, a B ma wymiar n x p , to AB będzie o wymiarze m x p i wówczas (AB)' będzie miało wymiar p x m . Aby zachodziła równość, wyrażenie po prawej stronie B 'A ' musi mieć taki sam wymiar. Ponieważ B ' ma wymiar p x n , a A ' ma wymiar n x m , więc iloczyn B'A ' rzeczywiście jest p x m , jak tego wymagamy. Wymiar B 'A ' jest taki, jaki powinien być. Zauważmy, że iloczyn A 'B ' nie jest zdefiniowany, jeśli nie jest spełniony warunek m = p. 1 2 Przykład 4. Dla danych A = 3 2 i B 'A '=
0 -1
6 7
1 3 2 4
12 13
12 13 0 -1 mamy: (A B )'= i B= 24 25 6 7
f
12 24 13 25
24 25
, 3. Jeśli A ma wymiar n x n , to A-1 też musi mieć wymiar n x n ; w przeciwnym razie nie miałaby wymiaru odpowiedniego do mnożenia z lewej i z prawej strony. Macierz jednostkowa utworzona w wyniku mnożenia też będzie miała wymiar n x n . 4. Jeśli odwrotność istnieje, to jest jedyna. Aby udowodnić jej jednoznaczność, przyjmijmy, że B jest odwrotnością A, czyli AB = BA = I. Załóżmy teraz, że mamy inną macierz C taką, że AC = CA = I. Mnożąc z lewej strony obie strony równości AB = I przez C znajdujemy, że (na mocy (4.8)): CAB = C I (= C). Ponieważ z założenia CA = I, więc poprzednie równanie redukuje się do IB = C, czyli B - C. To znaczy, że B i C muszą być jedną i tą samą macierzą odwrotną; z tego powodu możemy mówić o odwrotności A, a nie o pewnej odwrotności A. ■ ." ' 5. Dwie części równości definicyjnej (AA-1 = I i A -1A = I) w istocie implikują się nawzajem, tak więc spełnienie każdego z tych równań wystarczy, aby ustanowić związek odwrotności między A i A '1. Aby to udowodnić, powinniśmy pokazać, że jeśli A A 1= I i jeśli istnieje macierz B taka, że BA = 1, to B = A~‘ (tak więc BA = I musi w rezultacie być równaniem A“’A = I). Pomnóżmy obie strony danego równania BA = I przez A '1; wtedy: " ' :u r ': (BA)A_I = IA_1, [reguła łączności]
B(AA_I) = IA_I,
[AA-1 = I z założenia]
BI = IA-1. Wobec tego, jak to jest wymagane: B = A ‘.
[z (4.8)]
Podobnie można pokazać, że jeśli A 1A = I, to jedyną macierzą C, która daje CA-1 = I, jest. C = A.
Sprawdziliśmy zatem, że własność ta jest spełniona. Przykład 5. Niech A =
Odwrotności i ich własności Dla danej macierzy A można zawsze otrzymać transpozycję A'. Natomiast nie zawsze istnieje jej macierz odwrotna. Odwrotność macierzy A, oznaczona jako A-1, jest określona tylko wtedy, gdy A jest macierzą kwadratową i definiujemy ją jako macierz, która spełnia warunek: (4.12)
A A 1 = A 1A = I.
;
Oznacza to, że gdy A pomnożymy z lewej lub z prawej strony przez A-1, iloczyn będzie zawsze równy tej samej macierzy jednostkowej. Jest to kolejny wyjątek od reguły, że mnożenie macierzy nie jest przemienne. Należy zwrócić uwagę na następujące kwestie: 1. Nie każda macierz kwadratowa ma odwrotność — kwadratowość jest warunkiem koniecznym, ale nie dostatecznym istnienia odwrotności. Jeśli macierz kwadratowa A ma odwrotność, to mówimy, że A jest nieosobliwa. Jeśli A nie ma odwrotności^ nazywamy ją macierzą osobliwą. 2. Jeśli A-1 istnieje, to macierz A może być traktowana jako odwrotność A-1, dokładnie tak jak A-1 jest odwrotnością A. Macierze A i A-1 są nawzajem swoimi odwrotnościami.
3 0
1 2 -1 i B=— ; ponieważ czynnik skalamy -j- w B 2 6 6 Ó 3
może być wyłączony poza nawias (przemienność), więc możemy napisać: AB =
3 0
1 2
2 0
-1 1 6 3 ~6~ 0
1
0 6
1 0
0
Ustanawia to B jako odwrotność A i vice versa. Mnożenie w odwrotnej kolejności, jak można było oczekiwać, również daje tę samą macierz jednostkową: 1 2 B A -0
-1 3
1 6 0 ~"6 0 2
3
1
0 6
1 0 0 1
Interesujące są trzy następujące własności macierzy odwrotnych. Jeśli A i B są nieosobliwymi macierzami o wymiarach n x n, to: (4.13)
( A - 'r ^ A ,
(4.14)
(AB)’1 = B -‘A -‘,
(4.15)
(A0_1 = (A-1)'.
96 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 97
■ -Wzór (4.13) mówi, że odwrotnością macierzy odwrotnej jest macierz pierwotna. Wzór (4.14) stwierdza, że odwrotność iloczynu jest równa iloczynowi odwrotności w przeciwnej kolejności, a (4.15) oznacza, że odwrotność transpozycji jest transpozycją odwrotności. Zauważmy^ że w tych stwierdzeniach z góry zakłada się istnienie odwrotności i spełnienie warunku zgodności wymiarów. ’ ’ . "• p ' " v;s Prawdziwość (4.13) jest dość oczywista, ale udowodnijmy (4.14) i (4.15). Dla danego iloczynu AB znajdźmy: jego odwrotność — nazwijmy ją C. Z (4.12) wiemy, że CAB = I; zatem pomnożenie obu stron z prawej strony przez B _1A-1 daje: (4.16)
CABB~lA_1 = IB ”1A '1
(= B _1A~').
Ale lewa strona redukuje się do:
*
CA(BB-l) A-! = C A I A 1 =
......' ^
= CAA-1 = C I = Ć.
■[z (4.12)]
1
;
[z (4.14) i (4.8)]
Podstawienie tego wyrażenia do (4.16) mówi nam, że C = B_1A_1, jak przypuszczaliśmy. W tym dowodzie dwukrotnie używaliśmy równania AA-1 = A“'A = I. Zastosowanie tego równania jest dopuszczalne wtedy i tylko wtedy, gdy macierz i jej odwrotność ściśle sąsiadują ze sobą w iloczynie. Możemy napisać AA_1B = IB - B, ale nigdy AB A-1 = B. Dowód (4.15) jest następujący. Dla danej A ' znajdźmy jej odwrotność — nazwijmy ją D. Z definicji mamy wtedy DA' = I. Ale wiemy, że: (A A -^ ^ r^ I
DA' = ( A A 1)' = = (A-‘)'A'.
[z (4.11)]
Mnożąc obie strony z prawej strony przez (A')_1, otrzymujemy: DA'(A')-1_= (A~1)'A'(A/)"1 o .
-o ■
D = (A-‘)';
. 1■
.
(■ I-4-'.'
(4.18)
x = A_1d. (3x1) C3x3)<3xl)
Lewa strona (4.18) jest kolumnowym wektorem niewiadomych, a iloczyn po prawej stronie jest wektorem kolumnowym pewnych znanych liczb. Zatem, na mocy definicji równości macierzy lub wektorów, wzór (4.18) pokazuje, że liczby te muszą spełniać układ równań, tzn. stanowią jego rozwiązanie. Wektor A_1d, jeśli istnieje, jest jednoznacznie określony, musi więc być jedynym wektorem wartości rozwiązań. Będziemy zatem oznaczać wektor x z (4.18) jako x, aby podkreślić jego status (jedynego) rozwiązania. Metoda testowania istnienia macierzy odwrotnej i jej obliczania zostanie omówiona w następnym rozdziale. Należy tu jednak stwierdzić, że odwrotność macierzy A z (4.4) jest równa: 18 -13 -17
a" - 5
-1 6 26 18
-10 13 21.
Zatem okazuje się, że (4.18) jest równe:
co daje następujące rozwiązanie: Xi = 2; = 3; = 1. W rezultacie jedną z metod znajdowania rozwiązania układu równań liniowych Ax = d, gdzie macierz współczynników A jest nieosobliwa, jest znalezienie najpierw macierzy odwrotnej A-1, a następnie pomnożenie A-1 z prawej strony przez wektor wyrazów wolnych d. Iloczyn A~*d daje wtedy wartości rozwiązań dla zmiennych.
[z (4.12)] " ■
*■ .
zatem odwrotność A 'je s t równa (A-1)'. , W przedstawionych dowodach operacje matematyczne dotyczyły całych bloków liczb. Gdyby te bloki liczb nie były traktowane jako matematyczne obiekty (macierze), te same operacje byłyby znacznie dłuższe i bardziej złożone. Piękno algebry macierzy polega właśnie na upraszczaniu takich operacji. .r
A_1Ax - A_1d, czyli:
18 -1 6 - 1 0 ‘ ‘22 • '2 ' *r 1 *2 = -- 13 26 13 12 = 3 52 17 18 21 .10. .1. Â3.
daje tę samą macierz jednostkową. Zatem możemy napisać:
lub:
gdzie A, x i d są zdefiniowane tak, jak w (4.4). Jeśli istnieje macierz odwrotna A ‘, to pomnożenie obu stron równania (4.17) z lewej strony przez A daje:
1
-
: !
Macierz odwrotna i rozwiązanie układu równań liniowych Zastosowanie pojęcia macierzy odwrotnej do rozwiązania układu równań jest natychmiastowe i bezpośrednie. Mówiąc o układzie równań w (4.3), wspomnieliśmy, że można go zapisać w postaci macierzowej jako: .i '
Ćwiczenie 4.6 1. Dla danych macierzy: A=
2
4
-l
3
;
B=
3
8"
0
1
C=
1
znaleźć A', B' i C'. Zastosować macierze podane w poprzednim zadaniu do sprawdzenia, że: (a) (A + B)' = A '+ B ';
(b) (A C )'= C'A '.
Uogólnić wynik (4.11) na przypadek iloczynu trzech macierzy i sprawdzić, że dla dowolnych macierzy A, B i C, spełniających warunek zgodności wymiarów, spełniona jest równość (ABC)' = C'B'A'. 7 — Podstawy...
98 ANALIZA STATYCZNA
4.
Dla podanych czterech macierzy sprawdzić, czy któraś z nich jest odwrotnością innej:
1" "l \2 ; 0 3
E=
i i 6 8
1 -4 ;
F= o
i 3.
G-
4 I 1 r 3 ,2 .
5. Uogólnić wynik (4.14), udowadniając dla dowolnych nieosobliwych macierzy o zgodnych wymiarach A, B i C równość (ABC)-1 = C ^ B ^A -1. 6. Niech A = I ^ X ( X /X )-1X'. a. Czy A musi być kwadratowa? Czy (X'X) musi być kwadratowa? Czy X musi być kwadratowa? b. Pokazać, że macierz A jest idempotentna (uwaga: jeśli X/ i X nie są kwadratowe, to nie można tu stosować wzoru (4.14)).
5. MODELE LINIOWE I ALGEBRA MACIERZY (CIĄG DALSZY)
W rozdziale 4 pokazano, że układ równań liniowych, niezależnie od wielkości, może być zapisany w zwartej notacji macierzowej. Ponadto, taki układ równań może być rozwiązany za pomocą macierzy odwrotnej do macierzy współczynników, pod warunkiem, że ta odwrotność istnieje. Musimy się teraz zastanowić, jak sprawdzać jej istnienie i jak ją znaleźć. Dopiero po udzieleniu odpowiedzi na te pytania będziemy mogli w sposób sensowny stosować algebrę macierzy do modeli ekonomicznych.
5.1. WARUNKI NIEOSOBLIWOŚCI MACIERZY Dana macierz współczynników A może mieć odwrotność (tzn. może być „nieosobliwa’ ’) tylko wtedy, gdy jest kwadratowa. Jednak — jak wskazano wcześniej — warunek, że macierz jest kwadratowa, jest konieczny, ale niewystarczający dla istnienia odwrotności A-1. Macierz może być kwadratowa, ale mimo to może być osobliwa (może nie mieć macierzy odwrotnej).
Warunki konieczne a dostateczne Pojęcia „warunek konieczny” i „warunek dostateczny” są często stosowane w ekonomii. Ważne jest więc dokładne zrozumienie ich znaczenia. Warunek konieczny jest następujący: załóżmy, że stwierdzenie p jest prawdziwe tylko wtedy, gdy inne stwierdzenie q jest prawdziwe; wtedy q stanowi warunek konieczny dla p. Symbolicznie wyrażamy to w następujący sposób: (5.1)
p => q,
co czytamy: „p tylko wtedy, gdy q” lub alternatywnie „jeśli p, to q ". Również logicznie poprawne jest interpretowanie (5.1) jako „p implikuje q " . Może się oczywiście zdarzyć, że jednocześnie mamy p =t> w. Wtedy zarówno q, jak i w są warunkami koniecznymi dla p.
100 ANALIZA STATYCZNA
Przykład 1. Jeśli przyjmiemy, że p jest stwierdzeniem „pewna osoba jest ojcem” , a q jest stwierdzeniem „pewna osoba jest mężczyzną” , to stosuje się logiczne stwierdzenie p => ą. Pewna osoba jest ojcem tylko wtedy, gdy jest mężczyzną i bycie mężczyzną jest warunkiem koniecznym ojcostwa. Natomiast odwrotność nie jest prawdą: ojcostwo nie jest warunkiem koniecznym bycia mężczyzną. Odmienną sytuację mamy wtedy, gdy stwierdzenie p jest prawdziwe, jeśli ą jest prawdziwe, ale p może również być prawdziwe, gdy q nie jest prawdziwe. W tym przypadku mówimy, że q jest warunkiem dostatecznym dla p. Prawdziwość q wystarcza dla ustanowienia prawdziwości p, ale nie jest ono warunkiem koniecznym dla p. Ten przypadek wyrażamy symbolicznie: (5.2)
MODELE LINIOWE I ALGEBRA MACIERZY 101
wektorami wierszowymi:
A=
(5.3)
p <=> q,
co czytamy: „p wtedy i tylko wtedy, gdy q " (również pisze się „p wtw, gdy q ”). Podwójna strzałka jest w istocie kombinacją dwu typów strzałek występujących w (5.1) i (5.2); oznacza zatem łączne użycie dwu terminów „jeśli” i „tylko wtedy, gdy” . Tak więc (5.3) oznacza nie tylko, że p implikuje q, lecz również, że q implikuje p. Przykład 3. Jeśli przyjmujemy, ż e p jest stwierdzeniem „miesiąc ma mniej niż 30 dni” , a q jest stwierdzeniem „jest to luty” , to wówczasp <=> q. Aby miesiąc miał mniej niż 30 dni, musi to być luty. Odwrotnie, powiedzenie, że jest to luty, wystarczy do stwierdzenia, że miesiąc ten ma mniej niż 30 dni. Zatem q jest koniecznym i dostatecznym warunkiem dla p. Aby udowodnić p=> q, niezbędne jest wykazanie, że q wynika logicznie z p. Podobnie udowodnienie p <= q wymaga pokazania, że p wynika logicznie z q. Ale, aby udowodnić p <=> q, konieczne jest wykazanie, że p i q wynikają z siebie nawzajem.
Warunki nieosobliwości Jeśli spełniony jest warunek mówiący, że macierz jest kwadratowa, to warunkiem dostatecz nym nieosobliwości macierzy jest niezależność liniowa jej wierszy (albo, co jest równoważne, liniowa niezależność jej kolumn). Gdy dualne warunki kwadratowości i liniowej niezależności występują razem, tworzą one konieczny i dostateczny warunek nieosobliwości (nieosobliwość <=> kwadratowość i liniowa niezależność). Macierz współczynników A o wymiarze n x n może być traktowana jako uporządkowany zbiór wektorów wierszowych, tzn. jako wektor kolumnowy, którego elementy same są
a 22
_Uni
a „2
r*n
... ain •..
ttnn_
=
y'n.
ï>,v'= (lx/l) 0,
(5.4)
Przykład 2. Jeśli jako p przyjmujemy stwierdzenie „ktoś podróżuje do Europy” , a jako q stwierdzenie „ktoś leci samolotem do Europy” , to p <= q. Do Europy można dostać się samolotem, ale ponieważ można również przypłynąć statkiem, więc latanie nie jest niezbędnym warunkiem. Możemy zapisać p <= q, ale nie p => q. W trzeciej możliwej sytuacji q jest zarówno konieczny, jak i dostateczny dla p. W takim przypadku piszemy:
a \2
u21
= [«il a ¡2 •• a j , i = 1, 2, . niezależne, żaden z nich nie może być liniową kombinacją pozostałych. Bardziej formalnie, jak wspomniano w podrozdz. 4.3, liniowa niezależność wierszy wymaga, aby jedynym zbiorem skalarów kp które spełniają równanie wektorowe:
p <= q,
co czytamy: „p, jeśli q ” (bez słowa tylko) lub alternatywnie ,je śli q, to p ” , tak jakby czytając (5.2) wstecz. Można to również interpretować jako „q implikuje p ” .
’«11
1=1
był zbiór kt = 0 dla każdego i. Przykład 4. Jeśli macierzą współczynników jest: ‘3 4 5' A = 0 1 2 = V2 6 8 10 ,v;„ toponiew aż[6 8 10] = 2 [3 4 5], mamy v '= 2 v '= 2 v '+ 0 v '. Zatem trzeci wiersz może być wyrażony jako liniowa kombinacja pierwszych dwu i wiersze nie są liniowo niezależne. Powyższe równanie możemy alternatywnie zapisać jako: 2 v ; + 0 v ; - v ; = [6 8 10] + [0 0 0 ] - [ 6 8 10] = [0 0 0], Ponieważ w zbiorze skalarów, które doprowadziły do wektora zerowego w (5.4), nie dla każdego i jest ki = 0, więc wynika stąd, że wiersze są liniowo zależne. Liniowa niezależność kolumn lub wierszy nie jest widoczna. Trzeba znaleźć metodę jej sprawdzania. Zanim się tym zajmiemy, spróbujemy zrozumieć, dlaczego w ogóle łączymy warunek liniowej niezależności z warunkiem kwadratoWości. Przypomnijmy ogólny wniosek z rozważań w podrożdz. 3.4 o liczbie równań i niewiadomych. Aby układ równań miał jednoznaczne rozwiązanie, nie wystarcży równość liczby równań i zmiennych. Równania muszą być ponadto niesprzećzńe i funkcyjnie niezależne jedno ód drugiego (co w kontekście układu równań liniowych oznacza nieżależność liniową). Istnieje dość oczywisty związek między kryterium „taka sama liczba równań i zmiennych” a kwadratówością macierzy współczynników (tyle samo wierszy i kolumn). Wymaganie „liniowej niezależności wierszy” jest wykluczeniem sprzeczności i liniowej zależności równań. Wymaganie „kwadratowości i liniowej niezależności wierszy” macierzy kwadratowej jest dokładnie tym samym, co warunki istnienia jednoznacznego rozwiązania podane w podrozdz. 3.4. Pokażmy, jak liniowa zależność wierszy macierzy współczynników może spowodować sprzeezńość lub liniową zależność samych równań. Niech układ równań Ax = d przyjmie postać: '10 .4 5
2
JC2
4 d2
102 ANALIZA STATYCZNA
gdzie macierz współczynników A zawiera liniowo zależne wiersze: v ' = 2v' (zauważmy, że jej kolumny też są liniowo zależne, pierwsza jest równa - drugiej). Nie określiliśmy wartości wyrazów wolnych dy i ale są tylko dwie możliwości dotyczące ich wartości względnych: (1) d l = 2d2 i (2) d l 2 Ą . Dla pierwszej — powiedzmy d t = 12 i d^ = 6 — dwa równania są niesprzeczne, ale liniowo zależne (tak jak są liniowo zależne dwa wiersze macierzy A), gdyż pierwsze równanie jest po prostu równe drugiemu pomnożonemu przez 2. Jedno równanie jest wtedy zbędne i w rezultacie układ redukuje się do jednego równania 5*,+2x2 = 6 z nieskoń czoną liczbą rozwiązań. Dla drugiej możliwości — powiedzmy dl = 12, ale = 0 — dwa równania są sprzeczne , ponieważ jeśli pierwsze równanie ( IOjc, +4x2 = 12) jest prawdziwe, to dzieląc każdy składnik przez 2, możemy wywnioskować że 5 xl + 2x2 = 6, w konsekwencji drugie równanie (5y, + 2x2 = 0) nie może być jednocześnie prawdziwe. Zatem rozwiązanie nie istnieje. W rezultacie nie jest możliwe uzyskanie jedynego rozwiązania (przy każdej z obu możliwości), jeżeli wiersze macierzy współczynników A są liniowo zależne. Uzyskanie jedynego rozwiązania jest możliwe wówczas, gdy macierz współczynników ma liniowo niezależne wiersze (lub kolumny). W tym przypadku macierz A będzie nieosobliwa, co oznacza, że istnieje odwrotność A~l i że można znaleźć jedyne rozwiązanie x = A“*d.
Rząd macierzy Pojęcie niezależności wierszy może być stosowane również do każdej macierzy prostokątnej o wymiarze mXn. Jeśli maksymalna liczba liniowo niezależnych wierszy, jakie można znaleźć w tej macierzy, jest równa r, to mówimy, że macierz ma rząd r (rząd wskazuje nam także maksymalną liczbę liniowo niezależnych kolumn wspomnianej macierzy). Rząd .macierzy m x n może być równy co najwyżej m lub n, tzn. co najwyżej tej liczbie, która jest mniejsza. Z definicji wynika, że każda nieosobliwa macierz A o wymiarze n x n ma n liniowo niezależnych wierszy (lub kolumn); w rezultacie musi mieć rząd n. Odwrotnie, każda macierz o wymiarze n x n rzędu n musi być nieosobliwa.
MODELE LINIOWE I ALGEBRA MACIERZY 103
2. Niech p będzie zdaniem „figura geometryczna jest kwadratem” i niech q będzie następujące: (a) ma cztery boki, (b) ma cztery równe boki, (c) ma cztery równe boki i każdy jest prostopadły do sąsiedniego. Dla każdego z przypadków sprawdzić, co jest prawdą: p => q, p <= q, czy p o q ? 3. Czy dla każdej z następujących macierzy wiersze są liniowo niezależne: 'l (a) 4.
8'
.9
-3 .
2 ;
(b)
O1
0 '2
(c)
3
2
2.
;
(d)
-1
4
. 2
-8 .
Sprawdzić, czy kolumny każdej z macierzy z poprzedniego zadania są również liniowo niezależne. Czy otrzymana odpowiedź jest taka sama, jak dla niezależności wierszy?
5.2. TESTOWANIE NIEOSOBLIWOŚCI ZA POMOCĄ WYZNACZNIKA Do sprawdzenia, czy pewna kwadratowa macierz jest nieosobliwa, możemy wykorzystać pojęcie wyznacznika.
Wyznaczniki i nieosobliwość Wyznacznik macierzy kwadratowej A, oznaczany przez |A|, jest jednoznacznie określonym skalarem (liczbą) związanym z tą macierzą. Wyznaczniki są zdefiniowane jedynie dla macierzy kwadratowych. a ii
a¡2
a 2\
°22
Dla macierzy A =
wyznacznik jest zdefiniowany w następujący sposób:
Ćwiczenie 5.1 1. W następujących połączonych w pary stwierdzeniach niech p będzie pierwszym stwier dzeniem, a q drugim. Wskazać dla każdego przypadku, czy stosuje się do niego (5.1), czy (5.2), czy (5.3): (a) jest święto; jest Dzień Dziękczynienia, (b) figura geometryczna ma cztery boki; jest to prostokąt, (c) dwie pary uporządkowane (a, b) i (b, a) są równe; a jest równa b, (d) pewna liczba jest liczbą wymierną; może być wyrażona jako iloraz dwu liczb całkowitych, (e) macierz o wymiarze 4 x 4 jest nieosobliwa; jej rząd jest równy 4, (f) bak na benzynę w moim samochodzie jest pusty; nie mogę uruchomić samochodu, (g) list odesłano do nadawcy z powodu niewystarczającej opłaty; nadawca zapomniał nakleić znaczek na kopercie.
0
;
(5.5)
|A | =
aU
a \2
a l\
U22
—
Qna22—O21O12.
a więc otrzymujemy go, mnożąc dwa elementy głównej przekątnej macierzy A i odejmując iloczyn dwu pozostałych elementów. Ze względu na wymiar macierzy A jego wyznacznik | A | określony wzorem (5.5) jest nazywany wyznacznikiem drugiego stopnia. P rzykład 1. Dane są macierze:
'10 A=
4
. 8 5.
i
ich wyznaczniki są równe:
B=
3 0
5~ -1
104 ANALIZA STATYCZNA
10
MODELE LINIOWE I ALGEBRA MACIERZY 105
4
|A| =
= 10-5-8
8
4 = 18,
5
3
5
0
-1
!»! =
= 3 ■(—1) —0 - 5 = —3.
Wyznacznik (obejmowany przez dwie pionowe kreski, a nie nawiasy kwadratowe) jest z definicji skalarem, macierz natomiast nie ma wartości numerycznej. Innymi słowy, wyznacznik sprowadza się do liczby, ale macierz jest w przeciwieństwie do niego całym blokiem liczb. Należy również podkreślić, że wyznacznik jest określony tylko dla macierzy kwadratowych, podczas gdy dowolna macierz nie musi być kwadratowa. Nawet w początkowym etapie rozważań możemy domyślać się, że istnieje związek między liniową zależnością wierszy macierzy A a jej wyznacznikiem jA|. Obie macierze: 8"
.3
D=
2 V1 = Ld ł
OO
i 8.
mają liniowo zależne wiersze, gdyż c ' = równe zeru: 3
8
3
8
|C | =
6' £
3 C=
We wzorze (5.6) wartość | A| jest wyrażona w postaci sumy sześciu iloczynów, z których trzy poprzedzone są znakiem minus, a trzy znakiem plus. Mimo iż ta suma może wydawać się skomplikowana, niemniej istnieje bardzo łatwy sposób „wychwycenia” wszystkich tych sześciu wyrażeń dla danego wyznacznika trzeciego stopnia. Najlepiej wyjaśnić to za pomocą diagramu (rys. 5.1). W wyznaczniku pokazanym na rys. 5.1 każdy element górnego wiersza został połączony z dwoma innymi elementami dwiema pogrubionymi strzałkami w na stępujący sposób: au —>a22—>a33, a 12—>a23~+«3i i a 13—)<232— Każda trójka tak połą czonych elementów może być pomnożona i ich iloczyn jest jednym z sześciu składników w (5.6). Wyrażenia iloczynowe połączone pogrubionymi strzałkami mają być poprzedzone znakiem plus.
c' i d' = 4dj. Okazuje się, że ich wyznaczniki są
= 3- 8 - 3- 8 = 0, 2
6
8
24
= 2 - 2 4 - 8 - 6 = 0.
ID | =
Wyniki te jednoznacznie sugerują, że „znikający” wyznacznik (o wartości zero) może mieć coś wspólnego z liniową zależnością. Zobaczymy, że istotnie tak jest. Ponadto wartość wyznacznika |A | może służyć nie tylko jako kryterium sprawdzania liniowej niezależności wierszy (zatem nieosobliwości) macierzy A, lecz także jako element obliczania macierzy odwrotnej A-1, jeśli ona istnieje. Najpierw jednak musimy omówić wyznaczniki wyższych stopni.
Obliczanie wyznacznika trzeciego stopnia Wyznacznik trżeciego stopnlajest Związany z macierzą trzeciego stopnia. Dla danej macierzy:
A = <*21 «22 <<23 «31
«32
Rysunek 5,1
Natomiast każdy element górnego wiersza został również połączony z dwoma innymi elementami przez dwie przerywane strzałki w następujący sposób: a n ->a32—>023, « 12 " + «21 ~ * « 3 3 i « 1 3 ^ « 2 2 — ^ « 3 1 • Każdą trójkę tak połączonych elementów można rów nież pomnożyć i ich iloczyn przyjąć jako jeden z sześciu składników w (5.6). Takie iloczyny są poprzedzone znakiem minus. Suma wszystkich sześciu iloczynów będzie wtedy wartością wyznacznika.
«33
wyznacznik ma waftość: Przykład 2. (5.6)
«11
«12
«13
1A 1 = «21
«22
«23
«31
«32
= «11
«22
«23
«32
«33
«12
«21
«23
«31
«33
+ «13
«21
«22
«31
«32
«33
~ « ll« 2 2 « 3 3 — «11«23«32
«12«23«31
«12«21«33
«13«21«32
«13«22«31’
1
lic z b a ]
2
1 3
4
5 6 = 2 • 5 • 9 +1 • 6 • 7 + 3 • 8 • 4 - 2 - 8 • 6 —1 - 4 • 9 - 3 • 5 - 7 = -9 .
7
8 9
MODELE LINIOWE I ALGEBRA MACIERZY 107
106 ANALIZA STATYCZNA
Fakt, że dopełnienie algebraiczne ma określony znak, jest niezmiernie ważny i należy zawsze o nim pamiętać.
Przykład 3. -7
0
3
9
1 4 = (-7) • 1 - 5 + 0 -4 - 0 + 3 - 6 • 9 - ( - 7 ) - 6 - 4 - 0 - 9 - 5 - 3 • 1 0 = 295.
0
6
Przykład 4. W wyznaczniku
5
Ta metoda mnożenia wzdłuż przekątnych daje praktyczny sposób obliczania wyznacz nika trzeciego stopnia, ale niestety nie można jej stosować do wyznaczników stopnia wyższego niż 3. Musimy dla nich stosować tzw. rozwinięcie Laplace’a.
6
4
3
1
| M 12|=
9 6 3
8 5 2
7 4 1
minor elementu 8 jest równy:
= - 6,
ale dopełnienie algebraiczne tego samego elementu jest równe: |C 12| = -|/W 12| = 6,
Obliczanie wyznacznika stopnia n przez tzw. rozwinięcie Laplace’a Wyjaśnijmy metodę rozwinięcia wyznacznika trzeciego stopnia według wzoru Ldplace’a. Wróćmy do pierwszego wiersza wzoru (5.6). Widzimy tu, że wartość |A | może być traktowana również jako suma trzech składników, z których każdy jest iloczynem pewnego elementu pierwszego wiersza i odpowiedniego wyznacznika drugiego stopnia. Ta metoda obliczania | A | — przy użyciu pewnych wyznaczników niższego stopnia — ilustruje rozwinięcie wyznacz nika według wzoru Laplace’a. Trzy wyznaczniki drugiego stopnia w (5.6) nie są wyznaczone w sposób dowolny, lecz określone przez ścisłe reguły. Pierwszy z nich:
#22
Oyi
023
O-n 023 ; a32 a33
a2\ \m 12\ ee
^33
a21 Ü22
023
a21 a33
;
|m 13| =
On
I 6-23 I — ~ J 3^23 I — ~
9
8
3
2
= 6.
Za pomocą tych nowych pojęć możemy zapisać wyznacznik trzeciego stopnia jako: (5.7)
| A | = a Ł1[Afn| - a 121Afi2| +
= 3
jest podwyznacznikiem |A |
otrzymanym przez wykreślenie pierwszego wiersza i pierwszej kolumny |A|. Nazywamy go minorem elementu a n (elementu, który znajduje się na przecięciu wykreślonego wiersza i kolumny) i oznaczamy symbolem \Mn |. Ogólniej, symbol |Mff| stosowany jest do oznaczenia minoru otrzymanego po wykreśleniu /-tego wiersza i y-tej kolumny danego wyznacznika. Ponieważ minor sam jest wyznacznikiem, więc ma pewną wartość. Czytelnik może sprawdzić, że pozostałe dwa wyznaczniki drugiego stopnia w (5.6) są to minory \Mn \ i W n \, tzn.:
\M n \ ^
gdyż i + j = 1 + 2 = 3 jest liczbą nieparzystą. Podobnie dopełnienie algebraiczne elemen tu 4 jest równe:
Oi2
Pojęcie dopełnienia algebraicznego jest ściśle związane z pojęciem minora. Dopełnienie algebraiczne, oznaczone przez | C,y|, jest to minor z odpowiednim znakiem1. Zasada określania znaku jest następująca: jeśli suma dwu subskryptów i oraz j dla minora \Mq\ jest parzysta, to dopełnienie algebraiczne ma taki sam znak jak minor; to znaczy | Q | = \Mjj\. Jeśli suma ta jest nieparzysta, to dopełnienie algebraiczne ma znak przeciwny do znaku minora; to znaczy ICtj| = -|M y |. W skrócie: IQ | = (—l)i+'|M 0.|; oczywiście wyrażenie (—1),HJ może być dodatnie wtedy i tylko wtedy, gdy (/+_/) jest parzyste. 1 Wielu autorów stosuje symbole M,j i C,y (bez kresek pionowych) na oznaczenie minorów i dopełnień algebraicznych. Dodajemy pionowe kreski, aby unaocznić fakt, że minory i dopełnienia algebraiczne są z natury wyznacznikami i jako takie mają wartości liczbowe.
= U111C u l + a \2 1C i2| + ZZ13 1C 13I = 2 a y\C ij\,
tzn. jako sumę trzech składników, z których każdy jest iloczynem jednego z elementów pierwszego wiersza i dopełnienia algebraicznego tego elementu. Zwróćmy uwagę na to, że przy wyrażeniach a i2\M n \ i a 121Cj21 we wzorze (5.7) stoją przeciwne znaki. Jest tak, ponieważ 1 + 2 = 3 jest liczbą nieparzystą. Obliczanie wyznacznika trzeciego stopnia dzięki rozwinięciu według wzoru Laplace’a sprowadza się do obliczania wartości wyznaczników stopnia drugiego. Podobna redukcja uzyskiwana jest dla rozwinięcia Laplace’a wyznaczników wyższych stopni. Na przykład dla wyznacznika czwartego stopnia |B | pierwszy wiersz zawiera cztery elementy hu ... b ,4 ; wobec tego zgodnie ze wzorem (5.7) możemy zapisać: |B | = I h y l C y l , J= 1 gdzie dopełnienia algebraiczne | C-,j | mają stopień 3. Każde dopełnienie algebraiczne trzeciego stopnia może teraz być obliczone zgodnie z (5.6). Ogólnie, rozwinięcie Laplace’a wyznacz nika n-tego stopnia sprowadza całe zagadnienie do obliczenia n dopełnień algebraicznych, z których każde ma stopień równy (n - 1). Powtórne stosowanie metody będzie prowadzić do wyznaczników coraz to niższych stopni, aż w końcu dojdziemy do podstawowych wyznacz ników drugiego stopnia, takich jak określone wzorem (5.5). Wtedy można z łatwością obliczyć wartość pierwotnego wyznacznika. Metoda rozwinięcia Laplace’a została przedstawiona dla dopełnień algebraicznych elementów pierwszego wiersza, ale dopuszczalne jest rozwinięcie wyznacznika względem elementów dowolnego wiersza lub dowolnej kolumny. Na przykład jeśli pierwsza kolumna wyznacznika trzeciego stopnia |A| składa się z elementów a u , a2] i a31, to rozwinięcie
MODELE LINIOWE I ALGEBRA MACIERZY 109
108 ANALIZA STATYCZNA
wykorzystujące dopełnienie algebraiczne tych elementów również daje wartość |A|: 3
|A| = Un | Ci 11+ «21 1^211+<331 IC311=
/=i
|C„|.
3. Dane jest: a d
Przykład 5. Dla danego wyznacznika:
'5 |A |= 2 7
6 r 3 0 -3 0 .
3
0
-3
0
-6
2
0
7
0
+
2
3
7
-3
= 0 + 0 - 27 = -2 7 .
Ale rozwinięcie względem pierwszej kolumny daje identyczną odpowiedź: |A| = 5
3
0
-3
0
-2
6
1
-3
0
+7
6
1
3
0
2
3
7
-3
- 0 + 0 = -2 7 .
Reasumując, wartość wyznacznika | A| stopnia n możemy znaleźć za pomocą rozwinięcia Laplace’a względem dowolnego wiersza lub dowolnej kolumny w następujący sposób: (5.8)
c f i
IAI = X a y |C„| =
4. Obliczyć następujące wyznaczniki: 1 2 2 3 (a) 1 6 0 -5
n
[rozwinięcie względem ;'-tej kolumny]
= X a¡¡ IC,j\. J= 1
Możemy teraz omówić własności wyznaczników, co umożliwi nam „odkrycie” związku między liniową zależnością wierszy macierzy kwadratowej i zerowaniem się wyznacznika tej macierzy. Omówimy pięć podstawowych własności. Są to własności wspólne dla wyznaczników wszystkich stopni, chociaż będą ilustrowane .głównie przykładami dla wyznaczników drugiego stopnia. W łasność I. Zamiana wierszy i kolumn nie zmienia wartości wyznacznika. Innymi słowy wyznacznik macierzy A ma tę samą wartość co wyznacznik jej transpozycji A', tzn. |A | = |A'|.
P rzykład 2.
1. Obliczyć następujące wyznaczniki:
3 5 ; 9
4 (c) 6 8 (d)
1 8 0 4
5.3. PODSTAWOWE WŁASNOŚCI WYZNACZNIKÓW
Ćwiczenie 5.2
1 2 4 7 (b) 3 6
0 4 9 1
5. Dla pierwszego wyznacznika z poprzedniego przykładu znaleźć dopełnienie algebraiczne elementu 9.
Przykład 1.
1 3 0 1 ; 0 3
2 7 5 6 (b) 0 0 1 -3
9 6 ; -1 8
[rozwinięcie względem i-tego wiersza]
j= 1
8 (a) 4 6
0 4 0 0
= 0 - 6 - 2 1 = -2 7 .
Przy obliczeniach numerycznych pozwala nam to wybierać „łatwy” wiersz lub „łatwą” kolumnę dla rozwinięcia. Najlepiej wybrać w tym celu wiersz lub kolumnę z dużą liczbą zer i jedynek, gdyż 0 pomnożone przez dopełnienie algebraiczne daje zawsze 0, a 1 pomnożone przez swoje dopełnienie algebraiczne daje to właśnie dopełnienie, co oszczędza nam przynajmniej jednego mnożenia. W przykładzie 5 najłatwiejsze jest rozwinięcie wyznacznika względem trzeciej kolumny, która składa się z elementów 1,0 i 0. Moglibyśmy więc obliczyć wyznacznik w taki sposób: IAJ = 1
b e h
znaleźć minory i dopełnienia algebraiczne elementów a, b i f .
rozwinięcie względem pierwszego wiersza prowadzi do wyniku: IAI = 5
2. Określić znak, jaki trzeba postawić przed odpowiednim minorem, aby otrzymać na stępujące dopełnienie algebraiczne dla pewnego wyznacznika: IC^I, |Ć » |, IC331, |C4i| i IO341. ,
1 8 0
0 0 2 1 11 4
2 3 ;
a
(e) b c
3 4 2 ; 7
b c a
c a b
3
4
5
5
6
3
6
a
b
a
c
c
d
b
d
= 9.
= a d -b c .
W łasność EL Zamiana miejscami dowolnych dw u w ierszy (lub dowolnych dwu kolumn) zmienia znak, ale nie zmienia wartości bezwzględnej wyznacznika.
5
0
y (f) 3 9 -1
2 8
x
4
Przykład 3.
a b c d
= a d - b c , ale zamiana dwu wierszy daje:
c d a b
= c b - a d = - ( a d - b e ).
110 ANALIZA STATYCZNA
Przykład 4.
MODELE LINIOWE I ALGEBRA MACIERZY 111
0 1 3 2 5 7 = -2 6 , 3 0 1
ale
zamiana
drugiej
i
trzeciej
kolumny
daje
3 1 0 7 5 2 = 26. 1 0 3
Przykład 8.
Własność HI. Pomnożenie dowolnego jednego wiersza (lub jednej kolumny) przez skalar k zmieni wartość wyznacznika k-krotnie. Przykład 5. Mnożąc pierwszy wiersz wyznacznika z przykładu 3 przez k, otrzymujemy: ka
kb
c
d
= k a d -k b c = k ( a d - b c ) = k
a
b
c
d
Ważne jest, aby rozróżniać dwa wyrażenia k \ i k|A |. Gdy mnożymy macierz A przez skalar k, wówczas wszystkie elementy A trzeba pomnożyć przez k. Ale — po odczytaniu równania z tego przykładu od prawej do lewej — powinno być jasne, że mnożenie wyznacznika |A] przez k wymaga pomnożenia przez k tylko jednego wiersza (lub kolumny). Równanie to daje nam wobec tego regułę rozkładania wyznacznika na czynniki: jeśli jakiś wiersz (lub kolumna) zawiera wspólny dzielnik, to dzielnik ten można wyłączyć przed znak wyznacznika. Przykład 6. Wyłączając czynniki kolejno z pierwszej kolumny i drugiego wiersza otrzymujemy: 15a
Ib
12c
2d
=3
5a
Ib
4c
2d
= 3 -2
5a
Ib
2c
d
= 6 (5 a d -U b c ).
Bezpośrednie obliczanie pierwotnego wyznacznika dałoby oczywiście taką samą odpowiedź. W przeciwieństwie do tego, wyłączanie czynnika dla macierzy wymaga istnienia wspólnego dzielnika wszystkich jej elementów, tak jak poniżej: ka
kb
kc
kd
=k
a
b
c
d_
a
b d+ kb
= a (d + k b )-b {c + k a ) = a d - b c =
la
2b
a
b
= 2 a b -2 a b = 0\
c
c
d
d
= c d - c d = 0.
Dodatkowe przykłady tego typu zerujących się wyznaczników można znaleźć w ćwicze niu 5.2-1. Ta ważna własność jest w istocie logiczną konsekwencją własności IV. Aby to zrozumieć, zastosujemy własność IV do dwóch wyznaczników z przykładu 8 i zobaczymy, co z tego wyniknie. Dla pierwszego wyznacznika spróbujmy odjąć od pierwszego wiersza drugi wiersz pomnożony przez 2; dla drugiego Wyznacznika odejmijmy drugą kolumnę od pierwszej. Ponieważ operacje te nie zmieniają wartości wyznacznika, więc możemy napisać: 2a
2b
0
0
a
b
a
b
»
c
c
0
c
d
d
0
d
Nowe (przekształcone) wyznaczniki zawierają odpowiednio wiersz oraz kolumnę złożone z samych zer; zatem w obu przypadkach ich rozwinięcie według wzoru Laplace’a musi dawać wartość zero. W ogólnym przypadku, jeśli pewien wiersz (lub kolumna) jest wielokrotnością innego wiersza (kolumny), to stosując własność IV można zredukować wszystkie elementy tego wiersza (kolumny) do zera; skąd wynika własność V. Te podstawowe własności mogą mieć różne zastosowania. Jednym z nich jest wielkie ułatwienie obliczania wartości wyznacznika. Na przykład odejmując wielokrotność pewnego wiersza (lub kolumny) od innego, można sprowadzić elementy wyznacznika do znacznie mniejszych i prostszych liczb. Wyłączanie czynnika, jeśli jest możliwe, służy temu samemu celowi. Jeśli zdołamy zastosować te własności tak, aby przekształcić pewien wiersz lub kolumnę do postaci zawierającej głównie zera i jedynki, rozwinięcie tego wyznacznika według wzoru Laplace’a stanie się o wiele łatwiejszym zadaniem.
Wyznacznikowe kryterium nieosobliwości Obecnie jednak interesuje nas przede wszystkim powiązanie liniowej zależności wierszy z zerowaniem się wyznacznika. W tym celu odwołamy się do własności V. Rozważmy układ równań Ax = d:
Własność IV. Dodawanie wielokrotności dowolnego wiersza do innego wiersza (lub odejmowanie jej od innego wiersza) nie zmienia wartości wyznacznika. Stwierdzenie to pozostaje prawdziwe po zastąpieniu słowa wiersz słowem kolumna. Przykład 7. Jeśli do drugiego wiersza wyznacznika z przykładu 3 dodamy pierwszy wiersz pomnożony przez k, to otrzymamy wyznacznik taki, jaki był na początku:
c+ka
Własność V. Jeśli jeden wiersz jest wielokrotnością innego wiersza (lub jedna kolumna jest wielokrotnością innej kolumny), to wartość wyznacznika jest równa zeru. W szczególnym przypadku, gdy dwa wiersze (lub dwie kolumny) są identyczne, wyznacznik zeruje się.
a
b
c
d
3 15 4
4 20 0
2 10 1
Xl Xl -■*3.
di =
di -d j.
Układ ten może mieć jednoznaczne rozwiązanie wtedy i tylko wtedy, gdy wiersze macierzy współczynników A są liniowo niezależne, tak iż A jest nieosobli wa. Ale drugi wiersz jest równy pierwszemu pomnożonemu przez 5: wiersze są tak naprawdę zależne, więc nie może istnieć jednoznaczne rozwiązanie. Wykryliśmy tę liniową zależność wierszy, przy glądając się po prostu macierzy, ale z uwagi na własności V mogliśmy stwierdzić to na podstawie faktu, że |A| = 0.
112 ANALIZA STATYCZNA
Zależność wierszy macierzy może oczywiście przyjmować bardziej skomplikowaną i ukrytą postać. Na przykład dla macierzy: '4 B= 5 .1
1 2' Fv i l 2 1 = 0 1. k J wiersze są liniowo zależne, ponieważ 2v' —v ' —3v' = 0; ale ten fakt nie jest widoczny. Jednak nawet w tym przypadku własność V powoduje, że wyznacznik wyzeruje się, |B| = 0, gdyż dodając do v ' elementy wektora v ' pomnożone przez 3 i odejmując v ' pomnożone przez 2, można sprowadzić drugi wiersz do wektora zerowego. Ogólnie, dowolny schemat zależności liniowej wierszy spowoduje zerowanie wyznacznika — i na tym polega urok własności V! Jeśli natomiast, wiersze są liniowo niezależne, wyznacznik musi być różny od zera. Powyżej powiązaliśmy nieosobliwość macierzy z liniową niezależnością wierszy. Ale wcześniej stwierdziliśmy, że dla macierzy kwadratowej A niezależność wierszy <=> niezależ ność kolumn. Możemy to teraz udowodnić: Zgodnie z własnością I wiemy, że |A | = |A '|. Ponieważ liniowa niezależność wierszy A <=> | A| * 0, więc możemy powiedzieć, że niezależność wierszy A <=> |A '| * 0. Ale | A'| * 0 o liniową niezależność w macierzy transponowanej A ' <=>niezależność kolumn macierzy A (wiersze A ' są z definicji kolumnami A). Wobec tego niezależność wier szy A <=> niezależność kolumn A. Możemy teraz podsumować nasze rozważania dotyczące nieosobliwości macierzy. Jeśli dany jest układ równań liniowych Ax = d, gdzie A jest macierzą współczynników o wymiarze n X n, to: | A| * 0 <=> wiersze (kolumny) macierzy A są liniowo niezależne o <=> A jest nieosobliwa o <=> istnieje A-1 <=> o istnieje jednoznaczne rozwiązanie x = A 'd. Wobec tego wartość wyznacznika macierzy współczynników |A| stanowi wygodne kryterium sprawdzania nieosobliwości macierzy A i istnienia jednoznacznego rozwiązania układu równań Ax = d. Niestety, kryterium wykorzystujące wyznacznik nie daje żadnych informacji o znakach elementów rozwiązania. A zatem, mimo że jesteśmy pewni istnienia jednoznacznego rozwiązania, gdy |A |* 0 , możemy niekiedy otrzymać ujemne wartości rozwiązań, które są niedopuszczalne z punktu widzenia ekonomii.
MODELE LINIOWE I ALGEBRA MACIERZY 113
Inna definicja rzędu macierzy Rząd macierzy A był wcześniej zdefiniowany jako maksymalna liczba niezależnych wierszy A. Wobec związku między niezależnością wierszy i niezerowaniem się wyznacznika, możemy zdefiniować rząd macierzy m x n w nowy sposób, jako maksymalny stopień niezerowego wyznacznika utworzonego z wierszy i kolumn tej macierzy. Rząd dowolnej macierzy jest jednoznacznie określoną liczbą. Oczywiście rząd może być równy co najwyżej m lub n, tej z dwu liczb, która jest mniejsza, ponieważ wyznacznik jest zdefiniowany jedynie dla macierzy kwadratowej, a największy możliwy wyznacznik (równy zero lub nie), utworzony z elementów macierzy o wymiarze — powiedzmy — 3 x 5 , będzie miał stopień 3. Symbolicznie można to wyrazić w następujący sposób: r(A) < min{m, n}, co czytamy: „rząd A nie przekracza minimum zbioru dwu liczb m i n” . Rząd dowolnej nieosobliwej macierzy A stopnia n musi być równy n\ w tym przypadku możemy napisać r (A) = n. Niekiedy może być potrzebny rząd iloczynu dwu macierzy. Stosujemy wtedy następującą regułę: r(AB)
Ćwiczenie 5.3 2 1. Dla wyznacznika
2*! + 4*2 + -2 * 2 -
*3 *3
= 0, =2
-3 4 -2
-3 1 -1
(a)
sprawdzić pierwsze cztery własności wyznaczników.
9 27
9 0
18 56
18 ; 2
1 27 = 18 2 2
9 4
(b)
3 1
4. Sprawdzić, czy następujące macierze są nieosobliwe:
(a)
4 0 1 19 1 3 ; 5 4 7
(c)
7 -1 0 1 1 4 13 -3 - 4
-2 6 0
(d)
7 3 10
4 (b) -5 7
=- 8 * 0 .
Wynika stąd, że jednoznaczne rozwiązanie rzeczywiście istnieje.
3
3. Które własności wyznaczników pozwalają napisać, że:
ma jednoznaczne rozwiązanie? Wyznacznik macierzy współczynników tego układu |A| jest równy: 7 2 0
1
3
2. Wykazać, że gdy wszystkie elementy wyznacznika | A| stopnia n pomnożymy przez liczbę k, wynik będzie równy kP |A|. X
Przykład 9. Czy układ równań: 7*1 - 3*2 - 3*3 = 7,
0
1
5.
1 0 ;
9 0 8
5 1 6
Co można powiedzieć o rzędzie każdej macierzy z poprzedniego przykładu?
8 — Postaw y...
114 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 115
6. Czy któryś z zestawów wektorów 3-elementowych może generować przestrzeń 3-wymiarową? Dlaczego tak lub dlaczego nie: ■I (a) [1 2 0], [2 3 1], [3 4 2]; (b) [8 1 3], [1 2 8], [-7 1 5 ] ? 7. Zapisać prosty model dochodu narodowego (3.23) w postaciAx = d(Y jest pierwszą zmienną wwektorze x) i sprawdzić, czy macierzwspółczynników A jest nieosobliwa.
5.4. ZNAJDOWANIE MACIERZY ODWROTNEJ Jeśli macierz A liniowego układu równań Ax = d jest nieosobliwa, to istnieje A-1 i roz wiązaniem układu będzie x = A“‘d. Nauczyliśmy się sprawdzać nieosobliwość A na podstawie warunku |A| ¿ 0 . Następne pytanie brzmi: jak można znaleźć macierz A-1, jeśli dla A jest spełniony ten warunek?
Przyczyną takiego wyniku jest traktowanie sumy iloczynów w (5.9) jako rezul tatu prawidłowego rozwinięcia względem drugiego wiersza innego wyznacznika: Oli Ql2 a 13 |A * |= a n oi2 an , który różni się od |A| jedynie drugim wierszem i którego dwa a31 a 32 a33 pierwsze wiersze są identyczne. Jako ćwiczenie proszę napisać dopełnienie algebraiczne elementów drugiego wiersza |A*| i sprawdzić, że są to dokładnie dopełnienia algebraiczne pojawiające się w (5.9) — i z prawidłowymi znakami. Ponieważ | A* | = 0 ze względu na to, że ma dwajednakowe wiersze, więc rozwinięcie z obcymi dopełnieniami algebraicznymi w (5.9) musi mieć również wartość zero. Własność VI jest spełniona dla wielomianów wszystkich stopni i odnosi się do rozwinięcia zawierającego obce dopełnienia algebraiczne odpowiadające dowolnemu wier szowi lub dowolnej kolumnie. Możemy zatem w ogólnym przypadku stwierdzić, że dla wyznacznika n-tego stopnia prawdziwe są następujące wzory:
^ ^
Rozwinięcie wyznacznika z obcymi dopełnieniami algebraicznymi
X Oij\Ci-j\ = 0 1 n l a u \C,j -\ = 0
(i* i"),
[rozwinięcie względem i-tego wiersza z dopełnieniami i'-tego wiersza]
O '* /) .
[rozwinięcie względem/-tej kolumny z dopełnienia mi j '-tej kolumny]
Zanim odpowiemy na to pytanie, omówimy inną ważną własność wyznaczników. Własność VI. Rozwinięcie wyznacznika z obcymi dopełnieniami algebraicznymi (dopełnieniami algebraicznymi innego wiersza lub innej kolumny) zawsze ma wartość zero. Przykład 1. Jeśli zapiszemy rozwinięcie wyznacznika, stosując elementy pierwszego wiersza
4 1 2 | 5 2 1 i dopełnienia algebraiczne elementów drugiego wiersza |C2i| = 1 0 3
1 2 = -3 ; 0 3
IC d =
4 2 = 10; |C » |= - 4 1 = 1, to 1 0 1 3
otrzymamy
Û11IC21I+
+ 0 1 2 IC22I+¿¡13IC23I —4 • (—3) +1 • 10 + 2 • 1 —0.
Ogólniej, zastosowanie takiego, jak w przykładzie 1, sposobu rozwinięcia wyznacznika flu Û12 a 13 z obcymi dopełnieniami algebraicznymi do wyznacznika |A| = a 2\ « 2 2 <323 da na«3!
Û32
Û33
stępującą sumę iloczynów równą zeru:
Porównajmy uważnie (5.10) z (5.8). W tym drugim wzorze (zwykłym rozwinięciu Laplace’a) indeksy dla
Odwracanie macierzy Własność VI, streszczona wzorem (5.10), może pomóc w określaniu metody odwracania macierzy, tzn. znajdowania macierzy odwrotnej. Załóżmy, że dana jest nieosobliwa macierz A stopnia n: an a2\ (5.11)
&\2 ^22
a\n &2n
A= (nXit)
(|A |* 0 ). 1 Æ/j2••• Û71/1
(5.9)
iiO ijlC y l - «u \Cï i \+ an\C-22\ + a ^ |C231-
J =i
an
a¡2 #13 an + a i2 au a32 a33
a\3 a ¡1 a i2 —a¡3 a33 ÍI31 a32
——fln ÍI12¿33 +
Ponieważ każdy element macierzy A ma dopełnienie algebraiczne |Cy |, więc można utworzyć macierz dopełnień algebraicznych, zastępując każdy element atj w (5.11) jego dopełnieniem algebraicznym |Cl;|. Taka macierz dopełnień, oznaczona C = [ |C y |], musi również być macierzą kwadratową stopnia n. Obecnie jednak bardziej interesuje nas transpozycja macierzy C. Ta transpozycja C ' jest zwykle nazywana macierzą dołączo-
116 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 117
ną A (adjoint of A) i oznaczana symbolem adj A. Macierz dołączoną zapiszemy w postaci:
(5.12)
\Cn \
-IC21I
IC12I
\C & \
...
I C/12I
|C,„|
|C y ...
\CmI
|C „ |
C' = adj A = (« X « )
Przykład 2. Znaleźć odwrotność macierzy A =
Macierze A i C ' mają wymiary pozwalające na ich mnożenie, a ich iloczyn AC' jest inną macierzą stopnia n, której każdy element jest sumą iloczynów. Za pomocą wzoru na rozwinięcie Laplace’a i własności VI iloczyn AC' może być zapisany w następującej postaci:
a\j\C\j\
i* t n
X û 2;|C iyl AC' =
2=1
j L aij\C 2j\
; =i n
Y <*lj\Cn]\
Y G2j\Cîj\
2=1
|C „| |C21| JC21I ICzzlj
adj A = Y o nj\C\j\
Y anj\C2j\ 2 = 1
|A | 0 L0
Y anj i
0
0, więc
0 -f
’
-2
0
-2
-1
3
1
[na mocy (5.8) i (5.10)]
1
0
0
0
1
o
L0
0
1J
[wyłączenie czynnika]
Ponieważ wyznacznik | A) jest liczbą różną od zera, więc dopuszczalne jest dzielenie obu stron równania A C' = | A| I przez | A|. Wynik jest następujący: czyli
C'
Aïx r L
Mnożąc obie strony ostatniej równości z lewej strony przez A 1 i korzystając z tego, że C' A-1 A = I, otrzymujemy — = A" , czyli: |A | (5.13)
. Ponieważ |A | = —2
3
A
1
= l ïa d jA = - 2
0
-1
-2
3
|A|J
0
= |A|
^1A I = 1 ,
2
więc odwrotność A-1 można zapisać jako:
J =1
0
0 |A|
0
1
Zwróćmy uwagę na znała minus postawione przy 1 i 2, tak jak jest to wymagane dla dopełnień algebraicznych. Transpónowanie macierzy dopełnień daje:
Y 02j\C„j\ 2=1
(flX n )
Ć 2=l
3
istnieje macierz odwrotna A-1. Dopełnienie algebraiczne każdego elementu jest w tym przypadku wyznacznikiem 1 x 1 , który jest równy po prostu elementowi wyznacznika (tzn. |fly| 2=a,j). Wobęc tego mamy: C=
n
2=1
wykonujemy wtedy i tylko wtedy, gdy |A | ^ 0, bo dla |A | = 0 odwrotność w (5.13) nie jest określona); (2) znalezienie dopełnień algebraicznych wszystkich elementów macierzy A i ustawienie ich w macierz dopełnień C = [|CfJj]; (3) znalezienie transpozycji macierzy C, czyli adj A; (4) podzielenie adj A przez wyznacznik |A|. Wynikiem będzie poszukiwana macierz A“1.
A ' = — = ad jA . JA |
[z (5.12)]
Znaleźliśmy więc metodą odwracania macierzy A! Ogólna procedura znajdowania macierzy odwrotnej do danej kwadratowej macie rzy A obejmuje zatem następujące działania: (1) znalezienie |A | (następne działania
4 1 -1 Przykład 3. Znaleźć odwrotność macierzy B = 0 . 3 2 . Ponieważ |B | = 99 * 0, więc 3 0 .7 istnieje również macierz odwrotna B"1. Macierz dopełnień algebraicznych jest równa: 3
2
0
2
0
3
0
7
3
7
3
0
1 -1
4
-1
4
1
0
7
3
7
3
0
1 -1
4
-1
4
1
3
0
2
0
3
2
Wobec tego: adj B =
21 6 -9
-7 31 3
5 -8 12 J
‘21 6 7 31 = . 5 - 8
-9 3 12
118 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 119
i szukana macierz odwrotna jest równa:
B 1 = — adj B = — jB | J 99
'21 6 -9
-7 31
5' -8 . 3 12 _
Czytelnik może sprawdzić, że wyniki powyższych dwu przykładów spełniają odpowied nio równości AA-1 = A-1A = I oraz BB_1 = B ‘B - I.
5.5. WZÓR CRAM ERA Omówiony sposób odwracania macierzy pozwala nam na wyprowadzenie praktycznej metody rozwiązywania układu równań liniowych, znanej jako wzór Cramera.
Wyprowadzenie wzoru Rozwiązanie danego układu równań Ax = d, gdzie A jest macierzą stopnia n, można zapisać w postaci: x = A -‘d =
Ćwiczenie 5.4
|A|
(adj A) d,
[ze wzoru (5.13)]
pod warunkiem, że A jest nieosobliwa. Zgodnie z (5.12) oznacza to, że: x¡ X2
1. Załóżmy, że rozwijamy wyznacznik czwartego stopnia względem trzeciej kolumny i dopełnień algebraicznych elementów drugiej kolumny. Jak zapiszemy powstałą sumę iloczynów w notacji Z? Jaka będzie suma iloczynów w notacji Z, jeśli rozwiniemy wyznacznik względem drugiego wiersza i dopełnień algebraicznych elementów czwartego wiersza?
1
(b) B =
2
0
1
1
0
9
2
(c) C =
(d) D =
7
7
3
-1
7
6
0
3
. ••
IC 2 2 I
••
IC ul
.
K M ir P*1" d2
|C „ 2|
d„_
di |C n | + d2 \C2\\ + ...+ d n |C„[|
1 5
|C 2I|
.IC u l
2. Znaleźć odwrotność każdej z następujących macierzy: (a) A =
IC ul | C 12|
di |Cj2|+ d 2 |C22| + ...+ d „ |C „ 2|
=|Â]
Ai \Ci„\ + d2 |C2„| + ... + dn |COT| >1 n
3. a. Wzorując się na odpowiedziach do poprzedniego zadania, sformułować dwustopniową regułę obliczania macierzy dopełnień dla danej macierzy A stopnia drugiego. Wskazać w pierwszym działaniu, co należy zrobić z dwoma elementami głównej przekątnej macierzy A, aby otrzymać elementy głównej przekątnej adj A; w drugim, co należy zrobić z dwoma elementami A leżącymi poza główną przekątną (uwaga: reguła ta odnosi się tylko do macierzy stopnia 2). b. Zaproponować trzecie działanie, które wraz z dwoma poprzednimi prowadzi do uzyskania macierzy odwrotnej A-1 stopnia 2. 4. Znaleźć odwrotności wszystkich następujących macierzy:
-2 11 3 3 ; 0 1.
"1 0 o; (C) G = 0 0 1 0 1 0.
'1 -1 2" 0 3 ; 0 2.
"1 0 0' (d)H = 0 1 0 0 0 1.
'4 (a) E = 1 2
(b) F = 1 4
5. Czy macierz może być swą własną odwrotnością?
Y d i\C a \
1 : |Ài
Y d, | C„; j= l Przyrównując odpowiednie elementy po obu stronach równości, otrzymujemy wartości rozwiązań: (5.14)
td Ł |C „ |; |A | (=i
x2 = ~ Y d i\C i2\ |A | 1=1
(itd.).
Wyrażenia zawierające Z we wzorze (5.14) wyglądają obco. Co one oznaczają? Na podstawie wzoru (5.8) wiemy, że rozwinięcie wyznacznika |A | według wzoru Laplace’a względem pierwszej kolumny można zapisać w postaci: n
Y a,i |C,i|.
¡= i
Jeśli zastąpimy pierwszą kolumnę |A| wektorem kolumnowym d, pozostawiając wszystkie pozostałe kolumny bez zmian, to otrzymamy nowy wyznacznik, któiy możemy zapisać | Aj | — subskrypt 1 wskazuje, że to pierwsza kolumna została zastąpiona przez d.
120 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 121
Rozwinięcie |A ,| względem pierwszej kolumny (zawierającej d) jest równe wyrażeniu n X di | Cn |, gdyż elementy di zastąpiły elementy an ■Powracając do (5.14) widzimy zatem, że:
Podobnie, jeśli zastąpimy drugą kolumnę |A| wektorem kolumnowym d, zachowując wszystkie pozostałe kolumny, rozwinięcie nowego wyznacznika | A2| względem jego drugiej
Odpowiednie wyznaczniki |A | i |A; | są równe: 7 -1 -1 |A| = 10 - 2 1 = -6 1 ; 6 3 -2
|A 2| =
n
kolumny (kolumny d) daje wyrażenie X d, | C,2|. Po podzieleniu przez |A|, suma ta da wartość /=i rozwiązania x2 i tak dalej. Możemy teraz uogólnić tę procedurę. Aby znaleźć wartość rozwiązania dla /-tej zmie nnej Xj, zastępujemy po prostu /-tą kolumnę wyznacznika |A | przez wyrazy wolne d x, ..., d„, aby utworzyć nowy wyznacznik | A7|, a potem dzielimy | Ay| przez pierwotny wyznacznik | A|. Rozwiązanie układu Ax = d może zatem być wyrażone jako:
1 IA/l *, = 777 = |A| |A|
(5.15)
au
#12
a 2i
Qz2
•••
d/il
Cln2 •"
d\
...
a in
d2
...
&2n
dn —
Cli
0 -1 |A j| = 8 - 2 7 3
7 0 -1 10 8 1 = -183; 6 7 -2
1a 3 i =
7 10 6
-1 1 = -6 1 ; -2 -I -2 3
0 8 = -244, 7
zatem rozwiązania dla niewiadomych są równe:
_
IA.l IA | |A 3|
x } = -
-6 1
^
-6 1 -2 4 4 - = 4. -6 1
|A 2|
-183
IA |
-61
= 3;
*2 =
'Zauważmy, że w każdym z tych przykładów |A |^ 0 . Jest to konieczny warunek stosowania wzoru Cramera, podobniejak istnienia macierzy odwrotnej A-1. Wzór Cramera jest oparty na pojęciu macierzy odwrotnej, mimo iż w praktyce omija proces odwracania macierzy.
|/-ta kolumna zastąpiona jest przez d] Wynik (5.15) jest sformułowaniem wzoru Cramera. Zauważmy, że podczas gdy metoda wykorzystująca odwrotność macierzy daje rozwiązania dla wszystkich zmiennych endogenicznych jednocześnie (x jest wektorem), wzór Cramera pozwala na obliczenie rozwiązania za każdym razem tylko dla jednej zmiennej endogenicznej (*,■jest skalarem).
Uwagi o jednorodnych układach równań Rozważany powyżej układ równań Ax = d mógł jako elementy wektora d zawierać dowolne stałe. Jeśli natomiast d = 0, czyli di = d2 = ... =d„ = 0, to układ równań przyjmuje postać: Ax = 0,
Przykład 1. Znaleźć rozwiązania układu równań: 5*1 + 3*2 = 30, 6*i-2*2 = 8. Współczynniki i wyrazy wolne dają następujące wyznaczniki: IA| =
5
3
6
-2
= -2 8 ;
|A ,| =
|A2| =
30
= -8 4 ;
8 5
30
6
8
= -140.
. |A2| -1 4 0 ' • = i * r ^ r 5-
Przykład 2. Znaleźć rozwiązania układu równań: 7 * i- *2- *3 = 0, 10*1- 2*2+ *3 = 8, 6*i + 3*2 - 2*3 = 7.
x = A-1
(n x l)
Wobec tego na mocy (5.15) możemy napisać:
. IAiI -84 * = i A r = H =3;
gdzie 0 oznacza wektor zerowy. Ten szczególny układ nazywamy jednorodnym układem równań2. JeśU macierz A jest nieosobliwa, to jednorodny układ równań może mieć jedynie „rozwiązanie trywialne” , mianowicie *i = *2 = ... = *„ = 0. Wynika to z faktu, że równanie x = A_1d przyjmuje w tym przypadku postać: 0 =0.
( n x n )(/ix l)
(n x l)
Można również wyprowadzić ten wynik Ze wzoru Cramera. Z faktu, że d = 0 wynika, że dla każdego / wyznacznik | A,) musi zawierać kolumnę złożoną z samych zer, zatem okazuje się, że rozwiązanie jest równe: |A,I
0
« - «
*
Jest interesujące, że jedyna możliwość otrzymania nietrywialnegó rozwiązania jednorod2 Słowo .jednorodny’’ określa własność, która sprawia, że jeśli wszystkie zmienne *i *„ pomnożymy przez tę samą liczbę, to układ równań będzie Wciąż spełniony. Jest tó możliwe tylko wtedy, gdy wszystkie wyrazy wolne (te, które nie są przypisane do iksów) są równe zeru.
MODELE LINIOWE I ALGEBRA MACIERZY 123
122 ANALIZA STATYCZNA
nego układu równań występuje wtedy, gdy | A | = 0, czyli gdy macierz współczynników A jest osobliwa! Mamy wtedy:
- JĄjl = P |A |
0 ’
gdzie wyrażenie ^ nie równa się zeru, lecz jest nieokreślone. Wskutek tego nie można stosować wzoru Cramera. Nie oznacza to, ze nie można otrzymać rozwiązania, lecz jedynie, że nie da się uzyskać rozwiązania jednoznacznego. Rozważmy jednorodny układ równań: (5.16)
Pierwsza możliwość jest taka, że układ ma jednoznacznie określone, nietrywialne rozwiązanie. Taki rezultat może wystąpić tylko wtedy, gdy mamy niejednorodny układ równań z nieosobliwą macierzą współczynników A. Drugi możliwy rezultat, czyli jednoznaczne rozwiązanie trywialne, dotyczy układu jednorodnego z nieosobliwą macierzą A. Trzecia możliwość to istnienie nieskończenie wielu rozwiązań. Ta ewentualność jest związana wyłącznie z układem, w którym równania są zależne (tzn. w którym występują zbędne równania). W zależności od tego, czy układ jest jednorodny, rozwiązanie trywialne może należeć lub nie należeć do nieskończonego zbioru rozwiązań. W końcu sprzeczny układ równań nie ma wcale rozwiązań. Z punktu widzenia osoby budującej model najbardziej pożytecznym i pożądanym przypadkiem jest, oczywiście, jednoznaczne nietrywialne rozwiązanie x * 0 .
ZZl 1*1 + Ui2*2 = 0 , ^21 -*1
^
22-*2
—
0
*
Oczywiście *! = * 2 = 0 jest rozwiązaniem, ale trywialnym. Załóżmy teraz, że macierz współczynników A jest osobliwa i że | A | = 0. Wynika stąd, że wektor wierszowy [an al2] jest wielokrotnością wektora wierszowego [1221 « 22 ] ; w rezultacie jedno z dwu równań jest zbędne. Gdy wyrzucimy np. drugie równanie z (5.16), wówczas otrzymamy ostatecznie jedno (pierwsze) równanie z dwiema niewiadomymi, którego rozwiązaniem jest *1 = (—al2/a n )* 2- Rozwiązalne to jest nietrywialne i jest dobrze określone, jeśli a n 3*0, ale w rzeczywistości reprezentuje ono nieskończenie wiele rozwiązań, gdyż każdej możliwej wartości *2 odpowiada wartość *1 taka, że para tych wartości tworzy rozwiązanie. Zatem dla tego jednorodnego układu równań nie istnieje jednoznaczne nietrywialne rozwiązanie. To ostatnie stwierdzenie jest prawdziwe ogólnie dla przypadku «-wymiarowego.
Rezultaty dotyczące rozwiązań liniowych układów równań Prezentacja rozmaitych wariantów układów równań liniowych Ax = d pokazuje, że możliwe są aż cztery różne rodzaje rezultatów dotyczących rozwiązań. Dla umożliwienia lepszego przeglądu tych wariantów wymieniamy je w tabl. 5.1. Tablica 5.1 Wyniki dotyczące rozwiązań dla układu równań liniowych Ax = d ~~~ ~~— Wyznacznik | A |
Wekt or d :— .
d*0 (układ niejednorodny)
d=0 (układ jednorodny)
|A |* 0 . (macierz A jest nieosobliwą)
istnieje jednoznaczne nietry wialne rozwiązanie x*0
istnieje jednoznaczne rozwią zanie trywialne x=0
równania zależne
istnieje nieskończenie wiele rozwiązań (nie ma wśród nich rozwiązania trywial nego)
istnieje nieskończenie wiele rozwiązań (w tym rozwią zanie trywialne)
równania sprzeczne
nie istnieje żadne rozwiąza nie
nie dotyczy
1A | = 0 (macierz A jest osobliwa)
Ćwiczenie 5.5 1. Zastosować wzór Cramera do rozwiązania następujących układów równań: (a) 3*1- 2*2= 11, (c) 8* i - 7*2 = -6 , 2*i+ *2=12; * i+ *2 = 3; (b)
- * i + 3 * 2 = -3 , 4 * i- *2=12;
(d) 6*1 + 9*2=15, 7 * i-3 * 2 = 4.
2. Dla każdego układu równań z poprzedniego zadania znaleźć macierz odwrotną do macierzy współczynników i obliczyć rozwiązanie zę wzoru x = A- 1d. 3. Za pomocą wzorów Cramera rozwiązać następujące układy równań: (a) 8* i - * 2 =15, (c) 4* + 3y - 2z = 7, *2 + 5*3= 1, *+. y =5, 2*i + 3 *3 = 4; 3* + z = 4; (b) -*1 + 3*2 + 2*3 = 24, *i + *3= 6 , 5*2- *3= 8;
(d) - x + y + z = a, x - y + z = b, x + y - z = c.
4. Pokazać, że wzór Cramera może być wyprowadzony w inny sposób za pomocą następującej procedury: mnożymy obie strony pierwszego równania układu Ax = d przez dopełnienie algebraiczne [Cv], mnożymy obie strony drugiego równania przez dopełnienie algebraicz ne [C2j] itd. Dodajemy wszystkie tak otrzymane równania. Następnie indeksowi j na dajemy kolejno wartości 1, 2, . .. ,n i otrzymujemy wartości rozwiązań *i, *2, ...,*„ określone wzorem (5.14).
5.6. ZASTOSOWANIE DO MODELI RYNKU I DOCHODU NARODOWEGO Proste modele równowagi, takie jak omówione w rozdz. 3, można z łatwością rozwiązywać, stosując wzór Cramera lub odwrotność macierzy.
124 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY
Model rynku
a wektor kolumnowy stałych (danych wielkości) jest równy:
Model dotyczący dwu dóbr, opisany w (3.12), można (po wyeliminowaniu zmiennych oznaczających ilości) zapisać jako układ dwu równań liniowych, tak jak w (3.13'): ClPi + c2P2 = - c 0,
¡o + Go a Zauważmy, że sumę 70 + G0 traktujemy jako pojedynczą wartość, tzn. jako jeden element wektora stałych. Wzór Cramera natychmiast prowadzi do następujących rozwiązań:
-
y\P \ + y iP i= - 7 n . Trzy potrzebne wyznaczniki:— | A | , | Ai | i | A21— mają następujące wyrtości: IA I =
Cl
c2
yi 72
-C o
7i
-7 o
= - c i y 0 + c0yi.
C=
-1
a
1
1
-1
-b
1
Y=
= c, y2 - c2 / i ,
Cl
+ G0)
(/o
_ c0 c2 IAi I = = - C o 72 + C2 7 o. -7 o 72 |A 2| =
125
/o + Go + a 1- b
-1
(70 + G0)
-b
a
a + b Go + Go)
1
-1
1-b
-b
1
Wobec tego ceny równowagi muszą być równe: IAi I Pi =
c2 y0 - c0 72 ci y2 - c2 yi
Pi = -
Cq7 i - C i 7 o ci y2 - c27 i
i są to dokładnie te same wartości, które otrzymaliśmy w (3.14) i (3.15). Wartość równowagi można znaleźć, jak poprzednio, podstawiając P \= P \ \ P2 = P2 do funkcji popytu i podaży.
Proszę zwrócić uwagę, że wartości otrzymanych rozwiązań są identyczne z wartościami podanymi w (3.24) i (3.25). Spróbujmy teraz rozwiązać model, odwracając macierz współczynników. Ponieważ macierzą współczynników jest A = zatem mamy adj A =
Model dochodu narodowego
1
1
b
1
Y = C + Io + Go, C =a+ bY
(a> 0;
0 < b < l);
po uporządkowaniu można ję przedstawić w postaci: 7 - C = /o + G 0 ,
-b Y + C = d tak, aby zmienne endogenicźne Y i C występowały tylko j)0 lewej stronie znaków równości, a z m i e n n e egżogeniczne i wyraz wolny jedynie po prawej stronie. Macierz Współczynników przyjmuje teraz postać: 1 -b
-1 1
A 1=
1
, więc jej macierzą dopełnień będzie
1 b 1
1
Wynika stąd, że macierz odwrotna jest równa:
1
Prosty model dochodu narodowego cytowany w (3.23) można również rozwiązać, stosując wzór Cramera. Tak jak napisano w (3.23), model składa się z następujących dwu równań współzależnych:
1 -1 -b
1 1 adj A = ------b 1AI 1-b
1 1
Wiemy, że rozwiązanie układu równań Ax = d można wyrazić jako x = A ‘d. W od niesieniu do naszego modelu oznacza to, że:
V ć
i
i
i -b
b
1 1
Io + Go a
1 1- b
Io + G0 + a b (Io + Go) + a
Można z łatwością zauważyć, że jest to takie samo rozwiązanie, jak otrzymane poprzednio.
Algebra macierzy kontra eliminacja zmiennych Omówione powyżej modele ekonomiczne składały się zaledwie z dwu równań, więc obliczaliśmy wyznaczniki tylko drugiego stopnia. Dla dużych układów równań pojawiają się wyznaczniki wyższych stopni i ich obliczanie może nie być łatwe. Również odwracanie
126 ANALIZA STATYCZNA
dużych macierzy nie jest proste. Z punktu widzenia obliczeniowego odwracanie macierzy i wzór Cramera nie muszą być bardziej efektywne niż metoda kolejnej eliminacji zmiennych. Jeśli tak, to można zapytać, po co w ogóle używać metod macierzowych? Otóż — jak widzieliśmy na poprzednich stronach — algebra macierzy służy do zwartego zapisu dowolnego układu równań i zapewnia ponadto kryterium wyznacznikowe sprawdzania, czy istnieje jednoznaczne rozwiązanie.. Są to zalety nieosiągalne w inny sposób. Ponadto, w przeciwieństwie do metody eliminacji zmiennych, która nie umożliwia analitycznego wyrażenia rozwiązań, metoda odwracania macierzy i wzór Cramera dają’wygodne wyrażenia dla rozwiązań x = A“‘d i Xj = | A; | / |A |. Takie analityczne wzory są pożyteczne nie tylko dlatego, że stanowią skrótowy zapis rzeczywistej procedury obliczeniowej, lecz również dlatego, że umożliwiają, jeśli jest to potrzebne, wykonywanie następnych operacji matematy cznych na tak zapisanych rozwiązaniach. W pewnych okolicznościach, np. wtedy, gdy zadanie polega na jednoczesnym rozwiązaniu wielu układów równań mających identyczną macierz współczynników A i różne wektory wyrazów wolnych, metody macierzowe mogą mieć przewagę. Metoda eliminacji zmiennych wymagałaby powtarzania procedury obliczeniowej kolejno dla każdego układu równań. Przy użyciu metody odwracania macierzy znajdujemy natomiast wspólną macierz odwrotną A '1 tylko raz; potem wszystkie wektory wyrazów wolnych należące do rozpatrywanych układów równań mnożymy z lewej strony przez tę samą macierz odwrotną i w ten sposób otrzymujemy rozwiązania. Takie właśnie ułatwienie obliczeń będzie miało dla nas duże znaczenie praktyczne przy rozważaniu w następnym podrozdziale rozwiązań modeli Leontiewa nakładów i wyników.
Ćwiczenie 5.6 1. Rozwiązać model dochodu narodowego z ćwiczenia 3.5-1: (a) za pomocą odwracania macierzy; (b) według wzoru Cramera (zmienne ustawić w kolejności Y ,C ,T ) . 2, Rozwiązać model dochodu narodowego z ćwiczenia 3.5-2: (a) metodą odwracania macierzy; (b) według wzoru Cramera (zmienne ustawić w kolejności Y, C, G).
5.7. MODELE NAKŁADÓW I WYNIKÓW LEONTIEWA W wersji „statycznej” analiza nakładów i wyników przeprowadzona przez profesora Leontiewa3 umożliwia podanie odpowiedzi na następujące pytanie: „jaki powinien być poziom produkcji każdej z n gałęzi gospodarki, aby całkowity popyt na wytwarzane przez nie produkty był zaspokojony” ?
3 Wassily W. Leontief, The Structure o f American Economy 1919-1939,2d éd., Oxford University Press, Fair Lawn, N.J. 1951.
MODELE LINIOWE I ALGEBRA MACIERZY 127
Nazwa analiza nakładów i wyników jest uzasadniona. Wyniki produkcji każdej gałęzi (np. przemysłu stalowego) są potrzebne jako nakłady w wielu innych gałęziach i być może nawet w tej samej gałęzi; wobec tego „prawidłowy” (tzn. nie powodujący niedoboru i wolny od nadwyżek) poziom produkcji (np. stali) będzie zależny od zapotrzebowania na nakłady (na stal) we wszystkich gałęziach. Produkcja wielu pozostałych gałęzi będzie natomiast stanowić nakłady dla przemysłu stalowego, więc „prawidłowe” poziomy produkcji innych produktów będą z kolei zależne częściowo od zapotrzebowania przemysłu stalowego. Ze względu na te wzajemne zależności, każdy zbiór wartości i „prawidłowych” wyników produkcji n gałęzi musi być zgodny z całym zapotrzebowaniem na nakłady w gospodarce, aby nigdzie nie pojawiały się wąskie gardła. W świetle tego staje się jasne, że analiza nakładów i wyników jest wielce przydatna w planowaniu np. produkcji, rozwoju ekonomicznego kraju lub w tworzeniu programu obrony narodowej. Ściślej rzecz biorąc, analiza nakładów i wyników nie jest rodzajem ogólnej analizy równowagi omówionej w rozdz. 3. Mimo współzależności różnych gałęzi, „prawidłowe” poziomy produkcji wynikają nie z warunków równowagi rynkowej, lecz z tego, że muszą spełniać techniczne relacje nakładów i wyników. Niemniej jednak zagadnienie postawione w analizie nakładów i wyników również sprowadza się do rozwiązania układu współzależnych równań, gdzie można ponownie zastosować algebrę macierzy.
Struktura modelu nakładów i wyników Ponieważ model nakładów i wyników obejmuje zazwyczaj wiele gałęzi, więc z konieczności ma raczej skomplikowaną strukturę. Aby uprościć zagadnienie, przyjmuje się z reguły następujące założenia: 1) każda gałąź wytwarza tylko jeden jednorodny produkt (w szerszej interpretacji dopuszczamy przypadek dwu lub więcej dóbr wytwarzanych łącznie, pod warunkiem, że są one produkowane w' stałych proporcjach); 2) każda gałąź zużywa do produkcji nakłady jednego czynnika (lub kombinacji czynników w ustalonej proporcji); 3) produkcja każdej gałęzi charakteryzuje się stałymi przychodami, tak więc ¿-krotna zmiana ilości wszystkich nakładów spowoduje dokładnie ¿-krotną zmianę wielkości produkcji. Założenia te są oczywiście nierealistyczne. Korzystne przy tym jest to, że jeśli pewna gałąź wytwarza dwa różne towary lub stosuje dwie różne kombinacje czynników, to można tę gałąź — przynajmniej pojęciowo — podzielić na dwie osobne gałęzie. Z założeń tych wynika, że zapotrzebowanie na nakłady i-tego produktu, potrzebne do wytworzenia każdej jednostki j -tego produktu, jest ustaloną wielkością, którą oznaczymy a:j. W szczególności produkcja każdej jednostki j -tego dobra wymaga zużycia (ilości) pierwszego dobra, a2] drugiego dobra, . . . , anj n-tego dobra (łatwo zapamiętać kolejność indeksów w atj\ pierwszy indeks odnosi się do nakładu, a drugi do produktu, tak więc mówi, jaka ilość i-tego dobra jest zużywana do produkcji każdej jednostki j -tego dobra).' Dla naszych celów będziemy zakładać, że ceny są ustalone, czyli jako jednostkę każdego dobra przyjmiemy „ilość” wartą dolara. Wtedy zapis an = 0,35 będzie oznaczać, że ilość trzeciego dobra o wartości 35 centów jest potrzebna do wyprodukowania takiej ilości drugiego dobra, która jest warta dolara. Symbol a:j będzie nazywany współczynnikiem nakładów. Dla gospodarki o n gałęziach współczynniki nakładów tworzą macierz A = [a,j], jak w tabl. 5.2, w której każda kolumna wyznacza zapotrzebowanie na nakłady potrzebne do produkcji jednostki produktu danej gałęzi. Na przykład z kolumny drugiej wynika, że do
MODELE LINIOWE I ALGEBRA MACIERZY 129
128 ANALIZA STATYCZNA
wyprodukowania jednostki (czyli ilości wartej dolara) dobra Et potrzebne są nakłady: a i2 jednostek dobra I, an jednostek dobra II itd. Tablica 5.2 Macierz współczynników nakładów
I
+ O i2 * 2 + . . . +
0 \ n X„ + d l ,
czyli: (1 —Z(ll)xi —<212X2 - ... —ai„X„= dl,
Wyniki N a k ła d y
T l — O li j ą
I
n
. ‘
m 013^
'
, N ain
•
0n
012
n
a2\
022
ni
031
032
033
03/t
N
0nl
0„2
0n3
0/i/r
•
023
■-
■
02rt
Jeśli żadna gałąź nie używa swego własnego produktu jako nakładu, to wszystkie elementy głównej przekątnej macierzy A będą równe zeru.
gdzie di oznacza popyt końcowy na jej produkt, a alJxJ reprezentuje popyt na nakłady ze strony y-tej gałęzi4. Zauważmy, że poza pierwszym współczynnikiem (1 - a n ), wszystkie pozostałe w ostatnim równaniu są wzięte bezpośrednio z pierwszego wiersza tabl. 5.1, tyle że opatrzono je znakiem minus. Podobnie, odpowiednie równanie dla gałęzi II będzie miało takie same współczynniki, jak w drugim wierszu tabl, 5.1 (znów z dodanymi znakami minus), z tą różnicą, że współczynnik przy zmiennej x2 będzie równy (1 - 022). a nie -a-a. Dla wszystkich n gałęzi, .prawidłowe’’ poziomy produkcji mogą być zapisane w postaci następującego układu n równań liniowych: (l-O n )* i
(5.17)
-On 1*1
Model otwarty Jeśli model oprócz n gałęzi zawiera również sektor „otwarty” (np. gospodarstwa domowe), który określa egzogeniczny popyt końcowy (popyt nie na nakłady) na produkcję każdej gałęzi i dostarcza pierwotnych nakładów (np. siły roboczej) nie wytwarzanych przez n gałęzi, to takt model nazywamy modelem otwartym. Ze względu na obecność sektora otwartego suma elementów każdej kolumny macierzy współczynników nakładów A (lub w skrócie macierzy nakładów A) musi być mniejsza od 1. Każda suma elementów kolumny przedstawia częściowy koszt nakładów (nie obejmujący kosztu pierwotnego nakładu) zużytych na wyprodukowanie ilości pewnego dobra wartej dolara; jeśli ta suma jest większa lub równa 1$, to produkcja nie będzie ekonomicznie uzasadniona. Symbolicznie możemy to zapisać w następujący sposób: n £ atj < 1 0 = 1 , 2 , .. ., n), 1= 1
gdzie sumowanie jest względem i, tzn. sumujemy elementy pojawiające się w różnych wierszachy-tej kolumny. Kontynuując ten tok rozumowania, możemy stwierdzić, że ponieważ wartość produktu (1 $) musi być całkowicie „wchłonięta” przez płatności za wszystkie czynniki produkcji, więc wartość, jakiej po obliczeniu sumy brakuje do jedynki, musi reprezentować płatności za pierwotny czynnik na rzecz sektora otwartego. Zatem wartość czynnika pierwotnego niezbędnego do wyprodukowania jednostki y-tego dobra powinna być równa: n i- £ >=1 Jeśli gałąź I ma wytwarzać ilość produktu dokładnie równą zapotrzebowaniu n gałęzi i popytowi końcowemu sektora otwartego, to jej poziom produkcji musi spełniać następujące równanie:
- 0 1 2 * 2 -...'
-O 21 *1 + ( 1 - 022)*2- ...
- a u x„ = du - a 2„x„ = d1.
- a „2 *2- ... + (1 - a m)x„ = d„.
W zapisie macierzowym można to przedstawić jako:
(5.170
(1 - a n )
- 0 i2
— 021
(1 — 022)
tZ„i
ain -a ^
~a„ 2 . • ( 1 - 0
*1 *2
*„
' =
'
d2 dn
Gdybyśmy pominęli jedynki na głównej przekątnej macierzy po lewej stronie, wówczas pozostałaby po prostu macierz - A = [—%]': Macierz (5.170 jest sumą macierzy jednostko wej I„ (z jedynkami na głównej przekątnej i zerami poza nią) i macierzy -A . Zatem można ją również zapisać w postaci: \ ‘\ (5.17") ( I - A ) x = d, gdzie x i d są odpowiednio wektorem niewiadomych i wektorem końcowego popytu (wyrazów wolnych). Macierz (I - A) jest nazywana macierzą współczynników technologicz nych i oznaczana symbolem T. Układ może zatem być zapisany jako: (5.17"0
Tx = d.
Jeśli T jest nieosobliwa — a nie ma a priori powodu, dla którego nie miałaby być — możemy znaleźć jej odwrotność T-1 i otrzymać jednoznaczne rozwiązanie układu na podstawie równania: (5.18)
x = T ^ d = (I - A)_1d .
4 Nigdy nie dodawajcie współczynników nakładów w wierszu; taka suma, np. an + fl12+ ... +«i», nie ma sensu ekonomicznego. Natomiast suma iloczynów a ,, jr, + aa x2+ ... + ainx.taa sens ekonomicz ny; reprezentuje całkowitą ilość x t, czyli niezbędne nakłady tego czynnika dla wszystkich n gałęzi. 9 — Podstawy...
130 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 131
Przykład liczbowy Załóżmy, że gospodarka składa się tylko z trzech gałęzi i że macierz współczynników nakładów jest następująca (używamy tym razem ułamków dziesiętnych): On (5.19)
A=
an
o2i o22 a 32
_ a 31
a i3
0,2 0,3
0,2
O23 =
0,4 0,1
02
.
.0 ,1 0,3
0,2
a 33
«oi = 0,3;
£Zo2= 0 3 ;
Wobec tego konkretny popyt końcowy d =
flo3 = 0,4.
Dla macierzy A otwarty układ nakładów i wyników może być zapisany w postaci T x = ( I - A ) x = d:
(5.21)
' 0,8
-0 ,3
-0 ,4
0,9
.- o ,i
-0 ,3
- 0 ,2 -0 ,2 0,8.
'd r
"*i ‘
d2
=
*2 .* 3 .
A 3.
Celowo nie nadaliśmy konkretnych wartości popytowi końcowemu du d2 i d3. W ten sposób, dzięki pozostawieniu wektora d jako parametru, nasze rozwiązanie stanowi „wzór” , do którego możemy podstawić różne konkretne wartości d i otrzymywać odpowiadające im konkretne rozwiązania. Po odwróceniu macierzy współczynników technologicznych T rozwiązanie (5.21) może być w przybliżeniu (ze względu na zaokrąglenie ułamków dziesiętnych) podane jako: *i *2 = 7 “^ = .* 3
1 0,384
J
0,66
0,30 0,24
0,34
0,62 0,24
0,21
0,27 0,60 _
Jeśli konkretny wektor popytu końcowego (powiedzmy popyt końcowy, który jest celem programu rozwoju) jest równy np. d =
(w miliardach dolarów), to otrzymujemy
następujące konkretne wartości rozwiązań (również w miliardach dolarów): 1 Xl
0,384
(0,66 -10 + 0,39 - 5 + 0,24 - 6):
9,54 0,384
= 24,84
i podobnie: 7,94 - = 20 ,68 ; *2 = 0,384
3
YaojXj = 0,3 • 24,84 + 0,3 • 20,68 + 0,4 ■18,36 = 21,00 (mld dolarów). j=i
Suma elementów każdej kolumny macierzy A jest mniejsza od l.ta k ja k to powinno być. Ponadto, jeśli przez ay oznaczymy wartość (w dolarach) pierwotnego nakładu potrzebnego do wytworzenia /-tego dobra o wartości jednego dolara, to możemy zapisać (od jedynki odejmujemy sumę elementów każdej kolumny w (5.19)): ' (5.20)
kładu. Nasuwa się teraz pytanie, czy wymagana ilość jest zgodna z tym, co jest dostępne w gospodarce? Na podstawie (5.20) niezbędny nakład pierwotny może być obliczony w następujący sposób: -
7.05 *3 = ——— = 18,36. J 0,384
Produkcja dóbr wartości x lt x 2 i x 3 wymaga ściśle określonej ilości pierwotnego na-
będzie osiągalny wtedy i tylko wtedy,
gdy wartość dostępnych zasobów nakładu pierwotnego będzie równa przynajmniej 21 mld dolarów. Jeśli dostępne zasoby będą miały mniejszą wartość, to oczywiście trzeba będzie odpowiednio zredukować docelową wielkość produkcji. Ważną cechą powyższej analizy jest to, że dopóki współczynniki nakładów pozostają nie zmienione, dopóty macierz odwrotna T -1 = (I - A )'1 również się nie zmieni. Wobec tego wystarczy tylko raz odwrócić macierz, nawet jeśli mamy rozważać sto lub tysiąc rozmaitych wektorów popytu końcowego — jako cały zbiór możliwych celów rozwoju. Oznacza to znaczną oszczędność obliczeń w porównaniu z metodą eliminacji zmiennych, zwłaszcza jeśli zajmujemy się dużymi układami równań. Przypomnijmy, że wzór Cramera nie ma tej zalety: posługujemy się wzorem X] = \ T j \ l \ T \ , ale za każdym razem używamy innego wektora popytu końcowego, więc musimy na nowo obliczać wyznaczniki |T )|. Jest to bardziej czasochłonne niż mnożenie znanej macierzy T~l przez nowy wektor d.
Znajdowanie odwrotności przez przybliżenie Dla dużych układów równań odwracanie macierzy może być niesłychanie pracochłonne i kłopotliwe. Mimo iż komputery mogą nam w tym pomóc, wciąż jednak są potrzebne prostsze schematy obliczeń. Dla rozważanych modeli nakładów i wyników istnieje metoda znaj dowania przybliżenia odwrotności T-1 = (I - A)~‘.z dowolnym stopniem dokładności; jest zatem możliwe całkowite uniknięcie procesu odwracania macierzy. Rozważmy najpierw następujące mnożenie macierzy (m = pewna liczba dodatnia): ( I - A )(I + A + A2+ ... + A” ) = 1(1 + A + A2+ ... + A"1) - A ( I + A + A 2 + ... + A” ) = = (I + A +A2 + '... + Am) - (A + A2 + ... + Am+ A'"+1) = I - A " ,+ 1. Gdyby wynikiem mnożenia była sama macierz I, moglibyśmy przyjąć sumę macierzy (I + A + A2+ ... + A”) jako odwrotność ( I - A ) . Jednak obecność składnika - A m+l kom plikuje sytuację! Na szczęście pozostaje nam drugie wyjście, gdyż jeśliby Am+1przybliżała się do macierzy zerowej stopnia n, to I - Am+1 dążyłaby do I i zgodnie z tym wspomniana suma macierzy (I + A + A2 + ... + Am) dążyłaby do poszukiwanej odwrotności (I - A)-1. Wobec tego, gdy Am+1 będzie się przybliżało dó macierzy zerowej, wówczas możemy otrzymać przybliżoną odwrotność, dodając macierze I, A, A2, ..., Am. Czy możemy jednak spowodować, aby A” +'1 przybliżała się do macierzy zerowej? Jeśli tak, to jak to zrobić? Odpowiedź na pierwsze pytanie brzmi: tak, jeśli — co jest prawdą dla rozważanych modeli nakładów i wyników — elementy każdej kolumny macierzy A są liczbami nieujemnymi, których suma jest mniejsza niż 1, jak to pokazano w (5.19). W takich
132 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 133
przypadkach Am+1 może się przybliżać do macierzy zerowej, jeśli tylko m jest wystarczająco duże, tzn. w wyniku dostatecznie długiego procesu powtarzania mnożenia przez macierz A. Przeprowadzimy obecnie dowód tego stwierdzenia. Jeśli jest ono prawdziwe, to procedura obliczania przybliżonej odwrotności staje się jasna: możemy po prostu obliczać kolejno macierze A2, A3, ... tak długo, aż otrzymamy macierz A"l+ \ której elementy według przyjętego wcześniej kryterium są pomijalnie małe („przybliżają się do zera” ). W tym momencie przerywamy proces mnożenia, dodajemy wszystkie obliczone macierze i w ten sposób otrzymujemy przybliżoną5 odwrotność (I + A + A2 + ... + A"). Jeśli macierz A ma taką własność, że A "+1dąży do macierzy zerowej przy m dążącym do nieskończoności, to przybliżona odwrotność (I + A + A2 + ...' + A”) również ma taką włas ność, że wszystkie jej elementy są nieujemne. Pierwsze dwa składniki sumy I i A mają oczywiście tylko nieujemne elementy. Ale to samo jest ze wszystkimi potęgami A, gdyż mnożenie A przez siebie polega dokładnie na mnożeniu i dodawaniu nieujemnych elementów samej macierzy A. Ponieważ wektor popytu końcowego d również zawiera tylko elementy nieujemne, zatem na podstawie (5.18) powinno być jasne, że poziomy produkcji stanowiące rozwiązania również muszą być nieujemne. A to jest oczywiście dokładnie to, czego oczekujemy. Udowodnimy teraz twierdzenie, że dla danej nieujemnej macierzy współczynników nakładów A = [ay], której sumy elementów kolumn są mniejsze niż 1, macierz Am+1 będzie dążyć do zera, gdy m dąży do nieskończoności6. W tym celu potrzebne nam będzie po jęcie normy macierzy A, którą zdefiniujemy jako największą sumę elementów kolumny macierzy A i oznaczymy symbolem N (A). Na przykład dla macierzy (5.19) mamy N(A) = 0,7; jest to suma elementów pierwszej kolumny, jak się okazuje równa też sumie elementów drugiej kolumny. Jest oczywiście jasne, że żaden element macierzy nie może przekraczać wartości normy, tzn.: a,j =£ N (A )
(dla wszystkich i ,j) .
Dla modelu nakładów i wyników mamy N (A) < 1 i wszystkie a,j < 1. Rzeczywiście, ponieważ macierz A jest nieujemna, więc musimy mieć: 0 < N (A) < 1. W odniesieniu do norm macierzy istnieje twierdzenie mówiące, że dla danych dwu macierzy A i B (o odpowiednich wymiarach) norma iloczynu macierzy AB nie może przekraczać iloczynu N (A) i N(B): (5.22)
N (A B )< N (A )N (B ).
W szczególnym przypadku dla A = B, gdzie macierz jest kwadratową, wynik ten oznacza, że: (5.23)
N (A 2)<,[N(A)]2.
Gdy B = A2, wówczas z (5.22) i (5.23) wynika, że: N (A 3), < N (A )Ń (A 2) < N (A ) ¡7V(A)]2 = [A!(A)]3; uogólnioną wersją ostatniego wyniku jest: (5.24)
N (A m) < [N(A))m.
■ W świetle tej relacji fakt, że 0 < N (A) < 1, staje się znaczący, gdyż dla m dążącego do nieskończoności [JV(A)]m musi dążyć do zera, jeśli N (A) jest dodatnim ułamkiem. Na mocy (5.24) oznacza to, że N (A m) też dąży do zera, gdyż nie przekracza [Al (A)]“ . Jednak jeśli tak jest, to elementy macierzy Amrównież muszą dążyć do zera dla m dążącego do nieskończono ści, ponieważ żaden element ostatniej macierzy nie przekracza wartości normy N (A m). Zatem dla wystarczająco dużego m macierz Am+1 będzie przybliżeniem macierzy zerowej, jeśli spełniony jest warunek 0 < N (A) < 1.
Model zamknięty Jeśli egzogeniczny sektor modelu nakładów i wyników jest włączony do układu jako jedna z gałęzi, to model staje się modelem zamkniętym. W takim modelu nie pojawiają się końcowy popyt i pierwotny nakład; zamiast nich będziemy mieć zapotrzebowanie na nakłady i produkt nowo utworzonej gałęzi. Wszystkie dobra będą teraz z natury pośrednie, gdyż wszystko to, co jest produkowane, produkowane jest jedynie w celu zaspokajania zapotrzebowania na nakłady (n + 1) gałęzi występujących w modelu. Na pierwszy rzut oka przekształcenie otwartego sektora w dodatkową gałąź nie wydaje się powodować żadnej znaczącej zmiany. Jednak w rzeczywistości podaż tego, co stanowiło nakład pierwotny, musi teraz stanowić ustaloną proporcję tego, co było nazywane końcowym popytem, ponieważ zakłada się, że nowa gałąź ma — podobnie jak każda inna — ustaloną proporcję nakładów. Konkretniej, może to oznaczać, że np. gospodarstwa domowe będą korisumówać każde dobro w ustalonej proporcji do podaży pracy, jaką zapewniają. Stanowi to ną pewno znaczącą zmianę rozpatrywanej struktury analitycznej. Matematycznie, brak popytu końcowego oznacza, że będziemy teraz mieli jednorodny układ równań. Zakładając, że mamy tylko cztery gałęzie (w tym nową, oznaczoną inde ksem 0), „prawidłowe” poziomy produkcji, podobnie dó (5.17), będą wielkościahii spełniającymi układ równań:
5 Przybliżenie (I -A ) " 1 za pomocą (1 + A + A2+ ... + A”) jest analogiczne do przybliżenia nieskończonego szeregu:
(1
—«od) -« 1 0
(1 —r)-1 = —?— = 1 + r + r2 + ... l-r
(0 < r < 1)
przez sumę (1 + r + r2 + ... + r"). Ponieważ następne składniki szeregu stają się coraz mniejsze, więc możemy znaleźć przybliżenie (1 - r)~‘ z dowolną żądaną dokładnością, wybierając odpowiednio liczbę n. 6 Bardziej szczegółowe omówienie można znaleźć w pracy Fredericka V . Waugha, Inversion o f the Leontief Matrix by Power Series, ..Econometrica” 1950, April, str. 142-154.
>
1
—«20 —«30
- «01 (l-« u ) -«ŹJ —«31
(1
-« 0 2
+ 003
’ *0
—S l2 —a22)
^«13
*1
- «23 —« 33)
*3
-
«32
(1
*2
'O ' 0 Ô 0
Ponieważ powyższy układ równań jest jednorodny, więc może mieć hietrywińine rozwiązanie wtedy i tyiko wtedy, gdy macierz współczynników technologicznych (I - A) stopnia 4 ma wyznacznik rówrly żeru. Ten ostatni waruhek jest w praktyce zawsże spełniony.
134 ANALIZA STATYCZNA
MODELE LINIOWE I ALGEBRA MACIERZY 135
W modelu zamkniętym nie ma już nakładu pierwotnego, zatem każda suma elementów kolumny w macierzy współczynników nakładów A musi być teraz dokładnie równa (a nie mniejsza) 1, tzn. a0J + a tJ + a2J + a3J= 1, czyli: a0j = 1 - ay —ay —a3j . Wynika stąd, że w każdej kolumnie powyższej macierzy (I - A) pierwszy element jest zawsze równy liczbie przeciwnej do sumy pozostałych trzech elementów. W wyniku tego cztery wiersze są liniowo zależne i musi być 11 - A | = 0. Gwarantuje to, że układ równań ma nietrywialne rozwiązanie; w istocie, jak pokazano w tabl. 5.1, ma nieskończenie wiele rozwiązań. Oznacza to, że w modelu zamkniętym z jednorodnym układem równań nie istnieje jednoznaczny „poprawny” zestaw poziomów produkcji. Możemy wyznaczyć wzajemne proporcje poziomów produkcji x lt ale nie możemy ustalić ich wartości bezwzględnych dopóty, dopóki nie zostaną nałożone na model dodatkowe ograniczenia.
Ćwiczenie 5.7 1. Na podstawie modelu (5.21) obliczyć, jakie będą rozwiązania dla poziomów produkcji trzech gałęzi, jeśli końcowe popyty są równe: d\ = 30, d2 = 15 i d3 = 10 (mld dolarów). Wyniki zaokrąglić do dwu cyfr po przecinku. 2. Korzystając z informacji zawartej w (5.20), obliczyć całkowitą ilość pierwotnego nakładu potrzebną do wytworzenia poziomów produkcji stanowiących rozwiązania poprzedniego zadania. 3. Dla dwudziałowej gospodarki wiadomo, że: dział I do wyprodukowania dobra I o wartości 1 dolara zużywa swój produkt o wartości 10 centów i dobro II o wartości 60 centów; dział II do wytworzenia dobra II o wartości 1 dolara nie zużywa własnego produktu, tylko dobro I o wartości 50 centów; popyt sektora otwartego na I dobro wynosi.1000 mld dolarów, a na dobro II — 2000 mld dolarów. a. Zapisać macierz nakładów, macierz współczynników technologicznych, macierzowe równanie nakładów i wyników dla tej gospodarki. b. Znaleźć rozwiązanie dla poziomów produkcji za pomocą wzoru Cramera. 4. Dane są macierz nakładów i wektor popytu końcowego: 0,05
0,25
0,34
A = 0,33
0,10
0,12 ;
0,19
0,38
a. b. c. d. 5.
0
1800"
_
d=
200 900_
Wyjaśnić ekonomiczne znaczenie elementów 0,33; 0 i 200. Wyjaśnić (jeśli istnieje) ekonomiczny sens sumy elementów trzeciej kolumny. Wyjaśnić (jeśli istnieje) ekonomiczny sens sumy elementów trzeciego wiersza. Zapisać macierzowe równanie nakładów i wyników dla tego modelu.
Za pomocą wzoru Cramera znaleźć poziomy produkcji trzech gałęzi w rozwiązaniu poprzedniego żądania (odpowiedzi zaokrąglić do dwu cyfr po przecinku).
5.8. OGRANICZENIA ANALIZY STATYCZNEJ Gdy omawialiśmy równowagę statyczną na rynku lub dla dochodu narodowego, głównym naszym zadaniem było znalezienie wartości równowagi zmiennych endogenicznych wy stępujących w modelu. Podstawowym problemem, który ignorowaliśmy przy takiej analizie, był rzeczywisty proces dostosowania i ponownego dostosowywania zmiennych prowadzący ostatecznie do stanu równowagi (jeśli jest on w ogóle osiągalny). Pytaliśmy tylko o to, dokąd mamy dojść, ale nie o to, kiedy to się stanie lub co może się wydarzyć po drodze. Statyczna analiza nie zdołała wobec tego objąć dwu ważnych problemów. Pierwszy z nich polega na tym, że ponieważ proces dostosowania zmiennych może wymagać długiego czasu, więc poziom równowagi określony w pewnych ramach analizy statycznej może przestać być odpowiedni — zanim jeszcze zostanie osiągnięty — jeśli w tym czasie zmienne egzogeniczne modelu podlegały pewnym zmianom. Jest to problem przesunięć stanu równowagi. Drugi problem polega na tym, że nawet wówczas, gdy proces dostosowania przebiega bez zakłóceń, stan równowagi rozważany w analizie statycznej może być zupełnie nieosiągalny. Będzie to przypadek tzw. równowagi niestabilnej, która charakteryzuje się tym, że proces dostosowania będzie oddalał wartości zmiennych coraz dalej od tego stanu równowagi. Pominięcie procesu dostosowania oznacza wobec tego abstrahowanie od problemu osiągalności równowagi. Przesunięcie poziomu równowagi (w wyniku zmian wartości zmiennych egzogenicznych) to problem, którym zajmuje się statyka porównawcza, a badanie osiągalności i stabilności rozwiązania należy do analizy dynamicznej. Każda z tych dziedzin wypełnia oczywiście istotną lukę w analizie statycznej i wobec tego konieczne jest ich poznanie. Problematykę analizy dynamicznej omówimy w części 5 książki, a obecnie zajmiemy się statyką porównawczą.
CZĘŚĆ
TRZECIA ANALIZA STATYKI PORÓWNAWCZEJ
6. STATYKA PORÓWNAWCZA I POJĘCIE POCHODNEJ
Rozdział ten i dwa następne będą poświęcone metodom analizy statyki porównawczej.
6.1. NATURA STATYKI PORÓWNAWCZEJ Statyka porównawcza zajmuje się porównywaniem różnych stanów równowagi związanych z różnymi zbiorami wartości parametrów i zmiennych egzogenicznych. Takie porównanie zaczynamy zawsze od założenia, że dane jest początkowe położenie równowagi. Na przykład w modelu iynku izolowanego początkowa równowaga będzie reprezentowana przez określoną cenę P i odpowiadającą jej ilość Q. Podobnie w prostym modelu dochodu narodowego (3.23) początkowa równowaga będzie wyznaczona przez określony F i odpowiadającą mu C. Jeśli natomiast pozwolimy, aby w modelu nastąpiła zmiana wartości pewnego parametru lub zmiennej egzogenicznej, to początkowa równowaga zostanie oczywiście naruszona. W rezul tacie różne zmienne endogeniczne będą musiały ulec pewnym dostosowaniom. Jeśli zakłada się, że nowy stan równowagi odpowiadający nowym wartościom danych może być określony i osiągnięty, to zadaniem analizy statyki porównawczej jest udzielenie odpowiedzi na pytanie: jaka będzie nowa równowaga w porównaniu ze starą? Należy zauważyć, że w statyce porównawczej ponownie pomijamy proces dostosowania zmiennych; porównujemy po prostu początkowe położenie równowagi (przed zmianą) z końcowym (po zmianie). Wykluczamy również ponownie możliwość niestabilności położenia równowagi. Zakładamy, że nowa równowaga jest osiągalna tak samo, jak i dawna. Analiza statyki porównawczej może mieć naturę jakościową lub ilościową. Jeśli np. interesuje nas tylko wpływ wzrostu inwestycji 70 na zwiększenie lub zmniejszenie dochodu równowagi ?, to będziemy mieli do czynienia z analizą jakościową, gdyż rozważany będzie jedynie kierunek zmian. Jeśli natomiast zajmujemy się wielkością zmiany ? spowodowanej przez daną zmianę 70 (tzn. wielkością mnożnika inwestycyjnego), to analiza będzie oczywiście ilościowa. Jeśli jednak otrzymamy odpowiedź ilościową, to na podstawie jej znaku możemy
140 ANALIZA STATYKI PORÓWNAWCZE]
automatycznie określić kierunek zmian. Zatem analiza ilościowa zawsze obejmuje jakoś ciową. Rozważany problem dotyczy zasadniczo znalezienia stopy zmian wartości równowagi zmiennej endogenicznej względem zmiany pewnego parametru lub zmiennej egzogenicznej. Z tego względu matematyczne pojęcie pochodnej ma ogromne znaczenie w statyce porównaw czej, ponieważ pojęcie to — najbardziej podstawowe w rachunku różniczkowym — bezpośred nio dotyczy pojęcia stopy zmian! Co więcej, jak później zobaczymy, pojęcie pochodnej jest niezmiernie ważne również w przypadku zagadnień związanych z optymalizacją.
6.2. STOPA ZMIAN I POCHODNA Mimo że na tym etapie rozważań interesują nas przede wszystkim stopy zmian wartości równowagi zmiennych modelu, to zajmiemy się także stopą zmian dowolnej zmien nej y spowodowanych zmianą innej zmiennej x, gdy obie te zmienne są związane zależnością funkcyjną y = f(x). W ujęciu statyki porównawczej zmienna y będzie reprezentować war tość równowagi zmiennej endogenicznej, a x będzie pewnym parametrem. Zaczynamy od prostego przypadku, gdy w modelu jest jeden parametr lub zmienna egzogeniczna. Przejście do przypadku o większej liczbie parametrów okaże się dość łatwe.
STATYKA PORÓWNAWCZA I POJĘCIE POCHODNEJ 141
i może być obliczony, jeśli to i A t są dane. Niech to = 3 i A t = 4; wtedy średnia stopa zmian y będzie równa 6 • 3 + 3 ■4 = 30. Oznacza to, że przeciętnie, gdy t zmienia się z 3 ńa 7, wówczas zmiana y przypadająca na jednostkę zmiany t jest równa 30 jednostkom.
Pochodna Często interesuje nas stopa zmian y, gdy A t jest bardzo małe. W takim przypadku można otrzymać przybliżenie Ay/At, pomijając wszystkie występujące w ilorazie różnicowym składniki zawierające A t. Na przykład we wzorze (6.2), jeżeli A t jest bardzo małe, możemy po prostu przyjąć wyrażenie 6to po prawej stronie jako przybliżenie dla Ay/At. Oczywiście im mniejsza jest wartość A t, tym dokładniejsze jest przybliżenie do prawdziwej wartości Ay/At. Gdy A t dąży do zera (co oznacza, że wciąż przybliża się do zera, ale nigdy naprawdę go nie osiąga), wówczas (6 t0 + 3A t) będzie dążyć do wartości 6to i z tego samego powodu Ay/At będzie również dążyć do 6to. Symbolicznie wyrażamy to albo stwierdzeniem, że Ay/At —> 6 t0 dla A t 0, albo równaniem: (6-3)
3A t) = 6X0,
gdzie symbol lim^ czytamy: „granica... przy A t dążącym do zera” . Jeśli istnieje granica ilorazu
Iloraz różnicowy Potrzebny jest nam specjalny symbol na oznaczenie pojęcia ,.zmiany” . Gdy zmien na x zmienia wartość z x0 na nową wartość x u wówczas zmiana jest mierzona różnicą ją - z o . Piszemy zatem A x = X i ~ x 0 , stosując symbol A na oznaczenie różnicy. Potrzebny jest też sposób oznaczenia wartości funkcji/(t) dla różnych wartości x. Zwyczajowo stosuje się zapis / (jc£) na oznaczenie wartości / (x), gdy x = . Zatem dla funkcji f(x ) = 5 + x2 mamy: /(O) = 5 + O2 = 5 ;/( 2 ) = 5 + 22 = 9 itd. Gdy x zmienią wartość z początkowej xg na nową (at0 + A t), wówczas wartość funkcji y = f(x) zmienia się z /( to ) n a /( to + A t). Zmiana y przypadająca na jednostkę zmiany t może być reprezentowana przez iloraz różnicowy'. ^ ^
Ay _ /( to + A t) - /( t b ) At At
Iloraz ten, mierzący przeciętną stopę zmian y, może być obliczony, jeśli znamy początkową wartość t , czyli to, oraz wielkość zmiany t , czyli A t. To znaczy Ay/At jest fun kcją to i A t. Przykład 1. Dla danej y = / ( t ) = 3-t2- 4 możemy zapisać: / ( t 0) = 3 t o - 4 ;
/( to + A t) = 3(tb + A t)2- 4 .
Wobec tego iloraz różnicowy jest równy: Ay
3(t0 + A t)2 - 4 - (3tjj - 4) _ 6 t0A t + 3 (A t)2
różnicowego Ay/At przy A t 0, to jest ona defimowana jako pochodna funkcji y = /( t) . Omówimy teraz kilka kwestii związanych z pochodną. Po pierwsze, pochodna jest funkcją', w istocie — w tym zastosowaniu słowo pochodna oznacza naprawdę funkcję pochodną. Funkcja y = / ( t ) , która była na początku, jest funkcją pierwotną, a pochodna jest inną, pochodzącą od niej funkcją. Podczas gdy iloraz różnicowy jest funkcją t 0 i A t, pochodna (jak widać np. na podstawie (6.3)) jest funkcją samego t 0. Jest tak, ponieważ A t dąży do zera, więc nie powinno być traktowane jako argument funkcji. Dodajmy jeszcze, że stosowaliśmy dotąd symbol to z subskryptem 0 jedynie po to, aby podkreślić, że zmiana t musi się zaczy nać od pewnej konkretnej wartości t . Teraz)- gdy to jest zrozumiałe, możemy odrzucić subskrypt i stwierdzić po prostu, że pochodna — podobnie jak funkcja pierwotna — sama jest funkcją zmiennej niezależnej t , tzn. dla każdej wartości t istnieje jedyna, odpowiadająca jej wartość funkcji pochodnej. Po drugie, ponieważ pochodna jest jedynie granicą ilorazu różnicowego, który mierzy stopę zmian y, więc musi ona być również miarą pewnej stopy zmian. Ze względu na to, że zmiana t występująca w pojęciu pochodnej jest nieskończenie mała (tzn. A t —>0), stopa mierzona przez pochodną ma naturę natychmiastowej stopy zmian. Po trzecie, istnieje kwestia oznaczeń. Funkcje pochodne są zwykle oznaczane dwoma sposobami. Dla danej funkcji pierwotnej y = /( x ) pierwszy sposób oznaczania pochodnej (jeśli ona istnieje) polega na użyciu s y m b o lu /'(t) lub po prostu/ ' ; notacja ta jest przypisywana matematykowi Lagrange’owi. Inne zwyczajowe oznaczenie to dy/dt, wprowadzone przez matematyka Leibniza (tak naprawdę istnieję jeszcze trzecie oznaczenie: Dy lub D /(t), ale nie będziemy go tutaj używać). Oznaczenie f ( x ) , przypominające oznaczenie dla funkcji pierwotnej / (t), ma tę zaletę, że przekazuje ideę, iż pochodna sama jest funkcją x. Powodem, dla którego wyrażamy ją jako f ( x ) — a nie np.
142 ANALIZA STATYKI PORÓWNAWCZEJ
różni się od Ay/Ax głównie tym, że jest granicą tego ostatniego wyrażenia przy A x dążącym do zera. W dalszych rozważaniach będziemy stosować oba oznaczenia, wybierając to, które w danym przypadku będzie wygodniejsze. > Stosując te dwa oznaczenia, możemy zdefiniować pochodną danej funkcji y = f( x ) w następujący sposób: dy Ay ——= / (cc) = lim — . d.t a*-*o A x Przykład 2. Powracamy do funkcjiy = 3 ^ - 4 . Pokazaliśmy, że jej iloraz różnicowy jest równy (6.2), a granica tego ilorazu jest równa (6.3). Na tej podstawie możemy napisać (zastępując *0 przez x): dy — = 6x,
czyli
/ (x) = 6x.
Dla różnych wartości x będziemy otrzymywać odpowiednio różne wartości pochodnej. Na przykład dla x = 3 mamy f'( x ) = 6 ■3 = 18; ale gdy x = 4, znajdujemy / '( 4 ) = 6 • 4 = 24.
Ćwiczenie 6.2 1. Dana jest funkcja y = 4x2 + 9. a. Znaleźć iloraz różnicowy jako funkcję x i A x (stosować x zamiast x0). b. Znaleźć pochodną dy/d.t. c. Znaleźć/ '( 3 ) i /'(4 ) . 2. Dana jest funkcja y = 5 ^ - 4x. a. Znaleźć iloraz różnicowy jako funkcję x i Ax. b. Znaleźć pochodną dy/dx. c. Z n aleźć/'(2 ) i/'( 3 ) .
STATYKA PORÓWNAWCZA I POJĘCIE POCHODNEJ 143
W przypadku produktu mierzonego w jednostkach dyskretnych (tylko liczbami całkowitymi), zmiana równa jednej jednostce jest najmniejszą możliwą zmianą. Ale w przypadku produktu, którego ilość jest zmienną ciągłą, A Q będzie oznaczało nieskończenie mały przyrost. W tym ostatnim przypadku wiadomo doskonale, że koszt krańcowy można mierzyć jako nachylenie krzywej kosztu całkowitego. Ale nachylenie tej krzywej to nic innego, jak tylko granica ilorazu AC/AQ przy AQ dążącym do zera. Zatem pojęcie nachylenia krzywej jest po prostu geometrycznym odpowiednikiem pojęcia pochodnej. Oba zajmują się wielkościami „krań cowymi” , tak szeroko stosowanymi w ekonomii. Na rys. 6.1 wykreśliliśmy krzywą kosztu całkowitego C, która jest wykresem funk cji (pierwotnej) C = f(Q ). Gdy np. rozważamy <2o jako początkowy poziom produkcji, od której mierzymy jej wzrost, wTedy odpowiadającym mii punktem na krzywej kosztu będzie A. Jeśli produkcja ma wzrosnąć do 2o + A g = g 2, to całkowity koszt wzrośnie od C0 do Co + A C = C2; zatem AC/AQ = (C2 - C0) / (g 2 - Q0). Geometrycznie jest to iloraz długości dwoi odcinków prostej EB/AE, czyli nachylenie prostej AB. Ten właśnie iloraz mierzy przeciętną stopę zmian (średni koszt krańcowy dla narysowanego A Q) i reprezentuje iloraz różnicowy będący funkcją początkowej wartości g 0 i wielkości przyrostu AQ. Co się dzieje, gdy zmieniamy wartość A g ? Jeśli rozważamy mniejszy przyrost produkcji (powiedzmy tylko od go do g t), to średni koszt krańcowy będzie teraz mierzony przez nachylenie prostej AD. Ponadto, w miarę zmniejszania wielkości przyrostu produkcji, będziemy otrzymywać coraz mniej strome proste, a granicą (przy A g —» 0) będzie prosta KG (która jest styczną do krzywej kosztu w punkcie A). Nachylenie KG (równe HGIKH) mierzy nachylenie krzywej kosztu całkowitego w punkcie A i reprezentuje granicę A C/A ¡2 przy AQ —>0, gdy początkowy poziom produkcji jest równy Q = Qo- Wobec tego w terminach pochodnej nachylenie krzywej C = /( g ) w punkcie A odpowiada konkretnej wartości p o ch o d n e j/'(g 0). Co się stanie, jeśli początkowy poziom produkcji zmienia się z go na, powiedzmy, g 2? W tym przypadku punkt B na krzywej ząstąpi punkt A i nachylenie krzywej w nowym punk-
3. Dana jest funkcja y = 5x - 2. a. Znaleźć iloraz różnicowy Ay/Ax oraz odpowiedzieć na pytanie, jaki jest to rodzaj funkcji? b. Czy wobec tego, że wyrażenie A x nie występuje w powyższej funkcji AylAx, duża lub mała wartość Ax stanowi jakąś różnicę dla wartości Ay/Ax ? Jaka jest w związku z tym granica ilorazu dla Ax dążącego do zera?
6.3. POCHODNA I NACHYLENIE KRZYWEJ Zgodnie z elementarnymi zasadami ekonomii dla danej funkcji całkowitego kosztu C = /( ß ) , gdzie C oznacza koszt całkowity, a ß wielkość produkcji, koszt krańcowy (MC — marginal cost) jest określony jako zmiana całkowitego kosztu wynikająca z jednostkowej zmiany wielkości produkcji, tzn. MC = AC/AQ. Oczywiście A ß jest niezmiernie małą zmianą.
Rysunek 6.1
144 ANALIZA STATYKI PORÓWNAWCZEJ
STATYKA PORÓWNAWCZA I POJĘCIE POCHODNEJ
1
\
cie B będzie wyznaczać wartość p o c h o d n e j/'^ )- Podobne wyniki otrzymujemy dla innych początkowych poziomów produkcji. Ogólnie pochodnaf'{ Q ) — która jest funkcją Q — będzie się zmieniać wraz ze zmianami Q. i v
6.4. POJĘCIE GRANICY
145
'
Jest ważne, aby zdać sobie sprawę, że symbol °° nie jest liczbą, a wobec tego nie może być poddawany zwykłym działaniom algebraicznym. Nie możemy mieć 3 + °° lub 1/°°; nie co nie jest tym samym, co i —i Można jednak napisać, że grani możemy t^ż zapisać i = ca i jest równa „=” ■*> (a nie —»), bo to oznacza po prostu, że i —» °°.
Ilustracje graficzne
Pochodna dy/dr została określona jako granica iloczynu różnicowego Ay/Ax przy A x —» 0. Jeśli przyjmiemy skrótowe oznaczenia i = Ay/Ax dla ilorazu różnicowego oraz z = A x dla zmiany, to otrzymamy:
Na rys. 6.2 zilustrowane są różne możliwe sytuage dotyczące granicy funkcji i = g (z).
dy .. Ay — = lim — = lim i. d* A* *-»o Omówimy teraz pojęcie granicy, które jest nieodzowne do zdefiniowania pochodnej.
Granica lewostronna i prawostronna Pojęcie granicy jest związane z pytaniem: „do jakiej wartości przybliża się pewna zmienna (np. i), gdy inna zmienna (np. z) dąży do pewnej konkretnej wartości (np. do zen )? ” Aby to pytanie miało sens, i miisi być oczywiście funkcją z, czyli i = g (z). Interesuje nas bezpośrednio znalezienie granicy dla i przy z dążącym do zera, ale możemy również łatwo zbadać ogólniejszy przypadek z —» N, gdzie N jest dowolną skończoną liczbą rzeczywistą. Wtedy lim i będzie po prostu szczególnym przypadkiem lim i dla N = 0. Będziemy również rozważać
i —» 0
z —>iY
granicę i przy z —» + °° (plus nieskończoność) lub przy z —» —00 (minus nieskończoność). Gdy mówimy, że z — wówczas zmienna z może dążyć do liczby N przyjmując wartości większe lub mniejsze niż N. Jeśli i dąży do skończonej liczby L, gdy z —» N z lewej strony (przyjmując wartości mniejsze niż N), to liczbę L nazywamy lewostronną granicą i. Jeśli natomiast L jest liczbą, do której zmierza i, gdy z —> N z prawej strony (przyjmując wartości większe niż N), to nazywamy ją prawostronną granicą i. Granice lewostronna i prawostronna mogą być równe, ale nie muszą. Lewostronną granicę i oznaczymy lim i (znak minus oznacza, że z przyjmuje wartości .
.
.
.
.
mniejsze niż N), a granica prawostronna jest oznaczona symbolem lim^ i. Jeżeli — i tylko wtedy — obie granice mają jedną wspólną skończoną wartość (powiedzmy L), to istnieje granica i oznaczona jako lim i = L. Zauważmy, że L musi być skończoną liczbą. z —>N+
,
-
t
Rysunek 6A (a, b) Na rys. 6.2(a) pokazana jest gładka krzywa. Gdy zmienna z dąży do wartości N z którejkolwiek strony na osi poziomej, wówczas zmienna i dąży do wartości L. W tym przypadku granica lewostronna jest równa granicy prawostronnej; możemy zatem napisać: lim i = L. z— *N Krzywa na rys. 6.2(b) nie jest gładka; zmienia nagle kierunek dokładnie nad punktem N. Mimo to, gdy z dąży do N z którejkolwiek strony, wówczas i znów dąży do tej samej wartości L. Granica i znów istnieje i jest równa L. Rysunek 6.2(c) pokazuje funkcję zwaną funkcją schodkowej. W tym przypadku,
W sytuacji gdy lim i = <*>(lub -<*>), będziemy uważać, że nie ma granicy, gdyż lim i = °° z —»N
'
.
'' ~
z —» N
oznacza, że i —» °° przy z —> M a skoro i przyjmuje rosnące w nieskończoność wartości przy x —» N, to stanowiłoby to pewną sprzeczność, gdybyśmy powiedzieli, że i ma granicę. Jednak stosowany bywa zapis hm i = °° jako wygodny sposób wyrażenia myśli, że i —»«» przy z —» N\ Z -» N
mówi się wtedy, że i ma „granicę nieskończoną” . W pewnych przypadkach rozpatruje się jedynie granice jednostronne. Na przykład dla granicy i przy z —>+°° tylko lewostronna granica i ma sens, gdyż z może dążyć do nieskończoności jedynie z lewej strony. Podobnie dla ż — 00 odpowiednia jest jedynie granica prawostronna. Czy w tych przypadkach istnieje granica i, zależy tylko od tego, czy i dąży do skończonej wartości przy z —» + lub przy z —» -<*>.
1 Nazwa stanie się jasna, jeśli popatrzymy na kształt krzywej. Ale funkcja schodkowa może być wyrażona również algebraicznie. Funkcja pokazana na rys. 6.2(c) może być zapisana równaniem: _ \L i l= [Li
(dla 0 ^ z
Zwróćmy uwagę, że w każdym z przedziałów swej dziedziny podanym wyżej funkcja wygląda jak inna funkcja stała, co tworzy ,.schodek” na wykresie. W ekonomii funkcje schodkowe mogą być używane np. do pokazania różnych cen dla różnych ilości nabywanego towaru (krzywa na rys. 6.2(c) obrazuje rabat za ilość — quantity discount) lub różne stopy podatkowe stosowane dla różnych przedziałów dochodów. 10 — Podstawy..
146 ANALIZA STATYKI PORÓWNAWCZEJ
statyka porów naw cza i pojęcie pochodnej
147
Przykład 1. Dane jest i = 2 + z2', znaleźć lim /. Aby otrzymać granicę lewostronną, z '* ° 1 1 w miejsce z podstawiamy ciąg ujemnych wartości —1, (w tej kolejności) i znajdujemy, że 2 + z 2 będzie się systematycznie zmniejszać i dążyć do 2 (ponieważ z 2 będzie stopniowo przybliżać się do 0). Następnie dla granicy prawostronnej podstawiamy za miast z ciąg dodatnich wartości 1, — , —pjr, ... (w tej kolejności) i znajdujemy tę samą
10
100
granicę, co poprzednio. Ponieważ obie granice są identyczne, więc stwierdzamy, że istnieje granica i, co zapiszemy lim i = 2. z —>0
Często występuje pokusa traktowania otrzymanej właśnie odpowiedzi jako wyniku podstawienia z = 0 do równania i = 2 + z 2, ale na ogół należy się tej pokusie opierać. Obli czając z-*N lim i, pozwalamy zmiennej z jedynie dążyć do N, ale z reguły nie może być z = N.
Rysunek 6,2 (c, d)
gdy z dąży do AJ, wówczas lewostronna granica i jest równa L i, ale prawostronna granica jest równa 1^ i różna od poprzedniej. Wobec tego i nie ma granicy dla z —» N. Na rys. 6.2(d) przy z - » AJ granica lewostronna dla i jest równa a granica prawostronna jest równa +<*», ponieważ dwie części krzywej (hiperboli) będą maleć lub rosnąć w nieskończoność w miarę przybliżania się do przerywanej linii pionowej, czyli do swojej asymptoty. Tu również nie istnieje granica lim i . Jeśli natomiast będziemy rozważać inny rodzaj granicy, przedstawiony na rys. 6.2(d), a mianowicie lim i, to tylko granica
Rzeczywiście, całkiem zasadne jest mówienie o granicy i przy z~ * N nawet wtedy, gdy N nie należy do dziedziny funkcji i = g(z). W takim przypadku gdybyśmy przyjęli z = N, wówczas i oczywiście nie byłaby określona. Przykład 2. Dla danego /= (1 - z 2) /(l - z) znaleźć lim /. Tutaj N = 1 nie należy do Z~>1
dziedziny funkcji i nie możemy przyjąć z = 1, gdyż groziłoby to dzieleniem przez zero. Ponadto nawet procedura obliczania granicy przy z -» 1 podobna do tej, jaką zastosowano w przykładzie 1, będzie powodowała trudności, gdyż mianownik 1 - z będzie dążyć do zera, a wciąż nie znamy sposobu wykonania dzielenia w przypadku granicy. Jeden ze sposobów obejścia tej trudności polega na tym, aby spróbować przekształcić iloraz do postaci, w której z nie występuje w mianowniku. Ponieważ z —» 1 oznacza, że z * 1 i Z —1 jest różne od zera, więc można podzielić wyrażenie 1 - z2 przez 1 - z i zapisać2:
lewostronna ma tu zastosowanie i widać, że granica ta istnieje: lim i = M. Proszę sprawdzić, że istnieje również lim i = M. 1 Możliwe jest również zastosowanie pojęcia granicy lewostronnej i prawostronnej do kosztu krańcowego z rys. 6.1. W tym przypadku zmienne i i z będą się odnosiły odpowied nio do ilorazu AC/A ß i do wielkości A ¡2» gdzie wszystkie przyrosty są mierzone od punktu A do krzywej. Innymi słowy i odnosi się do nachylenia takich prostych, jak AB, AD i KG, podczas gdy z oznacza długości takich linii, jak Q0 Q 2 (= linia A E ) i ß o ß i (= linia AF). Widzieliśmy wcześniej, że gdy z dąży do zera przyjmując wartości dodatnie, i będzie dążyć do wartości równej nachyleniu prostej KG. Podobnie można sprawdzić, że gdy A ß dąży do zera, przyjmując wartości ujemne (tzn. gdy spadek produkcji jest coraz mniejszy), iloraz AC/Aß, mierzony nachyleniem takich prostych jak RA (nie narysowana), również będzie dążyć do wartości równej nachyleniu linii KG. Istotnie, przedstawiona tu sytuacja jest bardzo bliska tej, która jest zilustrowana na rys. 6.2(a). Zatem nachylenie KG na rys. 6.1 (odpowiednik L z rys. 6.2(a)) jest rzeczywiście granicą ilorazu i przy z dążącym do zera i jako takie daje nam koszt krańcowy dla poziomu produkcji ß = ß 0.
Obliczanie granicy Zilustrujemy teraz algebraiczne obliczenie granicy danej funkcji i - g (z).
1 -z2
1= —
1 -z
=l +z
(z * 1).
W tym nowym wyrażeniu nie występuje już mianownik zawierający z- Ponieważ (1 + z) —>2, gdy H l t którejkolwiek strony, więc możemy stwierdzić ostatecznie, że lim i = 2.
Z —* 1
Przykład 3. Dane je st / = (2z + 5 ) / ( z + 1); znaleźć lim /. Zmienna z znów występuje
Dzielenie może być wykonane w następujący sposób (podobnie jak dla liczb)-
1 +z (1 - z 2) : (1 -z ) -(1 -z ) z-z2 z-z 2 Możemy też uciec się do rozłożenia na poszczególne czynniki: 1 - z 2 ( l+ z ) ( l - z ) = — =l +z 1 -z 1 -z
(z * l).
148 ANALIZA STATYKI PORÓWNAWCZEJ
statyka porównawcza i pojęcie pochodnej
149
I w liczniku i w mianowniku. Jeśli pozwolimy, ab y -z—>+°° w obu tych wyrażeniach, to wynikiem będzie iloraz dwu nieskończenie wielkich liczb, który nie ma jasnego sensu. Aby poradzić sobie z tą trudnością, spróbujmy tym razem przekształcić dany iloraz do postaci, w której zmienna z nie będzie występowała w liczniku3. Można to osiągnąć dzieląc (2z + 5) przez (z+ 1), ale wynik będzie zawierał składnik resztowy: i 2Z+ 5 3 -= 2 + z + i “ z +r
najpierw, wymieniana jest mniejsza liczba (L - aj). Dalej będziemy też mówić o przedziałach jednostronnie otwartych i jednostronnie domkniętych, takich jak (3, 5) i (6, °°), które mają następujące znaczenie: (3, 5)'= {x: 3 < x =s 5};
Możemy teraz zdefiniować otoczenie L jako przedział otwarty4 określony wzorem takim, jak (6.4), który jest przedziałem „pokrywającym” liczbę L. W zależności od wielkości dowolnych liczb a: i a2 można skonstruować różne otoczenia dla danej liczby L. Za pomocą pojęcia otoczenia można teraz zdefiniować granicę funkcji w następujący sposób:
To nowe wyrażenie dla i nie ma już licznika zawierającego z. Jeśli zauważymy, że reszta 3/(z + 1) —>0 przy z —>+<», to możemy stwierdzić, że lim i = 2. Z —>00 Istnieje również wiele pożytecznych twierdzeń dotyczących obliczania granic. Zostaną one omówione w podrozdz. 6.6.
Formalne podejście do pojęcia granicy
(6, <*>) s {x: 6 =s x < <*>}.
Liczba L jest granicą funkcji i = g (z) przy z dążącym do liczby N, jeśli dla każdego, dowolnie małego, ustalonego otoczenia liczby L można dobrać otoczenie liczby N (zawarte w dziedzinie funkcji) w taki sposób, że dla każdej wartości z należątej do tego otoczenia N i różnej od N obraz jej należy do wybranego otoczenia L. Stwierdzenie to można wyjaśnić za pomocą rys. 6.3, który przypomina rys. 6.2(a). Na podstawie tego, co wiemy o tamtym rysunku, Wiadomo, że lim i = L (na rys. 6.3). Pokażemy, z —* N
Powyższe rozważania służyły przekazaniu ogólnych idei dotyczących pojęcia granicy. Podamy teraz jej bardziej precyzyjną definicję. Ponieważ w definicji tej skorzystamy z pojęcia otoczenia punktu na prostej (w szczególności otoczenia konkretnej liczby jako punktu na osi rzeczywistej), wyjaśnimy najpierw, co to pojęcie oznacza. Dla danej liczby L można zawsze znaleźć liczbę (L - aj) < L i inną liczbę (L + aj) > L, gdzie a2 i a2 są pewnymi dowolnymi liczbami dodatnimi. Zbiór wszystkich liczb leżących pomiędzy (L - aj) i (L + a2) nazywamy przedziałem o końcach w tych punktach. Jeśli liczby { L ~ a j) i (L + a2) włączono do zbioru, to zbiór jest przedziałem domkniętym-, jeśli nie są włączone, to zbiór jest przedziałem otwartym. Przedział domknięty o końcach (L - aj) i (L + aj) jest oznaczony nawiasami ostrymi i opisany następująco: (L -a i,
L + aj) = {q: L - a ^
q ^ L + a2},
a odpowiedni przedział otwarty jest oznaczony zwykłymi nawiasami: (6.4)
( L - a iy
L + a2) = {q: L - a l < q < L + a2}.
Wobec tego nawiasy ( ) są związane ze znakiem nieostrej nierówności =£, a nawiasy ( ) odnoszą się do znaku ostrej nierówności <. Należy pamiętać, że dla obu rodzajów przedziałów
3 Zwróćmy uwagę, że w przeciwieństwie do przypadku z -» 0, gdy chcemy pozbyć się z z mia nownika, aby uniknąć dzielenia przez zero, w przypadku z —> lepiej jest wykluczyć z z licznika. Gdy z —» » , ułamek zawierający z w liczniku będzie nieskończony, ale ułamek zawierający z w mianowniku będzie, co jest dla nas wygodniejsze, dążyć do zera i „po cichutku zniknie ze sceny” . W naszym przypadku będziemy mieli:
2z + 5 : z+ 1 - (2z + 2)
3
że L rzeczywiście spełnia założenia nowej definicji granicy. Najpierw wybierzmy dowolnie małe otoczenie liczby L, powiedzmy { L - au L + a j). (Powinniśmy właściwie uczynić je jeszcze mniejszym, ale pozostawiamy je w tej wielkości, aby ułatwić prezentację). Skonstru ujemy teraz otoczenie liczby N, powiedzmy ( N - b ly N + bj), tak, że dwa otoczenia (po rozszerzeniu na pierwszą ćwiartkę układu współrzędnych) wyznaczają razem (przyciemniony na rysunku) prostokąt o dwu wierzchołkach leżących na danej krzywej. Można wtedy sprawdzić, że dla każdej wartości z należącej do tego otoczenia N (różnej od N) odpowiadająca jej wartość i = g (z) należy do wybranego otoczenia L. W istocie, niezależnie od tego, jak małe jest wybrane przez nas otoczenie L, można wybrać odpowiednio małe otoczenie N posiadające wspomnianą własność. Zatem L spełnia definicję granicy, co było do udowodnienia. Powyższą definicję możemy również zastosować do funkcji schodkowej z rys. 6.2(c), aby pokazać, że ani Llt ani nie kwalifikują się jako lim i. Jeśli wybierzemy bardzo małe otoczenie Lly to niezależnie od tego, jak małe wybierzemy otoczenie dla N, prostokąt wyznaczony przez oba otoczenia nie może objąć dolnego „schodka” funkcji. Wynika stąd, że dla dowolnej wartości z < N odpowiednia wartość funk cji (na niższym jej poziomie) nie będzie należeć do otoczenia Li i wobec tego Li nie speł nia warunków dla granicy. Na podstawie podobnego rozumowania Lj. również musi zos tać odrzucone jako kandydat na lim i. W istocie w tym przypadku nie istnieje granica dla i przy z -» N. To, czy definicja jest spełniona, można również sprawdzić algebraicznie, a nie graficznie. Na przykład rozważmy ponownie funkcję: (6.5)
1 —z2 i ——z = l+ z 1- z
(z * l).
4 Określenie przedziału otwartego jako otoczenia punktujest właściwe tylko wtedy, gdy rozważamy punkt na prostej (czyli w przestrzeni jednowymiarowej). W przypadku punktu na płaszczyźnie (czyli w przestrzeni dwuwymiarowej) jego otoczenie musi być pewnym obszarem, np. kolistym obszarem wokół punktu.
STATYKA PORÓWNAWCZA I POJĘCIE POCHODNEJ 151
150 ANALIZA STATYKI PORÓWNAWCZEJ
poprzedniego otoczenia. Oznacza to, że gdy tylko spełniona jest nierówność: 1 - ¿i < z < 1 + b2, musi być również spełniona inna nierówność postaci: 3 - ai < 1 + z < 3 + a2, czyli: 2 - fli < z < 2 + a2.
N -b ,
N
Jedyna możliwość osiągnięcia tego to wybranie b2= a l - 1 i b2 = a2 + 1. Wynikałoby z tego, że otoczeniem 1 ma być otwarty przedział ( 2 - « i , 2 + <22)- Jednak — zgodnie z definicją granicy — można wybrać dowolnie małe a, i a2, powiedzmy a { = a2 = 0,1. W tym przypadku wspomniany przedział jest równy (1,9; 2,1) i leży całkowicie na prawo od punktu z = l na osi poziomej, czyli nie jest nawet otoczeniem 1. Zatem punkt 3 nie może spełniać warunków podanych w definicji. W podobny sposób można wykazać, że w rozpat rywanym przypadku żadna liczba różna od 2 nie będzie zgodna z definicją granicy. Ogólnie, jeśli pewna liczba spełnia definicję granicy i przy z —» N, to żadna inna liczba nie może jej spełniać. Granica, jeśli istnieje, jest jednoznacznie określona.
N + b2
Rysunek 6 3
W przykładzie 2 pokazano, że lim i - 2; zatem mamy tu N ~ 1 i L = 2. Aby sprawdzić, że i
L = 2 jest rzeczywiście granicą i, musimy pokazać, że dla dowolnie wybranego otoczenia L (2 - a u 2 + aj) istnieje otoczenie N (1 - b u 1 + bj) takie, że gdy tylko z należy do tego otoczenia N, to i musi należeć do wybranego otoczenia L. Oznacza to, że dla danych war tości aj i a2, jakkolwiek małych, można znaleźć liczby ¿>i i b2 takie, że gdy tylko spełniona jest nierówność: (6.6)
l-b i< z < l+ b 2
. *
Aby znaleźć taką parę liczb b x i b2, przepiszemy najpierw wzór (6.7), podstawiając do niego (6.5): 2 - a l < l + z < 2 + a 2.
z-* 2
Z-»a
3. Dane jest i = 5 - l/z (z 0); znaleźć: (a) Z— lim /; (b) lim i. >+oo 4. Za pomocą rys. 6.3 pokazać, że nie m ożem y traktować liczby (L + aj) jako granicy i przy Z dążącym do N.
Ten wzór możemy z kolei przekształcić w nierówność: (6.7")
2. Dane jest i = [(z + 2)3 - 8]/z (z * 0); znaleźć: '■v (a) lim /; (b) lim /; (c) lim /. z->0
2 —a 2 < / < 2 + a2.
(6.70
1. Dla danej funkcji i = (z2 + z - 5 6 ) / ( z - 7 ) , z * 1 , znaleźć granicę lewostronną i prawo stronną dla i przy z dążącym do 7. Czy można wnioskować z tych odpowiedzi, że i ma granicę przy z dążącym do 7?
( b # 1),
wówczas musi być spełniona inna nierówność postaci: (6.7)
Ćwiczenie 6.4
1 -<7i < z< 1 + a 2.
Porównanie (6.7'0 -— warianm (6.7) — z (6.6) sugeruje, że jeśli jako dwie liczby b j : i b2 wybierzemy b \= a \ i b2 = a2, to obie nierówności (6.6) i (6.7) będą zawsze jednocześ nie spełnione. Zatem rzeczywiście dla L = 2 można znaleźć otoczenie N (1 - b u 1 + bj) wymagane w definicji granicy, co oznacza, że Z, = 2 jest granicą. Zastosujemy teraz definicję granicy w odwrotny sposób, aby pokazać, że inna wartość (powiedzmy 3) nie kwalifikuje się jako lim i dla funkcji w (6.5). Gdyby 3 było tą granicą, Z ~~* 1
6.5. DYGRESJA O NIERÓWNOŚCIACH I WARTOŚCIACH BEZWZGLĘDNYCH
■
musiałoby być prawdą, że dla dowolnie wybranego otoczenia 3 (3 - a1, 3 + a 2) istnieje otoczenie 1 (1 - A lf 1 + bj) takie, że gdy z należy do niego, wówczas i musi należeć do
Wiele razy wcześniej korzystaliśmy z symboli nierówności. Do wyrażeń w postaci nierówności stosowaliśmy operacje matematyczne. Na przykład przy przekształceniu (6.7)
152 ANALIZA STATYKI PORÓWNAWCZEJ STATYKA PORÓWNAWCZA I POJĘCIE POCHODNEJ 153
w (6.7") odjęliśmy jedynkę od obu stron nierówności. Jakie reguły wykonywania działań dotyczą nierówności (w odróżnieniu od równań)?
Reguły dla nierówności
Wartości bezwzględne i nierówności
Zacznijmy od stwierdzenia pewnej ważnej własności: nierówności su przechodnie. Oznacza to, że jeśli a > b i b> c, to a > c. Ponieważ równości (równania) również są przechodnie, więc własność przechodniości powinna się odnosić do nierówności „słabych” (nieostrych) (=£ lub 3»), podobnie jak do „ostrych” (< lub >)■ Mamy zatem: a> b,
b> c =$ a> c,
a s* b ,
b Ss c => a ^ c .
Powyższe trzy reguły zostały sformułowane dla ostrych nierówności, ale są również spełnione, gdy znaki > zastąpimy przez
Jeżeli dziedziną wartości x jest przedział otwarty (a, b), to można tę dziedzinę zapisać jako zbiór { x : a < x < b } lub prościej za pomocą nierówności a < x < b . Podobnie, jeśli jest to przedział domknięty (a, b), można go zapisać za pomocą słabej nierówności
Własność ta umożliwia zapisywanie kilku nierówności jednocześnie, np. 3 < a < b < 8 lub 7 =£ x =£ 24. Przy zapisie takich złożonych nierówności znaki nierówności są z reguły skierowane w tę samą stronę, a najmniejsza liczba zwykle występuje po lewej stronie. Najważniejszymi regułami dotyczącymi nierówności są te, które dotyczą dodawania liczb do obu stron nierówności Gub,ich odejmowania od nierówności), mnożenia lub dzielenia nierówności przez liczbę i podnószenia nierówności do kwadratu. Reguły te przedstawiamy poniżej. Reguła I (dodawanie i odejmowanie) a > b = > a + k > b ± k . Nierówność będzie wciąż spełniona, jeśli taką samą liczbę dodamy lub odejmiemy od obu stron. Regułę tę możemy uogólnić w następujący sposób: jeśli a > b > c , to a ± k > b ± k > c ± k . Reguła U (mnożenie i dzielenie) , \k a > k b a> b= ) [ka< kb
(k> 0), (k < 0).
Mnożenie obu stron przez liczbę dodatnią zachowuje zwrot nierówności, ale ujemny mnożnik zmienia zwrot Gub kierunek) nierówności na przeciwny.
gdzie symbol |* | oznacza wartość bezwzględną (lub moduł) x. Dla każdej liczby rzeczywistej n wartość bezwzględna jest zdefiniowana w następujący sposób5: ( 6 .8 )
ale
1 Dzielenie nierówności przez liczbę n jest równoważne mnożeniu przez liczbę —; zatem n reguła dotycząca dzielenia jest zawarta w regule dotyczącej mnożenia. Reguła III (podnoszenie do kwadratu) a > b, b > 0 => a2 > b2. Jeśli obie strony nierówności są nieujemne, to nierówność będzie zachowana po podniesieniu obu stron do kwadratu. Przykład 2. Ponieważ 4 > 3 i ponieważ obie strony są dodatnie,więc42> 32, czyli 16 > 9. Podobnie, ponieważ 2 > 0, więc 22> O2, czyli 4 > 0. /
(gdy n > 0), (gdy n < 0), (gdy n = 0).
Zauważmy, że jeśli n = 15, to 1151= 15, ale jeśli n = -1 5 , to również J—151 = -(-1 5 ) = = 15. Wobec tego wartość bezwzględna dowolnej liczby rzeczywistej jest to po prostu jej wartość numeryczna po odrzuceniu jej znaku. Z tego powodu zawsze mamy (n | = | —n|. Wartość bezwzględna n jest również nazywana modułem n. G dy dane jest wyrażenie | x | = 10, wówczas z (6.8) możemy wywnioskować, że x musi być równe 10 lub -10. N a tej samej zasadzie wyrażenie 1*1 < 10oznacza, że: (1) jeśli x > 0, to x = |x | < 10, więc x musi być mniejsze niż 10; (2) jeśli x< 0, to zgodnie z (6.8) mamy - x = |* | < 10 lub x > -10, tak więc x musi być większe niż -10. Połączenie dwu części tego wyniku wskażuje, że x musi należeć do przedziału otwartego (-10, 10). W ogólnym przy padki! możemy napisać: (6.9)
Przykład 1. Ponieważ 6 > 5, mnożenie przez 3 daje 3 - 6 > 3■5, czyli18 > 15, rezultatem mnożenia przez - 3 jest - 3 • 6 < - 3 • 5, czyli - 1 8 < -1 5 .
n -n 0
|x |< ń ó - n < i c < n
(n > 0 ),
co może być również rozszerżone na słabe nierówności w następujący sposób: (6.10)
|*( =£ n » - n =£ x
n
{n s= 0).
Wąrtośći bezwzględne dwu liczb m in , ponieważ same są liczbami, mogą być dodawane, odejmowane* mnożone i dzielone. Wartości bezwzględne mają następujące własności:
3 Oznaczenie dla Wartości bezwzględnej jest podobne do oznaczenia wyznacznika macierzy pierwszego stopnia, ale te dwa pojęcia śą całkowicie różne. Definicja wyznacznika pierwszego stopniajest taka: V«
STATYKA PORÓWNAWCZA I POJĘCIE POCHODNEJ 155
154 ANALIZA STATYKI PORÓWNAWCZEJ
które samo jest nierównością. To rozwiązanie nie jest pojedynczą liczbą, lecz zbiorem liczb. Możemy również zapisać rozwiązanie jako zbiór {*: * > 2} lub jako przedział otwarty (2, °°).
| m | + | n | 3= | rrt + n |, ]m\ ■ |n] = |m ■n\,
Przykład 6. Rozwiązać nierówność 11 - * | =£ 3. Najpierw pozbędziemy się oznaczenia wartości bezwzględnej, stosując wzór (6.10). Dana nierówność jest równoważna stwierdzeniu:
m n
—3 =s 1 —* =s 3
Pierwszy z tych wzorów, co ciekawe, stanowi nierówność, a nie równanie. Przyczynę. łatwo rozszyfrować: podczas gdy wyrażenie | m | + | n | po lewej strome jest sumą dwu wartości liczbowych (obu traktowanych jako liczby dodatnie), to wyrażenie | m + n \ jest wartością liczbową albo sumy (gdy obie liczby m i n są np. dodatnie), albo różnicy (jeśli m i n mają przeciwne znaki). Lewa strona może więc być większa od prawej.
,
lub po odjęciu 1 od każdej strony: - 4 * £ -* * £ 2.
'
J '"
Mnożąc nierówność przez - 1 , otrzymujemy: 4 3= * 3= - 2 ,
Przykład 3. Jeśli m - 5 i n = 3, to |m | + |n | = |/n + n | = 8. Ale dla m = 5 i n = ~3; | m | + j n ] = 5 + 3 = 8, a | m + n | = (5 - 3 1= 2. Oczy wiście 8 > 2.
gdzie zwrot nierówności został odpowiednio odwrócony. Pisząc najpierw mniejszą liczbę, możemy wyrazić rozwiązanie w postaci:
W dwu następnych wzorach nie ma natomiast znaczenia, czy m i n mają takie same, czy przeciwne znaki, ponieważ gdy liczymy wartość bezwzględną iloczynu lub ilorazu po prawej stronie, to w obu przypadkach odrzucamy znak tego wyrażenia.
- 2 «£ * s 4 lub w postaci zbioru {*: - 2 =£ * =s 4 ), lub przedziału domkniętego ( - 2 ; 4). Niekiedy zadanie wymaga, aby jednocześnie było spełnionych kilka nierówności zawierających kilka niewiadomych. Trzeba wtedy rozwiązać układ nierówności. Zagadnienia tego typu pojawiają się np. w programowaniu matematycznym, które będzie omawiane w ostatniej części książki.
Przykład 4. Jeśli m = l i n = 8, to |/7i| |n | = |m n | = 7 - 8 = 56. Ale nawet gdy m = ~ l i n = 8 (przeciwne znaki), otrzymamy ten sam wynik: |m | - |n | = | - 7 | • |8 | = 7 • 8 = 56, | m • « | = | —7 • 8 1= 7 • 8 = 56.
Ćwiczenie 6.5 Rozwiązanie nierówności
1. Rozwiązać następujące nierówności: (a) 3 * - l < 7 * + 2 ; (c) 5 * + l < * + 3; \ (b) 2* + 5 < * - 4 ; (d) 2 * - l < 6 * + 5.
Podobnie jak równanie, nierówność zawierająca niewiadomą (powiedzmy *) może mieć rozwiązanie. Rozwiązanie to, jeśli istnieje, jest zbiorem tych wartości*, które po podstawieniu do nierówności czynią z niej zdanie prawdziwe. Takie rozwiązanie zwykle samo jest zapisane w postaci nierówności. Przykład 5. Znaleźć rozwiązanie nierówności:
■' . ■-
2. Mając nierówności 7 * - 3 < 0 i 7 * > 0 , wyrazić je jako jedną połączoną nierówność i znaleźć jej rozwiązanie. '
3. Rozwiązać następujące przykłady: (a) |* + 1 |< 6 ; (b) 14 —3*| < 2 ;
( c ) |2 * + 3 | ^ 5 .
3* - 3 > * + 1. ...
i.
-t
Podobnie jak przy rozwiązywaniu równania, składniki zawierające niewiadomą należy zgrupować po jednej stronie nierówności. Dodając 3 - * do obu stron otrzymujemy:
6.6. TWIERDZENIA O GRANICY
3* —3 + 3 - * > * + l + 3 —*, czyli 2* > 4. Mnożenie obu stron przez — (co nie zmienia zwrotu nierówności, gdyż — > 0) daje rozwiązanie:
. • ■ ;■
Zainteresowanie stopą zmian doprowadziło nas do badania pojęcia pochodnej, która z kolei — będąc z natury granicą ilorazu różnicowego — skłoniła nas do studiowania problemów istnienia i znajdowania granicy. Podstawowa procedura 'obliczania granicy, co pokaza no w podrozdz. 6.3, polega na tym, że jeżeli zmienna z ma dążyć do pewnej liczby (powiedz my N), to obserwuje się, do jakiej wartości dąży wówczas wartość funkcji. Gdy szukamy
STATYKA PORÓWNAWCZA I POJĘCIE POCHODNEJ 157 156 ANALIZA STATYKI PORÓWNAWCZEJ
lim 2i, = lim (i) + ii) - L i + L \ = 2L\, Z~*N Z-*S
granicy funkcji, wtedy możemy korzystać z udowodnionych już twierdzeń o granicach, co znacznie uprości zadanie, zwłaszcza dla skomplikowanych funkcji.
co jest zgodne z twierdzeniem I. Twierdzenie V (o granicy iloczynu)
Twierdzenia dotyczące pojedynczej funkcji i = g ( z ) •
Granica iloczynu dwu funkcji jest iloczynem ich granic. W odniesieniu do kwadratu funkcji daje to:
Twierdzenie I Jeśli i = az + b, to lim i - a N + b J-*.V
(a i b są stałymi).
-
lim (ijii) = L1L1=L?, Z-> N
Przykład 1. Dane jest i = 5z + 7; mamy lim i = 5 • 2 + 7 = 17. Podobnie lim i = =
5
0
+
7
=
7
.
lim (i, ¿2) = Li ¿ 2.
z -*N
•
•
* -.2
.
.
•
.
.
co jest zgodne z twierdzeniem HI.
i
z-> o
Twierdzenie VI (o granicy ilorazu) Twierdzenie II
11 = 12 ¿2
Jeśli i = g (z) = b, to lim i = b. Twierdzenie to, mówiące, że granicą funkcji stałej jest stała
(¿2 ^0 ).
z —* N
wartość tej funkcji, to po prostu szczególny przypadek twierdzenia I dla a = 0 (zadanie tego
Granica ilorazu dwu funkcji jest ilorazem ich granic. Oczywiście granica Li musi byó niezerowa, w przeciwnym razie iloraz nie będzie określony.
typu występowało już w ćwiczeniu 6.2-3).
Przykład 3. Znaleźć
Twierdzenie III
lim (1 + z)/(2 + z).
z -*0
Ponieważ j
mamy
tu
lim (1 + z) = 1
z-»O
i
lim (2 + z) = 2, więc poszukiwana granica jest równa
Jeśli i = z, to lim i = N. Jeśli i = z*, to lim i = N k.
Pamiętajmy, że Li i Li reprezentują skończone liczby; w przeciwnym przypadku nie można stosować tych twierdzeń. W przypadku twierdzenia VI L i musi byó ponadto różne od zera. Jeśli te warunki nie są spełnione, to musimy wrócić do metod obliczania granic pokazanych w przykładach 2 i 3 ż podrozdz. 6.4, które dotyczą — odpowiednio — przypad ków, gdy Li jest równe zeru i gdy Li jest nieskończone.
.
z-> N
Przykład 2. Dla i = z3 mamy *-»2 lim i = 23 = 8. W powyższych trzech twierdzeniach, aby znaleźć granicę i przy z —>N, wystarczyło podstawić z = N. Są to jednak szczególne przypadki i nie naruszają ogólnej reguły, że „z -> N ” nie oznacza „z = A ” .
Granica funkcji wielomianowej Twierdzenia dotyczące dwu funkcji Jeśli mamy dwie funkcje tej samej zmiennej niezależnej z: ij = g (z ) i i2~ h ( z ) i jeśli bbje
Dysponując powyższymi twierdzeniami o granicach, możemy z łatwością znaleźć granicę dowolnej funkcji wielomianowej:
funkcje hlają następujące granice:
(6.11)
lim rj = L i;
i-* N
lim i2 = L2l z-*N
'
'
• -¡Ą
gdzie L, i ¿2 śą dwiema skońeżónyiói liczbami, to ihpżna stosować przedstawione niżej
.
i = g(z) = a0 + a lz + a2źŁ+ ... +a„z",
przy z dążącym do liczby N. Ponieważ granice poszczególnych składników są równe odpowiednio: lim ao = ao\
twierdzenia.
lim aiz = alN \
\u n a 2z 2 = a2N2
(itd.),
Z-> N
więc granica funkcji wielomianowej (na podstawie twierdzenia o granicy sumy) jest równa: Twierdzenie IV (b granicy sumy 1 różńlcy funkcji) (6.12) lir a ( /j± i2) = L ,± L ,.
■ ‘
Granica sumy (różnicy) dwu funkcji jćśt śńmą (fóżhięą) ódpoWiednićh granic funkcji, W
śźćzególńóśći widzimy, żó:
'■
lim i = ao + a iN + a 2N 2 + ... +a„N".
z-*N
Zauważmy, że granica ta jest równa g (N), tzn. równa wartości funkcji w (6.11) przy z = N. Ten wynik okaże się istotny przy omawianiu pojęcia ciągłości funkcji wielomianowej.
158 ANALIZA STATYKI PORÓWNAWCZEI
STATYKA PORÓWNAWCZA I POJĘCIE POCHODNEJ 159
Ćwiczenie 6.6 1. Znaleźć granice funkcji i = 8 - 9z + z2: (a) p rz y z -ż O ; (b) przy z - » 3 ;
(c) przy z - » - 1 .
2. Znaleźć granice i = (z + 2) (z - 3): (a) przy z —» - 1 ; (b) przy z —>0;
(c) przy z -» 4.
3. Znaleźć granice i = (3z + 5)/(z + 2): (a) przy z -» 0; (b) przy
z -» 5;(c)przy
z -> -1 .
'f i
6.7. CIĄGŁOŚĆ I RÓŻNICZKOWALNOŚĆ FUNKCJI Pojęcie granicy i metody jej obliczania mogą być zastosowane do zdefiniowania ciągłości i różniczkowalności funkcji. Pojęcia te są bezpośrednio związane z interesującą nas pochodną funkcji.
Ciągłość funkcji Gdy funkcja i = g (z) ma granicę przy z dążącym do punktu A z jej dziedziny i gdy granica ta jest równa g (A) — tzn. równa wartości funkcji przy z = A — wtedy mówimy, że funkcja jest ciągła w A. Jak powiedziano, termin ciągłość obejmuje nie mniej niż trzy warunki: 1) punkt A musi należeć do dziedziny funkcji, tzn. jest określone g (N ), 2) funkcja musi mieć granicę przy z —>A, tzn, istnieje Z-»W lim g (z), 3) granica ta musi być równa co do wartości g (A), tzn. Zlim g (z) = g (A). —>iV Przy omawianiu granicy krzywej przedstawionej na rys. 6.3 punkt (A, L) nie byl brany pod uwagę, teraz natomiast nie pomijamy go. Przeciwnie, jak to powiedziano w trzecim warunku, punkt (A, L) musi leżeć na wykresie funkcji, abyśmy mogli traktować funkcję jako ciągłą w punkcie A. Sprawdźmy, czy funkcje pokazane na rys. 6.2 są ciągłe. Wszystkie trzy warunki są spełnione przez punkt A na diagramie 6.2(a). Punkt A należy do dziedziny, i ma granicę L przy z —»A i okazuje się, że granica L jest także równa wartości funkcji w A. Zatem funk cja reprezentowana przez tę krzywą jest ciągła w A. Tak samo jest dla funkcji przedsta wionej na rys. 6.2(b), gdyż Z, jest granicą tej funkcji przy z dążącym do wartości A należą cej do dziedziny i L jest również wartością funkcji w punkcie A. Jak wynika z ostatniego przykładu graficznego, ciągłość funkcji w punkcie A nie implikuje, że wykres funkcji jest „gładki” w punkcie z = N, gdyż punkt (A, L) na rys. 6.2(b) jest w istocie „ostrzem” , a mimo to funkcja jest ciągła dla tej wartości zJeżeli funkcja i = g (z) jest ciągła dla każdej wartości z z przedziału (a, b), to mówimy, że jest ciągła w tym przedziale. Gdy funkcja i = g (z) jest ciągła w każdym punkcie pod zbioru S swojej dziedziny (gdzie podzbiór S może być sumą pewnej liczby rozłącznych przedziałów), wówczas mówimy, że funkcja jest ciągła w 5. A jeśli funkcja jest ciągła
w każdym punkcie swojej dziedziny, to mówimy, że jest ciągła w swojej dziedzinie. Mimo wszystko nawet w tym ostatnim przypadku wykres funkcji może mieć nieciągłość (lukę) dla pewnej wartości z, powiedzmy z = 5, jeśli ta wartość z nie należy do dziedziny funkcji. Z wykresu 6.2(c) wynika, że funkcja jest nieciągła w punkcie A, ponieważ nie istnieje granica W tym punkcie, co narusza drugi warunek wymagany w definicji ciągłości. Niemniej jednak funkcja spełnia warunki ciągłości w przedziale (0, A) swojej dziedziny oraz w przedziale (A, » ). Wykres 6.2(d) jest oczywiście również nieciągły dla z = A. Tym razem nieciągłość wywołana jest tym, że A nie należy do dziedziny, co narusza pierwszy warunek ciągłości. Na podstawie wykresów z rys. 6.2 wydaje się, że punkty ostrza są niesprzeczne z ciągłością, jak na diagramie (b), luki natomiast są sprzeczne, jak na diagramach (c) i (d). Tak rzeczywiście jest. Podsumowując, funkcja ciągła w pewnym przedziale jest to laka funkcja, której wykres dla danego przedziału można narysować, nie odrywając ołówka lub pióra od papieru — sztuki tej można dokonać nawet wtedy, gdy na wykresie są ostrza, ale jest to niemożliwe, gdy występują luki.
Wielomiany i funkcje wymierne Rozważmy teraz ciągłość pewnych często spotykanych funkcji. Dla każdej funkcji wie lomianowej, takiej jak i = g (z) w (6.11), sprawdziliśmy w (6.12), że lim i istnieje i jest z->N równe wartości funkcji w punkcie A. Ponieważ A jest punktem (dowolnym) dziedziny funkcji, więc możemy stąd wywnioskować, że każda funkcja wielomianowa jest ciągła w swej dziedzinie. Jest to bardzo istotna informacja, gdyż często będziemy spotykać funkcje wielomianowe. A co powiemy o funkcjach wymiernych? Istnieje interesujące twierdzenie o ciągłości, które mówi, że suma, różnica, iloczyn i iloraz dowolnej skończonej liczby funkcji, które są ciągle w pewnym obszarze, są również ciągłe w ich dziedzinach. W wyniku tego każda funkcja wymierna (iloraz dwu funkcji wielomianowych) musi również być ciągła w swojej dziedzinie. Przykład 1. Funkcja wymierna:
jest określona dla wszystkich skończonych liczb rzeczywistych; zatem jej dziedzina jest przedziałem (-■», °°). Dla dowolnej liczby A z tej dziedziny granicą i jest (na mocy twier dzenia o granicy ilorazu): * j$ < 4z*> lim (z 2+ l )
4A 2 A2+ l ’
co jest równe g (A). Wobec tego wszystkie trzy wymogi ciągłości są spełnione w punkcie A. Zauważmy ponadto, że A może reprezentować dowolny punkt należący do dziedziny tej funkcji; wynika stąd, że funkcja jest ciągła w całej swej dziedzinie.
160 ANALIZA STATYKI PORÓWNAWCZEJ STATYKA PORÓWNAWCZA I POJĘCIE POCHODNEJ 161
z3 + z 2 —4z —4 , Przykład. 2. Funkcja wymierna i = i— — nie jest określona w punktach z = 2 .......... z —4 i z = -2 . Ponieważ te dwie wartości z nie należą do dziedziny, więc funkcja jest nieciągła w z = 2 i z = -2 , mimo że istnieje granica i przy z —> - 2 i przy z —> 2. Graficznie dla tej funk cji będzie występowała luka dla obu tych wartości z. Ale dla pozostałych wartości z (tych, które należą do dziedziny) funkcja ta jest ciągła.
pokazano na rys. 6.4, gdzie stare oznaczenia pojawiają się (w nawiasach kwadratowych) obok nowyęh. Zauważmy, że po zmianie oznaczeń A x stało się (x - N), więc wyrażenie „Ax —> 0” staje się ,,x —> IV” , co jest analogiczne do wyrażenia z —>N stosowanego wcześniej w związku z funkcją i = g (z). Zgodnie z tym (6.13) i (6.14) można teraz napisać w postaci: (6.13') lim f( fW rarv lim x ) == f( N ), (6.140
f \ N ) = lim
f( x ) ~ f( N )
x -*N
Różniczkowalność funkcji
x-N
Poprzednie rozważania wyposażyły nas w narzędzia potrzebne do stwierdzenia, czy jakaś funkcja ma granicę, gdy jej argument dąży do pewnej konkretnej wartości. Możemy więc próbować znaleźć granicę dowolnej funkcji y = f(x) przy x dążącym do pewnej wybranej wartości, np. x q . Możemy jednak zastosować pojęcie granicy na innym poziomie i przejść do granicy ilorazu różnicowego tej funkcji A y/Ax, przy A x dążącym do zera. Wyniki przechodzenia do granicy na tych dwu poziomach dotyczą dwu różnych, chociaż powiązanych własności funkcji f Gdy znajdziemy granicę samej funkcji y = /(x ), możemy wówczas — zgodnie z wcześ niejszymi rozważaniami — sprawdzić, czy fu n k cja /je st ciągła w punkcie x = x q . Warunki ciągłości są następujące: 1) x=Xo musi należeć do dziedziny funkcji /, 2) y musi mieć granicę przy x —» xo, 3) wspomniana granica musi być równa /( x 0). Gdy są one spełnione, możemy napisać: (6.13)
Lim f ( x ) = f( x 0).
[warunek ciągłości]
Gdy pojęcie granicy stosujemy do ilorazu różnicowego A y/A x przy A x —> 0, wówczas zajmujemy się problemem, czy fu n k c ja /je st różniczkowalna w punkcie x = x0, tzn. czy pochodna dy/dx istnieje w punkcie x = x q , czyli czy istnieje f'(xo). Stosowany jest tu termin „różniczkowalny” , ponieważ procedurę obliczania pochodnej dy/dx nazywamy różniczko waniem.. Ponieważ/'(xo) istnieje wtedy i tylko wtedy, gdy istnieje granica A y/A x w punkcie x = x0 przy A x —» 0, więc różniczkowalność / wyrażamy symbolicznie jako:
Chcemy zatem pokazać, że warunek ciągłości (6.130 wynika z warunku różniczkowałności (6.14'). Ponieważ oznaczenie x —>N implikuje, ż e ,x ź N , czyli ż e x - N jest liczbą niezerową, wolno nam napisać następującą tożsamość:
(6.14)
(6.15)
/'(x o )= lim —- = lim A * -» 0
A x
+
.
[warunek różniczkowałności]
A x
Te dwie własności, ciągłość i różniczkowalność, są bardzo ze sobą związane. Ciąg łość / jest warunkiem koniecznym jej różniczkowałności (chociaż, jak później zobaczymy, ten warunek nie jest wystarczający). Oznacza to tyle, że aby funkcja mogła być różniczko walna w punkcie x = xo, musi najpierw spełniać warunki ciągłości w x = xo. Aby to udowod nić, pokażemy, że dla danej funkcji y = /(x ) jej ciągłość w x = Xo wynika z jej różniczkowalności w x = xo, tzn. warunek (6.13) wynika z warunku (6.14). Zanim jednak to zrobimy, uprośćmy nieco zapis (1), zastępując x0 symbolem N, oraz zapis (2), zastępując (x0 + Ax) symbolem x. To ostatnie jest usprawiedliwione, ponieważ wartość, jaką ma x po zmianie, może być dowolną liczbą (zależy to od wielkości zmiany), a zatem jest zmienną, którą można oznaczyć jako x. Równoważność dwu sposobów oznaczeń
Rysunek 6.4
/(x ) - /( A D * f- X)- ~ ^ N ) ( x - N ) . x -N
Przejście do granicy po obu stronach (6.15) przy x —y N daje następujące wyniki: le w a stro n a = lim / ( x ) - lim f ( N ) = x —> N
x —* N
= lim f( x ) - f ( N ); x-+ N
. /(x ) - f( N ) prawa strona = l i m ---------------- lim (x - A7) = x-*N X — N =f '( N ) (ihn x - lim N) = x-> N
x-> N
= f \ N ) ( N - N ) = 0. U — Podstawy...
[twierdzenie o granicy różnicy] i/( jV) jest stałe] [twierdzenie o granicy iloczynu] [ze wzoru (6.14') i twierdzenia o granicy różnicy]
STATYKA PORÓWNAWCZA I POJĘCIE POCHODNEJ 163
162 ANALIZA STATYKI PORÓWNAWCZEJ
nie istnieje. Wymaga to wykazania niezgodności granicy lewostronnej i prawostronnej. Ponieważ wtedy, gdy rozważamy granicę prawostronną, x musi przekraczać 2, zgodnie z definicją wartości bezwzględnej w (6.8) mamy | x - 2 | = x - 2. Zatem granica prawostronna jest równa: |x - 2 | x~2 lim ---------- = lim --------= lim 1 = 1. x —2 x -» 2 ł X — 2 x— *2*
x -» 2 ł
Gdy rozważamy natomiast granicę lewostronną, wówczas x musi być mniejsze niż 2, ■ zatem zgodnie z (6.8) | x - 2 1= —(x —2). Zgodnie z tym granica lewostronna jest równa: \x -2 \ —( x - 2 ) lim J —!-= hm „ = lim (-1 ) = -1 x->2- x ~ 2 x->2- x - 2 x— »2-
Rysunek 6.5
Zauważmy, że nie moglibyśmy zapisać tych wyników, gdyby nie było założenia (6.14), ponieważ gdyby nie istniała f '( N ) , wówczas wyrażenie po prawej stronie (6.15) (a zatem również wyrażenie po lewej stronie) nie miałoby granicy. Jeśli jednak/'(JV ) istnieje, to obie strony mają granice, jak pokazano powyżej. Ponadto, po przyrównaniu lewej i prawej strony otrzymujemy lim f( x ) —/(IV) = 0, co jest identyczne z (6.13'). Udowodniliśmy zatem, że ciągłość, jak w (6.130, wynika z różniczkowałności, jak w (6.140. Ogólnie, jeśli funkcja jest różniczkowalna w każdym punkcie swojej dziedziny, to możemy wnioskować, że musi być ciągła w swej dziedzinie. Chociaż z różniczkowałności wynika ciągłość, to jednak twierdzenie odwrotne nie jest prawdziwe, tzn. ciągłość jest koniecznym, ale nie jest wystarczającym warunkiem różniczkowalności. Aby to pokazać, musimy po prostu przedstawić kontrprzykład. Rozważmy funkcję: (6.16)
y = /(* ) = |x —2 | + 1,
której wykres podano na rys. 6.5. Jak można łatwo wykazać, funkcja ta nie jest różniczkowalna w punkcie x = 2, chociaż jest ciągła. Łatwo sprawdzić, że funkcja jest ciągła w i = 2 . Po pierwsze, x = 2 należy do dziedziny funkcji, po drugie, istnieje granica y dla x dążącego do 2, a mianowicie: lim y = lim y = 1,
x-*2*
i różni się od granicy prawostronnej. Pokazuje to, że ciągłość nie gwarantuje różniczkowalności. Podsumowując, wszystkie funkcje różniczkowalne są ciągłe, ale nie wszystkie funkcje ciągłe są różniczkowalne. Na rys. 6.5 to, że funkcja nie jest różniczkowalna w punkcie x = 2, przejawia się tym, że nie jest określona styczna do wykresu w punkcie (2, 1), a zatem nie można przypisać wykresowi funkcji w tym punkcie żadnej określonej wartości nachylenia. Mianowicie, na lewo od tego punktu krzywa ma nachylenie —1, ale na prawo manachylenie +1i nachylenia po obu stronach nie dążą do wspólnej wartości dla x = 2. Punkt (2, 1) jest oczywiściepunktem szczególnym: jest to jedyny punkt, w którym krzywa jest załamana. W pozostałych punktach pochodna jest określona i funkcja jest różniczkowalna. Dokładniej, funkcja (6.16) może być podzielona na dwie funkcje liniowe w następujący sposób: lewa część:
y = -(* -2 )+ 1= 3 - x
prawa część: y = (x - 2) + 1 =*-•■!■
(x=£2), (x > 2).
Lewa część jest różniczkowalna w przedziale (—<*>, 2), a prawa część jest różniczkowalna w przedziale (2, °°) dziedziny. \ Ogólnie, różniczkowalność jest bardziej ograniczającym warunkiem niż ciągłość. Ciągłość w punkcie wyklucza jedynie występowanie luk, podczas gdy różniczkowalność wyklucza również występowanie ostrych załamań. Wobec tego różniczkowalność wymaga również — oprócz ciągłości — „gładkości” funkcji (krzywej). Większość konkretnych funkcji stosowanych w ekonomii ma tę własność, że są wszędzieróżniczkowalne. Ponadto, gdy stosowane są ogólne funkcje, często zakłada się, że są one wszędzie różniczkowalne i w dalszych rozważaniach będziemy przyjmować to założenie.
Ćwiczenie 6.7
x —»2“
po trzecie, sprawdzamy, że również /(2 ) = 1. Są zatem spełnione wszystkie trzy warunki ciągłości. Aby pokazać, że funkcja / nie jest różniczkowalna w punkcie x - 2 , musimy pokazać, że granica ilorazu różnicowego: |jc —2 1+ 1 - 1 | * -2 | m - m = lim hm ------------- = hm x->2 x - 2 x->2 x-2 *->2 x-2
1. Funkcja y = /(x ) jest nieciągła w i = % gdy którykolwiek z trzech wymogów dla ciągłości nie jest spełniony w x = ą . Sporządzić trzy wykresy ilustrujące naruszenie każdego z tych wymogów. 2, Jako dziedzinę funkcji i = g (z) = z 2 - I z - 3 przyjmujemy zbiór wszystkich skończonych liczb rzeczywistych.
164
a n a l iz a s t a t y k i p o r ó w n a w c z e j
a. Znaleźć granicę i przy z dążącym do N (skończonej liczby rzeczywistej). b. Sprawdzić, czy ta granica jest równa g (N ). c. Sprawdzić, czy funkcja jest ciągła w N i ciągła w swej dziedzinie. z+2 3. Dana jest funkcja i = g (z) = - 2 a. Stosując twierdzenie o granicy, znaleźć lim i, gdzie A' jest skończoną liczbą z-*N
rzeczywistą.
b. Sprawdzić, czy ta granica jest równa g (N). c. Sprawdzić ciągłość funkcji i w N i w jej dziedzinie (-<», <*>). x2 + x - 20 4. Dana jest funkcja y -f( x ) = — ------------. x~A a. Czy można zastosować twierdzenie o granicy ilorazu w celu znalezienia granicy tej funkcji przy x —» 4? b. Czy ta funkcja jest ciągła w r = 4? Dlaczego? c. Znaleźć funkcję, która przy x * 4 jest równoważna powyższej funkcji, i obliczyć na jej podstawie granicę y przy x —» 4. 5. Dlaczego w funkcji wymiernej z przykładu 2 (s. 160) licznik dzieli się bez reszty przez mianownik i iloraz jest równy z + 1 ? Czy możemy z tego powodu zastąpić tę funkcję bezpośrednio przez i = z + 1? Dlaczego tak lub dlaczego nie? 6. Czy na podstawie wykresów sześciu funkcji przedstawionych na rys. 2.8 można wywnioskować, że każda z tych funkcji jest różniczkowalna w każdym punkcie swej dziedziny? Wyjaśnić.
7. REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ
Centralne zagadnienie analizy statyki porównawczej — ustalanie stopy (tempa) zmian — może być utożsamiane z problemem znajdowania pochodnej pewnej funkcji y = /(* ), pod warunkiem, że rozważamy jedynie małe przyrosty x. Mimo iż pochodna dy/d* jest zdefiniowana jako granica ilorazu różnicowego y = f(x) przy x —»0, to szukając pochodnej funkcji wcale nie trzeba przeprowadzać procesu przejścia do granicy za każdym razem, ponieważ istnieją różne reguły różniczkowania (obliczania pochodnych), które umożliwiają bezpośrednie otrzymywanie żądanych pochodnych. Zanim przejdziemy do modeli statyki porównawczej, zajmijmy się regułami różniczkowania.
7.1. REGUŁY RÓŻNICZKOWANIA DLA FUNKCJI JEDNEJ ZMIENNEJ Najpierw omówimy trzy reguły Odnoszące się odpowiednio do następujących typów funkcji jednej zmienhej niezależnej: y = k (funkcja stała), y ~ x " oraz y = cxn (funkcje potęgowe). Wszystkie one mają ciągłe, gładkie wykresy i wobec tego są wszędzie różniczkowalńe.
Reguła dla funkcji stałej Pochodna funkcji stałej y - f { x ) - k jest tożsamościowo równą zeru, tzn. jest równą zeru dla wszystkich wartości x- Symbolicznie można to wyrazić w rozmaity sposób: dy ~n r - 0
lub
Ak -— = 0, hv
można to również zapisać w postaci:
lub
/'( * ) = 0;
166
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ 167
a n a l iz a s t a t y k i p o r ó w n a w c z e j
d d d , ■ — y = — /(* ) = — * = 0, QX QX dX
/'( * ) = - f - * = 1 - *° = 1. d*
gdzie symbol pochodnej został podzielony na dwie części: d /d * jest jedną, ay (lub/(a), lub k) jest drugą. Pierwsza część, czyli d/d*, może być traktowana jako symbol operatora, któiy nakazuje nam wykonanie pewnej operacji matematycznej. Podobnie jak symbol operatora j nakazuje nam wyciągnięcie pierwiastka kwadratowego, symbol d /d* oznacza instrukcję wzięcia pochodnej, czyli różniczkowania (pewnej funkcji) względem zmiennej *. Funkcja, którą mamy zróżniczkować, jest wskazana w drugiej części; tutaj jest nią y = /(* ) = k. Dowód reguły jest następujący. Skoro funkcja jest stała i/(* ) = k, to mamy/(/V) = k dla każdej wartości N. Zatem wartość/'(AT) — wartość pochodnej w punkcie * = N — zgodnie z definicją (6.13) będzie równa: .. f( x ) -/(A t) / (AA = l i m ---------------- = l i m * -* iV X — N -c -* iV
, , , . n .. f( x ) -/(A t) x-N / (At) = h m ---------------- = l i m --------X->N X —N X —N
- lim l = 1.
Ponieważ At reprezentuje dowolną wartość *, więc można n ap isać/'(* ) = 1. Dowodzi to reguły dla przypadku n = 1. Wykres funkcji y = /(* ) = * jest linią prostą przechodzącą przez początek układu i nachyloną do osi Ox pod kątem 45°; nachylenie jest stale równe +1. Dla większych liczb całkowitych n = 2, 3, ... zauważmy najpierw, że spełnione są tożsamości:
.
—= lim 0 = 0. X ~ N
Ponieważ N reprezentuje zupełnie dowolną wartość *, wynik f'{ N ) = 0 może być bezpośrednio uogólniony do /'(* ) = 0. To kończy dowód reguły. Ważne jest, aby jasno rozróżniać zapis / '( * ) = 0 od podobnie wyglądającego, lecz innego zapisu f '( x 0) = 0. Przez /'( * ) = 0 rozumiemy, że funkcja pochodna / ' ma wartość zero dla wszystkich wartości*; p isząc/ '(*0) = 0 łączymy natomiast zerową wartość pochodnej z pewną szczególną wartością *, mianowicie * = *oJak powiedziano wcześniej, pochodna funkcji ma swój geometrycznyodpowiednik w postaci nachylenia krzywej. Wykres funkcji stałej, np. funkcji kosztu stałego CF = /(G ) = 1200 $, jest poziomą linią prostą o nachyleniu stale równym zeru. Odpowiednio do tego pochodna również musi być równa zeru dla wszystkich wartości fi: - £ r O = 4 ~ 1200 = 0 dfi dg
Dowód tego wyniku można łatwo otrzymać z definicji/'/A /) określonej wzorem (6.14'). Gdy /(* ) = *, wówczas wartość pochodnej dla dowolnego *, np. x = N, jest równa:
lub
/ '( f i ) = 0.
x
(7.2)
2 - N
2
— — — = x + N,
[2 składniki po prawej strome]
* 8 —N 2 n — —— = * 2 + Nx + N 2,
[3 składniki po prawej stronie]
*" - At" —_ = x n~1+ At*"-2 + At2* "-3 + ... + At"-1,
[n składników po prawej stronie]
Na podstawie (7.2) możemy wyrazić pochodną funkcji potęgowej /(* ) = *"dla x = N w następujący sposób: (7.3)
„ /s n ,. f( x ) ~ f( N ) ,X * " - J V " / (At) = h m — = hm — = x-tN x-N x-tN X - N = jim (*"-1 +At*"- 2 + . . . +At"-1> -
Reguła dla funkcji potęgowej
= lini *"-1 + lim iV*"-2 + ... + lim AT1-1 =
Pochodna funkcji potęgowej y = /( * )= * " jest równa nx"~[. Symbolicznie wyrażamy to jako:
= At"- 1+ A/"- 1+ ... + At"- 1= n N n~l.
(7.1)
— x n = nxn~1 d*
lub
/ '( * ) = nxn-
dy d . , Przykład 1. Pochodną funkcji y = * jest ——= — * = 3* . d* d* Przykład 2. Pochodną funkcji y = *9 jest —- *9 = 9*8. d* Reguła ta obowiązuje dla dowolnej rzeczywistej potęgi *, tzn. wykładnik może być dowolną liczbą rzeczywistą. Udowodnimy ją jedynie dla przypadku, gdy n jest liczbą naturalną. W najprostszym przypadku, dian = 1, funkcja jest rów na/(*) = * i zgodnie z regułą jej pochodna wynosi:
[z (7.2)] [twierdzenie o granicy sumy] [suma n składników]
Ponieważ At jest-m ponownie dowolną wartością *, zatem ten ostatni wynik może być uogólniony jako: /'( * ) = «*"-1, co kończy dowód dla liczb naturalnych n. Jak wspomniano wcześniej, reguła ta obowiązuje nawet wtedy, gdy wykładnik w wyrażeniu potęgowym nie jest liczbą naturalną. Ilustrację zastosowania reguły w tych przypadkach stanowią następujące przykłady. Przykład 3. Znaleźć pochodną funkcji y = *°. Stosując (7.1), otrzymujemy: A a.o = 0;(. - i = 0 dx
168 ANALIZA STATYKI PORÓWNAWCZEJ
Przykład 4. Znaleźć pochodną funkcji y = —y. Występuję tu odwrotność potęgi, ale przedstawiając funkcję jako y = r~3, możemy znów zastosować (7.1), otrzymując pochodną: — x dx
dr
1
1
1
x " -N " ~^N C
~ C i™
2
[twierdzenie o granicy iloczynu] x" —N" X-Ń ~ =
[granica stałej]
2 fx .
/ '( 1 ) = 3 - 12 = 3;
= 3;
= cnN "~\
[z (7.3)]
Ponieważ N jest dowolną wartością r, więc ten ostatni wynik możemy natychmiast uogólnić do / '( r ) = cnx"~ \ co kończy dowód.
f'( 2 ) = 3 • 22= 12.
Te szczególne wartości pochodnej mogą być również zapisane następująco: dy dr
= 12,
ale oczywiście o zn a cz en ia/'(l) i / '( 2 ) są preferowane z powodu ich prostoty. Należy pamiętać, że gdy chcemy znaleźć wartość p o c h o d n e j/'( l),/'(2) itd., musimy najpierw zróżniczkować funkcję/(r), aby znaleźć jej funkcję pochodną/'(r), a dopiero potem nadać r konkretne wartości we wzorze n a / '( r ) . Podstawianie konkretnych wartości r do funkcji pierwotnej przed różniczkowaniem jest całkowicie niedopuszczalne. Przykładowo, jeśli podstawimy r = 1 do funkcji z przykładu 1 przed różniczkowaniem, to funkcja sprowadzi się do y = 1, czyli do funkcji stałej, która ma zerową pochodną, a wiadomo, że prawidłowa odpowiedź je s t / '( r ) = 3 r2.
Uogólniona reguła dla funkcji potęgowej Gdy w funkcji potęgowej pojawią się stały czynnik c, tak że / ( r ) = cxn, wówczas jej pochodna jest równa:
dr
Aby udowodnić tę nową regułę, zobaczmy, że dla każdej wartości r, np. r = N, wartość pochodnej / ( r ) = cx" jest równa: e>, „X _ /W -/(N ) ,. cxn- cNn .. ( x n- N 1 j (N ) = lir n — = l u n -------------- = lim c x —N *-*if x - N x-+n { x - N
Pochodne same są funkcjami zmiennej niezależnej x. W przykładzie 1 pochodna jest równa d y /d r = 3 r2, c z y li/'( r) = 3 r2, tak więc różne wartości x będą dawały różne wartości pochodnej, takie jak:
dr
Przykład 8. Pochodną / ( r ) = 3 r-2 j e s t / '( r ) = - 6 r 3.
-3
= -3 r~
Przykład 5. Znaleźć pochodną y = f x . W tym przypadku pojawia się pierwiastek i— i kwadratowy, ale ponieważ j x = r 2, więc można obliczyć pochodną w następujący sposób: d
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ 169
czyli
/ '( r ) = ęnx" 1
Wynik ten pokazuje, że różniczkując cx", możemy po prostu pozostawić stały czyn nik c bez zmian i zróżniczkować x" zgodnie ze wzorem (7,1). Przykład 6. Dla y = 2 r mamy d y /d r= 2 r° = 2. Przykład 7. D la /(r ) = 4 r 3 pochodną je s t / '( r ) = 12r2,
Ćwiczenie 7.1 1. Znaleźć pochodną każdej z następujących funkcji: (a) y = r 13; (b) y = 63;
(c) y= 7 r 6; (d) ^ = 3 « "';
(e) w = - 4r J .
2. Obliczyć: (a) T - C - * '4);
(c)
9 w4;
\ (e) — aub.
UW
d i (b) - 7 - 7 r 3; dr
d l/
d (d) — c r 2; dr
3. Z n aleźć/'(1 ) i / '( 2 ) dla następujących funkcji: (a) y = /( r ) = 18 r ;
(d) f( x ) = 2 r *;
(b) y = /(* ) = c r 3; -
(e) f( w ) = 6w ?.
4
(c) / ( r ) = - 5 r -2; 4. Narysować wykres funkcji, której pochodna jest r ó w n a /'(r ) = 0. Następnie narysować wykres funkcji /charakteryzowanej przez w a ru n e k /'(r0) = 0.
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ 171
170 ANALIZA STATYKI PORÓWNAWCZEJ
7.2. REGUŁY RÓŻNICZKOWANIA DOTYCZĄCE DWU LUB WIĘKSZEJ LICZBY FUNKCJI TEJ SAMEJ ZMIENNEJ Wszystkie reguły przedstawione w poprzednim podrozdziale dotyczyły pojedynczej funk cji /(* ). Załóżmy teraz, że mamy dwie różniczkowalne funkcje tej samej zmiennej x, np./(* ) i g (x) i że chcemy różniczkować sumę, różnicę, iloczyn lub iloraz utworzony z tych dwu funkcji. Czy istnieją reguły, które można zastosować w tych okolicznościach? Dokładniej Jeśli dane są dwie funkcje— powiedzmy f(x ) = 3x2 i g (x) = 9 x12— to jak mamy obliczyć pochodną 3x2 + 9x12 lub pochodną 3x29x12?
Reguły dla sumy i różnicy
Przykład 4.
dx
(7x4 + 2x3 - 3x + 37) = 28x3 + 6x2 - 3 + 0 = 28x3 + 6x2 - 3.
W dwu ostatnich przykładach stałe c i 37 nie wywierają wpływu na pochodną, ponieważ pochodna stałej jest równa zeru. W przeciwieństwie do stałego mnożnika, który zachowywany jest przy mnożeniu, stała dodawana znika. Fakt ten stanowi matematyczne wyjaśnienie dobrze znanej zasady ekonomicznej, że koszt stały firmy nie wpływa na jej koszt krańcowy. Dla danej funkcji krótkookresowego kosztu całkowitego: C = f i3 - 4 fi2 - 10g + 75
Pochodna sumy (różnicy) dwu funkcji jest sumą (różnicą) pochodnych tych funkcji: - j~ [ f( x ) ± g (*)] = - j - f(x ) ± dx d x d x
Przykład 3. —— (ax2 + bx + c) - 2ax + b. dx
g (x) = /'(* ) ± g'(x).
Udowodnienie tego wzoru wymaga zastosowania definicji pochodnej i innych twierdzeń o granicach. Pominiemy zatem dowód, a zamiast tego po prostu za pomocą przykładów pokażemy, że reguła ta obowiązuje. dy Przykład 1. Pochodna funkcji y = 14x3 jest równa — = 42x2. Ale 14x3 = 5x3 + 9x3, więc y można traktować jako sumę dwu funkcji: /(* ) = 5*3 i g(x) = 9x3. Zgodnie z regułą dla sumy mamy: — = — (5x3 + 9x3) = — 5.r3 + — 9x2 = 15x2 + 27x2 = 42x2, dx dx dx dx
funkcja kosztu krańcowego (dla nieskończenie małego przyrostu produkcji) jest granicą ilorazu AC/Ag, czyli pochodną funkcji C: dC . ~tx: - 3 g - 8 g + 10, dg a koszt stały jest reprezentowany przez addytywną stałą 75. Ponieważ znika ona podczas obliczania dC /dg, więc wielkość kosztu stałego oczywiście nie może wpływać na koszt krańcowy. Ogólnie, jeśli funkcja pierwotna y = /(x ) reprezentuje całkowitą funkcję, to pochodna dy/dx jest jej funkcją krańcową. Dla obu funkcji można oczywiście sporządzić ich wykresy jako funkcji zmiennej x; ze względu na odpowiedniość między pochodną funkcji i na chyleniem jej wykresu, dla każdej wartości x funkcja krańcowa powinna mieć wartość równą nachyleniu funkcji całkowitej dla tej wartości x. Na rysunku 7.1(a) liniowa funkcja całkowita (o stałym nachyleniu) ma, jak widać, stałą funkcję krańcową. Funkcja nieliniowa (o zmiennym nachyleniu) na rys. 7.1(b) ma natomiast
co jest tożsame z wcześniejszym wynikiem. Regułę tę, podaną wyżej dla dwu funkcji, można z łatwością rozszerzyć na większą liczbę funkcji. Zatem możemy napisać: - f - (/(*) ± g(x) ± h(x)] = /'( * ) ± g'(x) ± h \x ). dx Przykład 2. Funkcjay= 14x3 może być zapisana jako y = 2x3 + 13x3- x 3. Pochodna tej ostatniej, zgodnie z regułą dla sumy i różnicy, jest równa: -7^-= — (2 r3 + 13*3 - * 3) = ć*2 + 39*2 - 3*2 = 42*2, dx dx co znów zgadza się z poprzednią odpowiedzią. Reguła ta ma wielkie znaczenie praktyczne. Dzięki niej możemy znaleźć pochodną każdej funkcji wielomianowej, gdyż funkcja taka jest niczym innym, jak tylko sumą funkcji potęgowych.
Rysunek 7.1(a, b)
172 ANALIZA STATYKI PORÓWNAWCZEJ
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ 173
intuicyjnego uogólnienia, więc przedstawimy dowód wzoru (7.4). Zgodnie z (6.13) wartość pochodnej f(x)g {x) przy x = N powinna być równa: (7.5)
.d -IA O » « ] dx
-lim /W « W - /< " ) « W x-> N x-N x -N
Dodając i odejmując f(x ) g (N j w liczniku (pozostawiamy pierwotną wartość bez zmian), możemy przekształcić iloraz po prawej stronie (7.5) w następujący sposób: 7 (* ) g(x) ~ f(x ) g (AQ +/(x)g(/V ) - / ( N) g (N j x -N x-N
x-N
Podstawiając to zamiast ilorazu po prawej stronie (7.5) i przechodząc do granicy, otrzymujemy: Rysunek 7.1(c) (7.5') krzywoliniową funkcję krańcową, której wykres przebiega pod osią x, gdy całkowita funkcja ma nachylenie ujemne, a powyżej osi, gdy funkcja całkowita ma nachylenie dodatnie. Na podstawie rysunku 7.1(c) Czytelnik może zauważyć (porównując rys. 6.5), że „brak gładkości” funkcji całkowitej powoduje lukę (nieciągłość) funkcji krańcowej, czyli funkcji pochodnej. Stanowi to wielki kontrast z funkcją całkowitą przedstawioną na rys. 7.1(b), która wszędzie jest gładka i dla której funkcja krańcowa jest ciągła. Z tego powodu gładkość funkcji pierwotnej wiąże się z ciągłością jej funkcji pochodnej. Zamiast mówić, ze pewna funkcja jest wszędzie gładka i różniczkowalna, możemy scharakteryzować ją jako funkcję o ciągłej funkcji pochodnej i nazywać ją funkcją różniczkowalną w sposób ciągły.
Reguła dla iloczynu Pochodna iloczynu dwu funkcji różniczkowalnych jest równa sumie iloczynu pierwszej funkcji przez pochodną drugiej funkcji i iloczynu drugiej funkcji przez pochodną pierwszej funkcji: (7.4)
A [/(* )g(x)] = /( x ) - 1 g(x) + g(x) ~ f ( x ) = /(x ) g \x ) + g { x )f'(x ). dx dx dx
Przykład 5. Znaleźć pochodnąy = (2x + 3)3x2. N iech/(x) = 2x + 3 ig (x) = 3x2. Wtedy f ( x ) = 2, a g’(x) = 6x j zgodnie z (7.4) szukana pochodna jest równa: — [(2x + 3) O x1)} = (2x + 3) 6x + 3x2 ■2 = 18x2 + 18x. dx Wynik ten możemy sprawdzić, obliczając najpierw iloczyn f(x)g (x), a potem pochodną otrzymanego wielomianu. Iloczyn jest rów ny/(r) g (x) = (2x + 3) 3x2 = 6x3 + 9x2; bezpośred nie różniczkowanie daje tę samą pochodną równą 18x2 + 18x. Pamiętajmy, że pochodna iloczynu nie jest po prostu iloczynem dwu osobnych pochodnych. Ponieważ różni się to od tego, czego moglibyśmy oczekiwać na podstawie
^ ~ [f(x )g (x )] dx
r - ,/ a r ~
8 (x)~g(N) t v
v
= lim f(x ) h m ---------------- + lim g (N ) l i m ---------- —— . x —* N x-> N x —N x —> N x —* N X —N
Można łatwo obliczyć wartości czterech granic w (7.50. Pierwsza z nich jest równa f( N ) , a trzecia (jako granica stałej) jest równa g (N ). Pozostałe dwie, zgodnie z (6.13), są to odpowiednio g \N ) i f \ N ) . Zatem (7.50 sprowadza się do: (7.5")
-? -[/(* )* (* )] dx
= f(N )g \N ) + g { N )f\N ).
Ponieważ N reprezentuje dowolną wartość x, wzór (7.5'0 obowiązuje również po zastąpieniu symbolu N przez x. To kończy dowód reguły. Jako uogólnienie reguły na przypadek trzech funkcji mamy: (7.6)
— [f(x)g(x)h(x)] = f\x )g { x )h ( x ) + f(x)g '(x)h {x) + f( x ) g (x )h \x ) ,
czyli pochodna iloczynu trzech funkcji jest równa sumie iloczynu drugiej i trzeciej funkcji i pochodnej pierwszej funkcji, iloczynu pierwszej i trzeciej funkcji i pochodnej drugiej funkcji oraz iloczynu pierwszej i drugiej funkcji i pochodnej trzeciej funkcji. Wynik ten można otrzymać, stosując kilkakrotnie (7.4). Najpierw traktujemy iloczyn g(x) h(x) jak jedną funkcję, powiedzmy
174 ANALIZA STATYKI PORÓWNAWCZEJ
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANAI.IZTF. STATYKI PORÓWNAWCZEI 175
Znajdowanie funkcji przychodu krańcowego na podstawie funkcji przychodu przeciętnego Jeśli dana jest funkcja przeciętnego przychodu (average revenue function, AR) w postaci: AR = 1 5 -< 2 , to funkcję przychodu krańcowego (marginal revenue, MR) można znaleźć, mnożąc najpierw AR przez ß w celu znalezienia funkcji całkowitego przychodu (R): R = AR ß = ( 1 5 - ß ) ß = 1 5 ß - ß 2 i różniczkując następnie R : dJ? MR = — = 1 5 - 2 ß . dß Ale jeśli funkcja AR jest dana w postaci ogólnej A R = /( ß ), to funkcja całkowitego przychodu również będzie zapisana w postaci ogólnej: Ä = A R -ß = /(ß )ö , a zatem podejście wykorzystujące „wymnożenie” będzie bezużyteczne. Ponieważ jed nak R jest iloczynem dwu funkcji zmiennej ß , a mianowicie f( Q ) i samej Q, więc m ożna" zastosować wzór na pochodną iloczynu. Możemy zatem zróżniczkować R, aby otrzymać funkcję MR, w następujący sposób: (7.7)
MR = - ^ - = / ( ß ) - l + ß / ' ( ß ) = / ( ß ) + ß / '( ß ) . dß
Ale czy tak ogólny wynik może powiedzieć nam cokolwiek istotnego o MR? Otóż może. Przypomnijmy sobie, ż e f(Q ) oznacza funkcję AR; przegrupujmy (7.7) i zapiszmy: (7.7')
MR - AR = MR - / (ß ) = ß / '( ß ) ;
. i
obrazuje nam to istotny związek między MR i AR: będą się one mianowicie zawsze różnić o ß f '( ß ) . Pozostaje tylko zbadać wyrażenie ß / '( ß ) . Jego pierwsza składowa ß oznacza wielkość produkcji i jest zawsze nieujemna. Druga skladow a/'(ß) reprezentuje nachylenie wykresu AR jako funkcji Q. Ponieważ „przeciętny przychód” i „cena’’ są tylko różnymi nazwami tej samej rzeczy: -„.A R PO A R = — = — = P,
0
.
■
0
więc krzywa AR może być traktowana również jako krzywa wyrażająca zależność ceny P od produktu Q. P - f(Q ). Z tego punktu widzenia krzywa AR jest po prostu odwrotnością krzywej popytu na produkt firmy, tzn. jest krzywą popytu wykreśloną po zamianie miejscami osi P i ß W warunkach pełnej konkurencji krzywa AR jest poziomą linią prostą, więc / '( f i ) = 0 i — wzoru (7.7') — MR - AR = 0 dla wszystkich możliwych wartości ß . Zatem krzywe MR i AR muszą się pokrywać. Przy niepełnej konkurencji krzywa AR jest zwykle opadająca, jak na rys. 7.2, w ięc/ '(ß ) < 0 oraz, na mocy (7.7'), MR - AR < 0 dla wszystkich dodatnich poziomów produkcji. W tym przypadku krzywa MR musi leżeć poniżej krzywej AR.
Sformułowany właśnie wniosek jest jakościowy: dotyczy jedynie względnego położenia dwu krzywych. Ale wzór (7.7') dostarcza również informacji ilościowej, że krzywa MR będzie położona poniżej krzywej AR z odstępem dla każdego fi równym dokładnie Q f'(Q ). Popatrzmy znów na rys. 7.2 i rozważmy konkretny poziom produkcji N. Dla tej wielkości produkcji wyrażenie f i/'(f i) przyjmuje konkretną wartość N f'(N ); jeśli znajdziemy na rysunku wielkość N f'{ Al), to będziemy wiedzieć, w jakiej odległości poniżej punktu średniego przychodu G musi leżeć odpowiedni punkt przychodu krańcowego. Wielkość Aljest już określona. N atom iast/'(A /jest to po prostu nachylenie krzywej AR w punkcie G (gdzie Q = N), tzn. jest to nachylenie stycznej JM mierzone ilorazem dwu odległości OJ/OM. Widzimy jednak, że OJIOM = HJIHG: ponadto odległość HG jest dokładnie równa rozważanej wielkości produkcji N. Zatem odległość N f'(N ), jaka dzieli krzywą AR i leżącą pod nią krzywą MR dla produkcji Al, jest równa: N f \ N ) = H G ^ = HJ. Zgodnie z tym, jeśli zaznaczymy pionowy odcinek KG = HJ bezpośrednio pod punktem G, to punkt K musi być punktem na wykresie MR (łatwą metodą dokładnego wykreślania KG jest przeprowadzenie linii prostej przechodzącej przez punkt H i równoległej do JG\ punkt K jest punktem przecięcia tej prostej z pionową prostą NG). Taką samą procedurę można zastosować do wyznaczania innych punktów na krzywej MR. Dla każdego wybranego punktu G' na prostej musimy tylko narysować styczną do AR w punkcie G', która przetnie oś pionową w pewnym punkcie J ', Następnie rysujemy poziomą prostą przechodzącą przez G' i przedłużamy ją w stronę osi pionowej. Punkt jej przecięcia z osią oznaczamy jako H ’. Jeśli zaznaczymy pionowy odcinek K 'G ' = H 'J ' poniżej punktu G ', to punkt K ' będzie punktem na krzywej MR. Jest to graficzna metoda otrzymywania krzywej MR dla danej krzywej AR. Ściślej rzecz biorąc, dokładne wykreślenie stycznej wymaga znajomości wartości pochodnej dla dnej wielkości produkcji, tzn. /'(A 1); zatem przedstawiona metoda graficzna nie może istnieć całkiem samodzielnie. Ważnym wyjątkiem jest przypadek, gdy wykres AR jest prostą; wtedy
176 ANALIZA STATYKI PORÓWNAWCZEJ
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ 177
styczną do wykresu w dowolnym punkcie jest sama ta prosta i wskutek tego nie trzeba wykreślać żadnych stycznych. Wtedy powyższa metoda graficzna może być stosowana bezpośrednio.
I M
Wzór na pochodną ilorazu
- lim f(N ) lim x -> N
Pochodna ilorazu dwu funkcji /(x)/g(x) jest równa: d f( x )
W liczniku z których każdy /'( x ) występuje znakiem minus.
x-> N
x —> N
1 ,■ g(N) « n rlim / W -/W hm --------------x^>N x ~ N g (.x )g W x^>N°
g ( x ) -g ( N ) X ~ N
g \N )
[ g ( .N ) f \ N ) - f ( N ) g \ N ) l
[z (6.13)]
g \x ) wyrażenia po prawej stronie występują dwa składniki w postaci iloczynów, zawiera pochodną tylko jednej spośród pierwotnych funkcji. Zauważmy, że w iloczynie opatrzonym znakiem plus, a g'(x) w iloczynie opatrzonym Mianownik jest kwadratem funkcji g(x), tzn. g 2(x) = [g(x)]2.
Przykład 6.
Przykład 7.
Przykład 8.
dx
2 x-3
2(x + l ) - ( 2 x - 3 ) l
x+ 1
(x + 1)2
5x
5(x2 + l ) - 5 x - 2 x
5 (1 - x ) 2
(x2! - 1)2
(x2! - 1)2
dx x + 1 s /
dx
5
“ " ( x + l) 2
dx g(x)
2ax(cx) - (ax2 + b)c
c(ax2 - b )
ax2- b
cx
(cx)2
(cx)2
cx2
/
= lim
Zastosowanie ekonomiczne wzoru na pochodną ilorazu zilustrujemy przykładem dotyczącym tempa zmian przeciętnego kosztu przy zmianie wielkości produkcji. Dla danej funkcji całkowitego kosztu C = C(Q) funkcja przeciętnego kosztu (AC) będzie ilorazem dwu funkcji Q, ponieważ AC - C{Q)IQ i jest zdefiniowane dla Q > 0. Wobec tego tempo zmian AC względem Q może być obliczone przez różniczkowanie AC: d C ( 8 ) _ [C,( 8 ) 8 - C ( 8 ) 1] dQ
Q2
Q
1
Q
C \Q ) -
C(Q) Q
stąd wynika, że dla Q > 0:
fa x22+ bL \
Związki między funkcjami kosztu krańcowego i kosztu przeciętnego
(7.9)
Regułę tę można udowodnić w następujący sposób: dla dowolnej wartości x = N mamy: (7.8)
- lim ,
co można uogólnić, zastępując symbol Al przez x, ponieważ Al reprezentuje dowolną wartość x. Kończy to dowód wzoru.
f'(x )g (x ) - f ( x ) g \ x )
dx g {x )
dx g(x)
f{x )lg {x )-f{N )lg (N ) x-N
Wyrażenie ilorazowe stojące po znaku granicy można zapisać w postaci: f( x ) g ( N ) - f( N ) g ( x )
I
g(x)g(N)
x —N
d C(Q) ^dQ¡ ^Q 5 °
|v/tedy i tylko] C(Q) 1 c ( 2 ) i „ • [wtedy, gdy J Q
Ponieważ pochodna C'(Q) reprezentuje funkcję kosztu krańcowego (MC), a C(Q)/Q — funkcję AC, ekonomiczny sens (7.10) jest następujący: nachylenie krzywej AC będzie dodatnie, zerowe lub ujemne wtedy i tylko wtedy, .gdy krzywa kosztu krańcowego leży powyżej krzywej AC, przecina ją lub leży poniżej niej: Zilustrowano to na rys. 7.3, gdzie narysowano wykresy funkcji MC i AC otrzymanych dla konkretnej funkcji całkowitego kosztu: ■ C = Q3- 1 2 Q 2 + 60Q.
Dodając i odejmując w liczniku wyrażenia f(N )g (N), po uporządkowaniu możemy je przekształcić do postaci: 1 f( x ) g ( N ) - f( N ) g ( N ) + m g ( N ) - f ( N ) g ( x ) g(x)g(N ) x —N 1 _ /(x ) - f( N ) g (N ) g(x)g(N ) x —N
<7-10)
Na lewo od Q = 6 AC maleje, więc MC leży poniżej tej krzywej; na prawo jest odwrotnie. Dla (2 = 6 AC ma nachylenie równe zeru i MC oraz AC mają tę samą wartość1. Wniosek ilościowy podany w (7.10) został sformułowany w zastosowaniu do funkcji kosztu. Jednakże jego prawdziwość pozostanie nie zmieniona, gdy C (g ) będziemy inter pretować jako dowolną inną różniczkowalną funkcję całkowitą, z C{Q)!Q i C'(Q) jako odpowiadającymi jej funkcjami przeciętną i krańcową. Zatem wynik ten daje nam ogólny
g ( x ) -g ( N ) /W
x-N
Po podstawieniu tego wyrażenia do (7.8) i przejściu do granicy, otrzymujemy:
1 Zauważmy, że (7.10) nie oznacza, że gdy AC ma ujemne nachylenie, to MC również musi mieć ujemne nachylenie; oznacza jedynie, że wtedy AC musi przecinać MC. Na przykład w punkcie (2 = 5 na rys. 7.3 AC maleje, ale MC rośnie, więc ich nachylenia mają przeciwne znaki. 12 — Podstawy...
178 ANALIZA STATYKI PORÓWNAWCZEJ
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ 179
c. Czy wykres MR otrzymany graficznie w (a) zgadza się z matematycznie otrzymaną funkcją MR w (b)? d. Co można powiedzieć o nachyleniu funkcji AR i MR? 5. Podać dowód matematyczny ogólnego wyniku, że dla danej liniowej krzywej przeciętnej odpowiadająca jej krzywa krańcowa musi mieć taki sam punkt przecięcia z osią pionową, ale jest dwa razy bardziej stroma niż krzywa przeciętna. 6. Udowodnić wzór (7.6) traktując najpierw g(x)h(x) jako pojedynczą funkcję, g{x)h(x) = = cp(jc), a potem stosując regułę dla iloczynów (7.4). 7. Znaleźć pochodną funkcji: (a) (x2+ 3)!x\ (c) 4x/(x + 5); (b) (x + l ) / x ; (d) (ax2 + b)/(cx + d). 8. Dana jest funkcja f(x ) = ax + b. Znaleźć pochodne: (a) /(* ); (b) x f( x ) ; (c) 1lf(x); (d) f(x )lx .
7.3. REGUŁY RÓŻNICZKOWANIA DOTYCZĄCE FUNKCJI O RÓŻNYCH ARGUMENTACH Rysunek 73
związek między funkcją końcową i przeciętną. W szczególności zwróćmy uwagę, że fakt, omówiony w związku z rys. 7.2, iż MR leży poniżej AR, gdy AR jest malejąca, jest po prostu szczególnym przypadkiem ogólnego wyniku (7.10).
W poprzednim podrozdziale omówiliśmy reguły różniczkowania sumy, różnicy, iloczynu i ilorazu dwu (lub większej liczby) różniczko walnych funkcji tej samej zmiennej. Rozważymy teraz przypadki, gdy mamy dwie lub więcej funkcji różniczkowalnych, z których każda ma inną zmienną niezależną.
Wzór na pochodną funkcji złożonej Ćwiczenie 7.2 1. Dla danej całkowitej funkcji kosztu C= Q3 - 5Q2 + 14(2 + 75 zapisać funkcję kosztu zmiennego (variable-cost function, VC). Znaleźć pochodną funkcji VC i zinterpretować ekonomiczny sens tej pochodnej. 2. Dla danej funkcji przeciętnego kosztu AC = fi2 - 4Q + 214 znaleźć funkcję MC. Czy dana funkcja jest bardziej odpowiednia jako funkcja długookresowa, czy jako funkcja krótko okresowa? Dlaczego? 3. Za pomocą wzoru na pochodną iloczynu zróżniczkować: (a) (9x2- 2 ) ( 3 x + 1); (d) (a x - b ) c x 2; (b) (3x + 11) (6x2 - 5x); (e) (2 - 3jc) (1 + x) (x + 2); (c) x2(4;t + 6); (f) (x2 + 3)x~1. 4. a. Dla danego AR = 6 0 - 3 ( 2 sporządzić wykres krzywej przeciętnego przychodu, a następnie znaleźć krzywą MR metodą zastosowaną dla rys. 7.2. b. Znaleźć matematycznie funkcje całkowitego i krańcowego przychodu na podstawie danej funkcji AR.
Jeśli mamy funkcję z =f( y ) , gdzie y jest z kolei funkcją innej zmiennej x, powiedzmy y = g (x), to pochodna z względem x jest równa iloczynowi pochodnej z względem y i pochodnej y względem x. Można to wyrazić symbolicznie:
Reguła ta, znana jako wzór na pochodną funkcji złożonej, przemawia do intuicji. Dla danego A x musi się pojawić odpowiednie Ay za pośrednictwem funkcji y = g(x), ale Ay z kolei spowoduje powstanie Az za pośrednictwem funkcji z= f(y ). Mamy tu zatem „reakcję łańcuchową” : poprzez g A x ---------------- > Ay
poprzez /
» Az.
Dwa związki w tym łańcuchu dotyczą dwu ilorazów różnicowych A y/A x i Az/Ay. Po wymnożeniu Ay się skróci i w końcu zostaje iloraz różnicowy:
180 ANALIZA STATYKI PORÓWNAWCZEJ
Az Ay
Az
Ay A x
A x'
r e g u ł y r ó ż n i c z k o w a n i a i ic h z a s t o s o w a n i e w a n a l iz ie s t a t y k i p o r ó w n a w c z e j
który wiąże Az i Ax. Jeśli przejdziemy do granicy w tych ilorazach różnicowych przy A x —> 0 (co implikuje Ay -> 0), to każdy iloraz różnicowy przekształci się w pochodną, tzn. będziemy mieć (dz/dy) (dy/tLt) = dz/djc. Jest to dokładnie wynik podany w (7.11). Korzystając z funkcji y = g (x), możemy wyrazić funkcję z = /(y ) jako z =/Ls(/)]> gdzie występowanie dwóch symboli funkcyjnych f i g obok siebie oznacza, że jest to funkcja zło żona (funkcja innej funkcji). Z tego powodu reguła ta jest nazywana regułą różniczkowania funkcji złożonej. •. ; Wzór na pochodną funkcji złożonej można bezpośrednio uogólnić dla trzech lub więcej funkcji. Jeśli mamy z = /(y ), y = g(x) i x = h(yv), to: dz dz dy dx — = — — — = / (y) s t o * (w) dw dy d r dw i podobnie jest dla przypadków, w których występuje więcej funkcji. Przykład 1. Jeśli z = 3y2, gdzie y = 2x + 5, to: £ “ - ^ = 6 y - 2 = 12y==12(2* + 5). ax dy ax Przykład 2. Jeśli z = y - 3, gdzie y = x 3, to: dz — = l - 3 x 2 = 3x2. dx
'
Przykład 3. Użyteczność podanego wzoru możemy najbardziej docenić wtedy, gdy musimy zróżniczkować funkcję taką, jak: z = (x2 + 3 x - 2)17. Gdybyśmy nie dysponowali wzorem na pochodną funkcji złożonej, wówczas dz/dx można byłoby obliczyć tylko po pracochłonnym wymnożeniu 17 potęgi wyrażenia. Za pomocą wzoru na pochodną funkcji złożonej możemy natomiast „iść na skróty” , definiując najpierw nową, pośrednią zmienną y = x 2 + 3x - 2 i w konsekwencji otrzymać dwie funkcje połączone w łańcuch: z = y 17
i
181
a dQ /d L jest krańcową fizyczną produktywnością pracy (MPPl). Podobnie dR /dL stanowi funkcję krańcowego przychodu produktywności pracy (marginal revenue product of labor) (M RPJ. Zatem wynik pokazany powyżej stanowi matematyczne sformułowanie dobrze znanego w ekonomii wyniku, że MRPL= MR ■MPPL.
Reguła różniczkowania funkcji odwrotnej Jeśli funkcja y = f(x j reprezentuje odwzorowanie wzajemnie jednoznaczne, tzn. jeśli funkcja jest taka, że różnym wartościom y odpowiadają zawsze różne wartości x, to funkcja / bę dzie miała funkcję odwrotną x = f ~ l(y) (czytamy: x jest funkcją odwrotną y). Tutaj / _1 jest symbolem funkcyjnym, który — tak jak symbol funkcji pochodnej / ' — oznacza funkcję związaną z funkcją f : nie oznacza on odwrotności — —. f( x ) Istnienie funkcji odwrotnej oznacza, że nie tylko danej wartości x odpowiada jedyna wartość y (tzn. y = /(x )), lecz również danej wartości y odpowiada jedyna wartość x. Przykładem wzajemnie jednoznacznego odwzorowania jest odwzorowanie zbioru wszystkich mężów w zbiór żon w społeczeństwie monogamicznym. Każdy mąż ma jedną żonę i każda żona ma jednego męża. W przeciwieństwie do tego, odwzorowanie zbioru wszystkich ojców w zbiór wszystkich synów nie jest wzajemnie jednoznaczne, ponieważ ojciec może mieć więcej niż jednego syna, chociaż każdy syn ma jednego ojca. Gdy x i y są liczbami, wówczas własność wzajemnej jednoznaczności cechuje klasę funkcji znanych jako funkcje monofoniczne. Jeśli dla danej funkcji f(x ) kolejne, coraz to większe wartości zmiennej niezależnej x zawsze prowadzą do rosnących wartości f(x ), tzn. jeśli: x l > x2 =>f(xl) > f(x 2), to o fu n k cji/ mówimy, że jest funkcją rosnącą (lub monofonicznie rosnącą)2. Jeśli wzrost x zawsze prowadzi do zmniejszenia y, tzn. jeśli: •*1 > *2 = * /( * l) C / f e ) ,
to mówimy, że funkcja jest funkcją malejącą (lub monofonicznie malejącą). W obu tych przypadkach istnieje funkcja odwrotna f~'(x).
y = x 2 + 3x —2.
Pochodną dz/djt można teraz znaleźć w następujący sposób: — = — ^ = 1 7 y 16(2x + 3) = 17(;t2 + 3 ;c -2 )16(2* + 3). dr dy d r
-
Przykład 4. Dla danej funkcji przychodu całkowitego pewnej firmy R —f{Q )> gdzie produkcja Q jest funkcją nakładu pracy L, czyli Q = g (£.), znaleźć dR /dL. Na mocy wzoru na pochodną funkcji złożonej mamy: dR
dR dQ
,
dZ = d fi d f Przekładając to na terminy ekonomiczne, dR/dQ jest funkcją przychodu krańcowego MR,
2 Niektórzy autorzy wolą definiować f u n k c ję X\
termin X\
ro sn ą cą
jako funkcję o tej własności, że:
> X i =+/(ją) 5=/(x2): ś c iś le ro s n ą c a f u n k c ja
>x2=>/(xI) > f ( x j ) .
[z nieostrą nierównością] zachowują dla przypadku, gdy:
[z ostrą nierównością]
W tej terminologii wstępująca funkcja schodkowa jest rosnącą (chociaż nie ściśle rosnącą) funkcją mimo iż jej wykres zawiera poziome odcinki. Nie będziemy używać tej terminologii w książce. Zamiast tego będziemy traktować wstępującą funkcję schodkową nie jako funkcję rosnącą lecz jako funkcję n ie m a le ją c ą . Z tego samego względu będziemy rozpatrywać zstępującą funkcję schodkową nie jako funkcję malejącą lecz jako funkcję n ie r o s n ą c ą .
182 ANALIZA STATYKI PORÓWNAWCZEJ
Praktycznym sposobem sprawdzenia monotoniczności danej funkcji je st ustalenie, czy pochodna f'( x ) ma zawsze taki sam znak algebraiczny (i jest niezerowa) dla wszystkich wartości x. Geometrycznie oznacza to, że nachylenie wykresu funkcji jest zawsze dodatnie lub zawsze ujemne — wykres stale się wznosi albo stale opada. Zatem krzywa popytu dla pewnej firmy (wykres funkcji popytu Q = f(P ), która ma wszędzie nachylenie ujemne, jest monotoniczna. Jako taka ma ona funkcję odwrotną P = / " ’(0,4ctóra określa krzywą średniego przychodu firmy, gdyż P = AR. Przykład 5. Funkcjay = 5x + 25 ma pochodną dy/dx = 5, która jest dodatnia niezależnie od wartości x ; zatem funkcja jest monotoniczna (w tym przypadku jest rosnąca, gdyż pochodna jest dodatnia). Wynika stąd, że istnieje funkcja odwrotna. W obecnym przypadku funkcję odwrotną można łatwo znaleźć, rozwiązując dane równanie y = 5x + 25 względem x. Wynikiem jest funkcja: 1 X = J y ~ 5' Funkcja odwrotna też jest monotoniczna, i to rosnąca, gdyż d x /d y = — > 0 dla wszyst kich wartości y. . Mówiąc ogólnie, jeśli istnieje funkcja odwrotna, to zarówno oryginalna funkcja, jak i funkcja odwrotna muszą być monotoniczne. Ponadto jeśli / " ' jest funkcją odwrotną do /, to /m u s i być funkcją odwrotną dla f ~ \ t z n . / i / _1 są wzajemnie odwrotne. Łatwo sprawdzić, że wykresy funkcji y = /(x ) oraz x = / _1(y) są dokładnie takie same, ty le że z zamienionymi miejscami osiami współrzędnych. Jeśli nałoży się oś x wykresu/ “* na oś x wykresu / (i podobnie z osiami y), obie krzywe nałożą się na siebie. Jeśli natomiast oś x wykresu/ '* położona jest na osi y w ykresu/(i vice versa), to oba wykresy staną się swymi zwierciadlanymi odbiciami względem prostej przechodzącej przez początek układu współ rzędnych nachylonej do osi x i osi y pod kątem 45°. Ta lustrzana symetria zapewnia łatwy sposób sporządzania wykresu funkcji odwrotnej gdy dany jest wykres oryginalnej funkcji / (proszę to sprawdzić dla dwu funkcji z przykładu 5). Dla funkcji odwrotnych reguła różniczkowania jest następująca: dx
1
dy
d y /d x ’
co oznacza, że pochodna funkcji odwrotnej jest odwrotnością pochodnej oryginalnej funkcji; dx/dy musi mieć taki sam znak jak dy/dx, zatem jeśli / j e s t rosnąca (malejąca), t o / _1 też musi być rosnąca (malejąca). W celu sprawdzenia tej reguły odwołajmy się do przykładu 5, gdzie obliczyliśmy, że dy/dx jest równe 5, a dx/dy równe y . Te dwie pochodne są rzeczywiście swymi odwrotnościami i mają taki sam znak. W tym prostym przykładzie dość łatwo można otrzymać funkcję odwrotną, więc jej pochodna dx/dy może być obliczona bezpośrednio ze wzoru na funkcję odwrotną. Jednak, jak pokazuje następny przykład, czasami trudno jest w prosty sposób wyrazić funkcję odwrotną,
REGUŁY RÓŻNICZKOWANLA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ 183
a wtedy bezpośrednie różniczkowanie może nie być możliwe. Użyteczność reguły różnicz kowania funkcji odwrotnej jest wtedy bardziej widoczna. Przykład 6. Dla danej funkcji y = x 5 + x znaleźć dx/dy. Ponieważ: dy dx
, = 5x4 + 1 > 0
dla każdej wartości x, więc dana funkcja jest monofonicznie rosnąca i istnieje funkcja odwrotna. Rozwiązanie danego równania względem x nie jest zbyt łatwe, niemniej jednak można szybko znaleźć pochodną funkcji odwrotnej za pomocą reguły dla funkcji odwrotnej: dx _ dy
i dy/dx
_
i 5x4 + 1 ’
W zasadzie reguła obliczania pochodnej funkcji odwrotnej może być stosowana tylko wtedy, gdy funkcja jest odwzorowaniem wzajemnie jednoznacznym. W istocie mamy tu jednak pewne możliwości ominięcia tego założenia. Na przykład gdy mamy do czynienia z krzywą w kształcie litery U (nie monotoniczną), wówczas możemy potraktować dwa ramiona krzywej — malejące i rosnące — jakó reprezentujące dwie osobne funkcje, z których każda ma ograniczoną dziedzinę i jest w swojej dziedzinie monotoniczna. Można wtedy do każdej z nich zastosować regułę dla pochodnej funkcji odwrotnej.
Ćwiczenie 7.3 1. Dane jest y = H3+ l , gdzie u = 5 - x 2; znaleźć dy/dx ze wzoru na pochodną funkcji złożonej. 2. Dane są w = ay2 oraz y = b;t2 + cx; znaleźć dw/dx ze wzoru na pochodną funkcji złożonej. 3. Za pomocą wzoru na pochodną funkcji złożonej znaleźć dy/dx dla następujących funkcji: (a) y = (3x2- 1 3 ) 3; (b) y = (8x3- 5 ) 9; (ć). y = (ax + b)4. 4. Dane jest y = (16x + 3)"2. Za pomocą wzoru na pochodną funkcji złożonej znaleźć dy/dx. Następnie przepisać funkcję jako y = 1/(16x + 3)2 i znaleźć dy/dx ze wzoru na pochodną ilorazu. Czy obie odpowiedzi są identyczne? 5. Dana funkcja y = 7 x + 21. Znaleźć jej funkcję odwrotną. Następnie znaleźć dy/dx oraz dx/dy i sprawdzić, czy jest spełniona reguła dla funkcji odwrotnej. Sprawdzić też, czy wykresy obu funkcji są położone symetrycznie względem siebie. 6. Sprawdzić, czy następujące funkcje są monotoniczne: (a) y = -x 6 + 5 (x > 0 ); (b) y = 4x5 + x3 + 3x. Dla każdej funkcji, która jest monotoniczna, znaleźć dx/dy ze wzoru na pochodną funk cji odwrotnej.
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ 185
184 ANALIZA STATYKI PORÓWNAWCZEJ
7.4. RÓŻNICZKOWANIE CZĄSTKOWE
Techniki różniczkowania cząstkowego
i
Różniczkowanie cząstkowe różni się od poprzednio omawianego przede wszystkim tym, że musimy pozostawić wartości (n - 1) argumentów jako ustalone i zmieniać tylko jedną zmienną. Ponieważ nauczyliśmy się, jak postępować ze stałymi przy różniczkowaniu, więc praktycznie różniczkowanie nie powinno stwarzać problemów.
Dotychczas rozważaliśmy jedynie pochodne funkcji jednej zmiennej niezależnej. W analizie statyki porównawczej spotkamy jednakże sytuację, gdy w modelu występuje wiele parame trów, tak że wartość równowagi każdej zmiennej endogenicznej może być funkcją więcej niż jednego parametru. Zatem, aby zastosować pojęcie pochodnej do statyki porównawczej, musimy nauczyć się znajdowania pochodnej funkcji więcej niż jednej zmiennej.
Przykład 1. Dla y = f( x it x2) = 3xj + X)X2 + 4x1 znaleźć pochodne cząstkowe/Jeżeli szukamy dyldxi (czyli/ ) , to musimy pamiętać, aby w trakcie różniczkowania x2 traktować jako stałą. Zatem x2 zniknie w trakcie różniczkowania, jeśli jest stałą ąddytywną (tak jak wyrażenie 4x2), ale pozostanie, jeśli jest stałą multiplikatywną (taką jak w wyrażeniu x,x2). Mamy zatem:
Pochodne cząstkowe Rozważmy funkcję:
3y (7.12)
y = / ( x I; x2, ..., x„),
C/X^
gdzie zmienne x, ( ¿ = 1, 2, . . . , n) są niezależne od siebie, więc każda może zmieniać swoją wartość nie wpływając na pozostałe. Jeśli zmienna xt ulega zmianie Arą, podczas gdy x2, ..., x„ pozostają ustalone, to następuje związana z tym zmiana y, mianowicie Ay. Iloraz różnicowy będzie w tym przypadku wyrażony jako: (7 13)
_
Podobnie, traktując x, jako stałą, znajdujemy: 3y —
0X2
= / 2 = Xi + 8 x2.
Podobnie jak funkcja pierwotna f obie pochodne cząstkowe same są funkcjami zmiennych xt i x2, tzn. możemy je zapisać jako dwie funkcje pochodne:
A L = /(* i + A*i, x 2, . . . , x n) - f ( x i, x2,...,x „ ) AX[ Axi
Jeśli przejdziemy w Ay/Axi do granicy przy Arą —> 0, to granica ta będzie stanowiła pochodną. Nazywamy ją pochodną cząstkową y względem xu aby wskazać, że wszystkie pozostałe argumenty funkcji pozostają nie zmienione przy obliczaniu tej właśnie pochodnej. Podobne pochodne cząstkowe można zdefiniować dla nieskończenie małych przyrostów pozostałych zmiennych. Procedurę obliczania pochodnych cząstkowych można by nazwać różniczkowaniem cząstkowym. . 'S Pochodne cząstkowe są oznaczone odrębnymi symbolami. Przez analogię do litery d (jak dy/dx), stosujemy symbol d, który jest wariantem greckiej litery 8. Będziemy zatem pisać 3y/3x„ co czytamy: pochodna cząstkowa y względem x,. Symbol pochodnej cząstkowej d 3 .■ , ' czasem jest również zapisywany jako ——y. W tym przypadku część —— możemy traktować aXi oXj , jako symbol operatora, który wskazuje nam obliczenie pochodnej cząstkowej (pewnej funkcji / ) względem zmiennej x t. Ponieważ występująca tu funkcja jest oznaczona w (7.12) ja k o /, możemy również pisać 3//3x,. Czy istnieje również odpowiednik dla pochodnych cząstkowych używanego wcześniej symbolu /'( * ) ? Odpowiedź brzmi: tak. Jednakże zamiast f używamy teraz o zn a cz eń /, f i itd., gdzie subskrypt wskazuje, która zmienna niezależna (i tylko ona) podlega zmianom. Jeśli funkcja w (7.12) jest zapisana dla zmiennych bez subskryptów, takich jak y = /(« , v, w), to pochodne cząstkowe oznaczane są /„ , / v, /„ , a nie f i ; f i , f>. ń Zgodnie z tymi oznaczeniami, na podstawie (7.12) i (7.13) możemy teraz zdefiniować pierwszą spośród n pochodnych cząstkowych funkcji/:
= / i = 6xi + x2.
/l= /l(X l,X 2)
i
/ 2= /2(Xi ,X2).
Na przykład w punkcie (x!, x2) = (1, 3) należącym do dziedziny funkcji / pochodne cząstkowe przyjmują następujące wartości: /i(l,
3) = 6 1 + 3 = 9
i
/ 2(1, 3) = 1 + 8 • 3 = 25.
M Przykład 2. Dla danej funkcji y = f(u , v) = (u + 4) (3u + 2v) możnaobliczyć pochodne Cząstkowe za pomocą wzoru ha pochodną iloczynu.'Ustalając v, otrzymujemy: -.. ’■
/„ = (u + 4) 3 + 1 (3u + 2v) = 2 (3u + v + 6). Podobnie, ustalając u, znajdujemy: / , = (« + 4) 2 + 0 (3u + 2yj = 2 (u + 4). Dla n = 2 i v = 1 pochodne te będą przyjmowały następujące wartości:
:
/„(2, 1) = 2 13 = 26
i
/ v(2, i) = 2 ■6 = 12.
Przykład 3. Dla funkcji y = (3« - 2v)/(«2 + 3v) pochodnecząstkowe można znaleźć, stosując wzór na pochodną ilorazu; . /
dy ~d^= dy 3v
3 (k2 + 3v) - 2« (3« - 2v) (u2 + 3v)2
-3 « 2 + 4 uv + 9v =
(u2 + 3v)2
-2 { id + 3v) - 3 (3u - 2v) _ - u (2« + 9) (u1 + 3v)2
(m2 + 3v)2
’■
186 ANALIZA STATYKI PORÓWNAWCZEJ
Geometryczna interpretacja pochodnych cząstkowych Pochodna cząstkowa — jako szczególny rodzaj pochodnej — mierzy natychmiastowe tempo zmian pewnej zmiennej i jako taka ma geometryczny odpowiednik w postaci nachylenia pewnej krzywej. Rozważmy funkcję produkcji Q = Q(K, L), gdzie Q, K i L oznaczają odpowiednio produkcję, nakłady kapitału i nakłady pracy. Funkcja ta jest pewną szczególną wersją (7.12) dla dwu zmiennych, gdzie n = 2. Możemy wobec tego zdefiniować dwie pochodne cząstkowe dQ /dK (czyli Qg) i dQ /dL (czyli QL). Pochodna cząstkowa QK odnosi się do tempa zmian produkcji względem nieskończenie małych zmian kapitału, gdy nakłady pracy są ustalone. Zatem QK symbolizuje funkcję krańcowego fizycznego produktu kapitału (MPPk). Podobnie pochodna cząstkowa QL jest matematyczną reprezentacją funkcji MPPL. Geometrycznie funkcja produkcji Q = Q(K, L) może być zobrazowana za pomocą powierzchni produkcji „rozpiętej” w przestrzeni trójwymiarowej, jak to pokazano na rys. 7.4. Zmienna Q jest zaznaczona na osi pionowej, tak więc dla każdego punktu (K, L) w płaszczyźnie podstawy (płaszczyźnie KL) wysokość „zawieszenia” powierzchni będzie równa wielkości produkcji Q. Dziedzina funkcji powinna obejmować całą nieujemną ćwiartkę płaszczyzny podstawy, ale dla naszych celów wystarczy rozważenie jej podzbioru, czyli prostokąta OK0BL0. W konsekwencji na rysunku pokazana jest tylko niewielka część powierzchni produkcji.
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W A N A L IZ IE STATYKI PORÓWNAWCZEJ 187
geometryczny odpowiednik pochodnej cząstkowej QL. Ponownie zauważamy, że nachylenie krzywej całkowitej (TPPL) jest równe współrzędnej odpowiadającej jej krzywej krańcowej (MPPl = QL). ' Wspomniano wcześniej, że pochodna cząstkowa jest funkcją wszystkich zmiennych niezależnych funkcji pierwotnej. Na podstawię krzywej ^KnCDA jest oczywiste, że QL jest funkcją samej L. Gdy L = LUwówczas wartość QLjest równa nachyleniu krzywej w punkcie C; ale jeżeli L = L 2, to odpowiada mu nachylenie w punkcie D. Dlaczego QLjest również funk cją ¡Cl Odpowiedź jest następująca: K może być ustalone na różnych poziomach i dla każdego z nich otrzymamy inną krzywą TPPL (inny przekrój powierzchni produkcji), z nieuniknionymi reperkusjami dla pochodnej QL. Zatem QL jest również funkcją K. Analogicznie można zinterpretować pochodną cząstkową QK. Jeśli zamiast K ustalimy nakład pracy (powiedzmy, na poziomie io), to odpowiednim podzbiorem dziedziny będzie odcinek LoB i krzywa L^A będzie pokazywała odpowiedni podzbiór powierzchni produkcji. Pochodna cząstkowa QK może być wtedy interpretowana jako nachylenie krzywej LqA — jak pamiętamy, na rys. 7.4 oś K przebiega z południowego wschodu na północny zachód. Należy podkreślić, że QK również jest funkcją obu zmiennych L i K.
Ćwiczenie 7.4 1. Znaleźć dy/dxj i dy/dx2 dla każdej z następujących funkcji: (a) y = 2 x ] - l lx\x2 + 3x1; (c) y = (2x, + 3)(x2- 2 ) ; (b) y = 7*i + 5x,x \ - 9x 2; (d) y = (4x, + 3 )/(x 2- 2 ) . 2. Znaleźć f x i f y dla następujących funkcji: (a) f( x , y) = x 2 + 5xy - y 3;
(c) f( x , y) = — — — ; x +y
(b) f( x , y) = (x2 - 3y) (r —2);
(d) /(x , y) = -----
3. Na podstawie odpowiedzi do poprzedniego zadania znaleźć / ( 1 , 2 ) — wartość pochodnej cząstkowej f x dla x = 1 i y = 2 — dla każdej funkcji. 4. Dla danej funkcji produkcji Q = 96Kn'3L0'1 znaleźć funkcje MPPK i MPPL. Czy funkcja MPPk jest funkcją tylko zmiennej K, czy obu zmiennych K i Ul A jak jest z MPPL?
Rysunek 7.4
Niech teraz kapitał będzie ustalony na poziomie K0\ rozważamy jedynie zmiany nakła du L. Gdy przyjmujemy K = Ko, wówczas wszystkie punkty naszej (uszczuplonej) dziedziny oprócz tych, które leżą na odcinku K0B, mogą być pominięte. Z tego samego względu obecne rozważania dotyczą jedynie krzywej K0CDA (przekroju powierzchni produkcji). Krzywa ta reprezentuje krzywą całkowitego fizycznego produktu pracy dla ustalonej wielkości kapitału K = K0-, możemy zatem odczytać z jej nachylenia tempo zmiany Q względem zmian L przy ustalonym K. Jest wobec tego jasne, że nachylenie krzywej takiej, jak K0CDA, stanowi
5. Funkcja użyteczności dla pewnej osoby ma postać: V = U(xi , x2) = (xj + 2)2(x2 + 3)2, gdzie U jest całkowitą użytecznością, a x t i x2 są to ilości dwu konsumowanych dóbr. a. Znaleźć funkcję użyteczności krańcowej każdego z dwu dóbr. b. Znaleźć wartość krańcowej użyteczności pierwszego dobra, gdy konsumowane są 3 jednostki każdego dobra.
188 ANALIZA STATYKI PORÓWNAWCZEJ
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ 189
7.5. ZASTOSOWANIA ANALIZY STATYKI PORÓWNAWCZEJ
3P _ dc
Znając już rozmaite reguły różniczkowania, możemy zmierzyć się z następującymi zagad nieniami analizy statyki porównawczej: jak zmieni się wartość równowagi pewnej zmiennej endogenicznej, gdy następuje zmiana którejkolwiek zmiennej egzogenicznej lub parametru?
1 b+d
. 3P da’
. . \
3P _ 0 (b + d ) - 1 (a + c) 3d (b + d ?
- ( a + c)
3P
(b + d)2
db’
Ponieważ wszystkie parametry są w tym modelu z założenia dodatnie, więc możemy wnioskować, że:
Model rynku (7-16) Rozważmy powtórnie prosty model rynku jednego dobra (3.1). Może być on zapisany w postaci dwu równań: Q= a - b P Q = - c + dP
(a, b> 0), ( c ,d > 0),
'
[popyt] [podaż]
o rozwiązaniach: (7.14)
a +c P = --------, b +d
(7.15)
Q=
ad —bc b +d
^ - = ^ -> 0 da dc
i
db
dd
< o.
Aby bardziej docenić wyniki (7.16), przyjrzyjmy się rys. 7.5, na którym każdy diagram pokazuje zmianę jednego parametru. Podobnie jak poprzednio, na osi pionowej zaznacza my Q (a nie P). Rysunek 7.5(a) ilustruje wzrost parametru a (do wartości a'). Oznacza to, że krzywa popytu przecina oś pionową w wyżej położonym punkcie, a ponieważ parametr b (parametr
,
które nazywamy równaniami w postaci zredukowanej: dwie zmienne endogeniczne zostały zredukowane do jawnych funkcji czterech wzajemnie niezależnych parametrów a, b, c i d. Aby sprawdzić, jak nieskończenie mała zmiana wartości jednego z parametrów wpłynie na P, trzeba obliczyć pochodną cząstkową (7.14) względem każdego z parametrów. Jeśli znak pochodnej cząstkowej, powiedzmy dPIda, może być określony na podstawie znanych informacji o parametrach, to będziemy znać kierunek zmiany P wywołany zmianą para metru a ; stanowi to wniosek jakościowy. Jeśli natomiast można stwierdzić, jaka jest wielkość BPIda, będzie to stanowiło wniosek ilościowy. Podobnie możemy wyprowadzać jakościowe i ilościowe wnioski z pochodnych czą stkowych Q względem każdego parametru, np. z dQ/da. Aby uniknąć nieporozumień, trzeba jednak ściśle rozróżniać dwie pochodne; 3Qlda i dQ/da. Ta ostatnia — dQ/da —- jest pojęciem odnoszącym się do samej funkcji popytu, bez uwzględnienia funkcji podaży. Natomiast pochodna dQ/da odnosi się do poziomu równowagi w modelu, uwzględnia łączne oddziaływanie popytu i podaży. Aby uwydatnić to rożróżnierue, pochodne cząstkowe P i Q względem parametrów będziemy nazywać pochodnymi statyki porównawczej. Skupimy się na razie na P ; ż (7.14) możemy otrzymać następujące cztery pochodne cząstkowe: 3P da
1 b +d ’
3P
0(b + d) - 1 (a + ć)
- ( a + c)
~db
fb + d f
= {b + d)2 '
parametr a ma wpółczynnik
(«
b +d
[pochodna ilorazu] Rysunek 7.5
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ JL 91 -
190 ANALIZA STATYKI PORÓWNAWCZEJ
nachylenia) pozostaje nie zmieniony, więc wynikiem wzrostu a jest równoległe przesunięcie krzywej popytu w górę z D do D'. Przecięcie D ' i krzywej podaży S określa cenę równo wagi P ', która jest wyższa od starej ceny równowagi P. Potwierdza to wynik dP/da > 0, chociaż dla celów ilustracji pokazaliśmy na rys. 7.5(a) znacznie większy przyrost parametru a niż ten, który wynika z pojęcia pochodnej. Sytuacja na rys. 7.5(c) ma podobną interpretację, ale ponieważ występuje tu zmiana parametru c, więc rezultatem jest równoległe przesunięcie krzywej podaży. Zauważmy, że krzywa przesuwa się w dół. Ponieważ krzywa podaży przecina oś pionową w punkcie -c , zatem wzrost c powoduje zmianę punktu przecięcia, np. z - 2 .na - 4 . Otrzymany graficznie wynik dotyczący statyki porównawczej, mówiący, że P przekracza P", również jest zgodny z tym, czego oczekiwaliśmy na podstawie dodatniego znaku pochodnej dP/dc. Rysunki 7.5(b) i (d) ilustrują efekty zmian parametrów nachylenia b i d dwu funkcji występujących w modelu. Wzrost b oznacza, że nachylenie krzywej popytu będzie przyjmować większą wartość (bezwzględną) liczbową; oznacza to, że krzywa będzie bardziej stroma. Zgodnie z wynikiem dP/db > 0 widzimy, że na tym rysunku P zmniejsza się. Wzrost d, wskutek którego krzywa podaży staje się bardziej stroma, również powoduje zmniejszenie ceny równowagi. Jest to oczywiście zgodne z tym, że pochodna statyki porównawczej dP/dd ma ujemny znak. Wydawałoby się, że wszystkie wyniki podane w (7.16) można otrzymać graficznie. Skoro tak jest, to po co w ogóle uczyć się różniczkowania? Odpowiedź jest następująca: podejście wykorzystujące różniczkowanie ma co najmniej dwie wielkie zalety. Po pierwsze, w technice graficznej liczba wymiarów jest ograniczona. Gdy liczba zmiennych endogenicznych i parametrów jest taka, że położenie równowagi nie może być pokazane graficznie, wówczas stosuje się technikę różniczkowania. Po drugie, metoda różniczkowania może dawać wyniki o wyższym stopniu uogólnienia. Wyniki zawarte w (7.16) pozostają prawdziwe niezależnie od konkretnych wartości, jakie przyjmują parametry a, b, c i d, jeśli tylko spełniają one ograniczenia dotyczące znaków. Zatem wnioski dotyczące statyki porównawczej dla tego modelu odnoszą się w istocie do nieskończenie wielkiej liczby kombinacji (liniowych) funkcji popytu i podaży. W przeciwieństwie do tego, podejście graficzne dotyczy jedynie pewnych konkretnych elementów rodziny krzywych popytu i podaży i otrzymany na ich podstawie wynik analityczny ma zastosowanie tylko do konkretnych, przedstawionych na rysunku funkcji. Powyższe rozważania ilustrują zastosowania pochodnych cząstkowych do analizy statyki porównawczej dla prostego modelu rynku, ale tak naprawdę wykonano tylko połowę zadania, gdyż można również znaleźć pochodne statyki porównawczej odnoszące się do Q. Pozo stawiamy to Czytelnikowi jako ćwiczenie.
Model dochodu narodowego Zamiast prostego modelu dochodu narodowego omówionego w rozdz. 3 zbadajmy nieco powiększony model z trzema zmiennymi endogenicznymi, a mianowicie Y (dochód narodowy), C (konsumpcja) i T (podatki): Y = C + I0 + G0, (7.17)
C = a +P {Y -T )
(a> 0 ;
0 < /< l),
T= y+ SY
( y > 0;
0 < J< 1 ).
Pierwsze równanie tego układu stanowi warunek równowagi dla dochodu narodowego, a równania drugie i trzecie pokazują, odpowiednio, jak- są wyznaczane w modelu C i T. Warunki ograniczające wartości parametrów a , p , y i ¿m ożna wyjaśnić w następujący sposób: . . — a jest dodatnie, ponieważ konsumpcja jest dodatnia nawet wtedy, gdy rozporządzalny dochód ( Y —T) jest zerowy, — P jest dodatnim ułamkiem, gdyż reprezentuje krańcową skłonność do konsumpcji, — y jest dodatnie, ponieważ nawet wtedy, gdy Y jest zerowe, rząd wciąż jednak otrzymuje dodatnie przychody podatkowe (z podstawy podatku innej niż dochód), — S jest dodatnim ułamkiem, gdyż reprezentuje stopę podatku dochodowego i jako taka nie może przekraczać 100 procent. Zmienne egzogeniczne 70 (inwestycje) i G0 (wydatki rządowe) są oczywiście nieujemne. Zakłada się, że wszystkie parametry i zmienne egzogeniczne są od siebie niezależne, więc każda z nich może przyjmować nowe wartości i nie ma to wpływu na pozostałe. Można rozwiązać ten model względem Y, podstawiając trzecie równanie (7.17) do drugiego, a następnie otrzymane równanie podstawiając do pierwszego. Dochód w położeniu równowagi (w postaci zredukowanej) jest równy: r7 1 oN
- _ a - p y + I0 + G0
i-p+ps
(7-18)
'
Można znaleźć podobne wartości równowagi dla zmiennych endogenicznych C i T, ale skoncentrujemy się tu na wartości równowagi dla dochodu. Ze wzoru (7.18) można otrzymać sześć pochodnych statyki porównawczej. Wśród nich są trzy, które mają szczególne znaczenie dla polityki gospodarczej:
(7-19)
I n dY
^ h p s > 0’
\
-P
(7'20) tro n
( }
dF _ - P ( a - P y + Ig + Gp)
ds
(l - p + p s f
-p Y
\-p+ps
n
‘
[z( ' )]
Pochodna cząstkowa w (7.19) daje nam mnożnik wydatków rządowych. Ma on tu znak dodatni, gdyż P jest mniejsze od 1, a / ¿ j e s t dodatnie. Gdy dane są wartości liczbowe parametrów / i ¿ , możemy z (7.19) obliczyć wartość tego mnożnika. Pochodną otrzymaną w (7.20) możemy nazwać mnożnikiem podatków innych niż od dochodu, ponieważ pokazuje ona, jak zmiana y, przychód rządu ze źródeł podatków nie od dochodu, wpłynie na dochód równowagi. Mnożnik ten jest w obecnym modelu ujemny, ponieważ mianownik w (7.20) jest dodatni, a licznik jest ujemny. W końcu pochodna cząstkowa z (7.21) reprezentuje mnożnik stopy podatku dochodowego. W naszym modelu dla każdego dodatniego dochodu równowagi mnożnik ten jest również ujemny. Ponownie zwróćmy uwagę na różnicę między dwiema pochodnymi dY/dGo i dY/dG 0. Pierwsza jest otrzymana ze wzoru (7.18), czyli z wyrażenia dotyczącego dochodu równowagi. Druga, którą można otrzymać z pierwszego równania w (7.17), równa dY/dG 0= 1, jest całkowicie odmienna, jeśli chodzi o jej wielkość i znaczenie.
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ 193
192 ANALIZA STATYKI PORÓWNAWCZEJ
Model nakładów i wyników Rozwiązanie otwartego modelu nakładów i wyników ma postać równości macierzowej x = (I - A)~'d. Jeśli macierz odwrotną (I - A)"1oznaczymy przez B = [¿y], to rozwiązanie np. dla trójgałęziowej gospodarki może być zapisane jako x = Bd, czyli: ‘¿u
*1
* 2 = b 2i
(7.22)
¿31
*3
b 12 bn 'di b22 ¿23 d2 b32 ¿33 d3
Jest to zwarty sposób oznaczania wszystkich pochodnych statyki porównawczej dla otwartego modelu nakładów i wyników. Oczywiście ta macierzowa pochodna może z łatwością być rozszerzona z obecnego modelu trzygałęziowego na ogólny przypadek n gałęzi. Pochodne statyki porównawczej dla modelu nakładów i wyników są pożyteczne jako narzędzie planowania ekonomicznego, ponieważ rozstrzygają następujący problem: jak musimy zmienić docelową produkcję n gałęzi, jeśli cele planowania wyrażone w (dlt d2, d „ ) zostały zrewidowane i jeśli chcemy uwzględnić wszystkie bezpośrednie i pośrednie zapotrzebowania występujące w gospodarce tak, aby nie występowały wąskie gardła.
Jak będą się zmieniały wartości rozwiązań Xj względem egzogenicznego popytu końcowego du d2 i ¿ 3? Ogólna odpowiedź jest taka, że:
Ćwiczenie 7.5 (7.23)
^ ~ = bJk
( ¿ * = 1 ,2 ,3 ) .
Aby to zobrazować, wymnożymy Bd w (7.22) i wyrazimy równanie w postaci: bu d\ + b\2d2 + ¿]3 d3
'* 1'
*2 = ¿21 d\ . * 3.
+
2. Na podstawie (7.18) znaleźć pochodne cząstkowe 3P/3/0; d Y /d a i 3P/3/J. Zinterpretować ich znaczenie i określić ich znaki.
¿22 d2 E ¿23 d3
_b3\d\ + ¿32 d2 + ¿33 d}
W tym układzie trzech równań każde z nich wyraża jedną z wartości rozwiązań jako funkcję egzogenicznych wartości popytu końcowego. Różniczkowanie cząstkowe tych równań daje w sumie dziewięć pochodnych statyki porównawczej: 3*1
dx¡
34
dd2 ~ b n '
dd3
3*2
3*2 , ~dd^~
dx2
dx¡
(7.230
[
Qj\
211
li <3)U
M “ 3*3
3*3
dd3 dx3
,
32;
= b 1: —
bn
b2
dd3
*2 = ¿21 ’ *3 ¿31_
3x dd2 =
3. Numeryczny model nakładów i wyników (5.21) został rozwiązany w podrozdz. 5.7. a. De można otrzymać pochodnych statyki porównawczej? b. Zapisać te pochodne w postaci (7.23') i (7.23").
7.6. UWAGI O WYZNACZNIKACH JACOBIEGO
Jest to po prostu rozwinięta wersja (7.23). Odczytując (7.230 jako trzy oddzielne kolumny, możemy połączyć trzy pochodne z każdej kolumny w pochodną macierzową (wektorową): * in
1. Zbadać własności statyki porównawczej dla poziomu równowagi wyrażonego w (7.15) i sprawdzić wyniki za pomocą analizy graficznej.
¿12 ¿22 ¿32
3x
:
3d3 ~
b i3 ¿23 ¿33
Ponieważ trzy wektory kolumnowe w (1.23") są po prostu kolumnami macierzy B, w wyniku dalszej konsolidacji możemy połączyć dziewięć pochodnych w jedną pochodną macierzową 3x/3d. Dla danego x = Bd możemy zatem napisać:
Powyższe badania pochodnych cząstkowych były motywowane jedynie względami statyki porównawczej. Ale pochodne cząstkowe zapewniają również sprawdzenie, czy istnieje funkcyjna (liniowa lub nieliniowa) zależność w zbiorze n funkcji n zmiennych. Jest to związane z pojęciem wyznaczników Jacobiego (nazwanych tak na cześć matematyka nazwiskiem Jacobi). Rozważmy dwie funkcje: (7.24)
yi = 2xt + 3*2, y2 = 4*i + 12ją x2 + 9x1 •
Jeśli obliczymy wszystkie cztery pochodne cząstkowe: 1 ^ = 2; OXi
J^OX2
= 3; OXi
| ^ = 8*, + 12x2;^ - =12x,+ 18x2 0X2
i ustawimy je w określonym porządku w macierz kwadratową, zwaną macierzą Jacobiego J, a następnie obliczymy jej wyznacznik, to otrzymamy w rezultacie tzw. wyznacznik Jacobiego (lub w skrócie jakobian), oznaczony symbolem |J |: 13 — Podstawy...
194 ANALIZA STATYKI PORÓWNAWCZEJ
f o l
(7.25)
'|J |B
REGUŁY RÓŻNICZKOWANIA I ICH ZASTOSOWANIE W ANALIZIE STATYKI PORÓWNAWCZEJ 195
a,,* , + <1,2*2 + ... + ainx n = du 021*1 + azix2 + ... + a2nx„ = d2,
f o l
3*i
dx2
2
fo ł 3*i
fo2 3*2
(8*i +12*2)
3 (12*,+ 18*2)
Dla oszczędności miejsca jakobian ten jest niekiedy zapisywany jako:
.
3(yi, y2)
1
3(*i,-Jt2)
Ogólniej, jeśli mamy n różniczkowalnych, niekoniecznie liniowych funkcji n zmiennych:
(7.26)
yi = f i (x1, x 2,...,* „ ) , y 2 = f 2(xly x2, ...,* „), yn = f" (x i , * 2, ...,* „),
|J | 3
d ( y i,
y 2 , •
• » Y n)
3 (* 1 ,
* 2,
■, x „ )
.
są liniowo zależne wtedy i tylko wtedy, gdy wyznacznik | A | = 0. Ten wynik może być teraz interpretowany jako szczególne zastosowanie kryterium Jacobiego zależności funkcjonalnej. Potraktujmy lewą stronę każdego równania w (7.28) jako osobną funkcję n zmiennych * ,, ...,* „ i oznaczmy te funkcje przez y ,, ...,y „ . Pochodne cząstkowe tych funkcji są — jak się okazuje — równe fo,/3*i = a ,i; dyi/dx2 = a n itd., tak więc. możemy ogólnie za pisać: 3y,/3*j = a,j. względu na to elementy jakobianu tych n funkcji będą to dokładnie elementy macierzy współczynników A uporządkowane w odpowiedniej kolejności. Mamy zatem IJI = IA |, a więc kryterium Jacobiego funkcjonalnej zależności między y ,, ...,y „ lub — co sprowadza się do tego samego — funkcjonalnej zależności wierszy macierzy współczynników A jest w obecnym, liniowym przypadku, równoważne kryterium | A | = 0. Należy jednak pamiętać, że jakobian w (7.27) jest określony nawet wtedy, gdy każda funkcja w (7.26) zawiera więcej niż n zmiennych, np. n + 2 zmienne: >’i ~ f (x\ »* **»-T/i» xn+i , xn+2)
gdzie sym bol/" oznacza n-tą funkcję (a nie funkcję podniesioną do n-tej potęgi), to możemy otrzymać w sumie n pochodnych cząstkowych. Razem utworzą one jakobian:
(7.27)
a„\Xy + a„2x2 + ... + a„„x„ = dn
f o .
f o i
f o l
3 * i
3 * 2
3 * „
fo n
fo n
fo n
3 * i
3 * 2
3 * „
(i
1, 2, ..., ri) .
Jeśli w tym przypadku ustalimy dowolne dwie zmienne (np. *„+, i *„+2) lub potrak tujemy je jako parametry, to znów będziemy mieli n funkcji dokładnie n zmiennych i będziemy mogli utworzyć jakobian. Co więcej, ustalając inną parę zmiennych, możemy utworzyć inny jakobian. Z taką sytuacją będziemy mieli do czynienia w rozdz. 8 w związku z omawianiem twierdzenia o funkcji niejawnej. \ \ ''
Test na istnienie funkcyjnej zależności w zbiorze n funkcji wykorzystujący jakobian jest podany w następującym twierdzeniu: Jakobian | J | określony w (7.27) będzie tożsamościowo równy zeru dla wszystkich wartości *,, ...,* „ wtedy i tylko wtedy, gdy funkcje/ ' , . . . , / " w (7.26) są funkcjonalnie (liniowo lub nieliniowo) zależne. Przykładowo, dla dwu funkcji w (7.24) jakobian podany w (7.25) ma wartość: | J | = (24*, + 36*2) - (24*, + 36*2) = 0, tzn., że jakobian znika dla wszystkich wartości *, i x2. Wobec tego, zgodnie z twierdzeniem, dwie funkcje w (7.24) muszą być zależne. Proszę sprawdzić, że y2 jest po prostu równe kwadratowi y u zatem są one rzeczywiście funkcyjnie zależne (w naszym przykładzie nieliniowo zależne). Rozważmy teraz szczególny przypadek funkcji liniowych. Pokazaliśmy wcześniej, że wiersze macierzy współczynników A układu równań liniowych:
Ćwiczenie 7.6 1. Zastosować wyznaczniki Jacobiego do zbadania istnienia funkcjonalnej zależności między funkcjami połączonymi poniżej w pary: (a) y, = 3 * j+ *2, y2 = 9*i + 6*i(*2 + 4) + *2 (*2 + 8) + 12; (b) y, ^ 3*j + 2*1, y2 —5*i + 1. 2. Rozważmy (7.22) jako zbiór trzech funkcji *, = f ‘(di , d2, d2) dla i = 1, 2, 3. a. Zapisać jakobian trzeciego stopnia. Czy ma on coś wspólnego z (7.230? Czy możemy napisać | J | = | B |? b. Wiemy, że B = (I - A)“1. Czy możemy wnioskować, że j B j * 0? Co możemy na tej podstawie powiedzieć o trzech równaniach w (7.22)?
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 197
Załóżmy, że istnieje rozwiązanie równowagi F. Wtedy, przy pewnych dość ogólnych założeniach (które będą omówione później), możemy przyjąć, że F jest różniczkowalną funkcją zmiennych egzogenicznych 70, G0 i T0. Możemy zatem napisać równanie:
F= F(/0, Go, To),
8 ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI
pomimo tego, że nie jesteśmy w stanie zapisać jawnej postaci, którą przyjmuje ta funkcja. Ponadto w pewnym otoczeniu wartości równowagi Fbędzie spełniona następująca tożsamość:
F=c(F, r0)+/0+G0. Równanie tego typu będziemy nazywać tożsamością równowagi, ponieważ jest to dokładnie warunek równowagi, w którym zmienną Y zastąpiono jej wartością równowagi F. Teraz — gdy pojawiła się już F — mogłoby się na pierwszy rzut oka wydawać, że można obliczyć każdą pożądaną pochodną cząstkową tej tożsamości dla statyki porównawczej,
3F
Poznanie pochodnych cząstkowych umożliwiło nam uporanie się z zagadnieniami statyki porównawczej prostszego typu, w których rozwiązanie równowagi dla modelu (rozwiązanie, które jest położeniem równowagi) może być w sposób jawny wyrażone za pomocą postaci zredukowanej. W takich przypadkach pochodna cząstkowa rozwiązania jest źródłem pożądanej informacji dotyczącej statyki porównawczej. Przypomnijmy, że definicja pochod nej cząstkowej wymaga, aby nie istniała żadna zależność funkcyjna między zmiennymi niezależnymi (oznaczamy je *,), tak aby mogło się zmieniać, nie wpływając na wartości zmiennych x 2 , * 3 , W zastosowaniu do analizy statyki porównawczej oznacza to, że parametry oraz zmienne egzogeniczne pojawiające się w rozwiązaniu postaci zredukowanej muszą być wzajemnie niezależne. Ponieważ są one rzeczywiście zdefiniowane jako dane z góry ustalone dla celów modelu, więc możliwość ich wpływania na siebie nawzajem jest wykluczona. Procedura obliczania pochodnych cząstkowych przyjęta w poprzednim rozdziale jest zatem w pełni uzasadniona. Traci ona natomiast uzasadnienie, gdy wskutek włączenia do modelu ogólnych funkcji nie jest możliwe znalezienie w jawnej postaci rozwiązania formy zredukowanej. W tych przypadkach musielibyśmy obliczać pochodne dla statyki porównawczej bezpośrednio z pierwotnie podanych równań modelu. Na przykład dla prostego modelu dochodu narodowego z dwiema zmiennymi endogenicznymi Y i C: Y= C + 10+ G0, C = C (y , T0),
powiedzmy — Niestety tak me jest. Ponieważ y jest funkcją T0, więc dwa argumenty funk cjo cji C nie są niezależne, a mianowicie T0 może w tym przypadku wpływać na C nie tylko bezpośrednio, ale również pośrednio poprzez F. W rezultacie obliczanie pochodnych cząstkowych nie da pożądanego wyniku. Jak więc należy postąpić? W takich przypadkach należy korzystać nie z pochodnych cząstkowych, ale z różnicz kowania zupełnego (total differentiation). Z pojęciem różniczki zupełnej jest związane pojęcie pochodnej zupełnej, która mierzy tempo zmian funkcji C(F, T0) względem argumentu T0, gdy T0 wpływa też na drugi argument, a mianowicie na F. Gdy zatem zaznajomimy się z tymi pojęciami, będziemy mogli zajmować się funkcjami, w których nie wszystkie argumenty są niezależne. Usuniemy w ten sposób główną przeszkodę, na którą natrafialiśmy do tej pory przy badaniu statyki porównawczej dla modelu z ogólnymi funkcjami. Wstępem do omawiania tych problemów będzie pojęcie różniczki. ,
8.1. RÓŻNICZKI Symbol
dy
s\ \
•
' dla pochodnej funkcji y = /(* ) był do tej pory traktowany jako pojedyncza
wielkość. Teraz będziemy gó interpretować jako iloraz dwu wielkości: dy i dx.
Różniczki i pochodne [?o: egzogeniczne podatki]
który można sprowadzić do pojedynczego równania (warunku równowagi): y = c ( y , r 0) + /o + G 0, aby otrzymać F, należy rozwiązać to równanie. Ponieważ funkcja C ma ogólną postać, nie można więc uzyskać jawnego rozwiązania. Musimy wobec tego znaleźć pochodne dla analizy porównawczej bezpośrednio z tego równania. Jak moglibyśmy podejść do tego problemu? Jakie szczególne trudności możemy napotkać?
Gdy dana jest funkcja y = /(* ), wówczas konkretńej wartości przyrostu A x odpowiada przyrost Ay. Aby przedstawić stopę zmiań y wżględem x, możemy stosować iloraz różnico wy Ay/Aż. Ponieważ jest prawdą, że:
(8.D
A y - ( |t ] A x .
więc można znaleźć wielkość Ay, jeśli wiadomo, jaka jest stopa zmiany A y/A x i przyrost X.
198 ANALIZA STATYKI PORÓWNAWCZEJ
Gdy A* jest infinitezymalne (nieskończenie małe), Ay będzie również infinitezymalne i iloraz różnicowy Ay/A* stanie się pochodną dy/d*. Jeśli zatem infinitezymalne zmiany x i y oznaczymy odpowiednio przez d* i dy (zamiast A x i Ay), to tożsamość (8.1) przyjmie postać: (8.2)
d y s^ — jd *
lub
ANALIZA STATYKI PORÓWNAWCZEI DLA MODELU Z OGÓLNYMI FUNKCJAMI 199
yi y = f(x )
dy = /'(* ) d*.
Symbole dy i d* nazywamy różniczkami odpowiednio zmiennej y i zmiennej *. Dzieląc obie strony tożsamości (8.2) przez d*, otrzymujemy: (8.20
- ^ - = [^ -1 (d*)
lub
= /'(* ) . (d*) /
dy Wynik ten pokazuje, że pochodna — = / (*) może być interpretowana jako iloraz dwu d* osobnych różniczek dy i d*. Na podstawie (8.2) różniczkę dy możemy natychmiast zapisać jako dy = /'(* ) d*, gdy tylko dana jest pochodna funkcji y = /(*). Można zatem /'( * ) traktować jako „narzędzie” , które służy do przekształcenia nieskończenie małej zmiany d* w odpowiednią zmianę dy. Przykład 1. Dane jest y = 3*2 + 7 * - 5 ; znaleźć dy. Pochodna funkcji jest równa dy — = 6* + 7; zatem szukana różniczka jest równa: d* (8.3)
dy = (6* + 7)d*.
Wynik ten można wykorzystać do obliczenia zmiany wartości y spowodowanej przez daną zmianę x. Trzeba jednakże pamiętać, że różniczki dy i d* oznaczają jedynie nieskończenie małe zmiany. Jeśli zatem podstawimy do wzoru (8.3) przyrost * o znacznej wielkości (A*), to otrzymana wartość dy może służyć tylko jako przybliżenie dokładnej wartości odpowiedniego przyrostu y, czyli Ay. Obliczmy dy ze wzoru (8.3), zakładając, że * ma się zmienić od 5 do 5,01, Tak więc przyjmijmy, że * = 5 i d* = 0,01 i podstawmy te war tości do (8.3). Wynik jest następujący: dy = 37 • 0,01 =0,37. Jak ma się ta liczba w porównaniu do prawdziwej zmiany wartości y? Gdy * = 5 (przed zmianą), możemy obliczyć z podanego wzoru, że y = 105, ale gdy * = 5,01 (po zmianie), otrzymujemy y = 105,3703. Prawdziwa wielkość przyrostu y je st zatem równa Ay = 0,3703 i dla niej poprzednio otrzymana wartość stanowi przybliżenie z błędem równym 0,0003. Źródło błędu w tym przybliżeniu może być zilustrowane ogólnie za pomocą rys. 8.1. Dla danego A* (odległość AC) prawdziwa wielkość zmiany y, czyli Ay, jest to odległość CB. ( Ay CB\ Gdybyśmy wykorzystali nachylenie prostej AB = — = ------ jako odpowiednią stopę A* A C ) zmiany i zastosowali (8.1) do obliczenia Ay, wówczas otrzymalibyśmy prawidłową od powiedź: (Ay> CB Ay = —— A* = ——AC = CB. l,A*J AC
Rysunek 8.1
Ale stosując (8.3) — szczególną wersję (8.2) — w istocie przyjęliśmy pochodną
dy
d* Ay zamiast — , tzn. użyliśmy w rachunkach nachylenia linii stycznej AD (= CD!AC) zamiast A* nachylenia prostej AB. Otrzymaliśmy zatem odpowiedź: (d y)
CD
n i r =^ c=CD’\ która różni się od prawdziwego przyrostu CB o błąd DB.Można oczywiście oczekiwać, że błąd ten będzie coraz mniejszy w miarę zmniejszania się A*, czyli im bliżej punkt B przysuwa się ku A, tym dokładniejsze jest przybliżenie. Proces znajdowania różniczki dy nazywamy różniczkowaniem (differentiation). Przypo mnijmy, że stosowaliśmy ten termin jako synonim obliczania pochodnej (derivation) i nie podaliśmy odpowiedniego wyjaśnienia. W świetle interpretacji pochodnej jako ilorazu dwu różniczek podstawa stosowania tego terminu staje się oczywista. Wciąż jeszcze jest nieco niejasne, dlaczego jeden termin „różniczkowanie’ ’ ma być stosowany zarówno do obliczania dy dy różniczki dy, jak i do znajdowania pochodnej — . Przy liczeniu p o chodnej aby d* d* Uniknąć nieporozumienia — zazwyczaj uzupełnia się słowo „różniczkowanie’ ’ określeniem „względem *” . Powinno być jasne z (8.2), że dla danej funkcji y = /( * ) możemy zawsze: dy (1) przekształcić znaną różniczkę dy w pochodną — , dzieląc ją przez d*; (2) przekształcić d* dy znaną pochodną — w różniczkę dy, mnożąc ją przez d*. d*
2 0 0 ANALIZA STATYKI PORÓWNAWCZEJ
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 201
Różniczki i elastyczność punktowa Aby zilustrować zastosowanie pojęcia różniczki w ekonomii, rozważmy pojęcie elastyczności funkcji. Na przykład dla funkcji popytu g = / ( P ) elastyczność jest zdefiniowana jako (A g /g )/(A P /P ). Jeśli przyrost P jest nieskończenie mały (infinitezymalny), wyrażenia AP i AQ zredukują się do różniczek dP i d g i miara elastyczności będzie wtedy miała sens punktowej elastyczności, oznaczonej przez ed (jest to grecka litera epsilon, od „elastyczno ści” )1: ( 8.4)
d P IP
Q/P
W wyrażeniu po prawej stronie przestawiliśmy różniczki d g i d P tak, aby otrzymać iloraz d g /d P , który może być traktowany jako pochodna (lub funkcja krańcowa) dla funkcji popytu g = /(P ). Ponieważ możemy również interpretować iloraz g / P w mianowniku jako średnią funkcję dla funkcji popytu, staje się jasne, że elastyczność popytu w punkcie Ed w (8.4) jest ilorazem funkcji krańcowej i funkcji średniej dla funkcji popytu. Rzeczywiście, taki związek jest właściwy nie tylko dla funkcji popytu, lecz również dla każdej innej funkcji, ponieważ dla każdej danej całkowitej funkcji y = /(* ) możemy zapisać wzór na elastyczność punktową y względem * jako: dy/d*
funkcja krańcowa
y lx
funkcja przeciętna
£yx —--------- =
(.0.5)
Elastyczność jest — jak widać — funkcją P. Jednak gdy tylko wybierzemy konkretną wartość ceny, tym samym będzie określona wielkość elastyczności punktowej. Na przykład gdy P = 25, mamy ed = -1 , czyli | ed \ = 1, tak więc elastyczność popytu jest w tym punkcie jednostkowa. Przeciwnie, gdy P = 30, wówczas | ed | = 1,5, a zatem popyt jest przy tej cenie elastyczny. Ogólniej, można sprawdzić, że w tym przykładzie mamy | ed\ > 1 dla 25 < P < 50 i | ed | < 1 dla 0 < P < 25. (Czy cena P > 50 może być tu traktowana jako sensowna?) Na marginesie warto dodać, że interpretacja ilorazu dwu różniczek jako pochodnej — i wynikające stąd przekształcenie wzoru na elastyczność funkcji w iloraz jej funkcji krańcowej i jej funkcji przeciętnej — umożliwia szybki sposób graficznego wyznaczania elastyczności punktowej. Dwa diagramy na rys. 8.2 ilustrują odpowiednio krzywe o ujemnym i o dodatnim nachyleniu. W obu przypadkach wartość funkcji krańcowej w punkcie A ha krzywej lub w punkcie * = *0 dziedziny jest mierzona przez nachylenie prostej stycznej AB. Wartość funkcji przeciętnej jest natomiast w obu przypadkach mierzona przez nachylenie prostej OA (prostej łączącej początek układu współrzędnych z danym punktem A na krżywej, jak wektor wodzący), ponieważ w punkcie A mamy y = x0A i * = O*0, tak więc średnia jest równa y /x = x 0AJOxa = nachyleniu OA. Elastyczność w punkcie A może zatem być łatwo wyznaczona przez porównanie numerycznych wartości dwóch nachyleń: jeśli AB jest bardziej strome niż OA, to funkcja jest elastyczna w punkcie A; w przeciwnym przypadku jest nieelastyczna w A. Zgodnie z tym funkcja przedstawiona na rys. 8.2(a) jest nieelastyczna w A (czyli dla * = *o), a funkcja na diagramie (b) jest elastyczna w A.
.
Przyjęto konwencję, zgodnie z którą to, czy funkcja jest elastyczna w pewnym punkcie, określamy na podstawie modułu elastyczności. Na przykład w przypadku, funkcji popytu zapiszemy:
popyt
jest elastyczny ma jednostkową elastyczność jest nieelastyczny
w punkcie, gdzie | ed | § 1.
Przykład 2. Znaleźć ed, jeśli funkcja popytu jest równa g = 1 0 0 - 2 P . Funkcja krańcowa i funkcja przeciętna dla danego popytu są równe: dg _ dP ~
„
. 1
g P~
100- 2 P P
Rysunek 8.2
więc ich iloraz jęst równy: -P £i =
5 0 -P '
1 Miara elastyczności punktowej może alternatywnie być interpretowana jako granica wyrażenia: A g /g .
APIP
Ag/AP
--------
= — :
Q/P
dlaA -»Ó ,
co daje taki sam Wynik, jak (8.4).
,
Dwa porównywane nachylenia zależą ponadto bezpośrednio od wielkości dwu kątów $m i 6a (grecka litera theta; subskrypty m i a oznaczają odpowiednio marginal — krańcowy i average t —przeciętny). Możemy zatem alternatywnie porównać te dwa kąty, zamiast dwu odpowiednich nachyleń. Ponownie w odniesieniu do rys. 8.2 zauważmy, ż e d m < 6a w punkcie A na diagramie (a), co oznacza, że wartość krańcowa jest co do wartości numerycznej mniejsza od przeciętnej; zatem funkcja jest nieelastyczna w punkcie A. Dokładnie przeciwnie jest na diagramie (b). Niekiedy jesteśmy zainteresowani znalezieniem na danej krzywej punktu o jednostkowej elastyczności. Można to teraz łatwo zrobić. Jeśli krzywa ma nachylenie ujemne, jak na
ANALIZA STATYKI PORÓWNAWCZEJ
2 0 2 ANALIZA STATYKI PORÓWNAWCZEJ
8.2. RÓŻNICZKI ZUPEŁNE
yi
Pojęcie różniczki można łatwo rozszerzyć na funkcje dwóch lub więcej zmiennych niezależnych. Rozważmy funkcję oszczędności: (8.6)
'1 (¿)
(a)
Rysunek 8.3
rys. 8.3(a), możemy znaleźć taki punkt C, że. prosta OC i styczna BC tworzą z osią * kąty o takiej samej wielkości, chociaż przeciwnie skierowane. W przypadku krzywej o nachyleniu dodatnim, jak na rys. 8.3(b), trzeba tylko znaleźć taki punkt C, aby przedłużona styczna w punkcie C przechodziła przez początek układu współrzędnych. Opisana właśnie metoda graficzna jest oparta na założeniu, że funkcja y = /(* ) ma wykres sporządzony ze zmienną zależną y na osi pionowej. W szczególności, gdy stosujemy tę me todę do krzywej popytu, musimy się upewnić, że Q jest na osi pionowej. (Załóżmy, że Q zaznaczono na osi poziomej. Jak należy wtedy zmodyfikować naszą metodę odczytywania elastyczności punktowej?)
Ćwiczenie 8.1 1. Znaleźć różniczkę dy, gdy dane są: (a) y = - * (* 2 + 3);
(b) y = (* - 8) (7* + 5);
S = S(Y, 0,
gdzie S oznacza oszczędności, Pjest dochodem narodowym, a i stopą procentową. Zakładamy, że ta funkcja -— tak jak wszystkie używane tu funkcje — jest ciągła i ma ciągłe pochodne (cząstkowe), co jest innym sposobem stwierdzenia, że jest ona gładka i wszędzie różniczkowalna. Wiemy, że pochodna cząstkowa dS/dY (czyli SY) mierzy zmianę S względem nieskończenie małej zmiany Y, czyli — w skrócie — oznacza krańcową skłonność do oszczędzania. W rezultacie zmiana S wywołana tą zmianą Y może być reprezentowana przez wyrażenie (dStdY)dY, które jest porównywalne z wyrażeniem po prawej stronie (8.2). Na tej samej zasadzie zmiana S wywołana nieskończenie małą zmianą i może być oznaczona (dS/di)di. Całkowita zmiana S będzie wtedy równa: dS dS dS = — d Y + — di dY di lub w alternatywnym zapisie: dS = Sr dY+Sidi. Zauważmy, że dwie pochodne cząstkowe SY i S, znów odgrywają rolę „narzędzi” , które służą do przetworzenia nieskończenie małych przyrostów d y i di w odpowiednią zmia nę d.S'. Wyrażenie
(c) y = - ~ ~ r . xl + \
2. Dana jest funkcja importu M = f(Y ), gdzie M oznacza import, a Y jest dochodem narodowym. Wyrazić elastyczność dochodową importu emy jako funkcję skłonności do importu. 3. Dana jest funkcja konsumpcji C = a + bY (gdzie a > 0; 0 < b < 1). a. Znaleźć jej funkcję krańcową i funkcję przeciętną. b. Znaleźć dochodową elastyczność konsumpcji Ecy i określić jej znak, zakładając że 7>0. c. Pokazać, że funkcja konsumpcji jest nieelastyczna dla wszystkich dodatnich poziomów dochodu. 4. Znaleźć punktową elastyczność popytu dla Q = k /P n, gdzie k i n są dodatnimi stałymi. a. Czy elastyczność zależy w tym przypadku od ceny? b. Jaki jest kształt krzywej popytu w szczególnym przypadku, gdy n = 1? Jaka jest punktowa elastyczność popytu?
a y " ld y j,« * Jest zatem jasne, że pochodna cząstkowa dS/dY może również być interpretowana jako iloraz dwu różniczek dS i dy, przy zastrzeżeniu, że i, czyli druga zmienna niezależna funkcji, jest ustalona. W podobny sposób możemy utworzyć inną pochodną cząstkową d S - (d S /d i) di, gdy d y = 0, i intepretować pochodną cząstkową dS/di jako iloraz różniczki dS (przy ustalo nym Y) i różniczki di. Zauważmy, że mimo iż dS i di mogą teraz występować samodzielnie jako różniczki, wyrażenie dS/di pozostaje jedną wielkością. Ogólniejszy przypadek funkcji n zmiennych niezależnych może być zilustrowany np. przez funkcję użyteczności w postaci ogólnej: (8.7)
U = U tc,, *2, . :.,*„). Różniczkę zupełną tej funkcji można zapisać jako:
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 205
204 ANALIZA STATYKI PORÓWNAWCZEJ
8.3. REGUŁY DOTYCZĄCE RÓŻNICZEK
... B U . BU. BU A dU = — d*i + — dx2 + ... + — d*„, O Xi
OX 2
oxn
czyli:
n d i/= i/id*i + i/2d*2 + ••• + ł7„dx„ = X i/,dx,, i-i gdzie każdy składnik po prawej strome oznacza wielkość zmiany U wywołanej nieskończenie małą zmianą jednej ze zmiennych niezależnych. Pierwszy składnik i/id*i oznacza w inter pretacji ekonomicznej użyteczność krańcową pierwszego dobra pomnożoną przez wzrost konsumpcji tego dobra; podobnie interpretuje się pozostałe składniki. Suma ich wszystkich reprezentuje zatem całkowitą zmianę użyteczności pochodzącą ze wszystkich możliwych źródeł zmian. Można się spodziewać, że dla funkcji oszczędności (8.6) oraz funkcji użyteczności (8.7), ja k i dla każdej innej funkcji, otrzymamy zmiany elastyczności podobne do tych, jakie zostały zdefiniowane w (8.5). Ale każda zmiana elastyczności musi być w tych przypadkach zdefiniowana w stosunku do zmiany tylko jednej zmiennej niezależnej. Będą zatem dwie takie zmiany elastyczności dla funkcji oszczędności i n takich zmian dla funkcji użyteczności. Nazywa się je elastycznościami cząstkowymi. Dla funkcji oszczędności elastyczności cząstkowe można zapisać jako:
as/az £sr~
s/ y
as y ~aF7
as/a/ 1
as /
BU 3
Bxi U
jest znalezienie pochodnych cząstkowych /] oraz f 2 i podstawienie ich do wzoru: d y = /1d * i+ /2d*2. Niekiedy jednak wygodniejsze przy obliczaniu różniczek jest stosowanie niżej podanych wzorów, które — ze względu na swe uderzające podobieństwo do wzorów omówionych wcześniej dla pochodnych — są wyjątkowo łatwe do zapamiętania. Niech k będzie stałą, a u i v — dwiema funkcjami zmiennych *1 i x2. Wtedy prawdziwe są następujące reguły2: [por. regułę dla stałej]
Reguła I
dit = 0.
Reguła U
d (cić1) = cnu"~ldu.
[por. regułę dla funkcji potęgowej]
Reguła U l
d(u ± v) = du ± dv.
[por. regułę dla sumy i różnicy]
Reguła IV
d(«v) = vdw + wdv.
[por. regułę dla iloczynu]
Reguła V
1 d — = —T- (vdM - ndv). V v) v2
[por. wzór na pochodną ilorazu]
Zamiast udowadniać te reguły, zilustrujemy po prostu ich praktyczne zastosowania.
Xi
77
y = /(* !, *2)
£ s, ~ ~ ś / T ~ 1 h s ’
a dla funkcji użyteczności n elastyczności cząstkowych można zwięźle zapisać w następujący sposób: £ ux, —
Bezpośrednim sposobem obliczania różniczki zupełnej dy dla danej funkcji:
(i=
1»
7 , . . . ,
n).
Przykład 1. Znaleźć różniczkę zupełną dy funkcji: y = 5*2+ 3*2.
Ćwiczenie 8.2
Metoda bezpośrednia wymaga obliczenia pochodnych cząstkowych /] = lO*i i f 2 = 3, co pozwala nam zapisać:
1. Znaleźć różniczkę zupełną, gdy dane są funkcje: (a) z = 3A:2 + xy - 2y*; (b) ¡7 = 2xi + 9xi*2 + X22. Znaleźć różniczkę zupełną, gdy dane są funkcje: Xi 2*iX2 (a) y = — — ; (b) y = — — . * l+ * 2
d« = /id * i+ /2d*2 = 10*id*i + 3d*2. .
Możemy jednak przyjąć u = 5x2 i v = 3*2 i zastosować podane wcześniej reguły, otrzymując identyczną odpowiedź:
X y + X 2
3. Funkcja podaży pewnego dobra jest następująca: Q = a + bP2 + R in (a< 0; ¿ > 0 ).
[i?: wielkość opadów]
Znaleźć cenową elastyczność podaży Eqp oraz elastyczność podaży względem opadów EqR. 4. Jak zmieniają się dwie elastyczności cząstkowe w ostatnim zadaniu wraz ze zmianą P i R1 Czy w sposób monofoniczny (zakładając, że P i R są dodatnie)? 5. Popyt zewnętrzny na nasz eksport X zależy od dochodu za granicą Yf i naszego poziomu cen P: X = Y}'2 + P~2. Znaleźć elastyczność cząstkową zagranicznego popytu na nasz . eksport względem naszego poziomu cen.
dy = d (5*?) + d (3*2) =
[z reguły ID ]
= 10*id*i + 3d*2.
[z reguły II]
Przykład 2. Znaleźć różniczkę zupełną funkcji: y - 3*j + *i*2.
‘
2 Wszystkie reguły dotyczące różniczek omówione w tym podrozdziale stosuje się również do przypadku, gdy u i v same są zmiennymi niezależnymi (a nie funkcjami pewnych innych zmiennych *i i *>)•
A N A U 2A STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 207
2 0 6 ANALIZA STATYKI PORÓWNAWCZEJ
dz = d(vw) = wdv + vdw,
Poniew aż/i = 6*1+ x l 1 / 2 = 2*1*2. więc szukana pochodna będzie równa:
który po podstawieniu do poprzedniego równania daje:
dy = (6*1 + *i)d*i + 2*!*2d*2.
d(uvw) = vwdu + u(wdv + vdw) = vwdu + uwdv + uvdw,
Stosując podane reguły, można otrzymać taki sam wynik: dy = d(3*2) + d(*i*2) =
[z reguły HI]
- 6*!d*i + *2d*! + *]d(*2) =
[z reguł II i IV]
= (6*1+ * 2)d*! + 2*!*2d*2.
[z reguły II]
Ćwiczenie 8.3
Przykład 3. Znaleźć różniczkę zupełną funkcji:
y-
-U+ * 2 Zx2 ■
1. Stosując reguły dla różniczek, znaleźć: (a) dz dla z = 3*2 + * y - 2 y 3; (b) d U dla t/ = 2*i + 9*i*2 + *2. Sprawdzić odpowiedzi, porównując je z otrzymanymi w ćwiczeniu 8.2-1.
Ze względu na to, że pochodne cząstkowe są w tym przypadku równe: f _ - (*i + 2*2) f '~ 2*J
. '
2. Zastosować reguły dla różniczek do znalezienia dy dla następujących funkcji:
1 ~~ 2* f
^ y = — Xl■ (a) ---- ; *1
(proszę to sprawdzić jako ćwiczenie), szukana różniczka jest równa:
Jednakże taki sam wynik można otrzymać, stosując reguły w następujący sposób: [2*1 d (*1 + *2) - (*1 + *2) d (2*?)] = [2*i (d*i + d*2) - ( * i + * 2)4*i d*i] = =
1
[z reguły V ]
(b) y = 2X1X2 *1
+* 2
3. Dane jest y = 3*i (2*2 - 1) (*3 + 5). a. Znaleźć dy za pomocą reguły VII. b. Znaleźć różniczkę cząstkową dla y, gdy d*2 = d*3 = 0. c. Otrzymać z powyższych wyników pochodną cząstkową dy/dxi. 4. Udowodnić reguły n , Ul, IV i V przy założeniu, że u i v są zmiennymi niezależnymi (a nie funkcjami jakichś innych zmiennych).
[z reguły III i II]
[ - 2*i (*1 + 2*2) d*i + 2*id*2] =
-(*, + 2 *2 )
+*2
Porównać odpowiedzi z otrzymanymi w ćwiczeniu 8.2-2.
-(*1 + 2*2) 1 Z ti d" + I ^ d ' -
dy =
jako żądany wynik końcowy. Podobną procedurę można zastosować w przypadku wyprowadzania reguły VI.
8.4. POCHODNE ZUPEŁNE
1
Reguły te mogą być naturalnie rozszerzone na przypadki, gdy występują więcej niż dwie funkcje zmiennych *1 i *2. W szczególności możemy dodać następujące dwie reguły do powyższej kolekcji: Reguła VI
d (u ± v ± w ) = d u ± d v ± d w .
Reguła V II
d(«vw) = vwdu + uwdv + uvdw.
Teraz, gdy znamy już pojęcie różniczki, możemy udzielić odpowiedzi napytanie postawione na początku rozdziału: jak znajdujemy zmianę funkcji C(Y, T0) względem T0, gdy Y i T0 są od siebie zależne. Jak wspomniano wcześniej, odpowiedź kryje się w pojęciu pochodnej zupełnej. W przeciwieństwie do pochodnej cząstkowej, pochodna zupełna nie wymaga, aby argument Y pozostawał ustalony, gdy T0 się zmienia, co pozwala na istnienie postulowanego związku między dwoma argumentami.
Znajdowanie pochodnej zupełnej
Regułę V n możemy otrzymać w następujący sposób: przyjmując najpierw z = vw, tak że:
Rozważmy najpierw dowolną funkcję:
d (uvw) = d (uz) —zdu + udz,
(8.8)
stosujemy ponownie regułę IV do dz, otrzymując wynik pośredni:
[z reguły IV]
y = /(* , w),
przy czym
x = g(w)
z trzema zmiennymi y, * i w związanymi ze sobą, jak to zilustrowano na rys. 8.4, który
ANAT .17A STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 209
2 0 8 ANALIZA STATYKI PORÓWNAWCZEJ
będziemy nazywać mapą wpływów (channel map). Widać z niego, że w — ostateczne źródło zmian w tym przypadku — może wpływać na y poprzez dwa kanały: (1) pośrednio, przez funkcję g, a potem / (proste strzałki) i (2) bezpośrednio przez funkcję / (wygięta strzałka). Pochodna cząstkowa/*, jest konieczna do wyrażenia samego efektu bezpośredniego, a pochodna zupełna jest niezbędna do łącznego wyrażenia obu efektów.
y = f(x , w) = 3x - w2,
gdzie
x = g (w ) = 2w 2 + w + 4.
Na mocy (8.9) pochodna zupełna powinna być równa: dy — = 3 (4w + 1) + (-2 w) = IOw + 3. dw W celu sprawdzenia, możemy podstawić funkcję g do funkcji/: y = 3(2w2 + w + 4) - w2 - 5w2 + 3w + 12, otrzymując funkcję samego x. Można teraz łatwo obliczyć, że pochodna dy/dw jest równa IOw + 3 i jest to identyczna odpowiedź, jak otrzymana za pomocą wzoru (8.9).
Rysunek 8.4
Aby otrzymać pochodną zupełną, najpierw całkowicie różniczkujemy / i otrzymujemy różniczkę zupełną dy = fxdx +/„,div. Po podzieleniu obu stron tej równości przez różniczkę dw, otrzymujemy wynik: ( 8 .9 )
± dw
= f i *L+fw*!L J dw
J dw
dy dx
dy
dw
dx dw
3w
dw
Ponieważ iloraz dwu różniczek może być interpretowany jako pochodna, więc wyrażenie dy/dw po lewej stronie można traktować jako pewną miarę zmian y względem w. Ponadto jeśli dwa składniki po prawej stronie (8.9) mogą być utożsamione odpowiednio z pośrednim i bezpośrednim wpływem w na y, to dy/dw będzie rzeczywiście zupełną pochodną, której szukamy. Wiemy już, że drugi składnik (dy/dw) rzeczywiście mierzy efekt bezpośredni, 3y diA a zatem odpowiada wygiętej strzałce z rys. 8.4. Fakt, że pierwszy składnik —1------ Imierzy 1 ydx dw j efekt pośredni, stanie się również oczywisty, gdy przeanalizujemy to za pomocą kilku strzałek, jak,następuje3: .
Zmiana w (mianowicie dw) najpierw jest przekazywana do zmiennej x i poprzez wynikającą stąd zmianę x (mianowicie dc) jest przekazywana do zmiennej y. Ale jest to dokładnie efekt pośredni zobrazowany przez ciąg prostych strzałek na rys. 8.4. Zatem wyrażenie w (8.9) rzeczywiście reprezentuje szukaną pochodną zupełną. Proces znajdowania pochodnej zupełnej dy/dw jest nazywany zupełnym różniczkowaniem y względem w.
Przykład 2. Jeśli mamy funkcję użyteczności U = U (k, c), gdzie k jest ilością kon sumowanej kawy, a c jest ilością konsumowanego cukru, oraz mną funkcję c = g(k), wskazującą na komplementamość tych dwu dóbr, to możemy napisać pó prostu: U = U[k, g(k)], skąd wynika, że: dU
dU
dk
d k + d g (k)8 n '
,/IN
Wariacja na temat Sytuacja jest tylko nieco bardziej skomplikowana, gdy mamy: (8.10) y = /( * i, x2, w),
gdzie
,Jx i= g (w ), x2 = h(w).
Mapa wpływów będzie teraz wyglądała tak, jak na rys. 8.5. Tym razem zmienna w może wpływać na y trzema kanałami: (a) pośrednio, poprzez funkcję g i potem/, (2) znów pośred nio, poprzez funkcję h i/o r a z (3) bezpośrednio poprzez/. Na podstawie naszych poprzed nich doświadczeńoczekujemy, że te trzy efekty można wyrazić odpowiednio jako: dy
d*!
9y dx2
dy
¿ki
dw ’ 9*2 dw ’
dw
g a g i * -----------f
Przykład 1. Znaleźć pochodną zupełną dy/dw dla danej funkcji: dy dx ■■ ■’ -.■ Wyrażenie — stanowi reminiscencję reguły łańcuchowej (wzoru na pochodną funkcji dx dw złożonej) omówionej wcześniej, z tym wyjątkiem, że tu pojawia się pochodna cząstkowa, gdyż/jest funkcją więcej niż jednej zmiennej.
dU
3
f Rysunek 8.5 14 — Podstawy,..
210 ANALIZA STATYKI PORÓWNAWCZEJ
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 211
Oczekiwania te są rzeczywiście prawidłowe, gdyż jeśli obliczymy różniczkę zupeł ną y i podzielimy obie strony przez d w, to otrzymamy: (8.11)
dy (ki Ax2 ' dw dy d*i dy dx2 dy ^ = / 1- 1 + /2 7 1 + / » - = ^ +f +r , dw dw dw dw drą dw dx2 dw ów
co jest porównywalne ze wzorem (8.9). Przykład 3. Niech funkcja produkcji będzie równa: Q = Q(K, L, t),
\
gdzie oprócz dwu nakładów K i L występuje trzeci argument t, oznaczający czas. Obecnośó argumentu t wskazuje, że funkcja produkcji może zmienió się w czasie pod wpływem zmian technologicznych. Jest to zatem dynamiczna, a nie statyczna funkcja produkcji. Ponieważ kapitał i praca też mogą zmieniać się w czasie, więc możemy napisać: K = K{t)
i
L = L(t).
Wtedy stopa zmian produkcji względem czasu może być wyrażona zgodnie ze wzorem na pochodną zupełną (8.11) jako: dQ _ dQ AK
dQ AL
dQ
~ AOt~ ~ ^ K ~ A t' + lL ~ A t~ + ^ r lub w alternatywnych oznaczeniach:
dt
= Q K K \t) + QLL \t) + Q,.
Inna wariacja na temat Gdy ostateczne źródło zmian w dla (8.10) zastąpimy dwoma współistniejącymi źródłami u i v, powstaje następująca sytuacja: (8.12)
y = f ( x l, x 2, u, v),
gdzie
x x = g{u, v), '
./ ■
dbci
dw
Au
dx¡
dy dri dx¡ Au
dy A x 2 dx2 Au dy Ax2 dx2 Au
óy
(8 13)
§> = dy dxi ‘ & dx2 ■| dy §« dxi du dx2 du du’
co jest porównywalne z (8.11). Widzimy, że po prawej stronie pojawia się symbol dy/du, co zmusza nas do zastosowania nowego symbolu §y/§u po lewej stronie na oznaczenie szerszego pojęcia cząstkowej pochodnej zupełnej. W analogiczny sposób możemy otrzymać drugą cząstkową pochodną zupełną §y/§v. Ponieważ jednak role u i v są symetryczne w (8.12), możliwa jest więc prostsza alternatywa. W celu uzyskania §y/§v musimy wszędzie w (8.13) zastąpić symbol u przez symbol v. Zastosowanie nowych symboli §y/§u i §y/§v na oznaczenie cząstkowych pochodnych zupełnych jest wprawdzie niekonwencjonalne, ale służy dobremu celowi uniknięcia pomyle nia ze zwykłymi pochodnymi cząstkowymi dy/du i dy/dv, które mogą pojawić się dla tej samej fu n k c ji/w (8.12). Jednakże w szczególnym przypadku, gdy fu n k c ja /m a postać y = /(* !, x2), bez argumentów « i V, zwykłe pochodne cząstkowe dy/du i dy/dv nie są okreś lone. Zatem zastosowanie tych ostatnich symboli na oznaczenie cząstkowych pochodnych zupełnych y względem u oraz v może nie być niewłaściwe, gdyż w tym przypadku nie może to prowadzić do nieporozumień. Jednak nawet w tym przypadku zastosowanie specjalnych oznaczeń jest pożądane dla osiągnięcia większej jasności.
Pewne uwagi ogólne
U 2 = k(«, v).
Mapa wpływów będzie teraz zawierać więcej strzałek, ale zasada jej konstrukcji pozostaje nie zmieniona; pozostawiamy więc Czytelnikowi narysowanie jej. Aby znaleźć pochodną zupełną y względem u (przy ustalonym v), możemy znów uciec się do obliczenia różniczki zupełnej y, a następnie podzielenia przez u, co daje następujący wynik: dy _ 3y
(1) pochodne d*i/du i Ax2/Au po prawej stronie muszą być napisane ze znakami pochod nych cząstkowych jako d x jd u i dx2/du, co jest zgodne z funkcjami g i h w (8.12); (2) ilo raz Ay/Au po lewej stronie również musi być interpretowany jako pochodna cząstkowa, mimo iż ma w rzeczywistości postać pochodnej zupełnej, gdyż został otrzymany w wyniku zupełnego różniczkowania y. Z tego względu będziemy dla niego stosować nazwę cząstkowej pochodnej zupełnej. Oznaczamy ją przez §y/§u (z §, a nie d) dla odróżnienia od zwykłej pochodnej cząstkowej dyldu, która — jak pokazuje powyższy wynik —■jest tylko jednym z trzech składników składających się na cząstkową pochodną zupełną4. Po tych modyfikacjach nasz wynik przyjmuje postać:
Au
dy dv
du Au
dv Au
dy
dv
du
du
= 0, gdyż v jest ustalone
Ze względu na to, że zmieniamy u przy ustalonym v (ponieważ pojedyncza pochodna nie może objąć zmian obu zmiennych u i v), powyższy wynik musi być zmieniony na dwa sposoby:
Na zakończenie podrozdziału podajemy trzy ogólne uwagi dotyczące pochodnej zupełnej i różniczkowania zupełnego. 1. W omawianych przypadkach zawsze, bez żadnych wyjątków, występowała zmienna będąca funkcją drugiej zmiennej, która z kolei funkcjonalnie zależała od trzeciej zmiennej. W konsekwencji nieuchronnie pojawiało się pojęcie łańcucha, o czym świadczyło wy stępowanie iloczynu (lub iloczynów) dwu pochodnych jako składnika (lub składników) pochodnej zupełnej. Z tego względu reguły dla pochodnej zupełnej w (8.9), (8.11) i (8.13)
Alternatywnym sposobem oznaczania cząstkowej pochodnej zupełnej jest:
dy_ du v stałe
lub
dy du dv = 0.
212 ANALIZA STATYKI PORÓWNAWCZEJ
mogą być również traktowane jako szczególne wersje reguły łańcuchowej wprowadzonej w podrozdz. 7.3. 2. Łańcuch pochodnych nie musi być ograniczony jedynie do dwu „ogniw” (dwu pomnożonych pochodnych); pojęcie pochodnej zupełnej można rozszerzyć na przypadki, gdy w funkcji złożonej występuje trzy lub więcej ogniw. 3. We wszystkich omówionych przypadkach pochodne zupełne — również te, które nazwaliśmy cząstkowymi pochodnymi zupełnymi — mierzą wielkość zmian względem pewnych ostatecznych zmiennych w łańcuchu lub, innymi słowy, względem pewnych zmiennych, które są w pewnym sensie ęgzogeniczne i które nie są wyrażone jako funkcje innych zmiennych. Istota pochodnej zupełnej i procesu różniczkowania zupełnego polega na tym, aby należycie uwzględnić wszystkie kanały pośrednie i bezpośrednie, którymi efekty zmiany ostatecznej zmiennej mogą być przenoszone na szczególną zmienną zależną, którą badamy. a
Ćwiczenie 8.4 1. Znaleźć pochodną zupełną dzidy, gdy dane jest: (a) z = f( x ,y ) = 2x + x y - f , gdzie * = g(y) = 3y2; (b) z = 6 x 2- 3 x y + 2y2, gdzie x = l l y \ (c) z = (x+ y) (x - 2y), gdzie * = 2 - l y . 2. Znaleźć pochodną zupełną ózl dr, (a) z = x 2- 8 x y - y 3, gdzie (b) z = 3« + vt, gdzie (c) z = f ( x , y , t ) , gdzie
gdy dane jest: z = 3t i y = l —f; u = 2t2 i v = t + 1; x = a + bt i y = c + dt.
3. Znaleźć tempo wzrostu produkcji względem czasu, jeśli funkcją produkcji jest Q = A(i)ńT“L^, gdzie A(t) jest rosnącą funkcją t; K = Ko + at; L = Lq + bt. 4. Znaleźć cząstkowe pochodne zupełne §W/§w i §W7§v, jeśli: (a) W = a x2 + bxy + cu, gdzie x = a u + i y = yu; (b) W = f(x i, x2), gdzie Xi = 5n2 + 3v i x2 = u - 4 v 2.
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 213
(8.14)
y = f( x ) = 3 x \
jest nazywana funkcją w jawnej postaci, ponieważ zmienna y jest w sposób jawny wyrażona jako funkcja x. Gdyby zamiast tego zapisać tę funkcję w postaci równoważnej: (8.140
y - 3x4 = 0,
wówczas nie jest to już funkcja w jawnej postaci. Funkcja (8.14) jest wtedy dana równaniem (8.140 w postaci uwikłanej. Jeśli dane jest (jedynie) równanie w postaci (8.140, to funkcja y = f(x ), którą ono implikuje i której konkretna postać może być nawet nie znana, jest nazywana junkcją uwikłaną (lub niejawną). Równanie w postaci (8.140 może być ogólnie oznaczone F(y, x) = 0, ponieważ jego lewa strona jest funkcją dwu zmiennych y i x. Zwróćmy uwagę, że używamy tu wielkiej lite ry F, aby odróżnić ją od funkcji/; funkcja F, reprezentująca wyrażenie po lewej stronie wzoru (8.140, ma dwa argumenty y i x, podczas gdy funkcja/ , reprezentująca funkcję uwikłaną, ma tylko jeden argument x. Oczywiście funkcja F może mieć więcej niż dwa argumenty. Na przykład możemy napotkać równanie F(y, x u ..., xm) = 0. Takie równanie może określać funkcję uwikłaną y = f ( x x, ..., x„). Enigmatyczne słowo „może” w ostatnim zdaniu zostało użyte celowo. A to dlatego, że podczas gdy funkcja dana w jawnej postaci, powiedzmy y =f(x ), może być zawsze przekształcona w równanie F(y, x) = 0 (przez proste przeniesienie wyrażenia f( x ) na lewą stronę znaku równości), to odwrotne przekształcenie nie zawsze jest możliwe. Rzeczywiście, w pewnych przypadkach dane równanie postaci F(x, y) = 0 może nie określać w sposób uwikłany funkcji y = f(x). Na przykład równanie x 2 + y 2 = 0 jest spełnione tylko w początku układu współrzędnych (0,0), a zatem nie określa funkcji godnej uwagi. Inny przykład to równanie: (8.15)
F(y, x) = x 2 +.y2 - 9 = 0,
które nie implikuje funkcji, lecz relację, gdyż wykresem (8.15) jest okrąg pokazany na rys. 8.6, więc nie jest spełniony warunek, że każdej wartości x odpowiada dokładnie jedna wartość y. Jeśli jednak ograniczymy y do wartości nieujemnych, to będziemy mieć tylko górną połowę
5. Narysować mapę wpływów odpowiadającą przypadkowi (8.12). 6. Wyprowadzić wyrażenie dla §y/§v formalnie z (8.12), obliczając różniczkę zupełną dla y i dzieląc przez dv.
8.5. POCHODNE FUNKCJI NIEJAWNEJ Pojęcie różniczek zupełnych umożliwia nam znalezienie pochodnych tzw. funkcji niejawnej.
Funkcje niejawne (uwikłane) Funkcja dana w postaci y = /(x ), np.:
.
R y su n e k 8.6
21 4 ANALIZA STATYKI PORÓWNAWCZEJ
okręgu, a to określa funkcję, mianowicie y = + J 9 —x 2 . Podobnie dolna połowa okręgu z niedódatnimi wartościami y określa inną funkcję y = —-¡9- x 2. W przeciwieństwie do tego, ani lewa, ani prawa połowa okręgu nie określają funkcji. Interesuje nas, czy znane są ogólne warunki, przy których możemy mieó pewność, że dane równanie postaci: (8.16)
nawet wtedy, gdy nasz model zawiera równanie (8.16), które trudno jest w sposób jawny rozwiązać względem y. Ponadto, ponieważ twierdzenie -gwarantuje istnienie pochodnych cząstkowych/!, . . . , / m, więc ma teraz sens mówienie o tych pochodnych funkcji niejawnej.
Pochodne funkcji niejawnej
F(y, xi, ...,r„ ,) = 0
rzeczywiście określa funkcję niejawną: (8.17)
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 215
y = f{ x u ... x m).
Odpowiedź na to pytanie jest zawarta w tzw. twierdzeniu o funkcji niejawnej, które mówi, że: Dla (8.16), jeśli (a) funkcja F ma ciągłe pochodne cząstkowe Fy, Flt F2, ..., Fm i jeśli (b) w pewnym punkcie (y0.. x i0, ..., x m0) spełniającym równanie (8.16) Fy jest różna od zera, to istnieje pewne m-wymi arowe otoczenie N punktu ( r 10, ..., xmn), w którym y jest uwikłaną funkcją zmiennych x u . .. ,x m w postaci (8.17). Ta funkcja uwikłana spełnia yo =f ( x io ,..., x m0). Spełnia także równanie (8.16) dla każdej m-tki f o , ..., x m) należącej do otoczenia N, nadając (8.16) status tożsamości w tym otoczeniu. Ponadto funkcja niejaw na/jest ciągła i ma ciągłe pochodne cząstkowe / i , ...,/„ . Zastosujmy to twierdzenie do równania okręgu (8.15), które zawiera tylko jedną zmien ną x. Najpierw możemy sprawdzić, że Fy = 2y i Fx = 2x są ciągłe, jak to jest wymagane. Następnie zauważmy, że jest różne od zera prócz przypadku, gdy y = 0, tzn. prócz punktu (-3, 0) położonego najbardziej na lewo i punktu (3, 0), położonego najbardziej na prawo na okręgu. Zatem wokół każdego punktu okręgu z wyjątkiem (-3 , 0) i (3, 0) możemy skonstruować otoczenie, w którym równanie (8.15) określa funkcję niejawną y —f(x ). Można to łatwo sprawdzić na rys. 8.6, gdzie rzeczywiście można wokół każdego punktu okręgu — z wyłączeniem (-3 ,0 ) i (3,0) — narysować np. prostokąt w taki sposób, że zawarta w nim część okręgu będzie stanowiła wykres pewnej funkcji, z jedyną wartością y dla każdej wartości x w tym prostokącie. Należy podkreślić kilka kwestii dotyczących twierdzenia o funkcji niejawnej. Po pierwsze, warunki podane w twierdzeniu mają charakter warunków dostatecznych (ale nie koniecznych). Oznacza to, że jeśli zdarzy się nam znaleźć Fy = 0 w pewnym punkcie spełniającym (8.16), to nie możemy na podstawie twierdzenia wykluczyć istnienia funkcji niejawnej wokół tego punktu. Taka funkcja może bowiem rzeczywiście istnieć (zob. ćwicze nie 8.5-4)5. Po drugie, nawet jeśli jest pewne, że funkcja niejaw na/istnieje, twierdzenie nie daje żadnych wskazówek dotyczących konkretnej postaci, jaką ona przyjmuje. Nie mówi, jaka jest dokładnie wielkość otoczenia N, w którym funkcja niejawna jest zdefiniowana. Pomimo tych ograniczeń twierdzenie to ma wielkie znaczenie. Jeżeli tylko są spełnione jego założenia, to staje się sensowne mówienie o funkcji takiej, jak (8.17) i jej stosowanie
Jeśli można rozwiązać równanie F(y, x ly ..., xm) = 0 względem y, to możemy w jawny sposób zapisać funkcję y = / ( r i , . . . , xm) i znaleźć jej pochodne poznanymi wcześniej metodami. Na przykład po rozwiązaniu (8.15) otrzymujemy dwie osobne funkcje: ,
(8 .1 5 )
y+= + < /9 - r 2,
[górna połowa okręgu]
y~ = - - ¡ 9 - x
[dolna połowa okręgu]
i można znaleźć ich pochodne w następujący sposób: d
dy+ dr
dr
dr
dr
v-2\2 — /Q _ -v-2\"2 2
(8.18) d
¡9 ^7
=— y
- ( 9 - r 2)5 = - U 9 - x 2T H -2 x )= 1 — =— .2 . J9 -X 2 y
(y -* 0 ).
Ale co zrobić, jeśli nie można rozwiązać danego równania F ( y , i i r j = 0 w sposób jawny względem y? W tym przypadku, jeśli przy założeniach twierdzenia o funkcji niejawnej wiemy, że istnieje funkcja niejawna, możemy otrzymać poszukiwane pochodne bez rozwiązywania równania w celu znalezienia /. Aby to zrobić, korzystamy z tzw. wzoru na pochodną funkcji niejawnej, czyli z reguły, która może dać nam pochodne każdej funkcji niejawnej zdefiniowanej danym równaniem. Wyprowadzenie tej reguły opiera się na następujących podstawowych faktach: (1) jeśli dwa wyrażenia są tożsamościowo równe6, ich
6 Weźmy na przykład tożsamość: x 2 - y 2 = (r + y) (r - y). Jest to tożsamość, ponieważ obie strony są równe dla każdych wartości, jakie można nadać zmien nym x i y. Licząc różniczki zupełne obu stron, otrzymujemy: (lewa strona) —2xdx - 2ydy, (prawa strona) = (r -y )d (r + y )+ ( r+ y ) d (r-y ) = ( r - y ) (d r+ dy) + (r+y) (dr - dy) = 2 r dr - 2y dy. Oba wyniki są rzeczywiście równe. Jeśli jednak dwa wyrażenia nie są tożsamościowo równe, ale są równe jedynie dla pewnych konkretnych wartości zmiennych, ich różniczki zupełne nie będą równe. Na przykład równanie: r 2- y 2 = r 2 + y2- 2 jest prawdziwe jedynie dla y = ±1. Różniczki zupełne obu stron:
5 Z drugiej strony, jeśli Fy = 0 w całym otoczeniu, to można wnioskować, że w tym otoczeniu uie istnieje funkcja niejawna. Z tego samego względu, jeśli Fy = 0 tożsamościowo, to nigdzie nie istnieje funkcja niejawna. ■
(y** 0),
(lewa strona) = 2 rd r - 2ydy, (prawa strona) = 2r dr + 2y dy, nie są równe. Zauważmy w szczególności, że nie są nawet równe przy y = ±1.
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 217
216 ANALIZA STATYKI PORÓWNAWCZEJ
różniczki zupełne muszą być równe; (2) różniczkowanie pewnego wyrażenia zawierającego y, ją ,'..., xm daje wyrażenie zawierające różniczki dy, d x i , dxm; (3) jeśli podzielimy dy przez d ti i przyjmiemy, że wszystkie pozostałe różniczki (dx2>..., dxm) są równe zeru, to iloraz może być interpretowany jako pochodna cząstkowa dy/d xx; podobne pochodne można otrzymać, jeśli podzielimy dy przez dx2 itd. Stosując te zasady do równania F(y, x iy..., xm) = 0, które — jak sobie przypominamy — ma status tożsamości w otoczeniu N , w którym jest zdefiniowana funkcja niejawna, możemy zapisać dF = dO, czyli: Fjdy + Fjdhą + ... + Fmdxm= 0. Załóżmy, że tylko y i x, mogą się zmieniać (tylko dy i dx1 nie są przyrównane do zera). Wtedy powyższe równanie redukuje się do Fydy + Fjdjci = 0. Po podzieleniu obu stron przez dxx i rozwiązaniu względem dy /d ją, otrzymujemy: _dy_
_ dy
Fy
<±Ci
~
r y
p o z o s t a ł e z m ie n n e u s t a ło n e
1
F
W podobny sposób możemy otrzymać wszystkie pozostałe pochodne cząstkowe funkcji niejawnej /. Można to w sposób wygodny podsumować w postaci ogólnej reguły różnicz kowania funkcji niejawnej: dla danego F(y, x x, xm) = 0 , jeśli istnieje funkcja niejawna y = f ( x i, • ■, xm), to pochodne cząstkowe funkcji/ są równe: (8.19)
dy 0*1
F;
2x
x
Potwierdziliśmy wcześniej, że reguła różniczkowania funkcji niejawnej daje nam pochodną każdej funkcji niejawnej określonej przez dane równanie. Sprawdźmy to dla dwu funkcji (8.150 * ich pochodnych (8.18). Jeśli do wyniku otrzymanego dzięki regule o funkcji niejawnej dy/dx = - x l y podstawimy y+ zamiast y, to otrzymamy rzeczywiście pochodną dy+ldx podaną w (8.18); podobnie podstawienie y~ zamiast y prowadzi do drugiej pochodnej w (8.18). Zatem nasze wcześniejsze stwierdzenie jest należycie sprawdzone. Przykład 3. Znaleźć dy/dx dla wszystkich funkcji niejawnych, które mogą być okreś lone równaniem F(y, x, w) = y3x 2 + w3 + yxw - 3 = 0. Nie jest łatwo rozwiązać to równanie względem y. Ale ponieważ Fy, Fx i Fw są oczywiście ciągłe i Fy = 3y2x 2 + xw jest rzeczy wiście różne od zera w punkcie (1, 1, 1) spełniającym dane równanie, więc funkcja niejawna y - f ( x , w) na pewno istnieje przynajmniej w otoczeniu tego punktu. Ma zatem sens mówienie 0 pochodnej dy/dx. Na podstawie (8.19) możemy ponadto natychmiast napisać: dy _
F, _
2y2x + y w
dx
Fy
3y2x 2 + x w ’
•
W prostym przypadku, gdy dane jest równanie F(y, x) = 0, reguła ma postać: (8.W )
dy
^ = - 2 T - 7
w punkcie (1, 1, 1) pochodna ta ma w artość
(i = 1, 2, ..., m).
ty
Przykład 2. Znaleźć dy/dr dla funkcji niejawnych określonych równaniem okręgu (8.15). Tym razem mamy F(y, x ) = x 2 + y 2- 9, a zatem Fy = 2y i Fx = 2x. Na mocy (8.190 szukana pochodna jest równa7:
3
4
.
Przykład 4. Załóżmy, że równanie F(Q, K ,L ) = 0 określa w sposób niejawny funkcję produkcji Q = f(K , L). Znajdźmy sposób wyrażenia krańcowych fizycznych produktów MlPPk 1 MPPl zależności od funkcji F. Ponieważ produkty krańcowe są po prostu równe pochodnym cząstkowym dQ/dK i dQ/dL, możemy zastosować regułę dla pochodnych funk cji niejawnej i napisać: N-_ w
£ =- £ . dx Fy
Reguła ta mówi, że nawet wtedy, gdy nie mamy konkretnej postaci funkcji niejawnej, możemy znaleźć jej pochodną (lub pochodne), biorąc ze znakiem minus iloraz pary dwu pochodnych cząstkowych funkcji F występującej w danym równaniu, które określa funkcję niejawną. Zauważmy, że Fy zawsze występuje w mianowniku ilorazu. Ze względu na to nie jest dopuszczalne, aby Fy = 0. Ponieważ twierdzenie o funkcji niejawnej mówi, że F , 5* 0 w punkcie, wokół którego zdefiniowana jest funkcja niejawna, automatycznie pozbywamy się problemu zerowego mianownika w odpowiednim otoczeniu tego punktu.
dO
FK
MPP"r = "dK = ~ J a
dO 1
F,
'M PPŁł" a T = ~~Fq '
Oprócz nich ż równania F(Q, K, L) = 0 możemy otrzymać jeszcze jedną pochodną cząstkową: dKL = _ F L
Przykład 1. Znaleźć dy/dr dla funkcji niejawnej określonej przez (8.14'). Ponieważ F(y, x) ma postać y - 3x4, na mocy (8.190 mamy:
dx
Fv
d\L
Fk
Jaki jest sens ekonomiczny d K /dLl Znak pochodnej Cząstkowej oznacza, że trzecia zmienna, czyli Q, jest ustalona. Wynika stąd, że zmiany K i L opisane przez tę pochodną
1
W tym konkretnym przypadku możemy z łatwością rozwiązać dane równanie wzglę dem y i otrzymać y = 3x4. Łatwo jest więc sprawdzić poprawność powyższej pochodnej. .
7 Ograniczenie y * 0 jest oczywiście całkowicie zgodne z naszymi wcześniejszymi rozważaniami o równaniu (8.15) podanymi po sformułowaniu twierdzenia o funkcji niejawnej.
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 219
2 1 8 ANALIZA STATYKI PORÓWNAWCZEJ
mają charakter zmian kompensacyjnych” , które mają na celu utrzymanie produkcji Q na pewnym ustalonym poziomie. Stanowią zatem rodzaj zmian odnoszących się do ruchu wzdłuż izokwanty produkcji. W dodatku pochodna dK/dL jest miarą nachylenia — zazwyczaj ujemnego — takiej izokwanty. Wartość bezwzględna dK/dL jest ponadto miarą krańcowej stopy technicznej substytucji dwu nakładów.
to istnieje m-wymiarowe otoczenie N punktu (xI0, ..., x„0), w którymzmienne y u ...,y„ są funkcjami zmiennych x u . . . , x m (8.21). Te funkcje niejawne spełniają: y w = f l (.xw, . .. ,x m0),
yno f (*io» •••j *mo)
Rozszerzenie na przypadek układu równań Twierdzenie o funkcji niejawnej występuje również w bardziej ogólnej wersji dotyczącej warunków, przy której układ równań współzależnych:
F 2(yi, ...,y „ ;
*1, . . . , xm) = 0,
F"(yi, ...,y„ ;
x ,,...y
(8.20)
Podobnie jak w przypadku pojedynczego równania, teraz również można obliczyć pochodne cząstkowe funkcji niejawnych bezpośrednio z n równań (8.20), bez konieczności rozwiązywania ich względem y zmiennych. Korzystając z faktu, że w otoczeniu N (8.20) mają status tożsamości, możemy obliczyć różniczkę zupełną każdej z nich i napisać dF 1 = 0 (./= 1 ,2 ,... ,n). W wyniku tego otrzymujemy układ równań względem różniczek dy i , . . . , dy„ i djcj, ..., d r m. Po przeniesieniu składników zawierających dr, na prawą stronę znaków równości mamy:
O II
*1, . . . , xm) = 0,
K6
F l (y¡, ...,y „ ;
oraz spełniają również (8.20) dla każdej m-tki (xl t ..., x,„) należącej do otocze nia — nadając w ten sposób (8.20) status układu tożsamości spełnionych w tym otoczeniu. Ponadto funkcje niejawne / ' , . . . , / " są ciągle i mają ciągłe pochodne cząstkowe względem wszystkich z: zmiennych.
na pewno określa zestaw funkcji uwikłanych yi = /'(* !, (8.21)
y2= / 2(*i,
dF1 dFl ^ — dyi + -5— dy2 + ... dyi dy2
y n = fn(xu ...,X m).
dF2 (8 .22 )
Uogólniona wersja twierdzenia mówi, że: Jeżeli dany jest układ równań (8.20) i jeśli (a) funkcje F \ mają ciągłe pochodne cząstkowe względem wszystkich zmiennych y i x oraz jeśli (b) w punkcie (jyi0, ... , y„o',. *io> . -T/no) spełniającym (8.20) następujący wyznacznik Jacobiego jest różny od zera:
Ul =
d ( F \ . . , F n)
dF1
dF1
dF1
dyi
dy2
dyn
dF 2
dF 2
dF 2
dyi
dy2
dy„ * 0,
3(yi. ••-.J'n)
dF"
dF"
dF"
dyi
dy2
dyn
8 Z innego punktu widzenia warunki te służą do tego, aby nas upewnić, że n równań w (8.20) może w zasadzie być rozwiązanych względem n zmiennych ....... y„, nawet jeśli nie możemy otrzymać rozwiązań (8.21) w jawnej postaci.
dy 1
dF1 fd F 1 dF1 } — dy„ = - —— dią + ... + - — dxm , dy„ V 0*1 dx„ j
dF2 \d F 2 fd F 2 dF 2 d y i + ^ — dy2+ -.. + ^ r— dy„ = - —— dbą+ . . . + - — dx,■m h dy2 dyn \ óx 1 dx,
dF n dFn dF n fd F " dF” —— dy! + ^ — dy2+ ... + - ^ — dy„ = dż! + ... + ^ — dx„ dyi dy2 dyn \ dx\ dxm Ponieważ pochodne cząstkowe pojawiające się w (8.22) przyjmują konkretne (stałe) wartości w punkcie (yj0, ...,y„o; *10» ••■.xm0), w otoczeniu którego zdefiniowane są funkcje uwikłane (8.21), więc mamy tu układ n równań liniowych, w których różniczki dy,(traktowane jako endogeniczne) są wyrażone jako funkcje różniczek dr, (traktowanych jako egzogeniczne). Przyjmijmy teraz założenie, iż wszystkie różniczki dc(, oprócz d*lf są równe zeru (tzn. pozwalamy, aby tylko x 1 się zmieniało); wtedy wszystkie składniki zawierające d t2, ..., ćxm wypadną z układu. Załóżmy dalej, że dzielimy wszystkie pozostałe składniki przez dx[; wtedy otrzymujemy wyrażenia dyi/d xu AyJAXi. Powinny one jednak być interpretowane jako pochodne cząj/fawe w (8.21), ponieważ wszystkie zmienne x, oprócz *1, były ustalone. Postępując w taki właśnie sposób, otrzymujemy żądane pochodne cząstkowe funkcji niejawnej. W istocie „za jednym zamachem” otrzymujemy wszystkie n pochodnych (tutaj są to d y i/d x i,..., dyn/dxj). Po przeprowadzeniu opisanych powyżej działań otrzymujemy następujący układ li niowy:
220 ANALIZA STATYKI PORÓWNAWCZE]
dF1 dyi
(8.23)
d F ' fdy„
d F 1 fd y 2
U J+dy2
dy¡ l d * J
dy2 l d * i j
dF" ( d y A dyi
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 221
UiJ
dy2 ydxi j
+ .. . +
dF1
dy„ U * i
" a v
dF 2 fdy„
dF2
dy„ U *i
dx¡
dF" (dy„
dF"
dy„ [dx¡
37"’
gdzie — dla jasności obrazu — postawiliśmy nawiasy wokół tych pochodnych, dla których szukamy rozwiązania, aby odróżnić je od pozostałych pochodnych, które teraz traktujemy jako stałe. W zapisie macierzowym układ ten może być ujęty jako: dF1 dy i
dF1
dF '
dy2
dyn
dF 2
dF 2
dF2
dyi
dy2
dyn
(8.230
dyi dxi dy2 dx¡
Przykład 5. Przepiszmy model dochodu narodowego (7.17) w postaci: y - c - 7 0- G 0 = o, (8.25)
C - a - p ( Y - T ) = 0, T -y -S Y = 0 .
Jeśli za zmienne endogeniczne (ylt y2, y3) przyjmiemy (y, C, T), a za zmienne egzogeniczne i parametry ( y 1 ; x 2 , . . . , x 6 ) przyjmiemy (70, G0, a , ¡ 3 , y , <5), to lewa strona każdego równania może być traktowana jako konkretna funkcja F o postaci FJ(Y, C, T; 70, G0, a , P , y, <5). Zatem (8.25) jest szczególnym przypadkiem (8.20) dla n = 3 i m = 6. Ponieważ funkcje F l, F 2 i F 3 mają ciągłe pochodne cząstkowe i ponieważ odpowiedni wyznacznik Jacobiego (zawierający jedynie zmienne endogeniczne): dF1 dF1 dF1
dF1
~dY
dx i dF 2
;
(8.26)
~dC ~dT
1 -1
dF2 dF2 dF2
IJI
dY
dx¡
dC
~dT
dF3 dF3 dF3 dY dF"
dF"
dF"
dyn
dF"
dy i
dy2
dyn
dxi
dx i
Ponieważ wyznacznik macierzy współczynników w (8.230 jest niczym innym, jak szczególnym wyznacznikiem Jacobiego | J | (o którym wiemy, że jest niezerowy przy założeniach twierdzenia o funkcji niejawnej) i ponieważ układ musi być niejednorodny (dlaczego?), więc musi istnieć jednoznaczne rozwiązanie wzoru (8.230- Zgodnie ze wzorem Cramera, rozwiązanie to można wyrazić analitycznie w następujący sposób (por. (5.15)):
dC
(8.24)
W IJI
Po odpowiedniej adaptacji tej procedury można również otrzyrnać pochodne cząstkowe funkcji niejawnych względem pozostałych ^stajennych x2, Tak samo, jak prży regule dla funkcji niejawnej (849) dla przypadku pojedynczej zmiennej, opisana właśnie procedura pbliężeftia pochodnych cząstkowych funkcji niejawnych / ' , . . . , / " wymaga stosowania jedynie wartości pochodnych cząstkowych funkcji F w punk cie (yI0 yn0; *10, „ „ fa )), Zatem równańie macierzowe (8.234 i jego analityczne rozwiązanie (8.24) Są w rezultacie pewną wersją reguły różniczkowania funkcji niejawnych dla układu równań. Podkreślamy, że | J | ^ 0 wykjuęza żerówy mianownik (8,24), ppdobnić jak to było z Fy * 0 w regule dla funkcji niejawnych (8.19) i (8.19'), Również rola, jaką odgrywa warunek I J I ^ O przy gwarantowaniu istnienia jedynego (chociaż niejawnego) rozwiązania (8,21) układu (8.20), jest bardzo podobna do roli warunku nieosobliwóści | A | ^ 0 w układzie równali liniowych A.x = d.
-P
1 p
-8
0
i-p + p s
1
~dT
jest zawsze niezerowy (gdyż p i <5są dodatnimi ułamkami), możemy przyjąć, że Y, C i T są niejawnymi funkcjami (70, G0, a , /?, y, 8) wokół dowolnego punktu spełniającego (8.25) i w tym punkcie. Ale punkt spełniający (8.25) będzie rozwiązaniem równowagi odnoszą cym się do ?, C i T. Zatem twierdzenie o funkcji niejawnej mówi nam, że uzasadniony jest zapis: y = / ‘(/o, Go, 0 t,p , y, <5), C = / 2(70, G0, a , p , y, <5), T = / 3(70, G0, a , p , y, 8),
d jj
0
\
co wskazuje, że warunki równowagi zmiennych endogenicznych są funkcjami niejawnymi zmiennych egzogenicznych i parametrów. Pochodne cząstkowe funkcji niejawnych, takie jak dY/dI0 idY/dG0, mają naturę pochodnych statyki porównawczej. Do ichznalezienia potrzebnesą tylkowartości pochod nych cząstkowych funkcji F obliczone dla stanu równowagi modelu. Ponadto trzy wartości (gdyż n = 3) mogą być obliczone za jednym razem. Załóżmy teraz, że ustalamy wszystkie zmienne egzogeniczne i parametry oprócz G0. Wtedy korzystając z wyniku w (8.234 możemy zapisać równanie: 1 -1
o ' 'dY/dG o'
T
-p
1 p
dC/dGo -
0
-8
0
df/dG o
0
1
z którego możemy obliczyć trzy pochodne statyki porównawczej (wszystkie względem G0). Na przykład pierwsza, reprezentująca mnożnik wydatków rządowych, będzie równa:
220 ANALIZA STATYKI PORÓWNAWCZEJ
dF1 foi
Ifo.J
dF 2 fd y ,') (8.23)
dy fo i U
d F 1 dy2-
fo2 foi
dy i ^3^! J
+... +
d F ^ fd y A
J + fo i U
dF" fdy¡
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 221
J + -
d F 1 f fo » ]
dF 1
fo. I f o J
dx¡
dF2 i y„\ dF 2 fd
dF 2
1
+ dyn f o„ II f o J
dF" I' f o . ] + ... + fo2 l,foi dyn 'k fol
dF” (d y 2
J
Przykład 5. Przepiszmy model dochodu narodowego (7.17) w postaci: Y - C - I 0 ~ G 0 = 0, ■
(8.230
dF1
dF1
foi
dy2
fo»
dF2
dF 2
dF2
foi
fo2
dyn
C - a - P { Y - T ) = 0,
dx, ’
dF" ~d
gdzie — dla jasności obrazu — postawiliśmy nawiasy wokół tych pochodnych, dla których szukamy rozwiązania, aby odróżnić je od pozostałych pochodnych, które teraz traktujemy jako stałe. W zapisie macierzowym układ ten może być ujęty jako: dF1
(8.25)
T - y - 8 Y = 0. Jeśli za zmienne endogeniczne (yi, y2, yo) przyjmiemy (Y, C, T), a za zmienne egzogeniczne i parametry (xit x2, . .. ,x 6) przyjmiemy (/0, G0, a , /?, y, 8), to lewa strona każdego równania może być traktowana jako konkretna funkcja F o postaci F*(Y, C, T\ I0, G0, a , ¡i, y, 8). Zatem (8.25) jest szczególnym przypadkiem (8.20) dla « = 3 i m = 6. Ponieważ funkcje F 1, F 2 i F 3 mają ciągłe pochodne cząstkowe i ponieważ odpowiedni wyznacznik Jacobiego (zawierający jedynie zmienne endogeniczne): ć)F‘ dF1 dF1 ~dY d c ar
dF 1 foi dF 2
1 -1
dF2 dF2 dF2 |J | = ~dY d c dT
(8-26)
foi
dF3 dF3 dF3 dY d c dT dF" foi
dF" foz
dF"
dF"
dyn
foi
Ponieważ wyznacznik macierzy współczynników w (8.23') jest niczym innym, jak szczególnym wyznacznikiem Jacobiego | J | (o którym wiemy, że jest niezerowy przy założeniach twierdzenia o funkcji niejawnej) i ponieważ układ musi być niejednorodny (dlaczego?), więc musi istnieć jednoznaczne rozwiązanie wzoru (8.230. Zgodnie ze wzorem Cramera, rozwiązanie to można wyrazić analitycznie w następujący sposób (por. (5.15)):
0
~P
1
P
-8
0
1
= 1-p + p s
jest zawsze niezerowy (gdyż / i i <5są dodatnimi ułamkami), możemy przyjąć, że Y, C i T są niejawnymi funkcjami (/0, G0, a , ¡5, y, 8) wokół dowolnego punktu spełniającego (8.25) i w tym punkcie. Ale punkt spełniający (8.25) będzie rozwiązaniem równowagi odnoszą cym się do Y, C i T. Zatem twierdzenie o funkcji niejawnej mówi nam, że uzasadniony jest zapis: T = / ‘ (7o, Go, a , P, y, 8),
C = f 2(I0, G0, a , p , y, 8), T = f \ I 0, Go, a , P, y, 8),
(8.24)
foj W — = T 7T Xi Ul
0 = Í. 2
, n).
Po odpowiedniej adaptacji tej procedury można również otrzymać pochodne cząstkowe funkcji niejawnych wżględem pozostałych zmiennych x2, . . . , x m. Tak sarno, jak przy regule dla funkcji niejawnej (8.19) dla przypadku pojedynczej zmiennej, opisana właśnie procedura Obliczenia pochodnych cząstkowych funkcji niejawnych / ' , . . . , / " wymaga stosowania jedynie wartości pochodnych cząstkowych funkcji F w punk cie (yio, ...,y „ 0; *io, Zatem równanie macierzowe (8.230 i jego analityczne rozwiązanie (8.24) śą w rezultacie pewną wersją reguły różniczkowania funkcji niejawnych dla układu równań. Podkreślamy, że | J | ^ 0 wyklucza zerówy mianownik (8,24), podobnie jak to było z F , * 0 w regule dla funkcji niejawnych (8.19) i (8.19'). Również rola, jaką odgrywa warunek I J I ^ O przy gwarantowaniu istnienia jedynego (chociaż niejawnego) rozwiązania (8.21) układu (8.20), jest bardzo podobna do roli warunku nieosobliwości | Ą | # 0 W układzie równań liniowych Ax = d.
co wskazuje, że warunki równowagi zmiennych endogenicznych są funkcjami niejawnymi zmiennych egzogenicznych i parametrów. Pochodne cząstkowe funkcji niejawnych, takie jak dY/d/n i dY/dG0, mają naturę pochodnych statyki porównawczej. Do ich znalezienia potrzebne są tylko wartości pochod nych cząstkowych funkcji F obliczone dla stanu równowagi modelu. Ponadto trzy wartości (gdyż n = 3) mogą być obliczone za jednym razem. Załóżmy teraz, że ustalamy wszystkie zmienne egzogeniczne i parametry oprócz G0. Wtedy korzystając z wyniku w (8.231) możemy zapisać równanie:
1 -1
-P -8
1 0
o" 'dY/dG o'
1
P
dC/dGo = 0
1
dT/dGo
0
z którego możemy obliczyć trzy pochodne statyki porównawczej (wszystkie względem G0). Na przykład pierwsza, reprezentująca mnożnik wydatków rządowych, będzie równa:
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 223
222 ANALIZA STATYKI PORÓWNAWCZEJ
ii dG0 "
1 o 0
8.6. STATYKA PORÓWNAWCZA DLA MODELI Z OGÓLNYMI FUNKCJAMI
-1 0 i p 0 1 |J |
1- p + pS
[na mocy (8.26)]
To jest oczywiście dokładnie taki sam wynik, jaki otrzymaliśmy wcześniej w (7.19). Zauważmy jednak, że obecnie mieliśmy do czynienia jedynie z funkcjami niejawnymi i całkowicie ominęliśmy działania polegające na rozwiązaniu układu (8.25) względem Y, C i f . Ta właśnie szczególna cecha metody umożliwi nam teraz zajęcie się sta tyką porównawczą modeli z ogólnymi funkcjami, które ze swej natury nie mają jawnych rozwiązań.
Kiedy w rozdz. 7 po raz pierwszy rozważaliśmy problem analizy statyki porównawczej, zajmowaliśmy się przypadkiem, gdy wartości równowagi dla zmiennych endogenicznych modelu można wyrazić w sposób jawny jako funkcje zmiennych egzogenicznych i parame trów. Wtedy wszystkim, co było nam potrzebne, była technika zwykłych pochodnych cząstkowych. Jeśli jednak model zawiera funkcje wyrażone w postaci ogólnej, nie można stosować tej techniki, gdyż nie są osiągalne jawne rozwiązania. Zamiast tego trzeba zastosować nową technikę opartą na takich pojęciach, jak: różniczki zupełne, pochodne zupełne, twierdzenie o funkcji niejawnej, reguła różniczkowania funkcji niejawnej. Zilust rujemy to najpierw za pomocą modelu rynku, a,następnie przejdziemy do modelu dochodu narodowego.
Ćwiczenie 8.5 Model rynku 1. Zakładając, że równanie F (U ,xit . .. ,r ,) = 0w sposób niejawny określa funkcję użyteczno ści U = f(x u x2, x„): (a) znaleźć wyrażenia dla dUldx2\ dU/dxn\ dx}/dx2 i dx4/dx„\ (b) zinterpretować ich znaczenie ekonomiczne. 2. Dane są równania F(y, x) = 0 zapisane poniżej. Czy wokół punktu (y = 3; z = 1) jest określona funkcja niejawna: (a) z 3 —'hczy + 3xy2 - 22 = 0; (b) 2 z2 + 4;ty - y 4 + 67 = 0. Jeśli odpowiedź jest pozytywna, znaleźć dy/dz na podstawie reguły dla funkcji niejawnej i obliczyć jej wartość we wspomnianym punkcie. 3. Dane jest z 2 + 3zy + 2yz + y 2 + z2 - 1 1 = 0 . Czy funkcja niejawna z = /(z , y) jest określona dz/dx idzidy za pomocą reguły wokół punktu (z = 1; y = 2; z = 0)? Jeśli tak, znaleźć dla funkcji niejawnej i obliczyć ich wartości w tym punkcie. 4. Rozważając równanie F (y, z) = (z - y ) 3 = 0 w otoczeniu początku układu współrzędnych, udowodnić, że warunki podane w twierdzeniu o funkcji niejawnej nie mają charakteru warunków koniecznych. 5. Jeśli równanie F(x, y, z) = 0 w sposób niejawny definiuje każdą z trzech zmiennych jako funkcję dwu pozostałych zmiennych i jeśli istnieją wszystkie rozważane pochodne, znaleźć ■ dz dx dy wartość — —— . ' j .a dx dy dz 6. Uzasadnić podane w tekście stwierdzenie, że układrównań (8.234 musi być niejednorodny. 7. Na podstawie modelu dochodu narodowego (8.25) znaleźć za pomocą reguły dla funkcji niejawnej mnożnik podatków niedochodowych i mnożnik podatku dochodowego. Spraw dzić wyniki, porównując je z (7.20) i (7.21).
Rozważmy rynek pojedynczego dobra, na którym wielkość popytu Qd jest funkcją nie tylko bceny P, lecz również egzogenicznie określonego dochodu Y0, a wielkość podaży Qs jest funkcją tylko ceny. Jeśli funkcje te nie są podane w konkretnej postaci, możemy zapisać nasz model ogólnie, jak następuje:
& = G„. (8.27)
Qd = D{P, Y0)
(dD/dP < 0 ;
Qs = S(P)
(dS/dP > 0).
dD/dY0 > 0),
O obu funkcjach D i S zakładamyj że mają ciągłe pochodne, czyli — innymi słowy — że mają gładkie wykresy. Ponadto, aby zapewnić im ekonomiczny sens, nałożyliśmy określone warunki na znaki tych pochodnych. W ,wyniku ograniczenia dS/dP > 0, funkcja podaży jest monotonicznie rosnąca, chociaż może być liniowa lub nieliniowa. Podobnie przez ograniczenia nałożone na dwie pochodne cząstkowe funkcji popytu wskazujemy, że jest ona malejącą funkcją ceny, ale rosnącą funkcją dochodu. Warunki te służą ograniczeniu naszej analizy do „normalnego” przypadku, jaki spodziewamy się spotkać. Przy sporządzaniu wykresu w dwu wymiarach dla zwykłej krzywej popytu, zakłada się, że poziom dochodu jest ustalony. Gdy dochód się zmienia, naruszy to dane położenie równowagi, powodując przesunięcie krzywej popytu. Podobnie jest w (8.27): Y0 może spowodować zmianę naruszającą równowagę za pośrednictwem funkcji popytu. Tutaj Ya jest jedyną zmienną egzogeniczną lub parametrem; zatem analiza statyki porównawczej dla tego modelu będzie dotyczyła wyłącznie tego, jak zmiana Y0 wpływa na stan równowagi modelu. Stan równowagi rynkowej jest określony przez warunek równowagi Q d = Q s , który po dokonaniu podstawień i uporządkowaniu może być wyrażony jako: (8.28)
D (P, y0) - S(P) = 0.
Mimo że nie da się w jawny sposób rozwiązać tego równania względem ceny równo wagi P , będziemy zakładać, że istnieje równowaga statyczna, gdyż w przeciwnym przypadku nie miałoby sensu rozważanie problemu statyki porównawczej. Na podstawie naszego
2 2 4 ANALIZA STATYKI PORÓWNAWCZEJ
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 225
doSwiadczenia z modelami o konkretnych funkcjach nauczyliśmy się oczekiwać, że P jest funkcją zmiennej egzogenicznej F0: (8.29)
P = P(Yo).
Teraz możemy już stworzyć ścisłe podstawy tego przekonania, odwołując się do twierdzenia o funkcji niejawnej. .Ponieważ (8.28) ma postać F(P, Y0) = 0, więc jeśli będą spełnione założenia twierdzenia" o funkcji niejawnej, to każdej wartości Y0 będzie od powiadała jedyna wartość P w otoczeniu punktu spełniającego (8.28), tzn. w otoczeniu pewnego (początkowego lub „starego” ) położenia równowagi. W takim przypadku możemy rzeczywiście zapisać funkcję niejawną P = P(Y0) i rozważać jej pochodną dP /dF 0 -— tę właśnie pochodną statyki porównawczej, której szukamy, a o której wiadomo, że istnieje. Sprawdźmy wobec tego te założenia. Po pierwsze, funkcja F(P, Y0) rzeczy wiście ma ciągłe pochodne; jest tak, ponieważ z założenia jej dwie addytywne skła dowe D(P, Yo) i S(P) mają ciągłe pochodne. Po drugie, pochodna cząstkowa F wzglę dem P, mianowicie FP = dD/dP —dS/dP, jest ujemna, a zatem różna od zera, niezależnie od tego, w którym punkcie obliczamy jej wartość. Zatem ma zastosowanie twierdzenie o funkcji niejawnej i (8.29) jest rzeczywiście prawomocne. . Zgodnie z tym samym twierdzeniem, warunek równowagi (8.28) może być teraz traktowany jako tożsamość w pewnym otoczeniu rozwiązania równowagi. W wyniku tego możemy zapisać tożsamość równowagi; (8.30)
D(P, Yo) - S ( P ) = 0.
:
Trzeba jeszcze tylko zastosować bezpośrednio regułę różniczkowania funkcji niejawnej, aby otrzymać pochodną statyki porównawczej dP /dło. którą — dla jasności obrazu — będziemy od tej pory pisać w nawiasach, aby odróżnić ją od wyrażeń dla zwykłych pochodnych stanowiących po prostu część specyfikacji modelu. Wynik jest następujący: (8.3D
r^y 3dF/dP F/3y° dY0J
dDldY°
"óDióP - dS/dP
>o.
W wyniku tym wyrażenie dD/dP odnosi się do pochodnej dDIdP obliczonej w począt kowym położeniu równowagi, to znaczy dla P = P ; podobna interpretacja dotyczy dS/dP. W rzeczywistości również dDldY0 musi być obliczone w punkcie równowagi. Na mocy ustalonych znaków w (8.27), (d P /d f0) jest zawsze dodatnie. Zatem mamy wniosekjakościowy, że wzrost (spadek) poziomu dochodu zawsze spowoduje wzrost (spadek) ceny równowagi. Jeśli znamy wartości, jakie przyjmują pochodne funkcji popytu i podaży w pierwotnym położeniu równowagi, to (8.31) będzie też dawać wniosek ilościowy. Powyższe rozważania dotyczą wpływu, jaki wywiera zmiana ło na P. Czy można również określić jej wpływ na ilość dobra wytworzoną dla położenia równowagi Q {= Q j= Qs)l Odpowiedź jest pozytywna. Ponieważ w położeniu równowagi mamy <2 = S(P) i ponieważ P = P(ło), możemy więc dzięki zastosowaniu wzoru na pochodną funkcji złożonej otrzymać pochodną:
(8 '32)
d ) =S K )>0'
8<,yi
w tym modelu. Jak poprzednio, z (8.32) mogą wynikać wnioski ilościowe, jeśli znane są wartości, jakie różne pochodne przyjmują w położeniu równowagi. Wyniki w (8.31) i (8.32), które wyczerpują zawartość modelu, jeśli chodzi o statykę porównawczą (ponieważ zawiera on jedynie jedną zmienną egzogeniczną i dwie endogeniczne), nie są zaskakujące. W istocte nie zawierają nic innego, jak tylko stwierdzenie, że przesunięcie krzywej popytu ku górze spowoduje ustalenie wyższej ceny równowagi i większych ilości koniecznych do osiągnięcia równowagi. To samo stwierdzenie — jak mogłoby się wydawać — wynikałoby na pierwszy rzut oka z prostej analizy graficznej! Brzmi to rozsądnie, ale nie należy tracić z pola widzenia o wiele bardziej ogólnego charakteru zastosowanej tu procedury analitycznej. Analiza graficzna, powtórzmy, jest ze swej natury ograniczona do konkretnego zestawu krzywych (geometrycznego odpowiednika konkretnego zestawu funkcji). Jej wnioski, ściśle rzecz biorąc, są wobec tego prawdziwe i mogą być stosowane tylko do tego zbioru funkcji. W przeciwieństwie do tego, sformułowanie (8.27), jakkolwiek by było uproszczone, obejmuje cały zbiór możliwych kombinacji krzywych popytu o nachyleniu ujemnym i krzywych podaży o nachyleniu dodatnim. Jest zatem znacz nie bardziej ogólne. Ponadto zastosowana tu procedura analityczna może objąć wiele problemów o większej złożoności, które pozostają poza granicami możliwości podejścia graficznego.
Podejście dla równań współzależnych Powyższa analiza modelu (8.27) została przeprowadzona na podstawie pojedynczego równania, mianowicie (8.30). Ponieważ tylko jedna zmienna endogeniczna może z pożytkiem być włączona do jednego równania, więc włączenie P oznacza wykluczenie Q. W rezultacie byliśmy zmuszeni znaleźć najpierw (dP/dłb) i potem wyprowadzić (dg/dło). Teraz pokażemy, jak można jednocześnie badać P i Q. Ponieważ są tu dwie zmienne endogeniczne, więc odpowiednio do tego musimy ustanowić układ złożony z dwu równań. Najpierw, przyjmując w (8.27) Q = Qd = Qs i porządkując, możemy zapisać nasz model rynku jako:
(8.33)
F 1( P ,Q ; Y o) = D (P ,Y o) - Q = 0, F 2(P ,Q ; Yo) = S ( P ) - Q = 0,
co ma postać (8.20) dla n —2 i m — 1. Interesuje nas ponownie sprawdzenie warunków twierdzenia o funkcji niejawnej. Po pierwsze, ponieważ zakładamy, że obie funkcje popytu i podaży mają ciągłe pochodne, więc muszą je mieć funkcje F ' i F 2. Po drugie, jakobian dla zmiennych endogenicznych (obejmujący P i Q) rzeczywiście okazuje się być różny od zera, niezależnie od tego, w którym punkcie obliczamy jego wartość, ponieważ:
(8.34)
|J | =
3 F >0'
a zatem ilość dobra odpowiadająca położeniu równowagi jest również dodatnio związana z ło
aF l ap
af 1 de
ad
ap 2 dF2 ap de
dS
dp
dP
-1
_ 45 “ dP
> 0.
-1
Jeśli zatem istnieje rozwiązanie układu równań (P, Q) odpowiadające położeniu 15 — Podstawy...
2 2 6 ANALIZA STATYKI PORÓWNAWCZEJ
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 2 2 7
równowagi (musimy zakładać, że tak jest, aby miało sens mówienie o statyce porównawczej), to twierdzenie o funkcji niejawnej mówi, że możemy zapisać funkcje niejawne: (8.35)
P = P(Y0)
i
gdzie wartości wszystkich pochodnych funkcji popytu i podaży (również te pojawiające się w jakobianie) są obliczone w początkowym punkcie równowagi. Czytelnik może się przekonać, że otrzymane właśniewyniki są identyczne z tymi, które otrzymaliśmy wcześniej w (8.31) i (8.32) metodą dotyczącą pojedynczego równania. :
Q = Q (Y 0)
nawet wtedy, gdy nie możemy znaleźć jawnych rozwiązań dla P i Q. Funkcje te, jak wiemy, mają ciągłe pochodne. Ponadto (833) będzie stanowiło parę tożsamości w pewnym otoczeniu stanu równowagi; więc możemy również zapisać:
Zastosowanie pochodnych zupełnych
D(P, Y0) - Q = 0, S ( P ) - Q = 0,
(8.36)
Oba zilustrowane powyżej podejścia — dotyczące pojedynczego równania i układu równań — mają jedną wspólną cechę: obliczamy różniczki zupełne obu stron tożsamości równowagi i przyrównujemy wyniki. Zamiast różniczek zupełnych można obliczać i porównać pochodne zupełne względem pewnej zmiennej egzogenicznej lub parametru obu stron tożsamości równowagi. Na przykład przy podejściu dotyczącym pojedynczego równania tożsamość równowagi jest następująca:
a stąd można jednocześnie obliczyć (dP/dy0) i (AQJAY0). Te dwie pochodne mają jako swoje składowe różniczki dP, AQ i dy0. Różniczkujemy kolejno każdą tożsamość w (8.36). W rezultacie po uporządkowaniu otrzymujemy liniowy układ równań względem dP i AQ: dD
-
-
dD
gdzie-
D(P, Ya) - S ( P ) ^ Q , P = P(Y0).
fd P -d e = » :
Obliczanie pochodnej zupełnej tożsamości równowagi względem y0 —■która uwzględnia zarówno pośrednie, jak i bezpośrednie wpływy zmiany To — daje nam wobec tego równanie:
Układ ten jest liniowy, ponieważ dP i AQ (zmienne) występują tu w pierwszej potędze, a współczynniki, czyli pochodne (wszystkie mają być obliczone w początkowym punkcie równowagi) i dy0 (dowolna, niezerowa zmiana zmiennej egzogenicznej) reprezentują konkretne stałe. Po podzieleniu przez dy0 i zinterpretowaniu ilorazu dwu różniczek jako pochodnej, otrzymujemy równanie macierzowe9:
dD
f— V dP ,dy0J
dD
*£ -i dP
W
AS
( AQ )
dY0
dD dY0 2
po śred n i
be p o śre
w p ły w
d n i w p ły w
Jo n a D
Yo n a D
AS
” dP ldy0J p o śred n i w p ły w
Y o Dz S
Gdy rozwiążemy to równanie względem (dP/dło), otrzymamy wynik identyczny z uzyskanym w (8.31). Z drugiej strony, przy podejściu dotyczącym układu równań, mamy parę tożsamości równowagi:
0
Korzystając ze wzoru Cramera i stosując (8.34), znajdujemy następnie rozwiązanie:
D(P, Y0) - 2 = 0, S ( P ) - Q = 0,
ay0 o
dy0 (8.37)
-i
dP«.
Ul ’
dD
dD
dP
dY<>
ds AQ
0
dP Ul
P = P(Y0);
dY0
Ul
[z (8.36)]
gdzie:
dD dP
[z (8.30)] [z (8.29)]
dS dD
9 / S '1 ®
dPdYo
‘i j §
1JI
9 Można otrzymać to samo równanie macierzowe bez przechodzenia przez etap różniczkowania zupełnego i dzielenia przez dy0, przy zastosowaniu reguły różniczkowania funkcji niejawnej (8.23')-
Rysunek 8.7
Q = Q(Y0).
[z (8.35)]
228 ANALIZA STATYKI PORÓWNAWCZEJ
Trudniej jest teraz prześledzić różne wpływy Y0, ale za pomocą mapy wpływów przedstawionej na rys. 8.7 sprawa wydaje się być prostsza. Ta mapa wpływów pokazuje, że np. gdy różniczkujemy funkcję D względem Y0, musimy uwzględnić zarówno bezpośredni (wygięta strzałka), jak i pośredni (za pośrednictwem F) wpływ Y0 na D. Gdy natomiast różniczkujemy funkcję S względem Y0, jedynym efektem, jaki należy uwzględnić, jest wpływ pośredni (poprzez P). Zatem wynikiem zupełnego różniczkowania dwu tożsamości wzglę dem T0 jest, po uporządkowaniu, następująca para równań: |^ V d P W d f i j U p J IdToJ dS fd P
{dY0J
dYo
d ?ld F n są one oczywiście identyczne z równaniami otrzymanymi metodą różniczek zupełnych i prowadzą ponownie do pochodnych statyki porównawczej otrzymanych w (8.37).
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 229
Stosujemy tu symbol L, gdyż funkcja popytu na pieniądz jest zwyczajowo nazywana funkcją płynności (ang. liquidity function). Należy starannie rozróżniać symbol Md, reprezentujący popyt na pieniądz, od symbolu M dla importu. 6. Podaż pieniędza jest określona egzogenicznie w ramach polityki monetarnej: M, = MSoZauważmy, że I, S, M i X, reprezentujące pojęcia dotyczące przepływów, są mierzone w jednostkach przypadających na jednostkę czasu, podobnie ja k Y. Natomiast Md i M, są pojęciami dotyczącymi zasobów i wskazują ilości istniejące w pewnym konkretnym punkcie w czasie. O wszystkich powyższych funkcjach, czy to przepływach, czy też zasobach, zakłada się, że mają ciągłe pochodne. Osiągnięcie równowagi w tym modelu wymaga jednoczesnego spełnienia warunków równowagi na rynku dóbr (wpływy = wypływy, czyli / + X = S + M) oraz na rynku pieniądza (popyt na pieniądz = podaż pieniądza, czyli Md = Ms). Na podstawie ogólnych funkcji wymienionych powyżej, stan równowagi może być opisany następującą parą warunków: (8 38)
Model dochodu narodowego Zilustrowana wcześniej procedura zostanie teraz zastosowana do modelu dochodu narodowe go sformułowanego w postaci ogólnych funkcji. Tym razem dla urozmaicenia będziemy abstrahować od wydatków rządowych i podatków, a za to włączymy do modelu wymianę z zagranicą oraz — oprócz rynku dóbr — rynek pieniądza. Konkretnie będziemy zakładać, że rynek dóbr jest charakteryzowany przez następujące cztery funkcje: 1. Wydatki inwestycyjne są malejącą funkcją stopy procentowej i: /= /(/) (/' < 0), gdzie / ' = d //d i jest pochodną funkcji inwestycji. 2. Oszczędności S stanowią rosnącą funkcję dochodu narodowego Y oraz stopy procentowej i, przy czym krańcowa skłonność do oszczędzania jest dodatnim ułamkiem: S = S(Y, i)
(0 < S y < 1;
Ponieważ symbole /, S, M i L można traktować jako symbole funkcji, więc w rezul tacie mamy tylko dwie zmienne endogeniczne — dochód Y i stopę procentową i — oraz dwie zmienne egzogeniczne — eksport X0 (oparty na decyzjach zagranicznych) i Ms0 (określone przez władze monetarne). Zatem (8.38) może być wyrażone w postaci (8.20) dla n = m = 2: F l (Y, «; X o,M s0) = 1 (0 + X o - S ( Y , i ) - M ( Y ) = 0, F 2(Y, i; X0, Ml0) = ¿ ( K O - M,o = 0. Układ ten spełnia założenia twierdzenia o funkcji niejawnej, gdyż: (1) F 1 i F 2mają ciągłe pochodne (ponieważ wszystkie funkcje składowe tam występujące mają z założenia ciągłe pochodne) oraz (2) jakobian dla zmiennych eńdogenicznych jest różny od zera, zarówno jeśli obliczamy jego wartość dla początkowego położenia równowagi (o którym zakładamy, że istnieje), jak i poza nim:
Si > 0),
(0 < M ' < 1).
4. Poziom eksportu X jest określony egzogenicznie: X = X0. Na rynku pieniądza mamy jeszcze następujące dwie funkcje: 5. Popyt na pieniądz Md jest rosnącą funkcją dochodu narodowego (popyt transakcyjny), ale malejącą funkcją stopy procentowej (popyt spekulacyjny):
(8.39)
|J | =
d F '/d Y ÓF2ld Y
3 F l/3i óF 2/ói
li
gdzie S r = d S /d Y (krańcowa skłonność do oszczędzania) i Si = óS/di są pochodnymi cząstkowymi. 3. Wydatek na import M jest funkcją dochodu narodowego, a krańcowa skłonność do importowania jest również dodatnim ułamkiem: M = M (Y )
I ( » + X° = S (Y ,t) + M (Y), L(Y, i) = Ms0.
-S y -M ’ r - S i Ly L¡
= - L ,( S j + M ') - L y( l' - Si) > 0. Można zatem zapisać funkcje uwikłane; (8.40)
f = Y ( X 0,M ,o)
i
7=/(Xo, M,a),
chociaż nie jestęśmy w stanie ich w sposób jawny rozwiązać względem Y i i. Możemy ponadto przyjąć, że (8.38') jest parą tożsamości w pewnym otoczeniu położenia równowagi, więc możemy również zapisać: .....
I ( i ) + X o ~ S (Y , J ) - M ( Y ) * 0 , L ( Y , J ) - M s0mO,
Z tożsamości równowagi (8.41) można otrzymać w Sumie cztery pochodne statyki
230 ANALIZA STATYKI PORÓWNAWCZEJ
a n a l iz a s t a t y k i p o r ó w n a w c z e j d l a m o d e l u z o g ó l n y m i f u n k c ja m i
porównawczej: dwie odnoszące się do Xo i dwie odnoszące się do Ms0. Ale wyprowadzimy tutaj tylko dwie pierwsze, pozostawiając Czytelnikowi wyprowadzenie dwu pozostałych jako ćwiczenie. Po obliczeniu różniczki zupełnej każdej tożsamości w (8.41) przyrównujemy dM,0 do zera, tak aby dXo było jedynym czynnikiem naruszającym równowagę. Następnie dzieląc przez dX0 i interpretując każdy iloraz dwu różniczek jako pochodną cząstkową (cząstkową, ponieważ druga zmienna egzogeniczna Ms0 jest ustalona), otrzymujemy równanie macie rzowe: '- S y - M '
r - s ■ \dY ldX o) •4
(8.42)
i
«
07/axo).
egzogenicznej X0. Czyniąc tak, musimy oczywiście pamiętać o rozwiązaniach uwikłanych (8.40). Różne sposoby, jakimi X0 mogą wpływać na różne elementy składowe-modelu — dane w (8.41) i (8.40) — są podsumowane w postaci mapy wpływów na rys. 8.8?' Różniczkując funkcję oszczędności lub funkcję płynności względem X 0, musimy uwzglę dnić dwa pośrednie wpływy — jeden za pośrednictwem i i drugi za pośrednictwem Y. Korzystając z mapy wpływów, możemy obliczyć pochodne zupełne tożsamości równowagi względem X0 i otrzymać następującą parę równań:
-1 0_
I ) - 1* © ' 0-
Na mocy reguły Cramera i stosując (8.39), otrzymujemy rozwiązanie:
3?
-i o
r-s¡ u
z h > o, Ul
Wo (8.43)
Sy-M' dl
dx0
Ly
-1 0
231
- > 0,
Ul
gdzie wartości wszystkich pochodnych po prawej stronie znaku równości (w tym tych występujących w jakobianie) muszą być obliczone w punkcie początkowej równowagi, tzn. dla Y = Y i i ~ i. Gdyby znane były konkretne wartości tych pochodnych, z rozwiąza nia (8.43) wynikałyby wnioski ilościowe dotyczące wpływu zmian eksportu. Jednak przy braku wiedzy o tych wartościach musimy zadowolić się wnioskiem jakościowym, że Y i i wzrosną wraz ze wzrostem eksportu w obecnym modelu. Podobnie jak w modelu rynkowym, można — zamiast różniczek zupełnych — obliczać pochodne zupełne tożsamości równowagi (8.41) względem konkretnej badanej zmiennej
Ponieważ druga zmienna egzogeniczna Ms0 jest ustalona, więc lewa strona każdego z tych równań reprezentuje cząstkową pochodną zupełną wyrażenia po lewej stronie w odpowiedniej tożsamości równowagi. Jednakże pochodne statyki porównawczej (dY/dX0) i (di/dXo), będące pochodnymi funkcji niejawnych (8.40), są po prostu zwyczajnymi pochodnymi cząstkowymi. Po odpowiednim skondensowaniu dwa równania redukują się dokładnie do (8.42). Zatem metoda różniczki zupełnej i metoda pochodnej zupełnej dają identyczne rezultaty. Zauważmy, że (9?/9X0) stanowi mnożnik eksportu. Ponieważ indukowany przez eksport wzrost dochodu równowagi na mocy funkcji importu M = M (Y) spowoduje również wzrost importu, więc możemy ponownie zastosować regułę dla pochodnej funkcji złożonej w celu znalezienia (pomocniczej) pochodnej statyki porównawczej:
“ W
dX„)
i 3F'1 ~M% |J |
’
Znak tej pochodnej jest dodatni, ponieważ M ' > 0. Za pomocą analogicznej procedury możemy również znaleźć inne pomocnicze pochodne statyki porównawczej, takie jak (37/3Xo) i (dS/dXo).
Podsumowanie procedury W analizie modelu rynku oraz dochodu narodowego zawierających ogólne funkcje nie jest możliwe otrzymanie jawnych wartości rozwiązań dla zmiennych endogenicznych. Zamiast tego opieramy się na twierdzeniu o funkcji niejawnej, które umożliwia nam napisanie uwikłanych rozwiązań: P = P (Y 0)
Rysunek 8.8
i
7=7(X0, Ms0).
Nasze dalsze poszukiwania pochodnych statyki porównawczej, takich jak (dP/dio) i (di/dX0) mają sens, ponieważ — znów dzięki twierdzeniu o funkcji niejawnej — funk cje P i i rzeczywiście mają ciągłe pochodne. Aby ułatwić zastosowanie tego twierdzenia, warunek lub warunki równowagi dla modelu zapiszemy w postaci (8.16) lub (8.20). Sprawdzamy następnie, czy: (1) funkcja lub funk cje F mają ciągłe pochodne i (2) czy wartość Fy lub jakobianu dla zmiennych endoge-
2 3 2 ANALIZA STATYKI PORÓWNAWCZEJ
nicznych (zależnie od przypadku) jest różna od zera w początkowym położeniu równowagi modelu. Jednakże gdy tylko poszczególne funkcje w modelu mają ciągłe pochodne (założenie, które jest często przyjmowane jako normalne dla modeli z ogólnymi funkcjami), wówczas pierwszy z powyższych warunków jest automatycznie spełniony. W praktyce zatem trzeba jedynie sprawdzić wartość Fy lub jakobianu dla zmiennych endogenicznych. Jeśli jest ona różna od zera w położeniu równowagi, możemy od razu przejść do szukania pochodnych statyki porównawczej. W osiągnięciu tego celu pomaga reguła dla funkcji niejawnej. W przypadku pojedyn czego równania zmiennym endogenicznym po prostu nadajemy wartość równą ich wartości równowagi (np. przyjmując P = P) w warunku równowagi, a następnie stosujemy regułę sformułowaną w (8.19) do otrzymanej tożsamości równowagi. W przypadku układu równań również musimy nadać wszystkim zmiennym endogenicznym ich wartości równowagi w warunkach równowagi. Następnie do otrzymanych tożsamości równowagi możemy zastosować regułę dla fimkcji niejawnej pokazaną w (8.24) albo postępować zgodnie z opisaną poniżej procedurą: 1. Obliczyć kolejno różniczki zupełne każdej tożsamości równowagi. 2. Wybrać jedną i tylko jedną zmienną egzogeniczną (powiedzmy X0) jako jedyny czynnik naruszający równowagę i przyrównać różniczki wszystkich pozostałych zmiennych egzogenicznych do zera. Następnie podzielić wszystkie pozostałe składniki w każdej tożsamości przez dX0 i zinterpretować każdy iloraz dwu różniczek jako pochodną statyki porównawczej — pochodną cząstkową, jeśli model zawiera dwie lub więcej zmiennych egzogenicznych10. 3. Rozwiązać otrzymany układ równań względem pochodnych statyki porównawczej w nim występujących i zinterpretować ich ekonomiczne implikacje. Jeśli stosujemy wzór Cramera, możemy skorzystać z faktu, że wcześniej, przy sprawdzaniu warunku | J | & 0, obliczyliśmy już wyznacznik macierzy współczynników rozwiązywanego teraz układu równań. 4. W celu przeanalizowania innego czynnika naruszającego równowagę (innej zmiennej egzogenicznej), jeśli istnieje taki, powtarzamy kroki 2 i 3. Mimo iż w nowym układzie równań otrzymamy inną grupę pochodnych statyki porównawczej, macierz współczynników będzie taka sama jak poprzednio, a zatem znów można skorzystać ze znanej wartości | J |. Gdy dany jest model z m zmiennymi egzogenicznymi, będziemy musieli m razy powtarzać opisaną powyżej procedurę, aby objąć wszystkie występujące w nim pochodne statyki porównawczej.
Ćwiczenie 8,6
ANALIZA STATYKI PORÓWNAWCZEJ DLA MODELU Z OGÓLNYMI FUNKCJAMI 233
a. Zinterpretować ekonomiczny sens pochodnych S', T ' i /'. b. Sprawdzić, czy są spełnione warunki twierdzenia o funkcji niejawnej. Jeśli tak, napisać tożsamość równowagi. " c. Znaleźć (d?/dG 0) i omówić jej implikacje ekonomiczne. 2. Niech funkcje popytu i podaży pewnego dobra będą następujące: Q i-D { P , Y0) a = S ( P ,T 0)
(DP < 0; (Sf > 0;
D Yo>0), Sp0 < 0),
gdzie Y0 oznacza dochód, a Tojest podatkiem nałożonym na dobro. Wszystkie pochodne są ciągłe. a. Zapisać jednym równaniem warunek równowagi. b. Sprawdzić, czy można stosować twierdzenie o funkcji niejawnej. Jeśli tak, zapisać tożsamość równowagi. c. Znaleźć (dP/dY0) i (9P/9T0) oraz omówić ich implikacjeekonomiczne. d. Stosując procedurę podobną do (8.32), znaleźć (dQ/dY0) na podstawie funkcji podaży i (dQ/dT0) na podstawie funkcji popytu. Dlaczego nie można zastosować funkcji popytu dla tej pierwszej, a funkcji podaży dla drugiej pochodnej? 3. Rozwiązać poprzednie zadanie za pomocą podejścia dotyczącego układu równań. 4. Niech funkcje podaży i popytu na dobro będą następujące: (d D
Qd~D(P,to)
d D }
[ 9 ^ < 0 ; a ^ >0J
1
&=Q*>
gdzie t0 reprezentuje upodobania konsumentów dla tego dobra i gdzie obie pochodne cząstkowe są ciągłe. a. Zapisać warunek równowagi jako pojedyncze równanie. b. Czy można stosować twierdzenie o funkcji niejawnej? c. Jak będzie się zmieniać cena równowagi wraz ze zmianą upodobań konsumentów? 5. Dla modelu dochodu narodowego w (8.38) znaleźć (9?/9M s0) i (97/9Ml0) oraz zinter pretować ich znaczenie ekonomiczne. Stosować zarówno metodę różniczki zupełnej, jak i metodę pochodnej zupełnej i sprawdzić, czy końcowe wyniki są takie same. 6. Rozważmy następujący model dochodu narodowego (z pominięciem podatków): Y - C ( Y ) - I ( i ) - G o= 0 kY + L(i) - M sq= 0
(0 < C '< 1; / '< 0 ) , (k — stała dodatnia; V < 0).
a. Czy pierwsze równanie jest równaniem równowagi? b. Jaka jest całkowita wielkość popytu na pieniądz w tym modelu? c. Przeanalizować statykę porównawczą dla tego modelu, gdy zmienia się podaż pieniądza (polityka monetarna) i gdy zmieniają się wydatki rządowe (polityka fiskalna).
1, Niech będzie dany warunek równowagi dla dochodu narodowego: S(Y) + T(Y) = I(Y ) + Go ( S ',r ,I '> 0 ; S ’ + T '> I'), gdzie S, Y, T, J i G0 oznaczają odpowiednio oszczędności, dochód narodowy, podatki, inwestycje i wydatki rządowe. Wszystkie pochodne są ciągłe. 10 Zamiast wykonywania działań 1 i 2, możemy równoważnie uciec się do metody pochodnej zupełnej przez różniozkowąnie zupełne (obu stron) każdej tożsamości równowagi względem wybranej zmiennej egzogenicznej. Mapą wpływów okaże się w tym pomocna, - .
8.7. OGRANICZENIA STATYKI PORÓWNAWCZEJ Statyka porównawcza jest pożyteczną dziedziną badań, gdyż w ekonomii często jesteśmy zainteresowani zbadaniem, jak naruszająca równowagę zmiana parametru wpłynie na stan
234 ANALIZA STATYKI PORÓWNAWCZEJ
równowagi modelu. Ważne jest jednak uświadomienie sobie, że statyka porównawcza z natury rzeczy ignoruje proces przejścia od starego położenia równowagi do nowego i pomija również związany z tym procesem czas dostosowania. W konsekwencji nie uwzględnia tego, że z powodu wewnętrznej niestabilności modelu nowe położenie równowagi może nigdy nie zostać osiągnięte. Badanie procesu dostosowania per se należy do dynamiki ekonomicznej. W dotyczących jej rozważaniach. będziemy zwracać szczególną uwagę na sposób zmiany zmiennej w czasie i rozważymy problem stabilności położenia równowagi. Ważną kwestię dynamiki omówimy w piątej części książki. Tymczasem w następnej części podejmiemy temat badania problemu optymalizacji. Jest to szczególna, niezmiernie ważna odmiana analizy równowagi. Towarzyszą jej własne implikacje (i komplikacje) statyki porównawczej.
CZWARTA PROBLEMY OPTYMALIZACJI
9. OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI
Gdy w rozdz. 3 po raz pierwszy wprowadziliśmy termin „równowaga” , dokonaliśmy wyraźnego rozróżnienia między równowagą celową i nie stanowiącą celu. Rozważane przez nas modele rynku i dochodu narodowego były przykładami tego drugiego typu równowagi. Pojawia się on w wyniku wzajemnego oddziaływania w modelu pewnych przeciwstawnych sił, np. popytu i podaży w modelach rynku oraz wpływów i wydatków w modelach dochodów. Stan równowagi jest rezultatem zrównoważenia przeciwstawnych sił i nie występują w nim tendencje do zmian. Powtórzmy, osiągnięcie takiego typu równowagi jest wynikiem gry tych sil, a nie świadomego wysiłku z czyjejkolwiek strony zmierzającego do osiągnięcia wyznaczonego celu. To prawda, że konsumujące gospodarstwa domowe stojące za siłami popytu i firmy stojące za siłami podaży dążą do optymalnej pozycji w danych okolicznościach, ale jeśli chodzi o sam rynek, nikt nie ma ha celu uzyskania pewnej szczególnej ceny równowagi i ilości równowagi (dopóki oczywiście rząd nie próbuje ustalić cen). Podobnie jest przy określaniu dochodu narodowego: to „nieosobowe” zrównoważenie wpływów i wydatków powoduje właśnie stan równowagi, a świadomy wysiłek zmierzający do osiągnięcia jakiegokolwiek celu (np. próba zmiany niepożądanego poziomu dochodu poprzez politykę monetarną lub fiskalną) może wcale nie występować. W tej części książki zajmiemy się jednak badaniem równowagi celowej. Nazwiemy tak stan równowagi, optymalny dla danej jednostki ekonomicznej (gospodarstwa domowego, firmy lub nawet całej gospodarki), do którego wspomniana jednostka będzie dążyła celowo. Odwołujemy więc nasze wcześniejsze ostrzeżenie, że równowaga nie implikuje celowości. Skupimy się tu głównie na klasycznych technikach wykrywania położeń optymalnych przy użyciu rachunku różniczkowego. Nowocześniejsze osiągnięcia, znane jako programowa nie matematyczne, zostaną omówione później.
9.1. WARTOŚCI OPTYMALNE I EKSTREMALNE Ekonomia, ogólnie rzecz biorąc, jest nauką o dokonywaniu wyborów. Gdy ma być zrealizowany jakiś projekt ekonomiczny, np. wytworzenie określonej ilości produktu, zwykle
238 PROBLEMY OPTYMALIZACJI
istnieje pewna liczba sposobów jego wykonania. Jeden (lub więcej) z tych sposobów będzie jednak bardziej niż inne pożądany ze względu na pewne kryterium i istota problemu optymalizacji polega na tym, aby na podstawie tego konkretnego kryterium wybrać najlepszy z możliwych. Najpowszechniejszym kryterium celu w ekonomii jest maksymalizowanie czegoś (np. zysku firmy, użyteczności konsumenta, stopy wzrostu firmy lub gospodarki kraju) albo minimalizowanie czegoś (np. kosztu wytwarzania danej produkcji). W ekonomii problemy maksymalizacji i minimalizacji możemy umieścić pod ogólnym hasłem: optymalizacja, co oznacza „poszukiwanie najlepszego” . Jednak z czysto matematycznego punktu widzenia terminy „maksimum” i „minimum” nie mają znaczenia optymalności. Wobec tego jako zbiorcza nazwa dla maksimum i minimum, będących pojęciami matematycznymi, właściwsze jest określenie ekstremum, oznaczające wartość ekstremalną. Przy formułowaniu zadania optymalizacji pierwszym krokiem jest wytyczenie funkcji celu, w której zmienna zależna reprezentuje obiekt maksymalizacji lub minimalizacji, a zbiór zmiennych niezależnych to obiekty, których wielkości może wybierać i dobierać rozważana jednostka ekonomiczna, mając na względzie optymalizację W związku z tym zmienne niezależne będziemy nazywać zmiennymi wyboru'. Istotą procesu optymalizacji jest po prostu znajdowanie zbioru wartości zmiennych decyzyjnych, który prowadzi do szukanego eks-. tremum funkcji celu. Na przykład firma może starać się zmaksymalizować zysk n, tzn. zmaksymalizować różnicę między całkowitym przychodem R i całkowitym kosztem C. Ponieważ w ramach danego stanu technologii i danego popytu rynkowego na produkty firmy obie zmienne R i C są funkcjami poziomu produkcji Q, więc n można wyrazić jako funkcję Q:
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 239
9.2. WZGLĘDNE MAKSIMUM I MINIMUM: TEST WYKORZYSTUJĄCY PIERWSZĄ POCHODNĄ Ponieważ funkcja celu y = f (x) jest sformułowana w sposób ogólny, nie ma tu ograniczeń co do tego, czy jest ona liniowa czy nieliniowa lub czy jest monotoniczna albo czy zawiera zarówno części rosnące, jak i malejące. Spośród wielu możliwych typów funkcji zgodnych z powyższą postacią funkcji celu wybraliśmy trzy konkretne przypadki przedstawione na rys. 9.1, Wykresy, chociaż proste, powinny ułatwić nam znajdowanie maksymalnej lub minimalnej wartości funkcji y = f(x ).
Ekstremum względne kontra ekstremum absolutne Jeśli funkcja celu jest funkcją stałą, jak na rys. 9.1 (a), to wszystkie wartości zmiennej wybo ru x będą dawały taką samą wartość y, a odcięta każdego punktu na wykresie funkcji (takiego jak A, B lub C) może być traktowana jako maksimum albo minimum, albo ani jedno, ani drugie. W efekcie wybór wartości x nie ma tu istotnego znaczenia dla maksymalizacji lub minimalizacji y.
x(Q ) = R (Q )-C (Q ). Równanie to stanowi funkcję celu: n jest obiektem maksymalizacji, a Q stanowi zmienną decyzyjną (jedyną). Zadanie optymalizacji polega wtedy na wyborze takiego poziomu <2, aby tc było maksymalne. Zauważmy, że optymalny poziom n jest — z definicji — jego poziomem maksymalnym, ale optymalny poziom zmiennej decyzyjnej Q nie musi być ani maksymalnym, ani minimalnym. Aby sformułować problem w bardziej ogólny sposób (chociaż wciąż ograniczając się do funkcji celu tylko jednej zmiennej), rozważmy ogólną funkcję: y = f( x ) i spróbujmy opracować procedurę znajdowania poziomu zmiennej x, który będzie mak symalizował lub minimalizował wartość y. Będziemy zakładać w tych rozważaniach, że funkcja / jest różniczkowalna w sposób ciągły. 1
1 Można je również nazywać zmiennymi decyzyjnymi lub zmiennymi polityki (policy variables).
Na rys. 9.1 (b) funkcja jest monofonicznie rosnąca i nie istnieje skończone maksimum, jeśli przyjmujemy jako jej dziedzinę zbiór ńieujemnych liczb rzeczywistych. Możemy jednak traktować końcowy punkt D po lewej stronie (punkt przecięcia z osią y) jako reprezentujący minimum; jest to w tym przypadku minimum absolutne (lub globalne) w zbiorze wartości funkcji. Punkty E i F na rys. 9.1 (c) są natomiast przykładami względnego (lub lokalnego) ekstremum w tym sensie, że każdy z tych punktów reprezentuje ekstremum jedynie w bezpośrednim jego otoczeniu. Fakt, że punkt F je s t względnym minimum, oczywiście nie stanowi gwarancji, że jest on również globalnym minimum funkcji, chociaż może tak być. Podobnie punkt względnego maksimum, taki jak E, może być lub może nie być maksimum globalnym. Zauważmy również, że funkcja może mieć wiele względnych ekstremów, z których niektóre stanowią maksima, a inne minima. W większości problemów ekonomicznych, jakimi będziemy się zajmować, naszym głównym, jeśli nie jedynym, obiektem zainteresowania będą wartości ekstremalne różne od
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 241
2 4 0 PROBLEMY OPTYMALIZACJI
wartości w punktach końcowych. Dla większości takich zagadnień dziedzina funkcji celu jest ograniczona do zbioru liczb nieujemnych, a zatem punkt końcowy (po lewej stronie) będzie reprezentował zerową wartość zmiennej decyzyjnej, która często nie ma znaczenia praktycz nego. W rzeczywistości najczęściej spotykany w analizie ekonomicznej jest typ funkcji pokazanej na rys. 9.1(c) lub pewien jej wariant, którego wykres ma tylko jedno wygięcie. Będziemy w związku z tym kontynuować hasze rozważania głównie w odniesieniu do poszukiwania względnych ekstremów takich, jak punkty E i F. To jednak w żaden sposób nie wyklucza znajomości absolutnego maksimum, jeśli jest nam potrzebne, ponieważ musi być ono albo maksimum względnym, albo jednym z końcowych punktów funkcji. Jeśli zatem mamy wszystkie maksima względne, trzeba tylko wybrać największe z nich i porównać je z punktami końcowymi w celu określenia maksimum bezwzględnego. Bezwzględne minimum funkcji może być znalezione w analogiczny sposób. Kolejno rozważane wartości ekstremalne będą to ekstrema względne lub lokalne, jeśli nie stwierdzono przeciwnie.
Test wykorzystujący pierwszą pochodną Od tej pory o pochodnej funkcji będziemy mówić jako o pierwszej pochodnej (skrót od pochodnej pierwszego rzędu). Przyczyna tego stanie się wkrótce jasna. Dla danej funkcji y = /(* ) pierwsza pochodna /'( * ) odgrywa główną rolę w naszych poszukiwaniach wartości ekstremalnych. Jest to spowodowane faktem, że jeśli w punkcie * = *o występuje względne ekstremum, to albo ( l ) / / * o ) = 0, albo (2) / / * o ) nie istnieje. Druga ewentualność jest przedstawiona na rys. 9.2(a), gdzie punkty A i B reprezentują względne wartości ekstremalne dla y, a mimo to w żadnym z nich pochodna nie jest zdefiniowana. Ponieważ jednak zakładamy, że y = /(* ) jest ciągła i ma ciągłą pochodną, więc w rezul tacie wykluczamy punkty załamań. Dla funkcji gładkich wartości ekstremów względnych mogą występować tylko tam, gdzie pierwsza pochodna ma wartość równą zeru. Ilustrują to punkty C i D na rys. 9.2(b), z których każdy reprezentuje wartości ekstremalne i oba charakteryzują się zerowym n achyleniem ://*,) = 0 i f ( x 2) = 0. Łatwo również zobaczyć, że
Rysunek 9.2
jeśli nachylenie jest różne od zera, to prawdopodobnie nie możemy mieć względnego minimum (dna doliny) lub względnego maksimum (szczytu wzgórza). Z tego powodu możemy, dla funkcji gładkich, przyjąć warunek / / * ) = 0 jako konieczny warunek względnego ekstremum (maksimum lub minimum). Musimy jednak dodać, że zerowe nachylenie, chociaż jest konieczne, nie jest jednak wystarczające dla ustanowienia względnego ekstremum. Wkrótce przedstawimy przykład, gdy zerowe nachylenie nie będzie powiązane z ekstremum. Uzupełniając warunek zerowego nachylenia dodatkowym zastrzeżeniem, możemy jednak otrzymać test rozstrzygający dla bezwzględnego ekstremum. Może on być sformułowany w następujący sposób:
Test dla względnego ekstremum oparty na pierwszej pochodnej Jeśli pierwsza pochodna funkcji /(* ) dla x = *<>jest równa //* o ) = 0, to wartość funkcji w punkcie *o, czyli f( x 0), będzie: (a) względnym maksimum, jeśli pochodna//*) zmienia znak z dodatniego bezpośrednio po lewej stronie punktu *0 na ujemny bezpośrednio po prawej stronie tego punktu, (b) względnym minimum, je ś li//* ) zmienia znak z ujemnego bezpośrednio na lewo od *o na dodatni bezpośrednio na prawo od tego punktu, (c) ani maksimum względnym, ani minimum względnym, je ś li//* ) ma taki sam znak bezpośrednio na lewo i na prawo od punktu xr>.
Wartość xo, jeśli/./*b) = 0, będziemy nazywać wartością krytyczną x, a/(*o) będziemy nazywać wartością stacjonarną y (lub fu n k cji/). Punkt o współrzędnych *o i /( * o) może być — zgodnie z tym — nazywany punktem stacjonarnym. Uzasadnienie: słowo „stacjonar ny” powinno być samo przez się zrozumiałe — gdy tylko nachylenie jest równe zeru, rozważany punkt nie jest nigdy usytuowany na skosie nachylonym ku dołowi lub ku górze, lecz jest w martwym punkcie. Graficznie, pierwsza możliwość (a) wymieniona w tekście będzie określała punkt stacjonarny jako szczyt wzgórza, taki jak punkt D na rys. 9.2(b), a druga możliwość (b) będzie ustanawiała punkt stacjonarny jako dno doliny, taki jak punkt C na tym samym diagramie. W obliczu trzeciej możliwości (c), którą jeszcze mamy omówić, nie możemy rozpatrywać w aru n k u //* ) = 0 jako dostatecznego warunku względnego ekstremum. Ale widzimy teraz, że jeżeli spełniony jest warunek konieczny /'( * ) = 0, to zastrzeżenie dotyczące zmiany znaku pochodnej może służyć jako warunek dostateczny względnego maksimum lub minimum, zależnie od kierunku zmiany znaku. Wyjaśnijmy teraz trzecią możliwość. Na rys. 9.3(a) pokazano funkcję / osiągającą zerowe nachylenie w punkcie J (gdy * = j). Mimo że / '( / ) jest równe zeru — co czym / 0 ) wartością stacjonarną — pochodna nie zmienia znaku przy przejściu z jednej stony * = j na drugą. Zatem, zgodnie z powyższym testem, punkt J nie daje ani maksimum, ani minimum, co jest w należyty sposób potwierdzone przez wykres funkcji. Punkt ten stanowi przykład tego, co nazywamy punktem przegięcia. Charakterystyczną cechą punktu przegięcia jest to, że w tym punkcie pochodna funkcji (w przeciwieństwie do funkcji pierwotnej) osiąga wartość ekstremalną. Ponieważ ta wartość ekstremalna może być albo maksimum, albo minimum, mamy dwa typy punktów przegięcia. Na rys. 9.3(a'), gdzie narysowano wykres po ch o d n ej//* ), widzimy, żejej wartość jest równa 16 — Podstawy...
2 4 2 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 243
Najpierw znajdujemy pochodną funkcji:
,
/'( * ) = 3*2- 2 4 * + 36. Aby otrzymać wartości krytyczne, tzn. wartości * spełniające w arunek/'( * ) = 0, przyrównujemy kwadratową funkcję pochodną do zera i otrzymujemy równanie kwadratowe: 'ix2 - 24* + 36 = 0. Rozkładając wielomian na czynniki lub stosując wzory dla trójmianu kwadratowego, otrzymujemy następującą parę pierwiastków (rozwiązań):
Rysunek 9.3
zeru dla x —j (zob. punkt J ale jest dodatnia po obu stronach punktu J '\ to czyni J ' punk tem stanowiącym minimum funkcji pochodnej /'(* ).
*i = 2
(dla którego mamy / '( 2 ) = 0
i
./(2 ) = 40),
*2 = 6
(dla którego m a m y /'(6) = 0
i
/ ( 6) = 8).
P o n iew aż /'(2 ) = / '( 6) = 0, więc obie wartości * są szukanymi wartościami kry tycznymi. Łatwo sprawdzić, ż e /'(* ) > 0 dla * < 2 i/'( * ) < 0 dla * > 2 w bezpośrednim sąsiedztwie * = 2; zatem stwierdzamy, że odpowiednia wartość funkcji /( 2 ) = 40 jest względnym maksimum. Podobnie, ponieważ /'( * ) < 0 dla * < 6 i /'( * ) > 0 dla * > 6 w bezpośrednim otoczeniu * = 6, więc wartość fu n k cji/(6) = 8 musi być względnym minimum. Wykres funkcji z tego przykładu przedstawiono na rys. 9.4. Za pomocą takiego wykresu można sprawdzić położenie wartości ekstremalnych znalezionych dzięki zastosowa niu testu wykorzystującego pierwszą pochodną. Ale w większości przypadków „pomoc” ta płynie w przeciwnym kierunku — matematycznie wyprowadzone wartości ekstremalne pomagają w sporządzaniu wykresu. Idealnie byłoby, gdyby sporządzenie wykresu poprzedzała znajomość wartości funkcji w każdym punkcie jej dziedziny. W praktyce oblicza się wartość funkcji w kilku wybranych punktach, a resztę wykresu uzupełnia się przez interpolację. Jeśli zdamy się na przypadkowy wybór, grozi nam, że nie natrafimy na punkt lub punkty stacjonarne i w rezultacie wykres nie
Drugi typ punktu przegięcia jest przedstawiony na rys. 9.3(b), gdzie nachylenie funk cji g(x) rośnie aż do momentu osiągnięcia punktu k, a następnie maleje. W konsekwencji wykres pochodnej funkcji g'(x) będzie przyjmował kształt pokazany na diagramie 9.3(b'), gdzie punkt K ' wyznacza maksymalną wartość2 g'(x). Reasumując: względne ekstremum musi być wartością stacjonarną, ale wartość stacjonar na może być powiązana albo z ekstremum względnym, albo z punktem przegięcia. Aby znaleźć maksima lub minima względne dla danej funkcji, trzeba zatem najpierw znaleźć stacjonarne wartości funkcji, w których/'!*) = 0, a następnie zastosować test wykorzystujący pierwszą pochodną w celu sprawdzenia, czy każda z wartości stacjonarnych jest relatywnym maksimum, relatywnym minimum, czy też nie jest żadnym z nich. Przykład 1. Znaleźć względne ekstrema funkcji:
,
* = /( * ) = * 3- 12*2 + 3 6*+ 8.
2 Zauważmy, że zerowa wartość pochodnej, jakkolwiek jest warunkiem koniecznym dla ekstremum względnego, nie jest wymagana dla punktu przegięcia; pochodna g'(x) ma bowiem dodatnią wartość w * = k, a jednak punkt k jest punktem przegięcia.
Rysunek 9.4
244 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 245
będzie zgodny z dokładnym położeniem punktów, w których funkcja zmienia kierunek. Teraz, gdy dysponujemy testem wykorzystującym pierwszą pochodną, możemy precyzyjnie określić te punkty. »1 Przykład 2. Znaleźć względne ekstremum funkcji przeciętnego kosztu: AC = / (Q) = g 2 - 5(2 + 8.
'
Pochodna jest tutaj ró w n a /'(g ) = 2Q - 5 i jest funkcją liniową. P rz y ró w n u ją c/\g ) do zera, otrzymujemy liniowe równanie 2g - 5 = 0, które ma tylko jeden pierwiastek g -- 2,5. Jest to jedyna wartość krytyczna w tym przypadku. Aby zastosować test wykorzystujący pierwszą pochodną, znajdźmy odpowiednie wartości pochodnej, np. dla ¡2 = 2,4 i g = 2,6. P o n iew aż/'(2,4) = - 0 ,2 < 0 i /'(2 ,6 ) = 0 ,2 > 0, więc możemy wywnioskować, że wartość stacjonarna AC = /( 2 ,5) = 1,75 reprezentuje względne minimum. Wykres funkcji z tego przykładu jest w istocie krzywą w kształcie litery U, więc znalezione właśnie względne minimum będzie również minimum absolutnym. Nasza znajomość dokładnego położenia tego punktu będzie wielką pomocą przy sporządzaniu wykresu krzywej AC.
Ćwiczenie 9.2 1. Znaleźć wartości stacjonarne następujących funkcji (sprawdzić, czy są to maksima względne, czy minima, czy też punkty przegięcia), zakładając, że dziedziną jest zbiór wszystkich liczb rzeczywistych: (a) y = -2 x 2 + 4x + 9; (c) y = x2 + 3; (d) y - 3x - 6x + 2. (b) y = 5x + x ; 2. Znaleźć stacjonarne wartości następujących funkcji (sprawdzić, czy są to względne minima, czy maksima, czy punkty przegięcia), zakładając, że dziedziną jest przedział
(0, °°): (a) y = x 3 - 3x + 5;
9.3. POCHODNE DRUGIEGO I WYŻSZYCH RZĘDÓW Do tej pory rozważaliśmy jedynie pierwszą pochodną f'( x ) funkcji y = f(x ). Teraz wpro wadźmy pojęcie drugiej pochodnej (skrót dla pochodnej drugiego rzędu) i pochodnych jeszcze wyższych rzędów. Umożliwi nam to ustalenie różnych kryteriów lokalizowania względnych ekstremów funkcji.
Pochodna pochodnej Ponieważ pierwsza pochodna f '(x) sama jest funkcją x, więc powinna być również różniczkowalna względem x, jeśli jest ciągła i gładka. Wynik tego różniczkowania, znanyjako druga pochodna funkcji f jest oznaczany symbolami: f" (x ), gdzie podwójny prim wskazuje, że f( x ) została zróżniczkowana względem x dwukrotnie i gdzie wyrażenie (x) występujące po podwójnym primie wskazuje, że druga pochodna jest znów pewną funkcją x, d2y . d / dv \ , —-T-, co wynika z faktu, że druga pochodna oznacza w istocie — — ; stąd d w liczdx dx \ d x j niku i dx2 w mianowniku tego symbolu. Jeśli druga pochodna f" (x ) istnieje dla wszystkich wartości x należących do dziedziny, to mówimy, że funkcja f(x ) jest dwukrotnie różniczkowalna; jeśli w dodatku/"(x) jest ciągła, to mówimy, że funkcja f(x ) jest dwukrotnie różniczkowalna w sposób ciągły3. Druga pochodna, jako funkcja x, może być znów zróżniczkowana względem x, co daje trzecią pochodną, która może być źródłem czwartej pochodnej i tak dalej ad infinitum dopóty, dopóki spełniany jest warunek różniczkowalności. Pochodne wyższych rzędów są oznaczone według tego samego schematu, jak druga pochodna: f " '( x ) , f w ( x ) , . . . , f n\x )
[z indeksami górnymi zapisanymi w ( )]
lub: d3y
d4y
dx3 ’ dx4’
d”y ’ d x”
(b) y = y x 3- x 2 + x + 10; (c) y = - x 3 + 4,5x2 - 6 x + 6. 3. Wykazać, że funkcja y = x + l l x (gdzie x * 0 ) ma dwa względne ekstrema: jedno jest maksimum, a drugie minimum. Czy „minimum” jest większe, czy mniejsze od „mak simum” ? Dlaczego możliwy jest taki paradoksalny wynik? 4. Niech T = ę(x) będzie funkcją całkowitą (np. całkowitą produkcją lub całkowitym kosztem): a Napisać wzory dla funkcji krańcowej M i funkcji przeciętnej A. b. Pokazać, że gdy A osiąga ekstremum względne, M i A muszą mieć tę samą wartość. c. Jaka z tego wynika ogólna zasada dla wykreślania krzywej krańcowej i krzywej przeciętnej na tym samym diagramie? d. Co można powiedzieć o elastyczności funkcji całkowitej T w punkcie, gdzie A osiąga wartość ekstremalną?
d" d” Te ostatnie mogą być również zapisane jako — -y, gdzie część — - służy jako sym bol operatora, który każe nam obliczyć n-tą pochodną (pewnej funkcji) względem x. Niemal wszystkie konkretne funkcje, z jakimi będziemy pracować, mają ciągłe pochodne do dowolnego rzędu, jaki jest nam potrzebny, tzn. są różniczkowalne w sposób ciągły dowolną liczbę razy. Kiedykolwiek używamy funkcji ogólnej, takiej jak f(x ), zawsze zakładamy, że ma ona pochodne do tego rzędu, jaki jest niezbędny.
3 Następujące oznaczenia są często stosowane do opisu ciągłości i różniczkowalności funkcji: f e C(m lub f e C: f jest funkcją ciągłą, f e C(1) lub / e C1: / jest różniczkowalna w sposób ciągły, f e C<2): / jest dwukrotnie różniczkowalna w sposób ciągły. Symbol Cw oznacza zbiór wszystkich funkcji mających pochodne n-tego rzędu, ciągłe w dziedzinie funkcji.
246 PROBLEMY OPTYMALIZACJI
Przykład 1. Znaleźć pochodne od pierwszej do piątej dla funkcji: y = /(*) = 4x4 - a :3 + l l x 2 + 3x - 1. Szukane pochodne są^następujące: f'( x ) = 16x3 - 3x2 + 34x + 3,. f" ( x ) = 48x2 - 6 x + 34, f w (x) = 96,
Funkcja pochodna f'( x ) mierzy tempo zmian funkcji/. Na tej samej zasadzie funkcja drugiej pochodnej f " jest miarą tempa zmian pierwszej pochodnej/ ' ; innymi słowy, druga pochodna mierzy tempo zmian tempa zmian oryginalnej funkcji/. Inaczej, dla danego nieskończenie małego przyrostu zmiennejniezależnej x od punktu x = x^\
oraz:
/ <5)(x) = 0. W tym szczególnym przypadku (funkcji wielomianowej) każda następna pochodna jest wyrażeniem prostszym niż poprzednia, aż do momentu, gdy dochodzimy do piątej pochodnej, która jest tożsamościowo równa zeru. Nie jest to jednak ogólnie prawdziwe dla wszystkich typów funkcji, co pokażemy w następnym przykładzie. Należy tu z całą mocą podkreślić, że stwierdzenie „piąta pochodna jest zerowa’ ’ nie jest tym samym, co stwierdzenie „piąta pochodna nie istnieje” , które opisuje zupełnie inną sytuację. Zauważmy również, że /® (x) = 0 (zero dla wszystkich wartości x) nie jest tym samym, co f iS)(xo) = 0 (zero jedynie w punkcie xo). Przykład 2. Znaleźć pierwsze cztery pochodne funkcji wymiernej:
1+x
Interpretacja drugiej pochodnej
f ' ( x 0) > oj .. i rośnie, >oznacza, zewartość funkcji \ f ' ( x 0)< Oj (maleje
/'" ( * ) = 9 6 x - 6 ,
y = « (* )= T T -
OPTYMALIZACJA; SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 247
(* * -!)■
Pochodne te można obliczyć za pomocą wzoru na pochodną ilorazu albo — po zapisaniu funkcji jako y = x (l + x)_I — za pomocą wzoru na pochodną iloczynu: g\x ) = d + * r 2 g"(x) = - 2 ( i + * r 3 £ "'(*)= 6(1 g(4)(x) = -24(1 + x)~5
( * * -1 )
W tym przypadku jest oczywiste, że obliczanie kolejnych pochodnych nie wydaje się prowadzić do uproszczenia wyrażeń pochodnych. Zauważmy, że tak samo jak funkcja pierwotna g(x), wszystkie kolejno otrzymywane pochodne same są funkcjami x. Dla danej konkretnej wartości x funkcje te będą przyjmowały konkretne wartości. Na przykład dla x = 2 wartość drugiej pochodnej w przykładzie 2 móże być obliczona jako: g"(2) = -2(3)-3 = ~ i podobne obliczenia możemy przeprowadzić dla innych wartości x. Jest niezmiernie ważne zdawanie sobie sprawy z tego, że aby znaleźć wartość drugiej pochodnej g '\x ) dla x = 2, jak to zrobiliśmy, musimy najpierw otrzymać g"(x), a potem dopiero podstawić x = 2 do równania dla g"{x). Jest błędem podstawienie x = 2 do g(x) lub g'(x), zanim przeprowadzimy proces różniczkowania prowadzący do g"(x).
f " ( x 0) > oj a . (rośnie, > oznacza, że nachylenie krzywej i f 0k>) < OJ (maleje. Zatem dodatnia pierwsza pochodna połączona z dodatnią drugą pochodną w x = Xo oznacza, że nachylenie krzywej w tym punkcie jest dodatnie i rosnące — wartość funkcji rośnie w coraz większym stopniu. Podobnie dodatnia pierwsza pochodna z ujemną drugą pochodną wskazuje, że nachylenie krzywej jest dodatnie, lecz malejące — wartość funkcji rośnie w coraz wolniejszym tempie. Przypadek ujemnej pierwszej pochodnej może być interpretowany analogicznie, ale konieczne jest tu ostrzeżenie: gdy f \ x o) < 0 i f " ( x 0) > 0, wówczas nachylenie krzywej jest ujemne i rosnące, ale to nie oznacza, że nachylenie zmienia się, np. z -1 0 na -11; przeciwnie, zmiana powinna nastąpić z —11 na —10, czyli na większą liczbę. Innymi słowy, nachylenie ujemne musi stawać się mniej strome wraz ze wzrostem x. W końcu, g d y /'(x 0) < 0 i/"Oki) < 0, wówczas nachylenie krzywej musi być ujemne i malejące. Odnosi się to do nachylenia ujemnego, które w miarę wzrostu x staje się coraz bardziej strome. Ponieważ mówiliśmy o nachyleniach, korzystne będzie kontynuowanie rozważań z ilustracją graficzną. Na rys. 9.5 zaznaczyliśmy sześć punktów (A, B, C, D, E i F) na dwu pokazanych parabolach; każdy z tych punktów ilustruje inne zestawienie znaków pierwszej i drugiej pochodnej: jeśli w punkcie x = x2 x = x2
znaki pochodne są następujące
ilustruje to punkt
f '( x i) > 0
/" (* i) < o
A
f '( x 2) = 0 f '( x 3) < 0
/ '( * 2 )< 0 /" fe )< 0
B C
X
= x4
g'(x4) < 0
*"(*)> o
D
X
= x5
g "fe ) > 0
E
X
=X6
* '( * ) = 0 g '(x6) > 0.
g"0k)> 0
F
Na tej podstawie widzimy, że ujemna druga pochodna (trzy pierwsze przypadki) znajduje niezmiennie odbicie w krzywej o kształcie odwróconej litery U lub jej części, ponieważ wymaga się, aby rozważana krzywa miała coraz mniejsze nachylenie dla rosnących x. W przeciwieństwie do tego, dodatnia druga pochodna (trzy ostatnie przypadki) konsekwentnie wskazuje na krzywą o kształcie litery U lub jej części, gdyż rozważana krzywa musi mieć coraz to większe nachylenie w miarę wzrostu x. Jeżeli patrzymy na dwie krzywe przedstawione na rys. 9.5 z punktu widzenia osi poziomej, to widzimy, że krzywa na diagramie (a) jest stale
248 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 249
wypukłą, ale której pochodne: f'( x ) = 4 ć
Rysunek 9.5
wklęsła, a na diagramie (b) jest stale wypukła. Ponieważ wklęsłość i wypukłość stanowią opis ..wygięcia” krzywej, możemy więc oczekiwać, że druga pochodna funkcji będzie nas informować o krzywiinie jej wykresu, podobnie jak pierwsza pochodna mówi nam o jej nachyleniu. Mimo iż słowa „wklęsła” i „wypukła” adekwatnie opisują różniące się krzywizny dwu funkcji na rys. 9.5, obecnie nazwiemy je bardziej dokładnie: odpowiednio ściśle wklęsłą i ściśle wypukłą. Zgodnie z tą terminologią funkcja, której wykres jest ściśle wklęsły (ściśle wypukły), jest nazywana funkcją ściśle wklęsłą (ściśle wypukłą). Dokładna geometryczna charakterystyka funkcji ściśle wklęsłej jest następująca: Jeśli wybierzemy dowolną parę punktów M i N na jej wykresie i połączymy je linią prostą, to odcinek M N — prócz punktów M i N — musi leżeć całkowicie pod krzywą. Charakterystykę funkcji ściśle wypukłej moż na otrzymać, zastępując w ostatnim stwierdzeniu słowo „pod” słowem „nad” . Proszę to sprawdzić na rys. 9.5. Jeśli warunek charakteryzujący zostanie tak osłabiony, iż odcinek M N będzie mógł leżeć albo pod krzywą, albo na krzywej, to będzie to opis funkcji wklęsłej, bez przysłówka „ściśle” . Podobnie, jeśli odcinek M N leży powyżej lub na krzywej, to funkcja jest wypukła, znów bez przysłówka „ściśle” . Zauważmy, że ponieważ odcinek prostej M N może się pokrywać z (nie ściśle) wklęsłą lub wypukłą krzywą, krzywa ta może zawierać odcinek prostej. W przeciwieństwie do tego, ściśle wklęsła lub wypukła funkcja nigdy nigdzie nie może zawierać odcinka prostej. Wynika stąd, że funkcja ściśle wklęsła (wypukła) jest automatycznie funkcją wklęsłą (wypukłą); przeciwne stwierdzenie nie jest prawdziwe4. Z naszych poprzednich rozważań dotyczących drugiej pochodnej możemy teraz wywnioskować, że jeśli druga pochodna f" (x ) jest ujemna dla wszystkich x, to funkcja pierwotna f( x ) musi być funkcją ściśle wklęsłą. Podobnie/ (x) musi być ściśle wypukła, jeśli dla wszystkich x druga pochodna/"(x) jest dodatnia. Nie można jednak odwrócić powyższych wniosków i powiedzieć, że jeśli f ( x ) jest ściśle wklęsła (ściśle wypukła), to f" (x ) musi być ujemna (dodatnia) dla wszystkich x. Jest tak dlatego, ponieważ w pewnych wyjątkowych przypadkach w punkcie stacjonarnym na takiej krzywej druga pochodna może mieć wartość zero. Przykładem tego może być funkcja y = /( x ) = x4, której wykres jest krzywą ściśle 4 Pojęcia te omówimy szerzej w podrozdz. 11.5.
i
/" (* ) = 12*2
wskazują, że w punkcie stacjonarnym dla x = 0 wartość drugiej pochodnej w ynosi/"(0) = 0. Zauważmy jednak, że w każdym innym punkcie, dla x ^ 0, druga pochodna tej funkcji ma (oczekiwany) znak dodatni. Poza możliwością zerowej wartości w punkcie stacjonarnym, ogólnie możemy się spodziewać, że druga pochodna ściśle wklęsłej lub ściśle wypukłej funkcji będzie miała jeden stały znak. Dla innych typów funkcji druga pochodna może przyjmować wartości zarówno dodatnie, jak i ujemne, zależnie od wartości x. Na przykład na rys. 9.3(a) i (b) drugie pochodne zarówno f( x ) , jak i g(x) zmieniają znak w ich punktach przegięcia J i K. Zgodnie z rys. 9.3(a0 nachylenie f'( x ) — tzn. wartość f" (x ) — zmienia się z ujemnego na dodatnie w x = j\ całkiem przeciwnie dzieje się z nachyleniem g \x ) — tzn. z wartością g"(x) — co widać na rys. 9.3(b0Oznacza to, że wykres f( x ) zmienia się z wklęsłego w wypukły w punkcie J, a wykres g(x) podlega odwrotnej zmianie w punkcie K. Wynika stąd, że zamiast charakteryzować punkt przegięcia jako punkt, w którym pierwsza pochodna osiąga wartość ekstremalną, możemy alternatywnie scharakteryzować go jako punkt, w którym zmienia się krzywizna funkcji lub zmienia się znak jej drugiej pochodnej.
Zastosowanie Dwie krzywe przedstawione na rys. 9_5 stanowią przykłady wykresów funkcji kwadratowych, które można ogólnie zapisać w postaci: y = ax2'+ bx+ c
( a ź 0).
Z naszych rozważań dotyczących drugiej pochodnej możemy teraz wyprowadzić wygodny sposób określenia, czy dana funkcja kwadratowa będzie miała wykres ściśle wypukły (w kształcie litery U) czy ściśle wklęsły (odwrócona litera U). Ponieważ druga pochodna podanej funkcji kwadratowej jest d^y/dz2 = 2a, więc będzie miała zawsze taki sam znak, jak współczynnika. Przypomnijmy, że dodatnia druga pochodna implikuje ściśle wypukłą krzywą; możemy zatem wnioskować, że dodatni współczynnik a w powyższej funkcji kwadratowej powoduje powstanie wykresu w kształcie litery U. Przeciwnie, ujemny współczynnik a prowadzi do ściśle wklęsłej funkcji w kształcie odwróconej litery U.' Jak wspomniano na końcu podrozdz. 9.2, względne ekstremum tej funkcji będzie również jej ekstremum bezwzględnym, ponieważ dla funkcji kwadratowej można znaleźć tylko jedną dolinę lub jeden szczyt wzgórza, oczywiście odpowiednio dla U lub odwróconego U.
Ćwiczenie 9,3 1. Znaleźć drugą i trzecią pochodną następujących funkcji: 2x 00 a> r+ bx+ ć; (c) -— (x * l); 1- x (b) 6x4- 3 * - 4 ;
(d) 7- ^ 1- x
( * * 1).
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 251
2 5 0 PROBLEMY OPTYMALIZACJI
2. Która z następujących funkcji kwadratowych jest ściśle wypukła: (a) y = 9 r2- 4 t + 2 ; (c) m = 9 - x2; (b) w = - 3x2+39; (d) u = 8 - 3 x + x 2. 3. Narysować: (a) krzywą wklęsłą, która nie jest ściśle wklęsła; (b) krzywą, która jest jednocześnie krzywą wklęsłą i krzywą wypukłą. 4. Dla danej funkcji y = a -
b
(a, b ,c > 0; x > 0) określić ogólny kształt jej wykresu,
.badając: C+* (a) jej pierwszą i drugą pochodną; (b) jej punkt przecięcia z osią pionową; (c) granicę y przy x dążącym do nieskończoności. Jeśli ta funkcja ma być używana jako funkcja konsumpcji, jakie ograniczenia należy nałożyć na parametry, aby była ona ekonomicznie sensowna? 5. Narysować wykres funkcji f ( x ) takiej, żef'( x ) = 0 i wykres funkcji g (x) takiej, że g'(3) = 0. Streścić w jednym zdaniu podstawową różnicę m iędzy/(.t) i g(x), wykorzystując pojęcie punktu stacjonarnego.
trzecią lub nawet wyższe pochodne. Dla większości zagadnień ekonomicznych test wykorzys tujący drugą pochodną okazuje się jednak odpowiedni do określania maksimum lub minimum względnego. Przykład 1. Znaleźć względne ekstremum funkcji: y = f( x ) = 4x2- x . Pierwsza i druga pochodne są następujące: /'( * ) = 8 x - l
i
f" (x ) = 8.
Przyrównując f'( x ) do zera i rozwiązując otrzymane równanie, znajdujemy (jedyną) wartość krytyczną x = - , która daje (jedyną) wartość stacjonarną / T = — i-. Ponieważ O 16 druga pochodna jest dodatnia (w tym przypadku jest rzeczywiście dodatnia dla każdej wartości x), więc stwierdzamy, że to ekstremum stanowi minimum. W istocie, ponieważ dana funkcja ma wykres w kształcie litery U, względne minimum stanowi również minimum bezwzględne. Przykład 2. Znaleźć względne ekstrema funkcji: y = g (x)= x? -3 x? + 2 .
9.4. TEST WYKORZYSTUJĄCY DRUGĄ POCHODNĄ Powracając do pary punktów ekstremalnych B i E na rys. 9.5 i pamiętając o ustanowionym właśnie związku między drugą pochodną i krzywizną krzywej, powinniśmy dostrzec prawdziwość następującego kryterium dla ekstremum względnego. Test dla ekstremum względnego wykorzystujący drugą pochodną Jeśli pierwsza pochodna funkcji / w x = x0 jest f '( x 0) = 0, to wartość funkcji w pun kcie xQ, czyli / (x0) będzie stanowiła: a) względne maksimum, jeśli wartość drugiej pochodnej w x0 jest f" ( x 0) < 0, / b) względne minimum, jeśli wartość drugiej pochodnej w x0 jest f" (x 0) > 0 . Test ten jest na ogół wygodniejszy w użyciu niż test wykorzystujący pierwszą pochodną, ponieważ nie wymaga od nas sprawdzania znaku pochodnej po lewej i po prawej stronie x0. Ale ma on tę wadę, że nie można na jego podstawie wysnuć jednoznacznego wniosku w przypadku, gdy /"(*o) = 0. Wtedy bowiem wartość stacjonarna / (x0) może być względnym maksimum lub względnym minimum, lub nawet wartością w punkcie przegięcia5. W sytuacji gdy f " ( xo) = 0, musimy albo powrócić do testu wykorzystującego pierwszą pochodną, albo odwołać się do innego testu, który zostanie podany w podrozdz. 9.6 i który wykorzystuje
5 Aby zobaczyć, że możliwy jest punkt przegięcia, gdy f"(x
Pierwsze dwie pochodne tej funkcji są następujące: g'(x) = 3x2- 6 x
i
g"(x) = 6 x - 6 .
Przyrównując g'(x) do zera i rozwiązując otrzymane równanie kwadratowe 3x1- 6 x = 0, otrzymujemy wartości krytyczne x = 0 i x = 2, które dają dwie wartości stacjonarne: g (0) = 2
(maksimum, gdyż g"(0) = - 6 < 0),
g(2) = - 2
(minimum, gdyż g"(2) = 6 > Ó).
Warunki konieczne kontra dostateczne Podobnie jak w przypadku testu wykorzystującego pierwszą pochodną, warunek zerowego nachylenia f'( x ) = 0 odgrywa rolę warunku koniecznego w teście wykorzystującym drugą pochodną. Ponieważ warunek ten jest oparty na pochodnej pierwszego rzędu, często jest nazywany warunkiem pierwszego rzędu (first-order condition). Gdy tylko warunek pierwszego
zeru w punkcie krytycznym x = j. Zatem punkt J ilustruje punkt przegięcia występujący wtedy, gdy /"(*>) = 0. Aby zobaczyć, że względne ekstremum jest również zgodne z f"(xo) = 0, rozważmy funkcję y = x4. Wykres tej funkcji ma kształt litery U i funkcja ma maksimum y = 0 osiągane w punkcie krytycznym x = 0. Ponieważ druga pochodna tej funkcji jest f"(x) = 12*2, ponownie otrzymujemy zerową wartość tej pochodnej dla wartości krytycznej x = 0. Zatem ta funkcja stanowi ilustrację względnego ekstremum występującego dla f"(xo) = 0.
252 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 253
rzędu jest spełniony dla x = x0, ujemny (dodatni) znak f" ( x o) jest wystarczający na to, aby stwierdzić, że rozważana wartość stacjonarna jest względnym maksimum (minimum). Te warunki dostateczne, wykorzystujące pochodną drugiego rzędu, często są nazywane warun kami drugiego rzędu. Należy podkreślić, że warunek pierwszego rzędu jest konieczny, ale nie dostateczny dla względnego maksimum lub minimum. (Czy pamiętacie punkty przegięcia?) I przeciwnie, podczas gdy warunek drugiego rzędu, czyli że f" (x ) ma być ujemne (dodatnie) dla wartości krytycznej xo, jest dostateczny dla względnego maksimum (minimum), to jednak nie je st konieczny. (Czy pamiętacie względne ekstremum występujące przy f" ( x 0) = 0?) Z tego powodu należy starannie wystrzegać się następującego sposobu argumentacji: ¿.ponieważ wiemy już, że wartość stacjonarna / (x) jest minimum, więc musi być / " t o ) > 0” . To rozumowanie jest nieprawidłowe, ponieważ błędnie traktuje dodatni znak / " t o ) jako warunek konieczny na to, aby / t o ) było minimum. To wszystko nie oznacza, że pochodne drugiego rzędu nigdy nie mogą być używane przy formułowaniu warunków koniecznych dla ekstremów względnych. Rzeczywiście mogą. Należy jednak pamiętać, że względne maksimum (minimum) może występować nie tylko wtedy, gdy f" (x 0) jest ujemne (dodatnie), lecz również wtedy, gdy f" ( x 0) jest zerowe. W rezultacie warunki konieczne drugiego rzędu muszą być sformułowane w postaci nieostrych i maksimum) . , . nierówności: aby wartość stacjonarna / t o ) była względnym ( . . > konieczne jest, J J { minimum J
aby/"(aó) M o .
Warunki maksymalizacji zysku Przedstawimy teraz kilka przykładów ekonomicznych dotyczących zagadnień znajdowania wartości ekstremalnych, tzn. problemów optymalizacji. Jedną z pierwszych rzeczy, jakich uczy się student ekonomii, jest to, że w celu zmaksymalizowania zysku firma musi zrównać koszt krańcowy z przychodem krańcowym. Pokażemy matematyczne wyprowadzenie tego warunku. Aby utrzymać analizę na poziomie ogólnym, będziemy używać funkcji całkowitego przychodu R = R (Q) i funkcji całkowitego kosztu C = C(Q), obu będących funkcjami jednej zmiennej Q. Wynika stąd, że funkcja zysku (nasza funkcja celu) może również być sformułowana w odniesieniu do Q (zmiennej decyzyjnej): (9.1)
ti= n(Q ) = R (Q )-C (Q ).
Zatem optymalny poziom produkcji (produkcja równowagi) Q musi spełniać równanie R'(Q) = C (Q ), czyli MR = MC. Warunek ten stanowi warunek pierwszego rzędu dla maksymalizacji zysku. v Ponieważ warunek pierwszego rzędu może prowadzić do minimum, musimy zatem sprawdzić następnie warunek drugiego rzędu. Możemy otrzymać drugą pochodną, różnicz kując pierwszą pochodną w (9.2) względem Q:
d27T —
^ J t" (Q ) = R " ( Q )- C '(Q ) < 0
.
wtedy i tylko wtedy, gdy R"(Q) < C ’(Q). Dla poziomu produkcji Q takiego, że R/(Q) = C (Q ) spełnienie warunku drugiego rzędu R"(Q) < C"(Q) jest wystarczające na to, aby stwierdzić, że jest to poziom produkcji maksymalizujący zysk. Ekonomicznie oznaczałoby to, że jeśli tempo zmian M R jest mniejsze niż tempo zmian M C przy takim poziomie produkcji, dla którego M C = MR, to ten właśnie poziom produkcji będzie maksymalizować zysk. Warunki te są zilustrowane na rys. 9.6. Na diagramie (a) narysowaliśmy krzywą całkowitego przychodu i całkowitego kosztu, które — jak widać — przecinają się dwukrotnie dla poziomów produkcji Q2 i Qą. W otwartym przedziale (Q2, Qj) całkowity przychód R przekracza całkowity koszt C, a zatem rrjest dodatni. Ale w przedziałach (0, Qj) i (Q*. Qs), gdzie Qs reprezentuje gómą granicę możliwości produkcyjnych firmy, jest ujemny. Fakt ten jest widoczny na diagramie (b), gdzie krzywa zysku— otrzymana przez wykreślenie pionowej odległości pomiędzy krzywymi R i C dla każdego poziomu produkcji — leży powyżej osi poziomej tylko w przedziale (Q2, Q4). Gdy przyjmujemy An/dQ = 0, zgodnie z warunkiem pierwszego rzędu, intencją naszą jest znalezienie najwyższego punktu K na krzywej zysku, dla produkcji Q$, gdzie nachylenie krzywej jest równe zeru. Jednakże punkt minimum względnego M (dla produkcji Qj) również „narzuca się jako kandydat” , gdyż dla niego również spełnione jest wymaganie zerowego
"
Aby znaleźć poziom produkcji maksymalizujący zysk, musimy spełruć warupek pierwszego rzędu konieczny dla maksimum: d ;r/d 2 = 0. Odpowiednio zróżniczkujemy (9.1) względem Q i przyrównamy otrzymaną pochodną do zera. W wyniku otrzymamy:
Rysunek 9.6(a)
2 5 4 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 2 5 5
a nachylenie M R jest mniejsze co do wartości bezwzględnej od nachylema MC w punkcie N, skąd wynika, że R"(Q\) jest większe niż C"((2i). Wobec tego (2i narusza również warunek drugiego rzędu konieczny dla względnego maksimum, ale spełnia warunek drugiego rzędu dostateczny dla względnego minimum. Przykład 3. Niech funkcje R(Q ) i C(Q) będą następujące: R (Q )= 1200(2 —2 (22, C (2 ) = 2 3- 61,25 Q2+ 1528,5 Q + 2000. Zatem funkcja zysku jest równa: *
| - 3 e = ł . i 8 . 5 e - 3 2 W »o,
gd,
e = { 3’ ;5
Ale ponieważ druga pochodna wynosi: d2;r >0, — - = -6 (2 + 1 1 8 ,5 -| d2 [< 0 ,
Rysunek 9.6(b, c)
nachylenia. Odwołamy się później do warunku drugiego rzędu w celu wyeliminowania tego „złego” rodzaju ekstremum. Warunek pierwszego rzędu drr/dQ = 0 jest równoważny warunkowi R'(Q) = C (Q). Na rys. 9.6(a) poziom produkcji 23 spełnia ten warunek, ponieważ krzywe R i C rzeczywiście mają takie samo nachylenie dla Qi (proste styczne dla dwu krzywych w punktach H i J są równolegle). To samo jest prawdziwe dla produkcji 2 i ■ Ponieważ równość nachyleń R i C oznacza równość MR i MC, więc wielkości produkcji g 3 i 2 i muszą oczywiście być punktami przecięcia krzywych MR i MC, co pokazano na rys. 9.6(c). W jaki sposób pojawia się tu warunek drugiego rzędu? Popatrzmy najpierw na rys. 9.6(b). W punkcie K druga pochodna funkcji n (z wyłączeniem wyjątkowego przypadku zerowej wartości) będzie miała wartość ujemną k '\ Q ^ < 0, ponieważ krzywa ma w otoczeniu K kształt odwróconej liteiy U; oznacza to, że Qi będzie maksymalizować zysk. W punkcie M natomiast oczekujemy, że rr"(2i) > 0; zatem Qi stanowi względne minimum dla n. Warunek drugiego rzędu dostateczny dla maksimum może oczywiście być sformułowany alternatywnie jako R"(Q) < C \Q ), co znaczy, że nachylenie krzywej MR ma być mniejsze niż nachylenie krzy wej MC. Na podstawie rys. 9.6(c) widać, że poziom produkcji (23 spełnia ten warunek, gdyż w punkcie L nachylenie MR jest ujemne, a ftachylenie MC jest dodatnie. Natomiast pro dukcja Qx narusza ten warunek, ponieważ zarówno MC, jak i MR mają ujemne nachylenia,
gdy
2 = 3,
gdy
2 = 36,5,
poziom produkcji maksymalizujący zysk jest równy Q = 36,5 [tony na tydzień] (druga wartość produkcji mimmalizuje zysk). Podstawiając 2 do funkcji zysku, możemy znaleźć zysk maksymalny równy k = tt(36,5) = 16318,44 [dolarów na tydzień]. Jako alternatywne podejście do powyższego problemu możemy najpierw znaleźć funkcje MR i MC, a następnie przyrównać je, tzn. znaleźć przecięcie ich wykresów. Pomeważ: R ’(Q) = 1 2 0 0 - 4 2 , C{Q) = 3 2 2- 122,52+1528,5, przyrównanie obu funkcji prowadzi do równania kwadratowego identycznego z dntdQ = 0, które posłużyło do znalezienia dwu wartości krytycznych dla Q.
Współczynniki funkcji kosztu całkowitego trzeciego stopnia W przykładzie 3 zastosowaliśmy funkcję trzeciego stopnia do zaprezentowania funkcji kosztu całkowitego. Tradycyjna krzywa kosztu całkowitego C = C ( 2 ) taka, jaką pokazano na rys. 9.6(a), z założenia zawiera dwa skrzydła, które tworzą część wklęsłą (malejący koszt krańcowy) i następującą po niej część wypukłą (rosnący koszt krańcowy). Pomeważ wykres funkcji trzeciego stopnia zawsze zawiera dokładnie dwa skrzydła, jak pokazano na rys. 9.4, więc powinna dobrze spełniać tę rolę. Jednak rys. 9.4 stawia nas przed następującym problemem: funkcja trzeciego stopnia może prawdopodobnie utworzyć na wykresie segment o malejącym nachyleniu, podczas gdy funkcja kosztu całkowitego, aby miała sens ekonomicz ny, musi wszędzie mieć rosnące nachylenie (większa produkcja zawsze pociąga za sobą wyższy koszt całkowity).
- iii OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 257
2 5 6 PROBLEMY OPTYMALIZACJI
Aby zatem zagwarantować dodatniość MCmi„. musimy nałożyć ograniczenie: b1 < 3ac. Ograniczenie to6 implikuje ograniczenie C > 0. (Dlaczego?) Powyższe rozważania dotyczyły trzech parametrów a, b i c. A ćo z ostatnim parame trem d l Odpowiedź jest taka, że jest potrzebny warunek również dla d, ale że nie ma on nic wspólnego z dodatniością MC. Jeśli w (9.3) przyjmiemy <2=0, to otrzymamy C(Q) = d. Rola d polega na określeniu przecięcia krzywej C z osią pionową, bez związku z jej nachyleniem. Ponieważ ekonomicznie d oznacza stały koszt firmy, więc odpowiednim ograniczeniem (w kontekście krótkookresowym) jest, że ¿ > 0 . W sumie współczynniki funkcji całkowitego kosztu (9.3) powinny podlegać następującym ograniczeniom (w krótkim okresie):
Jeśli chcemy stosować funkcję całkowitego kosztu trzeciego stopnia taką, jak: (9.3)
C = C(Q) = aQi + bQ 2+ cQ+d,
musimy koniecznie nałożyć odpowiednie ograniczenia na wartości parametrów, aby krzy wa C nigdzie nie wyginała się ku dołowi. Równoważnym sposobem sformułowania tego wymagania jest, by krzywa MC była wszędzie dodatnia, a to można zapewnić tylko wtedy, gdy minimum bezwzględne funkcji MC jest dodatnie. Różniczkując (9.3) względem Q, otrzymujemy funkcję MC: (9.4)
(9.5)
MC = C (Q ) = 3aQ2+2bQ+c,
'
r •f
M R = /(0 + & f ( 0 . :
: -
3a
3a
[z (7.7)]
Nachylenie krzywej MR można znaleźć, obliczając pochodną: ^
MR = / ' ( 0 + / ' ( 0 + Q f"(Q ) = 2 / ' ( 0 + g / " ( 0 .
Gdy krzywa AR jest malejąca (a tak będzie przy niedoskonałej konkurencji), wówczas składnik 2f'{ Q ) jest na pewno ujemny. Ale składnik Q f"(Q ) może być ujemny, dodatni lub równy zeru, w zależności od znaku drugiej pochodnej funkcji, tj. od tego, czy krzywa AR jest ściśle wklęsła, liniowa, czy ściśle wypukła. Jeśli krzywa AR jest ściśle wypukła w całości (jak pokazano na rys. 7.2) lub w pewnej części, to możliwe jest, że (dodatni) składnik Q f"(Q ) może dominować nad (ujemnym) składnikiem 2 f ( Q ) , powodując w ten sposób, że krzywa MR będzie całkiem lub częściowo rosnąca.
m inim alizuje on (a nie maksymalizuje) MC, gdyż druga pochodna d2(MC)/d<22 = 6a jest na pewno dodatnia na mocy warunku a > 0. Znajomość Q* umożliwia nam teraz obliczenie MCmi,,, ale najpierw możemy wywnioskować na jej podstawie, jaki jest znak współczynnika b. Ponieważ ^wykluczyliśmy ujemne poziomy produkcji, więc widzimy, że b nie może być • dodatnie (skoro a > 0 ) . Ponadto ponieważ zakładamy, że prawo malejących przychodów obowiązuje dla dodatnich poziomów produkcji (tzn. zakładamy, że MC ma początkowy odcinek malejący), Q* powinno być dodatnie (a nie zerowe). W konsekwencji musimy nałożyć warunek b < 0. Teraz jest już prostą sprawą podstawienie minimalizującego MC poziomu produkcji Q* do (9.4) i obliczenie:
: -b 3 a c-b 2 + 2b - — l-c = -
Pokazaliśmy, że krzywa krańcowego przychodu na rys. 9.6(c) ma wszędzie nachylenie ku dołowi. Jest to oczywiście sposób, w jaki krzywa MR jest tradycyjnie rysowana dla firmy w warunkach niepełnej konkurencji. Jednakże nie można a priori wykluczyć możliwości, że krzywa MR częściowo lub nawet całkowicie będzie miała nachylenie ku górze7. Dla danej funkcji przeciętnego przychodu AR = / ( 0 funkcję przychodu krańcowego można wyrazić wzorem:
■;
—2 b - b <2* = ^ - = — ;
3a
b2 <3ac.
Wznosząca się krzywa krańcowego przychodu
Poziom produkcji spełniający ten warunek pierwszego rzędu jest równy:
MCmin = 3u
b< 0;
Jak Czytelnik może z łatwością sprawdzić, funkcja C ( 0 z przykładu 3 spełnia (9.5).
której wykres (ponieważ jest kwadratowa) jest parabolą taką, jak na rys. 9.6(c). Aby funk cja MC była wszędzie dodatnia (powyżej osi poziomej), konieczne jest, aby ta parabola miała kształt litery U (w przeciwnym razie, dla odwróconej litery U, wykres musi się rozciągać do drugiej ćwiartki układu współrzędnych). Zatem współczynnik wyrazu Q2 w (9.4) musi być dodatni, tzn. musimy nałożyć warunek a > 0. Jetjnak ograniczenie to wcale nie jest dostateczne, gdyż minimalna wartość krzywej MC w kształcie litery U — nazwijmy ją M C ,^ (minimum lokalne, które jest zarazem minimum absolutnym) — może mimo to znajdować się poniżej osi poziomej. Musimy więc następnie znaleźć M C ^ i sformułować dla parametrów takie warunki, które spowodują, że będzie ono dodatnie. Zgodnie z naszą wiedzą o względnym ekstremum, minimum MC będzie występować tam, gdzie: ;; d — MC = 6aj2+2h = 0. dQ
a, c, d > 0;
6 Ograniczenie to można również wyprowadzić metodą uzupełnienia kwadratu. Funkcja MC może być kolejno przekształcana w następujący sposób:
MC = 3a<22+2ż<2 + c = 3a<22+2ł><2 + — 3a
-m
i2 ( ,— Ib2')2 - b 2+ 3ac -+ c = h/3afi+A/— + 3a I \l3a I 3o
Ponieważ wyrażenie podniesione do kwadratu może być równe zeru, więc dodatniość MC będzie zapewniona (gdyż wiadomo, że a > 0) tylko wtedy, gdy b1 < 3ac. 7 Kwestia ta została z wielkim naciskiem podkreślona w pracy Johna P. Formby’ego, Stephena Laysona i W. Jamesa Smitha, The Law o f Demand, Positive Sloping Marginal Revenue, and Multiple Profit Equilibria, „Economic Inquiry” 1982, April, s. 303-311. 17 — Podstawy.,.
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 259
2 5 8 PROBLEMY OPTYMALIZACJI
’ i Czy funkcja całkowitego kosztu spełnia ograniczenia dotyczące współczynników z (9.5)?
Przykład 4. Niech funkcja przeciętnego przychodu będzie równa: AR = /(G ) = 8000 - 2 3 2 + 1 ,1 e 2- 0 ,0 1 8 g 3.
Zapisać funkcję całkowitego przychodu R jako funkcję 2Podać wzór określający funkcję całkowitego zysku w zależności od Q. Znaleźć poziom produkcji 2 maksymalizujący zysk. Jaki jest maksymalny zysk? >
Jak można sprawdzić (zob. ćwiczenie 9.4—7), funkcja ta prowadzi do malejącej krzy wej AR takiej, jaka jest odpowiednia dla firmy w warunkach niepełnej konkurencji. Ponieważ: MR = / ( 2 ) + 2 / '( 2 ) = 8 0 0 0 -4 6 2 + 3 3 2 2- 0,072 2 3,
4. Gdyby współczynnik b w (9.3) miał przyjąć wartość zero, co stałoby się z krzywymi kosztu krańcowego i kosztu całkowitego?
więc wynika stąd, że nachylenie MR jest równe:
5. Kwadratowa funkcja zysku 7t(Q) = h Q 2+jQ + k ma spełniać następujące założenia: (a) jeśli niczego nie produkujemy, zysk jest ujemny (z powodu kosztów stałych), (b) funkcja zysku jest ściśle wklęsła, (c) maksymalny zysk występuje przy dodatnim poziomie produkcji Q. Jakie warunki należy nałożyć na parametry?
4 - MR = -4 6 + 6 , 6 2 - 0.21622d2 Ponieważ jest to funkcja kwadratowa i współczynnik przy 2 2 jest ujemny, wykres d MR/d Q jako funkcja Q musi być krzywą o kształcie odwróconej litery U, jak to pokazano na rys. 9.5(a). Jeśli się zdarzy, że odcinek tej krzywej leży powyżej osi poziomej, to nachylenie MR będzie przyjmowało wartości dodatnie. Przyjmując dM R /dQ i stosując wzory dla trójmianu kwadratowego, znajdujemy miejsca zerowe funkcji kwadratowej 2 i = 10,76 i 2 2 = 19,79 (w przybliżeniu). Oznacza to, że dla wartości 2 w otwartym przedziale ( 2 i, Qi) krzywa dMR/d Q leży powyżej osi poziomej. Zatem krzywa przychodu krańcowego rzeczywiście ma dodatnie nachylenie dla poziomów produkcji pomiędzy 2 i i 22... Obecność w krzywej MR segmentu o dodatnim nachyleniu jest interesująca. Jeśli krzy- . wa MR zawiera więcej zagięć, to może mieć z krzywą MC więcej niż jeden punkt wspólny spełniający warunek drugiego rzędu dla maksymalizacji zysku. Wszystkie takie punkty wspólne stanowią optima lokalne, jednakże tylko jedno z nich jest poszukiwanym przez firmę optimum globalnym.
Ćwiczenie 9.4
6. Firma działająca w warunkach pełnej konkurencji ma jeden nakład L (praca), z płacą W0 za każdy okres. Stałe nakłady wymagają podnoszenia kosztów w wysokości F dolarów w każdym okresie. Cena produkcji jest równa P0. a. Zapisać funkcję produkcji, funkcję przychodu, funkcję kosztów i funkcję zysku dla tej firmy. b. Jaki jest warunek pierwszego rzędu maksymalizacji zysku? Zinterpretować ekonomicz nie ten warunek. c. Jakie okoliczności ekonomiczne zapewniałyby, że zysk jest maksymalizowany, a nie minimalizowany? 7. Zastosować następującą procedurę do sprawdzenia, że krzywa AR z przykładu 4 ma ujemne nachylenie: \ (a) oznaczyć nachylenie AR przez S; zapisać wzór dla S; (b) znaleźć maksymalną wartość S (.SmM) za pomocą testu wykorzystującego drugą pochodną; (c) wywnioskować z wartości S ^ , że krzywa AR ma ujemne nachylenie.
1. Znaleźć względne maksima i minima dla y za pomocą testu wykorzystującego drugą pochodną: (a) y = - 2 r 2+ 8 r+ 2 5 ;
(c) y = - x 3- 3 r 2+ 5 r+ 3 ;
(b) y ^ + 6 ^ + 7 ;
(d) y —
l-2 x
;
3. Pewna firma ma następujące funkcje całkowitego kosztu i popytu:
2= 100-P.
9.5. DYGRESJĄ O SZEREGACH MACLAURINA I TAYLORA
(**0,5).
2. Pan Greenthumb chciałby wytyczyć prostokątny klomb wzdłuż ściany swego domu. Pozostałe trzy boki mają być ogrodzone siatką drucianą, która ma tylko 9,6 metra. Jaka jest długość D i szerokość S prostokąta, który ma największą możliwą powierzchnię uprawy? Jak można się upewnić, że podana odpowiedź daje największą, a nie najnmiejszą powierzchnię?
C = ^ 2 3- 7 2 2+ 1 1 1 2 + 50,
'
Nadszedł czas sformułowania testu dla ekstremów względnych, który mógłby być stosowany nawet wtedy, gdy druga pochodna ma w punkcie stacjonarnym wartość zero. Jednak zanim to uczynimy, musimy koniecznie omówić tzw. rozwinięcie funkcji y = /(* ) w coś, co jest znane, odpowiednio, jako szereg Maclaurina (rozwinięcie wokół punktu x = 0) i szereg Taylora (rozwinięcie wokół dowolnego punktu x = x
2 6 0 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI
Szereg Maclaurina dla funkcji wielomianowej Rozważmy najpierw rozwinięcie funkcji wielomianowej n-tego stopnia: (9.6)
261
funkcje wartości pochodnych w x = 0: ,9.8,
'
f( x ) = ao+aix3-a2X2+a3x3+ a)X4+ . . . + a„x''.
Ponieważ wymaga to przekształcenia jednego wielomianu w inny, więc może się to wydawać bezpłodnym i bezcelowym ćwiczeniem, ale tak naprawdę rzuci ono wiele światła na całą ideę rozwinięcia. Ponieważ szereg potęgowy otrzymany jako rozwinięcie będzie obejmował pochodne różnych rzędów funkcji / , więc zaczniemy od ich obliczania. Kolejno różniczkując (9.6), możemy otrzymać następujące pochodne:
Ten nowy wielomian, szereg Maclaurina dla funkcji wielomianowej /(* ), reprezentuje rozwinięcie funkcji / wokół zera (x = 0). Przykład 1. Znaleźć szereg Maclaurina dla funkcji: (9.9)
/ (x) = 2 + 4* t 3-r2.
- -.
Funkcja ta ma pochodne: f'(x ) = ai + 2a2x+ 3a}x1+4ai x? + .. .+na„x?~\ f" ( x ) = 2a2+3 ■2a2x + 4 ■3at ^ + . : . + n ( n - l ) anx?~2, / ' " t ó = 3 ■2a3+4 ■3 • 2a4x + ...+ n ( n - l)(n - 2) / <4)t o = 4 ■3 • 2a4+ 5 - 4 • 3 • 2asx + ...+ n ( n - l) ( n - 2 ) ( n - 3 ) a „ x " - 4, f M(x) = n ( n - l ) ( n - 2 ) ( n - 3 ) . . . 3 -2 • la„. Zauważmy, że każde następne różniczkowanie zmniejsza liczbę składników o jeden — znika addytywna stała na początku — aż wreszcie w n-tej pochodnej pozostaje nam jeden stały składnik (iloczyn). Można obliczyć wartości tych pochodnych dla różnych wartości x; tutaj będziemy obliczać wartości dla x = 0, wskutek czego znikną wszystkie wyrazy zawierające x. Pozostaną nam wtedy następujące szczególnie uporządkowane wartości pochodnych: f'( 0 ) = ai; (9.7)
/"(O ) = 2a2\
/'"(O ) = 3 • 2ay,
/ (4)(Ó) = 4 ■3 • 2a4; ...; / w (0) = n ( n - I ) ( n - 2 ) ( n - 3 ) . . . 3 • 2 • la„. Jeśli wprowadzimy teraz skrótowy symbol n! (czytamy: n silnia) zdefiniowany jako: n\ = n ( n - l ) ( n - 2 ) ... 3 - 2 1
1!
/ (4)(0) 4!
ih = -
/"(O) 02 ————; 4 • 2!
/" t o = 6,
.
I /'( 0 ) = 4 ,
Wlę°
[/"(0) = 6,
zatem szereg Maclaurina jest równy: f" ( 0) / t o = /( 0 ) + / '(0) * + J- ^ x2 = 2+ 4x+ 3x1. Potwierdza to, że szereg Maclaurina rzeczywiście poprawnie reprezentuje daną funkcję.
Szereg Taylora dla funkcji wielomianowej Ogólnie można podać rozwinięcie funkcji wielomianowej w (9.6) wokół dowolnego pun ktu xo, niekoniecznie zera. Dla uprószczenia wyjaśnimy to za pomocą konkretnej funkcji kwadratowej podanej w (9.9), a następnie uogólnimy wyniki. W celu rozwinięcia wokół konkretnego punktu xq, najpierw możemy interpretować dowolną daną wartość x jako odchylenie od xq. Konkretnie przyjmiemy x = z
(n = liczba naturalna),
tak więc np. 2! = 2 • 1 = 2 i 3! = 3 ■2 ■1 = 6 itd. (przy czym 0! jest zdefiniowane jako równe 1), to wynik (9.7) można zapisać jako: /'(O ) oi — ;
f'( x ) = 4+6x,
/"'(O ) a2 —3! /<">(0) n! ‘
Podstawiając to do (9.6) i uwzględniając oczywisty fakt, że /(O) = ao, m ożem y teraz wyrazić daną funkcję f( x ) jako nowy wielomian3, którego współczynniki są wyrażone jako
/ t o = 2 + 4to+ < 5) + 3 to ,+ 5)2, (9.10)
/ ' t o = 4„+ 6(*o + 8), / " t o —6 .
Wiemy, że wyrażenie (x0+ S) =jc jest zmienną (argumentem funkcji), ale ponieważ x0 obecnie jęst ustaloną, więc tylko i może być właściwie traktowane jako zmienna w (9.10), W konsekwencji / t o jest tak naprawdę funkcją S, powiedźmy g(S): g(<5) = 2 + 4(x0+<5) + 3to+<5)2
[ = / to ]
o pochodnych: 8 Ponieważ 0! = 1 i 1! = 1, pierwsze dwa składniki po prawej stronie znaku równości w (9.8) można zapisać prościej jako /(0 ) i f \ 0 ) x . Włączyliśmy tu mianownik 0! i 1!, aby zwrócić uwagę na symetrię różnych składników rozwinięcia.
g'(S) = 4 + 6(xo+ S),
[ = / 't o ]
g \ 5 ) = 6.
W (x j)
2 6 2 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 263
Wiemy już, jak rozwinąć g (S ) wokół zera (5 = 0 ). Zgodnie z (9.8) takie rozwinięcie prowadzi do następującego szeregu Maclaurina: (9.11)
¿ (¿ ) = ! ^ + ^ 5 +
^ 5 2.
,
Ponieważ przyjęliśmy * = *<>+5, więc fakt przyjęcia 5 = 0 im plikujex = x0\ zatem na podstawie tożsamości g (S) =f ( x ) możemy napisać dla przypadku 5 = 0: ¿?(0)=/(*b);
g'(0) =/'(*«);
g "(0)= r(xo).
-
Po podstawieniu tych wyrażeń do (9.11) znajdujemy wynik przedstawiający rozwinię cie f( x ) wokół punktu xq, ponieważ współczynniki zawierają pochodne f'(xo), f" (x 0) itd. — wszystkie obliczone w punkcie x = xo: (9.12)
/ W [= i ( 5 ) ] = ^ + ^ ( ^ - ^ ) + Z ^ ( ^ - ^ ) ^
Czytelnik powinien porównać wynik — szereg Taylora dla f( x ) — z szeregiem Maclaurina dla g (S ) podanym w (9.11). Ponieważ dla konkretnej rozważariej funkcji (9.9) mamy:
/(*o) = 2+4zo+3z2;
f \ x o) = 4 + 6zb;
/"(*o) = 6,
więc wzór dla szeregu Taylora (9.12) daje:
f(x) = 2+4zo+3z2+ (4 + 6x0) (* - *o) + ^ (* - *o)2 = 2+4x+3x*. To dowodzi, że szereg Taylora rzeczywiście prawidłowo przedstawia daną funkcję. Wzór na rozwinięcie (9.12) może być uogólniony tak, aby można go było stosować do wielomianu stopnia n w (9.6). Uogólniony wzór na szereg Taylora jest następujący: ,0 ,,3 (9.13)
„ 3 /(*>) . /'(* « ), , . /"(*<>), . f 'W , „ /(* ) = - ^ j - + — (* -* o )+ — (* -* o łz+ . . . + — - — ( x - x o ) \
Rozwinięcie dowolnej funkcji Pokazaliśmy, jak można wyrazić funkcję wielomianową stopnia n w postaci innego wielomianu stopnia n. Okazuje się, że można również wyrazić dowolną funkcję (p(x) — która nie musi koniecznie być wielomianem — w postaci wielomianowej podobnej do (9.13); pod warunkiem, że ę(x) ma skończone ciągłe pochodne aż do potrzebnego rzędu w punkcie x0, wokół którego ją rozwijamy. Zgodnie z matematycznym stwierdzeniem znanym jako twierdzenie Taylora, dla danej dowolnej funkcji ę(x), jeśli mamy wartość funkcji
(9.14)
_ , o)1+
0!
1!
2!
^ ( x - x 0y +R„ = P„+R„,
gdzie P„ reprezentuje (zapisany w nawiasach kwadratowych) wielomian n-tego stopiua (pierwsze (n + 1) składiuków po prawej stronie), a R„ oznacza resztę, co objaśnimy poniżej9. Obecność R„ odróżnia (9.14) od (9.13) i z tego powodu (9.14) jest nazywane rozwi nięciem Taylora z resztą. Postać wielomianu P„ i wielkość reszty R„ będą zależne od wy branej przez nas wartości n. Im większe n, tym więcej składników będzie zawierać P„; zgodnie z tym R„ będzie na ogół przyjmować różne wartości dla różnych n. Fakt ten wyjaśnia potrzebę indeksu n w tych dwu symbolach. Zapamiętanie wzoru ułatwia to, że możemy utożsamiać n ze stopniem najwyższej pochodnej w P„ (w szczególnym przypadku n = 0, P„ nie będzie wcale zawierać współrzędnych). Pojawienie się R„ w (9.14) jest spowodowane faktem, że zajmujemy się tutaj dowolną funkcją '(.x)(x-x0)]+ R l = P i+ R u
Różni się od szeregu Maclaurina (9.8) jedynie zastąpieniem zera przez xo jako punktu, wokół którego rozwijamy funkcję, i zastąpieniem x przez wyrażenie (x-xo). Zastosuj my (9.13) dla danego wielomianu f( x ) stopnia n: jeśli w składnikach po prawej stronie wzoru (9.13) przyjmiemy np. x = l , wybierzemy dowolną liczbę *b> następnie obliczymy wartość składników i dodamy je, to w końcu otrzymamy dokładnie /(7 ), czyli wartość f(x ) dla x = 7. Przykład 2. Przyjmując xo = 3 jako punkt rozwinięcia, możemy zapisać (9.6) w równo ważny sposób:
f"(3)
gdzie Pi składa się z n + l = 2 składników i stanowi liniowe przybliżenie ę (x ). Jeśli wybierzemy n = 2, pojawi się składnik z drugą potęgą, tak więc: ę(x) = [ę (x 0) +
f {n)(3)
/(* ) = /(3 ) + /'( 3 ) ( x - 3 ) + ^ - ^ ( x - 3 f + ... + J- ^ - { x - 3)n. 9 Symbolu R„ (reszta) nie należy mylić z symbolem R" (przestrzeń n-wymiarowa).
: .'P
2 6 4 PROBLEMY OPTYMALIZACJI
Powinniśmy wspomnieć, że dowolna funkcja ę (x ) może oczywiście obejmować wielomian n-tego stopnia (9.6), jako szczególny przypadek. Jeśli rozwinięcie jest w postaci innego wielomianu n-tego stopnia, można dokładnie stosować wzór (9.13) lub — innymi słowy — można stosować wynik podany w (9.14) z R„ = 0. Jednakże jeśli dany wielomian n-tego stopnia f ( x ) mamy rozwinąć w wielomian niższego stopnia, to ten ostatni może być traktowany jedynie jako przybliżenie f( x ) i pojawi się reszta. Możemy wówczas stosować wynik (9.14) z niezerową resztą. Zatem szereg Taylora w postaci (9.14) jest doskonale ogólny. Przykład 3. Rozwinąć funkcję będącą wielomianem:
j1+ *
wokół punktu xo = 1, dla n = 4. Będą nam potrzebne cztery pierwsze pochodne ę (x), które są równe: ę'{x) = - { \ + x y 2,
czyli
ę \ \ ) = - 2 " 2= - ^ ,
ę ”(x) = 2 (l+ * )~ 3,
czyli
ę " ( l ) = 2 ■2-3 = ^ ,
ę '" (x ) = - 6 ( l + x T \
czyli czyli
= - 6 • 2-4 = y
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 265
Aby dokonać tego rozwinięcia, potrzebujemy jedynie pierwszej pochodnej ę (x ) = 2+2x. Gdy obliczymy wartości danej funkcji i jej pochodnej dla Xo = 1, będą one następujące: ę (Ab) = ę (1) = 8,
ę \ x 0) = ę ’( \) = 4,
zatem, szereg Taylora z resztą jest równy:
’
\
ę ( x ) = ę ( x 0) +
,
3 ęj(4)(l) = 2 4 - 2 - 3 = - .
Widzimy również, że ę ( l) = ~ . Zatem podstawiając x0 = 1 do (9.14) i wykorzystując podane powyżej informacje, otrzymujemy następujący szereg Taylora z resztą:
ę(x)=\~ \{x~1)+^ _ 1)2~ h (x' 1)3+Ł (x~1)4+/?4= 31
—
32
13
1 ,
16
2
- X+- XT
3 , 1 . X + JP+R 4 . 16 32
Można również wybrać x0 = 0 jako punkt, wokół którego dokonujemy rozwinięcia. W tym przypadku dla xQrównego zero W (9.14) otrzymujemy rozwinięcie w postaci szeregu Maclaurino z resztą. Przykład 4. Rozwinąć funkcję kwadratową: (p(x) = 5 + 2x+ xl wokół *0 = 1, dla n = 1. Funkcja ta jest ^-podobnie jak (9.9) w przykładzie 1 — wielomianem stopnia drugiego. Ale ponieważ wyznaczone nam zadanie polega na rozwinięciu go w wielomian pierwszego stopnia (n = 1), tzn. na znalezieniu liniowego przybliżenia dla danej funkcji kwadratowej, więc musi pojawić się składnik resztowy. Z tego powodu traktujemy
Reszta w postaci Lagrange’a Musimy teraz dokładniej omówić składnik resztowy. Zgodnie ze wzorem na resztę w postaci Lagrange ’a, R„ możemy wyrazić jako: c>
(9-15)
Rn= \
™ b - x ó r +\ (n+1)!
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANAŻIZY RÓWNOWAGI 2 6 7
2 6 6 PROBLEMY OPTYMALIZACJI
gdzie p jest pewną liczbą pomiędzy x (punktem, w którym chcemy obliczyć wartość do wolnej funkcji
gdzie punkt p znajduje się pomiędzy punktami x i xo, jak tego żądano. Jest to ilustracja reszty w postaci Lagrange’a dla przypadku n = 0. Zawsze możemy wyrazić Ro jako 0
przy
n -ż
tak że
Pn - * ę ( x )
przy ' ■n —> <»,
to będzie można uczynić Pn tak dokładnym przybliżeniem ę W , jak tylko chcemy, wybierając odpowiedmo dużą wartość n, tzn. uwzględniając10 wystarczająco dużą liczbę składników wielomianu Pn. W tym (wygodnym) przypadku mówimy, że szereg Taylora jest zbieżny do ę (x) w punkcie rozwinięcia. Przykład takiej sytuacji omówimy w podrozdz. 10.2.
xq).
Wynik ten — prosta wersja twierdzenia o wartości średniej — pokazuje, że różnica j między wartością funkcji
Ćwiczenie 9.5 1. Znaleźć wartość następujących wyrażeń zawierających silrnę: 4! 6! (w+ 2)! (a) 5!; (b) 7!; (c) (d) (e) -A 3! 3! n\ 2. Znaleźć pierwszych pięć składników rozwinięcia Maclaurina (tzn. przyjąć n = 4 i xo = 0) dla: (a) ę>(;t) = —i—; l-x
(b) ę{x ) = \ - ^ - . 1+j:
3. Dla obu funkcji z poprzedniego zadania znaleźć szereg Taylora dla n = 4 i
= -2 .
4. Na podstawie rozwinięcia Taylora z resztą w postaci Lagrange’a (zob. (9.14) i (9.15)) pokazać, że w.punkcie rozwinięcia ( l = xo) szereg Taylora będzie zawsze dawać dokładną wartość funkcji w tym punkcie, czyli ę(xo), a nie tylko przybliżenie.
, U*.
9.6. TEST WYKORZYSTUJĄCY iV-TĄ POCHODNĄ DLA EKSTREMUM WZGLĘDNEGO FUNKCJI JEDNEJ ZMIENNEJ
...
Rozwinięcie funkcji w szereg Taylora (lub Maclaurina) jest pożyteczne jako narzędzie aproksymacji w sytuacji, gdy R„ —> 0, gdy w -» °°, ale obecnie zajmiemy się jego za stosowaniem do wyprowadzenia ogólnego testu na ekstremum względne. ' i 10 Powinno nam to przypomnieć metodę znajdowania macierzy odwrotnej przez aproksymację, omówioną w podrozdz. 5.7.
2 6 8 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 269
Rozwinięcie Taylora i ekstremum względne Jako krok przygotowawczy do tego zadania sformułujmy następującą definicję ekstremum względnego: Funkcja f( x ) osiąga w punkcie x<> wartość lokalnie maksymalną (minimalną), jeśli / (x) - f ( x o) jest ujemne (dodatnie) dla wartości x leżących w bezpośrednim sąsiedztwie Xq, zarówno po jego lewej stronie, jak i po prawej stronie.
a jeśli jest, to czy jest to maksimum, czy minimum. W tym celu trzeba zbadać sumę po prawej stronie (9.16). Suma ta ma łącznie (n+ 1) składników (n składników z P„ plus reszta), a zatem rzeczywista liczba składników jest nieokreślona, gdyż zależy od wybranej przez nas wartości n. Wybierając jednak odpowiednio wartość n, możemy zawsze spowodować, że po prawej stronie będzie występował tylko jeden składnik i w ten sposób radykalnie uprościć zadanie sprawdzania znaku /(x )-/(x o ) i upewnienia się, czy f( x o) jest ekstremum, a jeśli jest, to jakiego rodzaju.
Pewne szczególne przypadki Można to wyjaśnić, odwołując się do rys. 9.9, gdzie Xi jest wartością x po lewej stronie x0, a x2 jest wartością x po prawej stronie Xq. Na diagramie (a) / (xb) jest względnym maksi mum, zatem / (x0) jest większe od f ( x i) i od f ( x 2). W istocie, /( x ) - /( x o ) jest ujemne dla każdej wartości x w bezpośrednim otoczeniu x0. Przeciwnie jest na diagramie (b), gdzie / (x0) jest lokalnym minimum, a zatem / (x) - f (xo) > 0.
Wszystko to stanie się jaśniejsze po omówieniu szczególnych przykładów. Przypadek 1.
/'(xo) A 0
Jeśli pierwsza pochodna w Xojest różna od zera, to wybierzemy n = 0. Wtedy po prawej stronie będzie n + 1 = 1 składnik, z czego wynika, że będzie tam tylko reszta R„. To znaczy mamy:
f(x )-f(X o )
=
( x - x 0) = f'(p )
( x - X 0) ,
gdzie p jest pewną liczbą pomiędzy x0 i wartościąx w bezpośrednim otoczeniu x0. Zauważmy, że zgodnie z tym p musi znajdować się bardzo, bardzo blisko x0. Jaki jest znak wyrażenia po prawej stronie? Ze względu na ciągłość pochodnej f'( p ) będzie ono miało taki sam znak, jak f '( x 0), gdyż — jak wcześniej wspomniano — p leży bardzo, bardzo blisko Xq. W obecnym przypadku f'{p ) musi być niezerowe; w istocie musi to być konkretna dodatnia lub ujemna liczba. Ale co można powiedzieć o części (x—x0)? Gdy przechodzimy z lewej strony Xo na prawą, x zmienia się od wielkoścFxT Xo(zob. rys. 9.9). W rezultacie wyrażenie (x-xo) musi zmieniać się z ujemnego w dodatnie i /(x ) —/( x 0) —f ( p ) (x—Xo) musi również zmieniać znak przy przejściu z lewej strony x0 na prawą. Jednak narusza to naszą nową definicję względnego ekstremum, wobec tego nie może istnieć względne ekstremum w /( x 0), gdy / '( x 0) ź 0 — fakt, który jest nam dobrze znany.
Rysunek 9.9
Przy założeniu, że /(x ) ma w punkcie x = x0 skończone, ciągłe pochodne, aż do potrzebnego rzędu, można rozwinąć funkcję /(x ) — nie musi to być koniecznie wielomian — wokół punktu Xq szereg Taylora. Na podstawie wzoru (9.14), po odpowiedniej zamianie ę na / i użyciu reszty w postaci Lagrange’a, możemy napisać: ‘
Przypadek 2.
f '( x 0) = 0;
/"(xo) * 0
w
(9.16)
/ (x) -f(x o ) = / ' (xQ) (x Xq) + ^ ^
W tym przypadku bierzemy n = 1, tak iż początkowo po prawej stronie będą « + 1 = 2 składniki. Ale jeden z nich znika, gdyż f'(xo) = 0 i znów pozostanie nam tylko jeden składnik do obliczenia:
( x - x o )2+
f(x )-f(X o ) = / /(X o)(x—Xo) + ^ ^ — (Z -X o )2 = ^ f" ( p ) ( x -X o ) 2.
[gdyż /'(*>) = 0]
+ . . . + ^ ( x - x 0r + f ^ ( x - x 0) - . n!
( n + 1 )!
Jeśli możemy określić znak wyrażenia /(x )-/(x o ) dla wartości x leżących bezpośrednio po lewej i po prawej stronie x0, to łatwo możemy wywnioskować, czy /( x 0) jest ekstremum,
Tak jak poprzednio f"{p ) będzie mieć taki sam znak jak f" ( x o), znak określony i niezmienny, podczas gdy część ( x - x 0)2, jako kwadrat, jest niezmiennie dodatnia. Zatem wyrażenie /(x ) -/(xo) musi mieć taki sam znak, jak f" ( x 0) i zgodnie z powyższą definicją
OPTYMALIZACJA: SZCZEGÓLNA ODMIANA ANALIZY RÓWNOWAGI 271
2 7 0 PROBLEMY OPTYMALIZACJI
Test wykorzystujący N-tą pochodną
względnego ekstremum określi: względne maksimum f( x ) , jeśli / " t o ) < 0,
Możemy zatem w końcu sformułować następujący ogólny test: ' ” [dla / ' t o ) = 01
względne minimum f(x ), jeśli f" ( x o)>0.
Łatwo zauważyć, że jest to wprowadzony wcześniej test wykorzystujący drugą pochodną. P rzypadek 3.
f \ x 0) = / " t o ) = 0,
ale
/ " 't o ) * 0
Mamy tu sytuację, której nie może objąć test drugiej pochodnej, gdyż /"(xo) jest teraz równe zeru. Za pomocą szeregu Taylora można jednak bez trudu wysnuć rozstrzygający wniosek. Wybierzmy n = 2; wtedy początkowo po prawej stronie pojawią się trzy składniki. Ale dwa z nich znikną, gdyż / ' t o ) =/"(*<,) = 0, tak więc ponownie będziemy obliczać wartość tylko jednego składnika:
/ t o - / t o ) = / 't o ) ( x - x 0) + ^ / " t o ) (* - *o)2+ j j / '" ( p ) O -*o)3 = ^ f " '( p ) ( x - x o f . Podobnie ja k poprzednio, znak f " { p ) jest identyczny ze znakiem f ' “(x0) z powodu ciągłości pochodnej i dlatego, że p jest bardzo bliskie xo. Ale część (x - x0)3 zmienia znak. Ponieważ (ż -;to ) jest ujemne na lewo o d x0, więc (x -x o )3 też będzie ujemne, ale naprawo o d x0 wyrażenie (x -x o )3 będzie dodatnie. Ponownie mamy zmianę znaku f ( x ) - / t o ) przy przejściu przez x0, co narusza definicję ekstremum względnego. Wiemy jednakże, że xo jest wartością krytyczną ( f'( x 0) = 0), a zatem musi dawać punkt przegięcia, ponieważ nie stanowi ekstremum względnego. Przypadek 4.
f '( x 0) =/"(xo) =
•’to ) = 0,
ale
Test dla względnego ekstremum funkcji jednej zmiennej oparty na /V-tej pochodnej Jeśli pierwsza pochodna funkcji /'Oto) = 0 i jeśli pierwsza niezerowa wartość pochodnej w punkcie x0 napotkana przy kolejnym różniczkowaniu występuje dla ZZ-tej pochodnej f iN) to ) * 0, to wartość stacjonarna / t o ) będzie: a) względnym maksimum, jeśli A jest liczbą parzystą i / m t o ) < 0, b) względnym minimum, jeśli N jest liczbą parzystą, ale to ) > 0, c) punktem przegięcia, jeśli N jest nieparzyste. Na podstawie powyższego stwierdzenia powinno być jasne, że test /V-tej pochodnej może działać tylko wtedy, gdy funkcja — wcześniej czy później — dla jakiejś pochodnej będzie miała wartość różną od zera w punkcie krytycznym x0. Chociaż istnieją wyjątkowe sytuacje, które nie spełniają tego warunku, jednak dla większości funkcji11, jakie spotykamy, rzeczywiście w trakcie kolejnego różniczkowania otrzymamy różną od zera wartość f m (x0). Zatem test okaże się użyteczny w większości przypadków. Przykład 1. Zbadajmy ekstrema lokalne funkcji y = (7 - x ) 4. Ponieważ f'( x ) = - 4 (7 - x ) 3 jest równe zeru dla x = 7, przyjmujemy więc x = l jako wartość krytyczną, z y = 0 jako wartością stacjonarną funkcji. Różniczkując kolejno (do momentu, gdy napotkamy niezerową wartość pochodnej w punkcie x = 7), otrzymujemy: / " W = 12(7- r ) 2,
czyli
/" (7 ) = 0,
/ ' " t o = - 2 4 (7 - x ) ,
czyli
/ ' " ( 7 )= 0 ,
/ <4)t o —24,
czyli
/ <4,(7) = 24.
/
Jest to bardzo ogólny przypadek, więc możemy wyprowadzić z niego bardzo ogólne wnioski. Zauważmy, że tutaj wartości wszystkich pochodnych są równe zeru, aż do rzędu N. Podobnie do poprzednich trzech przypadków, szereg Taylora dla przypadku 4 zredukuje się do:
m - f ( x o ) = ^ f m ( p ) ( x - x o)".
11 Jeśli np. /( r ) jest funkcją stalą, to oczywiście f'( x ) = f"(x) = . . . = 0, więc nigdy nie będzie można znaleźć niezerowej wartości pochodnej. Jest tojednak przypadek trywialny, ponieważ funkcja stała i tak nie wymaga żadndgo testu na ekstremum. Jako przykład nietiywialny, rozważmy funkcję: (dla z * 0 ), (dla x = 0),
Ponownie f m (p) przyjmuje taki sam znak, jak f m (x0) — ustalony i nie zmieniający się. Znak części (jc—jc0)^ będzie natomiast zmieniać się, gdy N jest nieparzyste (por. przypadki 1 i 3) lub będzie niezmienny (dodatni), jeśli A jest parzyste (por. przypadek 2). Zgodnie z tym, jeśli //j e s t nieparzyste, to / ( x ) - / ( x 0) będzie zmieniać znak przy przejściu przez punkt x0, naruszając tym samym definicję ekstremum względnego (co oznacza, że xo musi dawać punkt przegięcia). Ale jeśli N jest parzyste, to f{x ) - / to ) nie będzie zmieniać znaku od lewej strony *o ku prawej, a zatem będzie określać wartość stacjonarną /Oto) jako względne maksimum lub minimum, w zależności od tego, czy / (N>to ) jest ujemne, czy dodatnie.
gdzie funkęjay = e~lfa*jest funkcją wykładniczą, którą zdefiniujemy w rozdz. 10. Funkcja ta jest nieciągła dla x = 0, gdyż x = 0 nie należy do dziedziny (dzielenie przez zero jest nieokreślone). Ponieważ jednak lim y = 0, możemy więc — przyjmując, żey = 0 d la * = 0 — wypełnić tę lukę w dziedzinie i otrzymać w ten sposób funkcję ciągłą. Wykres funkcji pokazuje, że osiąga ona minimum dla x = 0. Ale okazuje się, że w x = 0 wszystkie pochodne (dowolnego rzędu) mają zerowe wartości. Zatem nie jesteśmy w stanie wykorzystać testu ŻV-tej pochodnej do potwierdzenia faktu, który można stwierdzić graficznie, że funkcja ma minimum dla x = 0. Dalsze rozważania dotyczące tego szczególnego przypadku można znaleźć w książce R. Couranta, Differential and Integral Calculus (przetłumaczonej przez EJ. McShane’a), 1.1, wyd. 2, Interscience, Nowy Jork 1937, str. 1%, 197 i 336.
2 7 2 PROBLEMY OPTYMALIZACJI
Ponieważ 4 jest liczbą parzystą i / (4)(7) jest dodatnie, wnioskujemy, że punkt (7, 0) stanowi minimum lokalne. Łatwo sprawdzić, że wykresem tej funkcji jest krzywa ściśle wypukła. Ponieważ druga pochodna w x = 7 jest zerowa (a nie dodatnia), więc ten przykład służy jako ilustracja naszego wcześniejszego stwierdzenia dotyczącego drugiej pochodnej i krzywizny krzywej (podrozdz. 9.3): dodatnia wartość f" (x ) dla wszystkich x implikuje ścisłą wypukłość f{x), jednak to, że f( x ) jest ściśle wypukła, nie implikuje, że f" (x ) ma być dodatnia dla wszystkich x. Co ważniejsze, przykład ten ilustruje również fakt, że dla krzywej ściśle wypukłej (ściśle wklęsłej) ekstremum znajdowane na tej krzywej musi być minimum (maksimum), ponieważ takie ekstremum albo będzie spełniało warunek dostateczny drugiego rzędu, albo — jeśli go nie spełnia — musi spełniać inny (dla pochodnej wyższego rzędu) warunek dostateczny dla minimum (maksimum). '
10. FUNKCJE W YKŁADNICZE I LOGARYTM ICZNE
Ćwiczenie 9.6 ł . Znaleźć wartości stacjonarne dla: (a) y = x 3; (b) y = - x 4; ■ (c) y = x6+5. Za pomocą N-tej pochodnej określić, czy stanowią one względne maksima, względne minima, czy punkty przegięcia. 2.
Znaleźć wartości stacjonarne następujących funkcji: (a) y = ( x - 1 ) 3+ 16; (c) y = (3 -x ) 6+7. (b) y = (x —2)4; • Zastosować test TY-tej pochodnej do określenia dokładnej natury tych wartości stacjonar nych.
Test N-tej pochodnej wyprowadzony w poprzednim rozdziale posłuży nam do znalezienia wartości ekstremalnych dowolnej funkcji celu, jeśli obejmuje ona tylko jedną zmienną decyzyjną, ma pochodne aż do wymaganego rzędu i jej pochodna wcześniej lub później przyjmuje niezerową wartość w punkcie krytycznym x0. W przypadkach cytowanych w rozdz. 9 używaliśmy jednak jedynie funkcji wielomianowych i wymiernych, dla których umiemy obliczać potrzebne pochodne. Załóżmy teraz, że nasza funkcja celu jest funkcją wykładniczą, taką jak:
Jesteśmy w tej sytuacji bezradni, ponieważ jeszcze nie nauczyliśmy się różniczkować takiej funkcji. Nauczymy się tego w tym rozdziale. Funkcje wykładnicze oraz ściśle z nimi związane funkcje logarytmiczne mają ważne zastosowania w ekonomii, zwłaszcza w dziedzinie problemów wzrostu i ogólnie w dynamice ekonomicznej. W tej .części książki przedstawiono ich zastosowania do klasy problemów optymalizacji, w których zmienną decyzyjną jest czas. Na przykład pewien kupiec może mieć zapas wina, którego wartość rynkowa, ze względu na jego rocznik, będzie — jak wiadomo — rosła wraz z upływem czasu w pewien z góry ustalony sposób. Zadanie polega na tym, aby na podstawie funkcji wartości wina, po uwzględnieniu alternatywnego kosztu stopy procen towej wynikającego z zamrożenia kapitału pieniężnego, określić najlepszy moment sprzedaży tego zapasu. Funkcja wykładnicza może pojawić się w lak im zagadnieniu na dwa sposoby. Po pierwsze, wartość wina może zwiększyć się w czasie zgodnie z pewnym wykładniczym prawem wzrostu. W tym przypadku będziemy mieć wykładniczą funkcję wartości wina. Jest to oczywiście tylko możliwe, a nie pewne. Po drugie, przy rozważaniu kosztu alternatywnego stopy procentowej z całą pewnością pojawi się pewna funkcja wykładnicza z powodu kapitalizacji odsetek, co obecnie wyjaśnimy. Musimy zatem zbadać naturę funkcji wykład niczych, zanim będziemy mogli omówić ten typ zagadnień optymalizacji.
2 7 4 PROBLEMY OPTYMALIZACJI
Ponieważ naszym głównym celem jest zajmowanie się czasem, jako zmienną decyzyjną, od tej pory w dalszych rozważaniach będziemy stosować symbol t — zamiast x — na oznaczenie zmiennej niezależnej (jednakże ten sam symbol t może równie dobrze reprezen tować również zmienne inne niż czas).
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 275
Postać graficzna Wykres funkcji wykładniczej (10.1) przyjmuje ogólny kształt krzywej przedstawionej na rys. 10.1. Tę krzywą narysowano dla podstawy b = 2, ale również dla innych war tości b dominować będzie taki sam ogólny jej kształt.
10.1. NATURA FUNKCJI WYKŁADNICZYCH Wprowadzony w związku z funkcjami wielomianowymi termin wykładnik oznacza wskaźnik potęgi, do jakiej ma być podniesiona zmienna. W wyrażeniach potęgowych takich, jak X3 lub X 5 , wykładnikami są stałe; ale nie ma powodu, dla którego nie moglibyśmy mieć również zmiennych wykładników takich, jak 3* lub 3', gdzie liczba 3 ma być podniesiona do zmieniających się potęg (potęg równych różnym wartościom x). Funkcja, której zmienna niezależna występuje w roli wykładnika, jest nazywana funkcją wykładniczą.
Prosta funkcja wykładnicza W prostej wersji funkcja wykładnicza może być przedstawiona w postaci: (10.1)
y = /( /) = *'
(¿>>1),
gdzie y i / są odpowiednio zmienną zależną i niezależną, a b oznacza ustaloną podstawę potęgi. Dziedziną takiej funkcji jest zbiór wszystkich liczb rzeczywistych. Zatem — w przeci wieństwie do wykładników w funkcji wielomianowej — zmienny wykładnik t w (10.1) nie jest ograniczony do liczb naturalnych, chyba że chcemy nałożyć takie ograniczenie. Ale dlaczego mamy tu warunek b > 1? Wyjaśnienie jest następujące. Ze względu na to, że dziedziną funkcji (10.1) jest zbiór wszystkich funkcji rzeczywistych, t może przyjmować np. wartość
Gdyby b mogło przyjmować wartości ujemne, b do potęgi ~ oznaczałoby
wyciąganie pierwiastka kwadratowego z liczby ujemnej. Chociaż nie jest to zadaniem niewykonalnym, wolelibyśmy oczywiście wybrać łatwiejszą drogę wyjścia, ograniczając b do liczb dodatnich. Gdy jednak przyjmujemy ograniczenie b > 0, możemy równie dobrze przejść do warunku b > 1. Ograniczenie b > 1 różni się od b > 0 jedynie dalszym wykluczeniem przypadków: (1) 0 < ¿>< 1 oraz (2) b = 1, ale — jak tó pokażemy — pierwszy przypadek może być podciągnięty pod ograniczenie b > 1, podczas gdy drugi może być od razu odrzucony. Rozważmy pierwszy przypadek. Jeśli b = - , to mamy:
r,
Tak więc funkcja o podstawie ułamkowej może łatwo być zapisana w postaci funkcji o podstawie większej niż 1. Jeśli chodzi o drugi przypadek, dla b = 1 otrzymujemy funkcję y = 1'= 1, czyli funkcja wykładnicza w istocie degeneruje się do funkcji stałej: może być zatem zdyskwalifikowana jako funkcja wykładnicza.
Można wyróżnić kilka charakterystycznych cech takiego typu krzywej wykładniczej. Po pierwsze, jest wszędzie ciągła i gładka, zatem funkcja powinna być wszędzie różniczkowałna. Dodajmy, że jest ona różniczkowałna w sposób ciągły dowolną liczbę razy. Po drugie, jest ona monotonicznie rosnąca i w istocie y rośnie wszędzie w coraz szybszym tempie. W konsekwen cji zarówno pierwsza, jak i druga pochodna funkcji y = b? powinny być dodatnie — fakt, który powinniśmy być w stanie potwierdzić po wyprowadzeniu odpowiednich wzorów na różniczkowanie. Po trzecie, chociaż dziedzina funkcji zawiera liczby ujemne i dodatnie, zbiór wartości funkcji jest ograniczony do przedziału otwartego (0, °°). To znaczy, że zmienna zależna jest niezmiennie dodatnia, niezależnie od znaku zmiennej niezależnej t. Monotoniczność funkcji wykładniczej ma co najmniej dwie interesujące i istotne implikacje. Po pierwsze, możemy wnioskować, że funkcja wykładnicza musi mieć funkcję odwrotną, która sama jest monotoniczna. Ta funkcja odwrotna — jak się okaże — jest funkcją logarytmiczną. Po drugie, ponieważ monotoniczność oznacza, że dla danej wartości y mamy dokładnie jedną wartość t i ponieważ zbiorem wartości funkcji wykładniczej jest przedział (0, °°), więc wynika stąd, że powinniśmy być w stanie wyrazić każdą liczbę dodatnią jako jednoznaczną potęgę o podstawie b> 1. Można to zobaczyć na rys. 10.1, gdzie krzywa y = 2‘ obejmie wszystkie dodatnie wartości y należące do jej przeciwdziedziny, zatem każdą dodatnią wartość y można wyrazić jako pewną dodatnią potęgę liczby 2. Nawet jeśli zmienimy podstawę na jakąś inną liczbę rzeczywistą większą od 1, otrzymamy ten sam zbiór wartości; tak więc każdą dodatnią liczbę y można wyrazić jako potęgę o dowolnej podstawie b > 1.
2 7 6 PROBLEMY OPTYMALIZACJI
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 277
Uogólniona funkcja wykładnicza Ostatni akapit poprzedniego punktu wymaga bliższego zbadania. Jeśli rzeczywiście dodat nie y można wyrazić jako potęgi przy różnych podstawach, to musi istnieć ogólna procedura zmiany podstawy. Na przykład w przypadku funkcji y = 9' możemy łatwo przekształcić ją w y = (32)' = 32', zmieniając w ten sposób podstawę z 9 na 3, pod warunkiem, że wykładnik jest odpowiednio zmieniony z t na 21. Ta żmiana wykładnika, niezbędna z powodu zmiany podstawy, nie tworzy nowego typu funkcji, gdyż jeśli podstawimy w = 2 t, to y = 32' = 3* ma wciąż postać (10.1). Jednakże, z punktu widzenia podstawy 3, wykładnik jest teraz równy 21, a nie i. Jaki jest skutek dołączenia liczbowego współczynnika (tutaj 2) do wykładnika /? Odpowiedź znajdziemy na rys. 10.2(a), gdzie narysowano dwie krzywe — jedną dla funkcji y - f ( t ) = b \ drugą dla innej funkcji y = g(t) = b2'. Ponieważ wykładnik tej drugiej jest dokładnie dwa razy w iększy niż pierwszej i ponieważ dla obu funkcji przyjęto tę samą podstawę, więc przyjęcie dowolnej wartości t = t0 w funkcji g i t = 2r0 w funkcji / musi dawać tę samą wartość:
sposób całą rodzinę krzywych (funkcji) wykładniczych. Jeśli a i c są dodatnie, ogólny wygląd krzywej będzie taki, jak pokazany na rys. 10.2, jeśli jednak a lub c (lub obie) będą ujemne, to w kształcie krzywej wystąpią zasadnicze zmiany (zob. ćwiczenie 10.1-5).
f( 2 t0) = g(to) = b2'o = yo. Zatem odległość yo J (por. rys. 10.2(a)) jest równa połowie yoK. Podobnie rozumując, dla każdej wartości y funkcja g powinna być dokładnie w połowie pomiędzy funkcją / i osią pionową. Można zatem wywnioskować, że podwojenie wykładnika powoduje przybliżenie krzywej wykładniczej o połowę odcinka w kierunku osi y, podczas gdy podzielenie wykładnika przez 2 odsunie krzywą od osi y na podwójną odległość mierzoną poziomo. Jest ciekawe, że obie funkcje mają ten sam punkt przecięcia z osią pionową: ■yy /(O) = g(Q) = ¿>° = 1. Zmiana wykładnika t na 21 lub na dowolną wielokrotność t pozostawia nie zmieniony punkt przecięcia z osią pionową. Jest tak, ponieważ zwężenie zerowej odległości poziomej wciąż dawać będzie zerową odległość. Zmiana wykładnika jest jednym ze sposobów modyfikowania — i uogólniania — funkcji wykładniczej (10.1). Innym jest przyłączenie do b' współczynnika, np. 2b' (ostrzeżenie: 2b' ^ (2 b )'). Wpływ takiego współczynnika również polega na zwężeniu lub rozszerzeniu krzywej, ale tym razem w kierunku pionowym. Na rys. 10.2(b), wyższa krzywa reprezentuje y —2b', a niższa y - b'. Dla każdej wartości t ta pierwsza musi oczywiście być dwa razy wy? żej, ponieważ ma wartość y dwa razy większą niż ta druga. Mamy zatem t0J ' = J 'K ’. W tym przypadku zmienia się również punkt przecięcia z osią pionową. Możemy zatem stwierdzić, że podwojenie współczynnika (tu z 1 na 2) służy do odsunięcia krzywej od osi poziomej na dwukrotną odległość w linii pionowej, podczas gdy podzielenie współczynnika przez 2 spowoduje zbliżenie krzywej o połowę ku osi t, r,i ) Na podstawie omówionych powyżej modyfikacji można teraz uogólnić krzywą y = b1 do postaci: • a?& ' (1 0 .2 )
y = a b '\
....
gdzie a i c są czynnikami „zwężającymi” lub „ r o z s z e r z a j ą c y m i ” wykres funkcji. Gdy na damy im różne wartości, będą zmieniały położenie krzywej wykładniczej, generując w ten
Rysunek 10.2
Preferowana podstawa Rozważania o zmianie wykładnika i na ct są związane ze zmianą podstawy. Ale, zakła dając dopuszczalność zmiany podstawy, czemu miałoby się jej dokonywać? Jedna z od powiedzi jest taka, że jeśli chodzi o przekształcenie matematyczne, niektóre podstawy są bardziej wygodne niż inne. Co ciekawe, w rachunku różniczkowym i całkowym preferowaną podstawą jest pewna niewymierna liczba oznaczona symbolem e: e = 2,71828... Funkcja wykładnicza o tej podstawie jest nazywana naturalną funkcją wykładniczą. Przykładami są: y = e';
y = e3';
y = A ert.
Te przykładowe funkcje mogą być również wyrażone w altemaity wnym zapisie jako: y = exp(f);
y = exp(3f);
y = A exp(rt),
gdzie skrót exp (od słowa exponential — wykładniczy) wskazuje, że e ma mieć jako swój wykładnik wyrażenie podane w nawiasie. Wybór takiej niezwykłej liczby jak e = 2,71828... jako preferowanej podstawy wydaje się bez wątpienia zdumiewający. Ale jest po temu doskonały powód, gdyż funkqa e' ma godną uwagi własność bycia swą własną pochodną! To znaczy:
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 279
278 PROBLEMY OPTYMALIZACJI
.
di
e =e,
..............................
co zredukuje pracę przy różniczkowaniu praktycznie do zera. Ponadto, ta reguła różnicz kowania, która zostanie udowodniona później w tym rozdziale, ułatwia znalezienie pochodnej bardziej skomplikowanej naturalnej funkcji wykładniczej, takiej jak y = Aę". Aby to zrobić, przyjmiemy najpierw w = rt, tak iż funkcja staje się równa: y = Ae'v,
10.2. NATURALNE FUNKCJE WYKŁADNICZE A PROBLEM WZROSTU
'
gdzie w = rt, a A i r są stałymi. Następnie na mocy wzoru na pochodną funkcji złożonej możemy napisać: dy dy dw , . „ — = — — = Aew(r) = M e", df dw di
Pytanią na jakie jeszcze nie odpowiedzieliśmy, są następujące: Jak jest zdefiniowana liczba e? Czy ma ona jakiś sens ekonomiczny oprócz jej matematycznego znaczenia jako wygodnej podstawy? W jaki sposób naturalne funkcje wykładnicze stosuje się w analizie ekonomicznej ?
Liczba e
to znaczy: (10.3)
(a) przypadek a = -1 z przypadkiem a = 1; (b) przypadek c = -1 z przypadkiem c = 1.
Rozważmy następującą funkcję:
d —Ae = rAeP. df
(10.4)
/(m ) = ( \ + £ p
Matematyczna przydatność podstawy e powinna zatem być zupełnie jasna.
Ćwiczenie 10.1____________ ____________________________ ’
Jeśli liczbie m będziemy nadawać coraz większe wartości, to f{m ) również będzie przyjmować coraz większe wartości: / ( l ) = [ l + j ) 1= 2’
1. Sporządzić na jednym diagramie wykresy funkcji wykładniczych y = 3' i y = 3 21. a. Czy położenia tych dwóch wykresów są powiązane w ten sam sposób, jak na rys. 10.2(a)? b. Czy te dwie krzywe mają ten sam punkt przecięcia z osią y ? Dlaczego? c. Naszkicować na tym samym diagramie wykres funkcji y = 33'.
/(2 ) = ( l + ^ J = 2,25,
2. Narysować na jednym diagramie wykresy funkcji wykładniczych y = 4' i y = 3 • 4'. a. Czy oba wykresy ilustrują ogólny związek położenia zasugerowany na rys. 10.2(b)? b. Czy te dwie krzywe mają ten sam punkt przecięcia z osią y? Dlaczego? 3 c. Naszkicować na tym samym diagramie wykres funkcji y = - - 4'.
/(4 ) = (1+i ) = 2 >4414-
dy 3. Przyjmując, że e' jest swą własną pochodną użyć reguły łańcuchowej, aby znaleźć — dla następujących funkcji: (a) y = e5'; (b) y = 4e3';
/(3 ) = ^l + ^ j =2,37037...,
* Jeśli ponadto m rośnie w nieskończoność, to f(m ) będzie dążyć do liczby 2,71828... = e; zatem e może być zdefiniowana jako granica (10.4) przy (10.5)
e = lim /(m )= lim ( l + —1 . m
^
ftiJ
(c) y = 6e“2'.
4. Czy w świetle naszych rozważań na temat funkcji (10.1) można oczekiwać, że funkcjay = e' monotonicznie rośnie w coraz szybszym tempie? Sprawdzić odpowiedź na podstawie znaków pierwszej i drugiej pochodnej tej funkcji. Czyniąc tak, należy pamiętać, że dziedziną tej funkcji jest zbiór wszystkich liczb rzeczywistych, tzn. przedział (-<*>, <»). 5.
\
W (10.2), jeśli nada się ujemne wartości liczbom a i c, ogólny kształt krzywych na rys. 10.2 nie ulegnie zmianie. Zbadać zmianę konfiguracji krzywej, porównując:
To, że przybliżoną wartością e jest 2,71828, można sprawdzić, znajdując szereg Maclaurina dla funkcji ę{x) = e*. Użyto tu symbolu x, aby ułatwić zastosowanie wzoru na rozwinięcie (9.14). Taki szereg da nam wielomianowe przybliżenie e \ a zatem wartość e (= e1) może być przybliżona przez podstawienie x = 1 do tego wielomianu. Jeśli przy zwiększaniu liczby składników szeregu do nieskończoności składnik resztowy Rn dąży do zera, tzn. jeśli szereg jest zbieżny do ę(x), to rzeczywiście — biorąc dostatecznie dużą liczbę składników — możemy przybliżać wartość e z dowolnym stopniem dokładności.
280 PROBLEMY OPTYMALIZACJI
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 281
W konsekwencji, po podstawieniu x0 = 0 do (9.14), otrzymujemy szereg Maclaurina dla ek e =
2!
ę T (0) 3!
, > ( 0) ^ + ..'.+ — 7- * " + K = n\
Jeśli jednak kapitalizacja odsetek następuje co pół roku, odsetki wynoszą 50%, czyli połowa kapitału początkowego jest doliczana pod koniec 6 miesięcy. Będziemy mieć zatem 1,50 $ jako nowy kapitał na początku drugiego sześciomiesięcznego okresu, w którym odsetki będą naliczone jako 50% od kapitału 1,50 $. Zatem wartość naszego kapitału na końcu roku będzie równa 1,50(1 + 50%), czyli: r
= 1 + x + — x 2 H— x 3 + ... + —-x n + Rn. 21 31 nl
V(2) = (l + 50% )(l + 50%) = 1 +
Składnik resztowy R„ zgodnie z (9.15) może być zapisany jako: = ę'"+1}(P) ^ (n + 1 )!
i = _ ^ _ x n+1 (n + 1)!
t i ^ +|)(*) = ex;
ex = l + x + ^ x 2 + ± x 3 + i * 4 +
\ Analogicznie możemy napisać V(3) = 1+ r (10.7)
V(m) =
l 3J
\
\
/
3
V
1 1+ 4
itd., a ogólnie: /
1+i
m
gdzie m reprezentuje częstotliwość kapitalizacji odsetek w ciągu roku. W przypadku granicznym, gdy kapitalizacja następuje w sposób ciągły przez cały rok, tzn. gdy m staje się nieskończone, wartość wkładu będzie rosła „lawinowo” , przyjmując na końcu roku wartość: lim V(m) = lim
+ ...
1+
1 -
= e (dolarów).
[z (10.5)]
Liczba e = 2,71828 może być zatem interpretowana jako wartość, do jakiej wzrośnie po roku kapitał początkowy o wartości 1 $, gdy odsetki przy stopie procentowej równej 100% rocznie będą kapitalizowane w sposób ciągły., Pamiętajmy, że stopa procentowa równa 100% jest jedynie nominalną stopąprocentową, gdyż jeśli 1 $ staje się po roku e = 2,718 $, to efektywna stopa procentowa jest w tym przypadku równa w przybliżeniu 172 procent rocznie.
Jako szczególny przypadek, dla x= 1, znajdujemy, że: 1 +— 1 +— 1 +— 1 e = 1, + 11+ — = 2! 3! 4! 5! = 2+ 0,5 + 0,1666667 + 0,0416667 + 0,0083333 + 0,0013889 + +0,0001984 + 0,0000248 + 0,0000028 + 0,0000003 + . . . = = 2,7182819.
2 f
Ponieważ wyrażenie z silnią (n + 1)! zwiększa swą wartość szybciej niż wyrażenie potęgowe x n+1 (dla skończonego x) w miarę wzrostu n, wynika stąd, że Rn —>0 przy n —>°o. Zatem szereg Maclaurina jest zbieżny i wartość e* można wyrazić jako szereg nieskończonyi czyli wyrażenie obejmujące nieskończenie wiele (n —>°°) addytywnych składników mających zgodny, rozpoznawalny schemat tworzenia, w którym składnik resztowy dąży do zera CR„->0): -4 (10.6)
\. -
u
ę \ 0 ) =
koniec roku będzie równa 2 $. Oznaczymy tę wartość przez V(l), gdzie liczba w nawiasie wyraża częstotliwość kapitalizacji odsetek w ciągu roku: ( . \, 1 V (l) = kapitał początkowy (1 +stopa procentowa) = 1(1 + 100%) = = 2. 1+T
5
W tym celu potrzebne nam są pochodne różnych rzędów funkcji e*. Przyjmując, że pierwszą pochodną e* jest sama ex, widzimy, że pochodną
‘
Jeśli zatem chcemy mieć liczbę z dokładnością do pięciu cyfr po przecinku, możemy napisać e = 2,71828. Nie musimy się martwić o następne składniki nieskończonego sze regu, gdyż będą one pomijalnie małe. ■
Ekonomiczną interpretacja e Matematycznie liczba e jest granicą wyrażenia przedstawionego w (10.5). Ale czy ma onajakiś sens ekonomiczny? Odpowiedź brzmi: tak — może być interpretowana jako wynik szczególnego procesu kapitalizacji odsetek. Załóżmy, że startując od kapitału 1 $, znajdujemy hipotetycznego bankiera, który oferuje nam niezwykłą stopę oprocentowania w wysokości 100% rocznie (odsetki w wysokości 1 $ rocznie). Jeśli odsetki mają być kapitalizowane raz w roku, wartość naszego kapitału pod
Kapitalizacja odsetek i funkcja Aert Omówiony ciągły proces kapitalizacji odsetek może być uogólniony w trzech kierunkach; można bowiem przyjąć: (1) więcej lat kapitalizacji, (2) kapitał początkowy inny niż 1 $ i (3) nominalną stopę procentową inną niż 100%. Jeśli wkład w wysokości 1 $ wynosi jpo 1 roku ciągłej kapitalizacji e $ i jeśli przyjmie my e $ jako nowy wkład w drugim roku (podczas którego każdy dolar wzrośnie znów do e $, to wartość naszego wkładu pod koniec drugiego roku stanie się równa ee = e2 $. Pod koniec trzeciego roku będzie równa e3. Ogólnie po t latach stanie się równa e' $. Zmieniamy następnie początkową wartość kapitału z 1 $ na A $. Możemy sobie łatwo poradzić z tą zmianą: jeśli 1 $ wzrośnie do e* $ po t latach ciągłej kapitalizacji przy stopie 100% rocznie, to — Co wydaje się oczywiste — A $ wzrośnie do A t' $. A co będzie, jeśli nominalna stopa procentowa będzie równą np. r - 0,05 (5%)? Skutkiem
FUNKCJE WYKŁADNICZE 1 LOGARYTMICZNE 283
282 PROBLEMY OPTYMALIZACJI
tej zmiany oprocentowania jest zastąpienie wyrażenia Ae' przez Ae". Sprawdzamy tó w następujący sposób: Dla kapitału początkowego A $, który ma byó zainwestowany na t lat przy nominalnej stopie procentowej r, wzór na kapitalizację odsetek (10.7) musi zostać zmodyfikowany do postaci: ■' (10.8)
P(m) = A 1 +
-
Podstawienie współczynnika A oznacza zmianę kapitału z poprzedniego poziomu 1 $. Wyrażenie ułamkowe r/m oznacza, że w każdym z m okresów kapitalizacji odsetki 1 . . ; • '" 'T '' obliczamy według — nominalnej stopy procentowej. Wykładnik mt oznacza natomiast, że m ponieważ odsetki mają być kapitalizowane m razy w roku, więc w ciągu t lat w sumie bę dzie mt okresów kapitalizacji. Wzór (10.8) można również zapisać w postaci: ■f
'i
II s
S'
V oo o
r 1+ m -\
m ir rt
=A -
f
r w i+ -l w )
“
\
gdzie
m w = —. r
Gdy częstotliwość kapitalizacji m wzrasta, wówczas nowo utworzona zmienna w musi tym samym wzrosnąć. Zatem dla m —>°° mamy w —>°° i wyrażenie w nawiasach kwa dratowych w (10.80, na mocy (10.5), dąży do liczby e. W konsekwencji możemy stwierdzić, że wartość A w uogólnionym procesie ciągłej kapitalizacji jest równa: (10,8")
V = lim V(m) = Ae", m —»«»
jak to wcześniej przedstawiono. k: ■; : ■ Zauważmy, że w (10.8) t jest zmienną dyskretną (a nie ciągłą); może przyjmować jedynie wartości, które są całkowitymi krotnościami l/m. Na przykład, jeśli m = 4 (kapitalizacja . 1 1 3 , . , , . ; -cr: kwartalna), to t może przyjmować jedynie wartości - , - , - , 1 itd., co wskazuje na to, ze V(m) będzie przyjmować nową wartość jedynie pod koniec każdego nowego kwartału. Jednakże gdy m ->°° — tak jak w (10.8") — l/m stanie się nieskończenie małe i odpowiednio zmienna t stanie się ciągła. W tym przypadku można mówić o częściach roku i pozwolić, aby t było równe np. 1,2 lub 2,35. Tak więc wszystkie wyrażenia e, e', Ae' i Ae" mogą być interpretowane ekonomicznie w związku z ciągłą kapitalizacją odsetek, co podsumowano w tabl. 10.1. •O. Tablica 10.1 Ciągła kapitalizacja odsetek Kapitał w $ 1 1 A A.
Nominalna stopa procentowa 100% (=1) 100% 100%
r
Lata ciągłej kapitalizacji
Wartość wkładu na końcu procesu kapitałowego w $
1
t t t
.
e e' Ae"
•••'
Natychmiastowa stopa wzrostu Należy jednak podkreślić, że kapitalizacja odsetek jest poglądową, ale nie jedyną interpretacją naturalnej funkcji wykładniczej Ae". Kapitalizacja odsetek stanowi po prostu przykład ogólnego procesu wzrostu wykładniczego (tutaj jest to wzrost sumy kapitału pieniężnego w czasie) i funkcję możemy stosować równie dobrze do wzrostu populacji, majątku lub kapitału rzeczowego. Współczynnik r w Ae" zastosowany w kontekście innym niż naliczanie odsetek nie oznacza już nominalnej stopy procentowej. Jakie ma on wtedy znaczenie ekonomiczne? Odpowiedź: r może być interpretowany jako natychmiastowa stopa wzrostu funkcji Ae" (dlatego właśnie przyjęliśmy oznaczenie r dla stopy wzrostu). Dla danej funkcji V - Ae", która określa V w każdym momencie t, stopę wzrostu V można znaleźć za pomocą pochodnej: dV — = rAe = rV.
[por. (10.3)]
Ale stopa wzrostu V jest po prostu stopą zmiany V wyrażoną w terminach względnych (procentowych), tzn. wyrażoną jako część wartości samej V. Zatem dla każdego danego momentu mamy: (10.9)
stopa wzrostu V =
dV7dr V
rV = — = r, V
jak wyżej stwierdzono. Musimy uczynić kilka uwag dotyczących stopy wzrostu. Najpierw jednak wyjaśnijmy podstawową kwestię dotyczącą pojęcia czasu, mianowicie rozróżnienie między momentem i okresem. Zmienna V (oznaczająca sumę pieniędzy lub wielkość populacji itd.) jest pojęciem typu zasób, które jest związane z pytaniem: jaka jego ilość istnieje w danym momencie? Jako takie Vjest związane z momentem', w każdym momencie V przyjmuje dokładnie jedną wartość. Zmiana Iżreprezentuje natomiast strumień, którego dotyczy pytanie: jaka jego ilość występuje w ciągu danego przedziału czasowego? Zatem zmiana V i z tej samej racji stopa zmiany V muszą się odnosić do pewnego okresu, powiedzmy roku. Gdy już jest to jasne, wróćmy do (10.9). . 1. Stopa wzrostu zdefiniowana w (10.9) jest natychmiastową stopą wzrostu. Ponieważ pochodna dV7df = rAę" przyjmuje różne wartości w różnych momentach t, podobnie jak Ae", więc ich iloraz musi również odnosić się do pewnego konkretnego punktu (lub momentu) t. W tym sensie stopa wzrostu jest natychmiastowa (instantaneous). 2. W obecnym przypadku tak się zdarza, że natychmiastowa stopa wzrostu jest równa stałej r, zatem stopa wzrostu jest taka sama dla wszystkich momentów. To oczywiście nie musi być prawdą dla wszystkich rzeczywiście występujących sytuacji wzrostu. 3. Mimo iż stopa wzrostu r jest mierzona w pewnym punkcie w czasie, to jednak jej wielkość ma konotację iluś procent przypadających na jednostkę czasu, np. na rok (jeśli jest to mierzone w jednostkach równych latom). Wzrost z samej swej natury może następować jedynie w pewnym czasie. Dlatego właśnie jedno zdjęcie fotograficzne (zapisujące sytuację w pewnej chwili) nigdy nie może ujawnić rozwoju dziecka, podczas gdy dwa zdjęcia zrobione w różnych okresach — np. w odstępie roku — mogą tego dokonać. Powiedzenie, że V ma stopę wzrostu r w chwili t = t0, tak naprawdę oznacza, że jeśli stopa wzrostu r występująca
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 285
284 PROBLEMY OPTYMALIZACJI
w J = J0 pozostałaby nie zmieniona przez całą jednostkę czasu (1 rok), to V wzrosłoby do końca tego roku o rV. 4. Dla funkcji wykładniczej P = A e " procentowa stopa wzrostu jest stała dla wszystkich punktów t, ale bezwzględna wielkość przyrostu V zwiększa się wraz z upływem czasu, gdyż procentowa stopa będzie obliczona dla coraz to większych podstaw. . Przy interpretowaniu r jako stopy wzrostu w danym momencie jest jasne, że od tej pory niewielkim wysiłkiem będzie można znaleźć stopę wzrostu naturalnej funkcji wykładniczej postaci y = Aert, pod warunkiem, że r jest stałe. Dla danej funkcji y = 75e0,02i możemy bezpośrednio odczytać stopę wzrostu jako 0,02, czyli 2% na każdy okres. -
Wzrost ciągły kontra dyskretny
•
Powyższe rozważania, chociaż analitycznie interesujące, mogą być kwestionowane z punktu widzenia ekonomii, ponieważ w rzeczywistości wzrost nie zawsze odbywa się w sposób ciągły — nawet przy naliczaniu odsetek. Ale nawet dla przypadków dyskretnego wzrostu, gdy zmiany następują jedynie raz w danym okresie, a nie w każdym momencie, uzasadnione jest stosowanie ciągłej wykładniczej funkcji wzrostu. * ' - '' U W przypadkach gdy częstotliwość składania procentów jest względnie duża, chociaż nie nieskończona, ciągły schemat wzrostu może być traktowany jako przybliżenie prawdziwego schematu wzrostu. Ale, co ważniejsze, możemy pokazać, że zagadnienie dyskretnego łub nieciągłego wzrostu może zawsze być przekształcone w równoważną wersję ciągłą. Załóżmy, że mamy geometryczny schemat wzrostu (np. dyskretne naliczanie pdsetęk) pokazany za pomocą następującego ciągu: A, A(1 +/'), A ( l+ /) 2, A ( l+ i) 3,
...,
;
Możemy zatem A b' przekształcić w naturalną funkcję wykładniczą:
.
•••
Wzrost ciągły i rozpad Przejdźmy na chwilę od kapitalizacji odsetek do blisko z nią związanego pojęcia dyskon towania. W zadaniu dotyczącym kapitalizacji odsetek chcemy obliczyć przyszłą war tość V (kapitał plus odsetki) dla danej bielącej wartości A (kapitał początkowy). Problem dyskontowania jest przeciwny — szukamy wartości bieżącej A dla pewnej sumy V, która będzie dostępna za / lat. Rozpatrzmy najpierw przypadek dyskretny. Jeśli po t latach kapitał A wzrośnie do wartości A(1 + i)' przy rocznej kapitalizacji odsetek dla stopy procentowej i, tzn. jeśli: V = A(l + i)V to dzieląc obie strony równania przez niezerowe wyrażenie (1 + i)', możemy otrzymać wzór na dyskontowanie: (10.10)
A = _ X - = V ( 1 + /)-', (1 + 0
który zawiera ujemny wykładnik. Należy zdawać sobie sprawę, że w tym wzorze role V i A zostały odwrócone: V jest teraz dane, podczas gdy A jest niewiadomą, którą mamy obliczyć na podstawie znajomości i (stopy dyskontowej), / (liczby lat) oraz V. Podobnie jest dla przypadku ciągłego: jeśli po / latach kapitał A wzrośnie do war tości Aen przy ciągłej kapitalizacji odsetek dla stopy procentowej r zgodnie ze wzorem:
'
V = A t",
gdzie efektywna stopa procentowa przypadająca na każdy okres jest oznaczona przez' i, a wykładnik wyrażenia (1 + i) oznacza liczbę okresów, jakie uwzględniono przy kapitalizacji. Jeśli (1 + /) potraktujemy jako bazę b w wyrażeniu wykładniczym, to wyraz ogólny powyższego ciągu może być zapisany w postaci Ab', z tym zastrzeżeniem, że — ze względu na dyskretną naturę zagadnienia — / jest ograniczone do wartości całkowitych. Ponadto b = 1 + i jest liczbą dodatnią (nawet wtedy, gdy i jest ujemną stopą procentową, np. równą -0,04), i tak więc zawsze można ją wyrazić jako potęgę dowolnej liczby rzeczywistej więksżej niż 1, również liczby ę. Oznacza to, że musi istnieć pewna liczba r taka, ż e 1: . - '<"5 l + i - b = er.
A(l + i')'. Tłumaczy to, dlaczego naturalne funkcje wykładnicze są szeroko stosowane w analizie ekonomicznej, mimo że nie wszystkie schematy wzrostu muszą być ciągłe.
yjtfi , .
A^^ + i) '= A b '^ A o r,, Dla każdej całkowitej wartości / funkcja A ę rl będzie oczywiście przyjmować dokładnie taką samą wartość, jak A(1 + /)', np. A(1 + i) = A e r i A ( l+ /) 2 = Ae2'. Możemy zatetń Wykorzystać ciągłą funkcję wykładniczą A ert, chociaż rozważamy przypadek dyskretny
1 Metoda znajdowania liczby r dla danej konkretnej wartości b zostanie omówiona Wpodroźdz. 10-4i
to możemy otrzymać wzór na ciągłe dyskontowanie, dzieląc obie strony ostatniego równania przez e": (10.11)
A = — =VeTr'. e
X
-ł.
■
.
W tym przypadku znów A (a nie V) jest niewiadomą, którą mamy obliczyć dla danej przyszłej wartości ^.nominalnej stopy dyskontowej r i liczby lat /. Traktując (10.11) jako funkcję wzrostu wykładniczego, możemy natychmiast odczytać - r jako stopę wzrostu A w danym momencie. Ponieważ jest ona ujemna, więc niekiedy jest nazywana stopą rozpadu (rate of decay). Tak więc kapitalizacja odsetek stanowi przykład procesu wzrostu, a dyskontowanie ilustruje wzrost negatywny (negative growth).
•
Ćwiczenie 10.2 1.
Stosując e* w postaci nieskończonego szeregu przedstawionego w (10.6), znaleźć przybliżoną wartość: (a)
e2;
(b) V e(= e2).
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 287
286 PROBLEMY OPTYMALIZACJI
Proszę zaokrąglać obliczenia każdego składnika do 3 miejsc po przecinku i kontynuować szereg dopóty, dopóki nie otrzymamy składnika 0,000. 2. Dla danej funkcji 0 przy n - > ~ , tzn. czy szereg jest zbieżny do
10.3. LOGARYTMY
V
^
Funkcje wykładnicze są blisko związane z funkcjami logarytmicznymi. Zanim omówimy funkcje logarytmiczne, wyjaśnijmy znaczenie terminu logarytm. .:
Znaczenie logarytmu
-Vd.;
.;■&
Jeżeli mamy dwie takie liczby, j ak np. 4 i 16, które mogą być powiązane równaniem 42 = .16, to definiujemy logarytm 16 o podstawie 4 jako wykładnik 2 i piszemy: 'L. l i , log4 16 —2.
i.
Na podstawie tego przykładu powinno być jasne, że logarytm jest niczym innym, jak tylko potęgą, do której należy podnieść podstawę (4), aby otrzymać pewną liczbę (16)..Ogólnie możemy stwierdzić, że: ■ : ra i; (10.12)
y=
o / = logt y,
co wskazuje, że logarytm y o podstawie b (oznaczony logj, y) jest potęgą, do jakiej trzeba podnieść b, aby osiągnąć wartość y. Z tego powodu następujący zapis jest poprawny, cho ciaż tautologiczny: b '^ y = y .
wykładnik t (niekoniecznie dodatni) taki, że y = b'. Ponadto, im większa jest wartość y, tym większe musi być r, co można zobaczyć na rys. 1Ó.2. Wyrażona w języku Iogarytmów monotoniczność funkcji wykładniczej implikuje, że każda dodatnia liczba y musi mieć jedyny logarytm t o podstawie ¿ > 1 taki, że im większe jest y, tym większy jest jego logarytm. W funkcji wykładniczej y = b' — jak pokazują rys. 10.1 i 10.2 — y musi być koniecznie dodatni, a w konsekwencji liczba ujemna lub zero nie mogą mieć logarytmu.
Logarytm dziesiętny i logarytm naturalny Podstawa logarytmu (¿ > 1 ) nie musi być ograniczona do jakiejś konkretnej liczby, ale w praktyce stosuje się powszechnie dwie liczby: 10 i e. Gdy podstawą jest 10, logarytm jest nazywany logarytmem dziesiętnym i oznaczany logl0 (lub, jeśli kontekst jest jasny, po prostu log). Jeśli natomiast podstawą jest e, to logarytm jest nazywany logarytmem naturalnym i oznaczany albo loge, albo ln (od słów: logarytm naturalny). Można też używać symbolu log (bez indeksu e), jeśli w danym kontekście nie prowadzi to do nieporozumień. Przykłady Iogarytmów dziesiętnych często stosowanych w obliczeniach są następujące: log10 1000 = 3
(gdyż 103 = 1000),
log10 100 = 2
(gdyż 102 = 100),
log10 10
= 1
(gdyż 101 = 10),
log10 1
=0
(gdyż 10° = 1 ),
logio 0,1 = - 1
(gdyż 1 0 -'= 0,1),
log10 0,01 = - 2
(gdyż 10-2 = 0,01).
Zauważmy, że istnieje ścisły związek między zbiorem liczb stojących tuż przed znakiem równości i zbiorem liczb po jego prawej stronie. Jest zatem oczywiste, że logarytm dziesiętny liczby większej od 10 i mniejszej od 100 będzie wynosił więcej niż 1 i mniej niż 2, a logarytm dziesiętny liczby większej od 1 i mniejszej od 10 będzie dodatnim ułamkiem itd. Dokładne wartości Iogarytmów można z łatwością odczytać z tablic Iogarytmów dziesiętnych lub obliczyć za pomocą kalkulatorów2. W rozważaniach analitycznych logarytmy naturalne okazały się jednak znacznie bardziej wygodne w użyciu niż logarytmy dziesiętne. Ponieważ z definicji logarytmu wynika związek: (10.13)
y = e' o ł = logey
(lu b / = lny),
więc jasne jest, że analityczna użyteczność e dla funkcji wykładniczych automatycznie rozszerza się na logarytmy o podstawie e. Następujące przykłady służą jako ilustracja Iogarytmów naturalnych: ln e3 = log,. e3 = 3, ln e2 = logc e2 = 2,
■: ■-■/■■i .'■*
Przy omawianiu funkcji wykładniczych podkreśliliśmy, że funkcja y = b’ (dla b > 1) jest monofonicznie rosnąca. Oznacza to, że dla każdej dodatniej wartości y istnieje jedyny
2 Wartość logarytmu, podobnie jak wartość e, może być obliczona (lub obliczona w przybliżeniu) na podstawie rozwinięcia funkcji logarytmicznej w szereg Maclaurina w sposób podobny do na szkicowanego w (10.6). Nie będziemy się tu jednak zagłębiać w te kwestie.
28 8 PROBLEMY OPTYMALIZACJI
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 289
Dowód tej reguły jest bardzo podobny do reguły I i dlatego pozostawiamy go Czytelnikowi jako ćwiczenie.
In e' = loge e1 = 1, ln 1 =log„ e° = 0, ln - = loge e_I = -1 . ■
-
e
Reguła III (logarytm potęgi) ln«“ = a ln « (« > 0 ).
Ogólna zasada3 wynikająca z tych przykładów jest taka, że dla danego wyrażenia e", gdzie n jest dowolną liczbą rzeczywistą, możemy automatycznie odczytać wykładnik n jako logarytm naturalny e”, a zatem ln e" = n. Logarytmy dziesiętny i naturalny mogą być nawzajem w siebie przekształcane, tzn. można zmieniać podstawę logarytmu tak samo, jak można było przekształcać podstawę wyrażenia wykładniczego. Po omówieniu podstawowych reguł dla logarytmów podamy kilka wzorów na zmianę podstawy.
Przykład 5. ln e 15 = 15 ln e = 15. Przykład 6. ln A3 = 3 ln A. Dowód. Z definicji eta“ = u i podobnie e k"'”= «“. Jednak można w następujący sposób utworzyć inńe wyrażenie dla «“: u“= (e1““)“ = ea]nu.
Reguły dla logarytmów Logarytmy mają naturę wykładników; podlegają wobec tego pewnym regułom blisko związanym z regułami dla wykładników podanymi w podrozdz. 2.5. Mogą one stanowić wielką pomoc przy upraszczaniu operacji matematycznych. Pierwsze trzy reguły są sfor mułowane w odniesieniu do logarytmów naturalnych, ale obowiązują również po zastąpieniu symbolu ln przez logb.
Reguła I (logarytm iloczynu) ln(«v) = ln u + ln v (u, v > 0). Przykład 1. ln(e6e4) = ln e6 + ln e4 = 6 + 4 = 10. Przykład 2. ln(Ae7) = lnA + ln e 7 = ln A + 7 . Dowód. Z definicji ln u jest potęgą, do jakiej trzeba podnieść e, aby osiągnąć4 wartość u, zatem e1”“ = n. Podobnie mamy eta>, = v i ew“v>= uv. To ostatnie jest wyrażeniem dla uv. Jednakże inne wyrażenie dla kv można otrzymać, mnożąc bezpośrednio u i v:
Przyrównując wykładniki w obu wyrażeniach dla u “, otrzymujemy pożądany wynik, czyli ln«" = a ln u. Te trzy reguły są pożyteczne przy upraszczaniu operacji matematycznych w pewnych typach zagadnień. Reguła I służy do przekształcania, za pośrednictwem logarytmów, operacji mnożenia (uv) w dodawanie (ln u + ln v). Reguła II przekształca dzielenie («/v) w odejmowanie ( ln « -ln v ). Reguła m pozwala na zredukowanie potęgi do stałej multiplikatywnej. Ponadto reguły te mogą być stosowane łącznie. Przykład 7. ln(«v“) = ln « + ln v “ = ln« + aln v . Uprzedzamy jednak, że gdy na początku mamy wyrażenie addytywne, to logarytmy nic tu nie pomogą. W szczególności należy pamiętać, że: ln(« ± v) ^ ln u ± ln v. Wprowadźmy teraz dwie dodatkowe reguły związane ze zmianą podstawy logarytmu.
uv = elll“e,IU' = eln“+lliv. Porównując zatem oba wyrażenia dla uv, otrzymujemy; e ta(uv) _ glnu + lnw
Ju b
Reguła IV (zmiaiia podstawy logarytmu) log,, u = (log,, e) (log,, u) (u > 0).
l n ( « v ) = fil M + fil V.
Reguła ta, która przypomina nieco regułę łańcuchową (zwróćmy uwagę na „łańcuch” Reguła U (logarytm ilorazu) ln(«/v) = ln u - ln v (u, v > 0).
/* e \i ? u \ b e J, umożliwia nam otrzymanie logarytmu logew(o podstawie e) z logarytmu log4« (o podstawie b) i vice versa.
Przykład 3. ln(e2/c) = ln e2 - ln c = 2 - ln c.
Dowód. Niech u = ep, tak iż p = log„«. Wynika stąd, że:
Przykład 4. ln(e2/e5) = ln e2 - lne5 = 2 - 5 = -3 .
log* u = log,, t p = p log,, e = (loge u) (log,, e). Reguła IV może być z łatwością uogólniona do:
3 Zapamiętajmy jako zasadę mnemotechniczną, że gdy symbol ln (lub lo g j stoi po lewej stronie wyrażenia e”, to symbol ln skraca się jak gdyby z symbolem e, pozostawiając n jako odpowiedź. 4 Gdy e podnosimy do potęgi ln«, wówczas symbole e i ln „skracają się” , pozostawiając u.
logt « = (log4c)(logc«), gdzie c jest pewną podstawą inną niż b. 19 — Podstawy...
290 PROBLEMY OPTYMALIZACJI
Reguła V (odwracanie podstawy logarytmu) log^e = loge/T
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 291
co jest liniowym równaniem względem zmiennej x, które ma rozwiązanie: ■
Reguła ta, przypominająca regułę różniczkowania funkcji odwrotnej, umożliwia nam otrzymanie logarytmu b o podstawie e natychmiast, gdy tylko dany jest logarytm e o podstawie b i vice versa (reguła ta może być również uogólniona do postaci log,,c= l/logcb).
logc - log a x = --------------- . log b
-
'
Ćwiczenie 10.3 Dowód. Niech u = b; wtedy mamy: logt b = (logt e) (loge b). Wyrażenie po lewej stronie jest równe logbb = 1, a zatem log6e i logcb muszą być wzajemnymi odwrotnościami, co stwierdza reguła V. Z ostatnich dwu przykładów łatwo otrzymać następującą parę wzorów na zamianę Iogarytmów dziesiętnych na naturalne i na odwrót: (10 14)
logiow =(1°gioe) 0 °g eN) = 0,4343 logt N, lo g 'N = (log, 10) (log10N) = 2,3026 log10N,
2. Oblicz wartości następujących wyrażeń: (a) ln e2; (c) ln (l/e3); (e) (eto3)!; (b) log.e-4; (d) loge(l/e 2); (f) l n e * - e taL 3. Oblicz wartość następujących wyrażeń, stosując reguły dla Iogarytmów: (a) log10(100)14; (d) lnAe2;
dla dodatniej liczby rzeczywistej N. Pierwszy znak równości w obu wzorach można łatwo uzasadnić za pomocą reguły IV. W pierwszym wzorze wartość 0,4343 (logarytm dziesiętny 2,71828) można znaleźć w tablicy Iogarytmów dziesiętnych lub obliczyć za pomocą kalkulatora; w drugim wartość 2,3026 (logarytm naturalny 10) jest po prostu odwrotnością 0,4343 obliczoną na podstawie reguły V. Przykład 8. log^ 100 = 2,3026Qog10100) = 2,3026 ■2 = 4,6052. log10100 = 0,4343(loge 100) = 0,4343 • 4,6052 = 2.
1. Oblicz wartości następujących Iogarytmów: (a) log1010000; (c) log381; (b) log100,0001; (d) log53125.
Odwrotnie mamy:
(W log 10 i^o ’
kiABe"4;
(c) ln(3/B);
(f) (log4 e)(loge 64).
4. Które z następujących równości są prawdziwe: (a) ln « - 2 = ln —; t e3 (b) 3 + ln v = ln —; v
(c) lnM + l n v - l n w = ln — ; w ■ (d) ln 3 + ln 5 = ln 8 .
5. Udowodnić, że ln(n/v) = ln u - ln v.
Zastosowanie Powyższe reguły dla Iogarytmów umożliwiają rozwiązywanie pewnych prostych równań wykładniczych (w których funkcje wykładnicze przyrównane są do zera). Na przykład, jeśli chcemy znaleźć wartość x spełniającą równanie: a b * -c = 0
(a, b, c> 0),
to możemy najpierw spróbować przekształcić to równanie wykładnicze — za pomocą Iogarytmów — w równanie liniowe, a następnie rozwiązać je w tej postaci. W tym celu należy najpierw przenieść na prawą stronę składnik c:
10.4. FUNKCJE LOGARYTMICZNE Gdy pewna zmienna jest wyrażona jako funkcja logarytmu innej zmiennej, otrzymaną funkcję nazywamy funkcją logarytmiczną. Widzieliśmy już dwie wersje tego typu funkcji w (10.12) i (10.13), a mianowicie: t = logi,y
i
f = logey (=lny),
które różnią się od siebie tylko podstawą logarytmu.
a tf-c . Chociaż nie mamy prostego wyrażenia logarytmicznego dla różnicy (a lf - ć), mamy jednak wygodne wyrażenie logarytmiczne oddzielnie dla wyrażenia multiplikatywnego ab* i dla c. Zatem po przeniesieniu c i po zlogarytmowaniu (powiedzmy, przy podstawie 10) obu stron równania otrzymujemy: logo + rlo g i) = log c,
Funkcje logarytmiczne i wykładnicze Jak wcześniej stwierdziliśmy, funkcje logarytmiczne są funkcjami odwrotnymi pewnych funkcji wykładniczych. Jeśli zbadamy powyższe dwie funkcje logarytmiczne, to upewnimy się, że są one rzeczywiście odpowiednio funkcjami odwrotnymi funkcji wykładniczych: y = b'
i
y = e‘,
292 PROBLEMY OPTYMALIZACJI
ponieważ podane funkcje logarytmiczne są wynikiem odwrócenia ról zmiennych zależnych i niezależnych w odpowiednich funkcjach wykładniczych. Czytelnik powinien oczywiście zdawać sobie sprawę, że symbol t jest tu użyty jako ogólny symbol i nie musi koniecznie oznaczać czasu. Nawet jeśli go oznacza, jego występowanie w roli zmiennej zależnej świadczy o tym, że czas jest określony przez pewną zmienną y; znaczy to jedynie, że dana wartość y jest związana z jedynym punktem w czasie. Funkcje logarytmiczne — jako funkcje odwrotne funkcji monofonicznie rosnących (wykładniczych) — również muszą być monofonicznie rosnące, co jest zgodne z naszym wcześniejszym stwierdzeniem, że im większa liczba, tym większy jest jej logarytm o dowolnej podstawie. Własność tę można wyrazić symbolicznie w postaci dwu następujących stwier dzeń. Dla dwu dodatnich wartości y (yl i yf): (10.15)
lny, = lny2 o y ,= y 2, ln y ,> ln y 2 o y ,> y 2;
stwierdzenia te są również prawdziwe, jeśli ln zastąpimy przez logt .
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 293
dodatnią dziedzinę (ograniczenie dotyczące dziedziny funkcji logarytmicznej jest oczywiście po prostu innym sposobem powiedzenia, że tylko dodatnie liczby mają logarytmy). Po trzecie, ponieważ y = e' przecina oś pionową w punkcie y = 1, więc funkcja logarytmiczna / = logey musi przecinać oś poziomą w punkcie y = 1, co wskazuje na to, że logt 1 = 0 . Ponieważ na ten punkt przecięcia z osią poziomą nie wpływa zmiana podstawy logarytmu (np. również logio 1 = 0), więc możemy wnioskować z ogólnego kształtu krzywej logarytmicznej na rys. 10.3(b), że dla dowolnej podstawy:
(10.16)
0 l
log y < 0, log y —0, lo g y > 0 .
W celu weryfikacji możemy sprawdzić dwa zestawy przykładów logarytmów dziesięt nych i naturalnych podane w podrozdz. 10.3. Ponadto możemy zauważyć, że: (10.16')
lo g y -> t
t,
gdy
y —» 0+.
Postać graficzna Monotoniczność i inne ogólne własności funkcji logarytmicznych mogą być z łatwością zaobserwowane na wykresie. Dla danego wykresu funkcji wykładniczej y = e' możemy otrzymać wykres odpowiedniej funkcji logarytmicznej przez narysowanie pierwotnego wykresu z zamienionymi osiami. Wynik takiego sporządzania wykresów jest pokazany na rys. 10.3. Zauważmy, że gdybyśmy nałożyli diagram (b) na diagram (a), z osią y nałożoną na oś y i osią t nałożoną na oś t, wówczas oba wykresy dokładnie pokrywałyby się. W takiej postaci, w jakiej są przedstawione na rys. 10.3 — z zamienionymi osiami — dwie krzywe są symetryczne względem prostej przechodzącej przez początek układu współrzędnych i na chylonej pod kątem 45° do osi (tak jak to powinno być dla wykresów dowolnej pary funkcji odwrotnych). Ta symetria ma różne, godne uwagi implikacje. Po pierwsze, chociaż obie funkcje są monofonicznie rosnące, to jednak krzywa logarytmiczna rośnie i ma malejące tempo wzrostu (druga pochodna jest ujemna), a krzywa wykładnicza rośnie w rosnącym tempie. Po drugie, funkcja wykładnicza ma dodatni zbiór wartości, a funkcja logarytmiczna ma zamiast tego
Graficzne porównanie funkcji logarytmicznej i wykładniczej na rys. 10.3 jest oparte na prostych funkcjach y = e' i / = ln y. Ten sam ogólny wynik wystąpi, jeśli porównamy uogólnioną funkcję wykładniczą y = A t" z odpowiadającą jej funkcją logarytmiczną. Są tu (dodatnie) stałe A i r, które powodują zwężanie lub rozszerzanie krzywej wykładniczej; będzie ona jednak przypominać ogólny zarys z rys. 10.3(a), z tą różnicą, że będzie przecinać oś pionową w punkcie y = A, a nie w punkcie y = 1 (gdy t = 0, mamy y = Ae° = A). Jej funkcja odwrotna musi przecinać oś poziomą dla y = A. Ogólnie, funkcja logarytmiczna od powiadająca funkcji wykładniczej będzie jej symetrycznym odbiciem względem prostej przechodzącej przez początek układu współrzędnych i nachylonej pod kątem 45° do osi. Jeśli potrzebne jest konkretne wyrażenie algebraiczne określające odwrotność y = A t" , można je otrzymać poprzez zlogarytmowanie obu stron wzoru funkcji wykładniczej (co zgodnie z pierwszym stwierdzeniem z (10.15) nie naruszy^ równości) i rozwiązanie względem t: ln y = lń (Ae ") = ln A + rt ln e = ln A + ri, a zatem: (10.17)
In y -Jn A t = ------------r
(r* 0 ).
Wynik ten, czyli funkcja logarytmiczna, stanowi odwrotność funkcji wykładniczej y = Aert. Jak postulowano wcześniej, funkcją (10.17) przecina oś poziomą W punkcie y = A. Ponieważ y = A, więc lny = lnA, a zatem / = 0.
Zmiana podstawy
Rysunek 103
W podrozdz. 10.2 stwierdzono, że funkcja Wykładnicza y = A b' może zawsze być przekształ cona W naturalną funkcję wykładniczą y = A t". Jesteśmy teraz przygotowani do wy prowadzenia wzoru na taką zmianę. Jednak zamiast A b' rozważymy przekształcenie
294 PROBLEMY OPTYMALIZACJI
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 2 9 5
ogólniejszego wyrażenia A b a w Ae". Ponieważ istotą problemu jest znalezienie r dla danych wartości b i c takich, że: er = bc, niezbędne jest więc wyrażenie r jako funkcji b i c. Zadanie to można łatwo wykonać, logarytmując obie strony równania:
Widać od razu, że lewa strona jest równa r, tak więc otrzymujemy żądaną funkcję (wzór na zamianę zmiennej): r = ]nbc = cln b ,
/=
ln2
lny,
jednak na podstawie (10.19) możemy ją również wyrazić jako / = (1/0,6931) lny.
co oznacza, że funkcja y = A b cl może zawsze być zapisana w postaci naturalnej funkcji wykładniczej y = A e
/ = a (log* e) (log, cy) = —^— logc(cy) = -^ -ln (cy)log,o Ino Przykład 3. Przekształcić funkcję t= log2y w postać funkcji logarytmu naturalnego. Ponieważ w tym przykładzie mamy b = 2 i a = c = 1, szukana funkcja jest równa:
ln er = ln bc.
(10.18)
Stosując tę samą procedurę, możemy przekształcić bardziej ogólną funkcję logarytmicz n ą / = a log* (cy) do postaci równoważnej :
ln 2 = 2,3026 log102 = 2,3026 ■0,3010 = 0,6931.
Teraz wcześniejszy wynik możemy wyrazić jako y = e0,6” 1'.
Przykład 4. Przekształcić funkcję t = 71og102y w naturalną funkcję logarytmiczną. Wartości stałych są w tym przypadku równe a = 7, b - 10 i c = 2; w konsekwencji szukaną funkcją jest: t=
7 ln 10
ln 2y, 7
ale ponieważ ln 10 = 2,3026 (jak wskazuje wzór (10.14)), więc powyższą funkcję można zapisać ja k o / = (7/2,3026) ln 2y = 3,0400 ln2y. W powyższych rozważaniach stosowaliśmy zasadę wyrażania t jako funkcji y, gdy funkcja jest logarytmiczna. Jedynym powodem takiego postępowania jest pragnienie podkreślenia związku między funkcjami wykładniczą i logarytmiczną. Gdy funkcja logaryt miczna jest badana samodzielnie, będziemy pisać y = ln / (a nie / = lny), zgodnie ze zwyczajem. Naturalnie taka zamiana symboli nie zmienia analitycznej strony rozważań.
Przykład 2. Przekształcić y = 3 • 521w naturalną funkcję wykładniczą. W tym przykładzie A = 3,/> = 5 i c = 2, więc wzór (10.18) daje r - 2 ln 5. Wobec tego szukana funkcja jest równa:
Ćwiczenie 10.4
y = Ae" = 3e(2to5)'. Ponownie, jeśli chcemy, to możemy obliczyć, że: 2 ln 5 = ln 25 = 2,3026 log1025 =2,3026 • 1,3979 = 3,2188, tak że wcześniejszy wynik można wyrazić również jako y = 3ewl88'. Jest oczywiście również możliwe przekształcenie funkcji logarytmicznych postaci t = log*y w równoważne naturalne funkcje logarytmiczne. W tym celu wystarczy zastosować regułę IV dla Iogarytmów, którą można wyrazić jako:
2. a. Naszkicować wykres funkcji wykładniczej y = Ae"; wskazać wartość funkcji w punkcie przecięcia z osią y. b. Naszkicować wykres funkcji logarytmicznej t = —^
r
i
wskazać jej wartość
w punkcie przecięcia z osią poziomą.
log* y = (log* e)(logey).
3. Znaleźć funkcję odwrotną do y = aba.
Bezpośrednie zastosowanie tego wyniku do danej funkcji logarytmicznej natychmiast daje szukaną naturalną funkcję logarytmiczną: t = logi,y = (log* e) (logcy) = — logey = loge O lny =— . Ino
1. Postać funkcji odwrotnej doy = Ae" w (10.17) wymaga, aby r było różne od zera. Jaki jest sens tego wymagania dla pierwotnej funkcji wykładniczej y = Ae" ?
[na mocy reguły V dla Iogarytmów]
4. Przekształcić następujące funkcje do postaci naturalnej funkcji wykładniczej: (a) y = 83'; ( c ) y = 5 - 5 '; (b) y = 2 ■T2'; (d) y = 2 • 154'. 5. Przekształcić następujące funkcje do postaci naturalnych Iogarytmów: (a) / = log7y; (c) / = 31ogls9y; (d) i = 21og10y. (b) t = log8 3y;
2 9 6 PROBLEMY OPTYMALIZACJI
6.
Znaleźć roczną nominalną stopę procentową (r) przy kapitalizacji ciągłej równoważną stopie procentowej przy kapitalizacji dyskretnej (i) równej: (a) 5% rocznie przy kapitalizacji rocznej, (b) 5% rocznie przy kapitalizacji co pół roku, (c) 6% rocznie przy kapitalizacji co pół roku, (d) 6% rocznie przy kapitalizacji co kwartał.
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 297
Ponieważ n może być dowolną liczbą, dla której jest zdefiniowany logarytm, możemy uogólnić ten wynik i napisać: / '( / ) = d (ln /)/d / = j , co kończy dowód reguły dla Iogarytmów.
Reguła dla funkcji wykładniczej 10.5. POCHODNE FUNKCJI WYKŁADNICZEJ I LOGARYTMICZNEJ Wcześniej stwierdzono, że funkcja e' jest swą własną pochodną. Jak się okazuje, naturalna funkcja logarytmiczna ln / również ma dosyć prostą pochodną, mianowicie d (ln /)/d /= l/t. Ten fakt wzmacnia nasze preferencje dla e jako podstawy funkcji wykładniczej i logarytmicz nej. Udowodnimy teraz prawdziwość tego stwierdzenia, a następnie wyprowadzimy wzory na pochodne dla pewnych wariantów wyrażeń wykładniczych i logarytmicznych e' i ln/.
Pochodna funkcji y = e ' jest równa: d — e' = e'. d/
Wynik ten można łatwo wyprowadzić z reguły dla Iogarytmów. Wiemy,żefun odwrotną do funkcji y = e 'je s t / = ln y,która ma pochodną d//dy l/y . Zatem na podstawie reguły dla pochodnej funkcji odwrotnej możemy natychmiast napisać: _d_e ' = . ^ = _ ! _ = _ L = d/ d/ d//dy l/y ^
Reguła dla funkcji logarytmicznej Pochodna funkcji logarytmicznej y = ln / jest równa: d, i — ln / = - . d/ /
Uogólnienie reguł Powyższe dwie reguły mogą być uogólnione na przypadki, gdy zmienna / w wyrażeniu e' i ln / są zastąpione przez pewną funkcję /, np. f (/). Uogólnione wersje dwu reguł są takie:
Aby to udowodnić, przypomnijmy, że z definicji pochodna y = /( /) = ln / ma następującą wartość dla / = N: ,. m - m l n t - l n N ,. ln (t/N) / (IV) = lim -------------- = lim ------------ = lim — . <-»* t - N i-+n t-N >->* t - N [na podstawie reguły II dla Iogarytmów] N . l m Wprowadźmy skrótowe oZńaćzenje m = ------- . Teraz mozęmy zapisać — — = -— oraz t-N t-N N — = 1 + — —= 1 + — . Zatćm wyrażenie po prawej stronie znaku równości w powyższym N N m Wzorze można przekształcić do postaci: U 1 ff ' 11 > ^\,n 1 , 1 m , [na mocy reguły HI dla Jogaiytmów] 1+ — : ln — = — lh t- N N N m) Zauważmy, że gdy / dąży do N, wówczas m dąży do nieskończoności. Aby zatem znąleźć szukaną wartość pochodnej, możemy w tym ostatnim wyrażeniu przejść do granicy przy
- A e /(,) = / '( / ) e/(,) dZ .
d du lub — e “ = e “ — d/ x d/ /
d/
' d 1 dvA lub — ln v = ----- — d/ v d/
( 10.20)
/(/)
Aby udowodnić (10.20), wystarczy bezpośrednio zastosować wzór na pochodną funkcji złożonej. Dla danej funkcji y = e /(,) możemy najpierw przyjąć u = /( / ) , tak iż y = e \ Wtedy, na mocy wzoru na pochodną funkcji złożonej, otrzymujemy pochodną: A e/w = A e - = A e “ — = e “ — = e/(,)/'( / ) . dr dr du d/ dr Podobnie dla funkcji y = ln /(/) możemy najpierw przyjąć v = / ( / ) , aby utworzyć funkcję złożoną y = ln v, gdzie v = /( /) . Wtedy ze wzoru na pochodną funkcji złożonej otrzymujemy: d d d dv 1 dv 1 — In/ ( / ) = — lnv = - —lnv — = -------- = -------/ (/). d/ dv d/ v d // ( / ) d / JK
J
Zauważmy, że jedyną istomą różnicą między (10.20) a prostszymi regułami d e '/d / = e' i d (ln /)/d /= l / t jest czynnik/ '( / ) .
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 299
298 PROBLEMY OPTYMALIZACJI
d ~— b' = b '] n b , dt
Przykład 1. Znaleźć pochodną funkcji y = e". Tutaj wykładnik jest równy r t= f( t) , w ięc/'(Z ) = r ; zatem:
( 10.21)
dy d — = — e = re . d Z di
d
d.v d — = — e ' = -e dz dz
■
_
W szczególnym przypadku dla podstawy e (gdy b = e) mamy ln 6 = ln e = 1,tak iż te dwie pochodne sprowadzą się odpowiednio do (d/dZ)e' = e ' i (d /d /)ln /= 1/Z. Dowody dla (10.21) nie są trudne. W przypadku b ' dowód opiera się na tożsamości b = etoŁ, która umożliwia nam zapisanie: >.
Przykład 3. Znaleźć dy/dZ dla funkcji y = Ina/. Ponieważ w tym przypadku/ ( / ) = at, czyli / '( / ) = u, więc pochodna jest równa: d u l — lnn/ = — = —; dt at t co ciekawe, jest identyczna z pochodną y = ln /. Ten przykład pokazuje, że stała pomnożona przez / wewnątrz wyrażenia logarytmicz nego znika podczas różniczkowania. Zauważmy, że dla stałej k mamy: d , d k — fcln/ = A:— ln / = —, dt dt t
b* =
= e ,lnb
(piszemy tla b zamiast In ¿-Z, aby podkreślić, że f nie jest częścią logarytmowanego wyrażenia); zatem: ■ ± * ' = - V * = in * .e '“ »= df df = ] n b b ' = b']nb.
[z (10.20)]
Aby udowodnić drugą cżęść (10.21), skorzystamy z podstawowej własności logarytmów: logŁZ= log,, e ■log, Z= X - l n Z, Ino
na zewnątrz wyrażenialogarytmicznego jest zachowana w trakcie
Przykład 4. Znaleźć pochodną funkcji y = ln /c. Dla f ( t ) = t c i / ' ( / ) = c/c_1 wzór (10.20) daje: c t‘~l d — In tc = dt tc
1
d 7 ,o s* " 7 E T
Przykład 2. Znaleźć dy/d/ dla funkcji y = e"'. W tym przypadku / ( / ) = - / , więc /'(Z ) = -1 . W rezultacie:
zatem stała pomnożona różniczkowania.
T d uw aga:— b ' * t b ' x 6 df
która prowadzi do pochodnej: d d I1 d d , . 1 . "l 1 T lN — logjZ = — -— -— ln/ =---dz dz lni> ‘n( lnb dz lnł> Ogólniejsze wersje tych dwu wzorów są następujące:
r
— fe/(0 = / '( / ) b™ ]nb, dt
t ( 10.2 1 ')
Przykład 5. Znaleźć dy/d/ dla y = z3ln /2. Ponieważ ta funkcja jest iloczynem dwu czynników z3 i ln /2, trzeba skorzystać ze wzoru na pochodną iloczynu: Ponownie widać, że jeśli b = e, to ln b = 1 i wzory te zredukują się do (10.20).
; X = / 3 A l n / 2 + ln /2 A /3 = df dl dz
Przykład 6. Znaleźć pochodną funkcji y = 12'~'. Tutaj b = 12,/(z ) = 1 - / , / ' ( / ) = - 1 ; zatem:
= /3 -=- + ( ln /2) ( 3 /2) = = 2 z2 + 3 Z2 (2 ln Z) =
[reguła III dla logarytmów]
dy — = - 1 2 '- 'l n l2 . dz
= 2z2(l+ 3 1 n z ).
Przypadek, gdy podstawa jest równa b Dla funkcji wykładniczych i logarytmicznych o podstawie b pochodne są równe:
Pochodne wyższych rzędów Wyższe pochodne funkcji wykładniczej i logarytmicznej, podobnie jak dla innych typów funkcji, są po prostu wynikiem powtórnego różniczkowania.
3 0 0 PROBLEMY OPTYMALIZACJI
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 301
Przykład 7. Znaleźć drugą pochodną y - b ' (dla b > 1). Pierwsza pochodna — według (10.21) — jest równa y '(/) = fc'lnfc (gdzie ln b jest oczywiście stalą); zatem różniczkując ją jeszcze raz względem /, otrzymujemy;
dy
7*+ 6
dx
x{x + 3) (2 * + 1)
— b' lD.b = ( b ' l n b ) l n b = b '( k ib )2. dt
at
Przykład 8. Znaleźć drugą pochodną y = ln/. y ' = 1// = r 1; zatem druga pochodna jest równa:
y=
7 *+ 6
Zwróćmy uwagę, że y = b' jest zawsze dodatnie i ln b (dla b > 1) jest również dodatnie (z (10.16)), zatem y'(/) = b ’\n b też musi być dodatnie. Również y"(/), równe iloczynowi b 1 i kwadratu pewnej liczby, musi być dodatnie. Te fakty potwierdzają nasze poprzednie stwierdzenie, że funkcja wykładniczay = b ' rośnie monofonicznie w coraz szybszym tempie.
- -- r
pochodną:
x (Jx + 6)
*(;c + 3)(2;c+ 1) (x + 3)(2x+ 1)
(x + 3)2(2* + l ) 2 ‘
Przykład 10. Znaleźć dy/At dla y = x at kx~c. Biorąc logarytm naturalny obu stron, otrzymujemy: ln y =-a ln x + ln zkx~c = a ln x + kx - c .
Pierwsza pochodna jest równa "2
Różniczkując obie strony względem x i stosując (10.20), otrzymujemy:
-1 ,2 ' y ar
Ponieważ dziedzina tej funkcji to otwarty przedział (0, °°), więc y ' = l // musi być liczbą dodatnią. Z drugiej strony y " jest zawsze ujemny. Te dwa wnioski razem wzięte potwierdzają nasze poprzednie zapewnienia, że funkcja logarytmiczna y = ln / rośnie mono fonicznie w malejącym tempie.
dy
dx
x r a — +k X \ y
r
a
\
y = —x + k V
,
/
Ćwiczenie 10.5 Zastosowanie
-
Jedną z głównych zalet logarytmu jest jego „zdolność” przekształcania mnożenia w dodawa nie i dzielenia w odejmowanie. Ta własność może być wykorzystana, gdy trzeba zróżnicz kować skomplikowany iloczyn lub iloraz funkcji dowolnego typu (niekoniecznie wykład niczych lub logarytmicznych). Przykład 9. Znaleźć dy/d* dla funkcji:
C* + 3 )(2 ;c + l) Zamiast stosować wzory na pochodną iloczynu i ilorazu, możemy najpierw obliczyć logarytm naturalny obu stron równości, co pozwala sprowadzić funkcję do postaci: lny = Ino:2 - ln (x + 3) - ln (2x + 1). Zgodnie z (10.20) pochodne lewej i prawej strony względem x są równe: d — (lewa strona) d*
1 dy --------, y dr
d 2x — (prawa strona) = — d* x
1 x +3
lx + 6 = ----------. 2x + 1 x(x + 3) (2 x + 1 )
Gdy przyrównamy dwa wyniki i pomnożymy obie strony przez y, otrzymamy szukaną
1.
Znaleźć pochodne (a) y = e2,+4; (b) y = e1-7'; (c) y (d) y = 3e2- ' 2;
funkcji: (e) y = c ^ 2+bx+c\ (f) y = x t z \ (g) y = x 2e 2*\ '. (h) y = a x e bx+c.
2. a. Sprawdzić pochodną z przykładu 3 za pomocą równania ln a t = ln a + lnt. b. Sprawdzić wynik z przykładu 4, stosując równanie ln t c = c ln /. 3. Znaleźć pochodne funkcji: (a) y = ln 8 /5; (e) y = l n ;c - ln ( l + x ); (b) y = ln n /<:; * (f) y = l n [ a : ( l - j:)8]; (c) y = ln (/ + 9);
(g)
y = ln
(d) y = 5 1n(/+ l) 2;
(h)
y = 5x4ln x 2.
l+ x
4. Znaleźć pochodne funkcji: (a) y = 5'; (d) y = log77j:2; (b) y = log2( / + l ) ; (e) y = log2(8jc2 + 3); (c) y = 1 3 2,+3; (f) y = x 2logjX. 5. Udowodnić dwa wzory podane w (10.21')6. Pokazać, że funkcje V = A e" (A, r> 0) i funkcja A = Ve~rt (V, r> 0) są monofoniczne, ale jedna rośnie, a druga maleje, oraz że obie są ściśle wypukłe (por. ćwiczenie 10.2-5).
\ \
30 2 PROBLEMY OPTYMALIZACJI
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE
303
\ 7. Znaleźć pochodne następujących funkcji, obliczając najpierw logarytm naturalny obu stron:
Warunki maksymalizacji W arunkiem pierwszego rzędu dla maksymalizacji A jest, aby dA/dt = 0. W celu znalezienia
(a) y = t , n\~r , ^ T’ (x + 2) (x + 4)
^
y = {x2 + 3)exZ+l.
10.6. OPTYMALNY WYBÓR MOMENTU DZIAŁANIA
tej pochodnej możemy albo bezpośrednio zróżniczkować (10.22') względem i, albo zrobić to pośrednio: najpierw obliczyć logarytm naturalny obu stron (10.22') i potem różniczkować względem t. Zilustrujemy tę ostatnią procedurę. Najpierw z (10.220 otrzymujemy równanie: lnA (f)= lnK + In e^~" = ln K + U - r t ) . Po zróżniczkowaniu obu stron względem t otrzymujemy: 1 dA _ 1
To, czego się nauczyliśmy o funkcjach wykładniczych i logarytmicznych, możemy teraz zastosować do pewnych prostych przykładów optymalnego wyboru momentu działania.
_
~ A ~ d t~ 1l t
r'
dA
>
czyli:
Problem przechowywania wina Przypuśćmy, że pewien kupiec ma pewną ilość (np. beczkę) wina, które może albo sprze dać teraz (/ = 0) za sumę K doi., albo przechowywać przez pewien okres, a potem sprzedać po wyższej cenie. Wiadomo, że rosnąca wartość (V) wina jest następującą funkcją czasu:
dt
Y l _A
= A —/ 2- r
U
)
.
Ponieważ A # 0, warunek d A /d t = 0 może być spełniony wtedy i tylko wtedy, gdy: 1 -i.
—t 2= r,
2
. . 1 czyli — = = r, 2 /7
czyli
1
r—
— = jt.
2r
Wynika stąd, że optymalna długość okresu przechowywania jest równa: (10.22)
V = KeF
[=K exp { t %
jeśli t = 0 (sprzedaż już teraz), to V = K. Zadanie polega na zbadaniu, kiedy kupiec powinien sprzedać wino, aby zmaksymalizować zysk, przy założeniu, że koszty magazynowania są równe zeru5. Ponieważ koszt wina jest kosztem „utopionym” (już za nie zapłacono) i ponieważ zakłada się, że nie istnieje koszt magazynowania, maksymalizowanie zysku jest tym samym, co maksymalizowanie przychodów ze sprzedaży, czyli wartości V. Jest tu jednak jeden kłopot. Każda wartość V odpowiada konkretnemu /; reprezentuje więc sumę dolarów, którą można otrzymać w określonym dniu i — ze względu na odsetki — nie jest bezpośrednio porównywalna z wartością V w innym dniu. Wyjściem z tej trudnej sytuacji jest dyskontowanie każdej wartości V do równoważnej jej obecnej wartości (wartość w dniu t = 0), gdyż wtedy wszystkie wartości V będą porównywalne. Załóżmy, że stopa oprocentowania przy ciągłej kapitalizacji jest ustalona na poziomie r, wtedy — zgodnie z (10.11) — bieżąca wartość V może być wyrażona jako: (10.220
A (t) = VeTrl = Ke^e~r‘ =
gdzie A , które oznacza bieżącą wartość V, samo jest funkcją t. Zatem nasze zagadnienie sprowadza się do znalezienia wartości maksymalizującej A.
5 Uwzględnienie kosztu magazynowania spowodowałoby trudności, z jakimi na razie nie możemy sobie poradzić. W rozdz. 13 powrócimy do tego zagadnienia.
1V <2r)
1 4 r2 *
jeśli np. r = 0,10 to 7= 25 i kupiec powinien przechowywać beczkę z winem przez 25 lat. Pamiętajmy, że im wyższa jest stopa procentowa (stopa dyskontowa), tym krótszy będzie optymalny czas przechowywania. Warunek pierwszego rzędu 1 /2 /7 = r ma łatwą interpretację ekonomiczną Wyrażenie po lewej stronie reprezentuje stopę wzrostu wartości wina V, ponieważ z (10.22) wynika: — = — Kexp (/i) = K — exp (/?) = dt dt dt
[K jest stałe]
= K ^ fż je * p (/ż )=
[z (10.20)]
= ^ Ir4 jv ,
[z (10.22)]
tak więc stopa wzrostu V rzeczywiście jest równa wyrażeniu po lewej stronie w warunku pierwszego rzędu: r=
dV/dt 1 1 1 — = — t 2= 2 2 /7 '
Wyrażenie po prawej stronie jest natomiast stopą oprocentowania lub stopą wzrostu przy ciągłej kapitalizacji takiej sumy pieniędzy, jaką można by otrzymać, gdyby udało się sprzedać wino natychmiast. Dla zagadnienia przechowywania wina jest to koszt utraconych możliwości.
j
304 PROBLEMY OPTYMALIZACJI
Zatem przyrównanie tych dwu stóp, jak pokazano na rys. 10.4, oznacza próbę magazynowania wina dopóty, dopóki zyski z przechowywania nie znikną zupełnie, tzn. czekania do momentu, gdy (malejąca) stopa wzrostu wartości wina nie zrówna się ze (stałą) stopą oprocentowania uzyskaną z wpływów ze sprzedaży.
^
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 305
Należy wyznaczyć optymalny termin wyrębu lasu przy założeniach, że stopa dyskontowa jest równa r (ciągła) i podczas wzrostu lasu nie są ponoszone żadne koszty. Tak jak w zagadnieniu dotyczącym wina, powinniśmy najpierw sprowadzić V do jej bieżącej wartości: \ •■ A (0 = Ve-r' = 2/7e-", zatem: lnA = l n 2 ^ + ln e 'f’ = J T \ n 2 - r t = t lr2\ n 2 - r t . Aby zmaksymalizować A, musimy ustalić dA /d/ = 0. Pierwszą pochodną można otrzymać, różniczkując lnA względem / i mnożąc następnie przez A: 1 ^ = —r 1 1/2, I/2h io2 - r , A dt 2 zatem: dt
U JT
Ponieważ A ^ 0, warunek d A /d t = 0 może być spełniony wtedy i tylko wtedy, gdy: ln2
ijT Następnym krokiem jest sprawdzenie, czy wartość 7 spełnia warunki drugiego rzędu dla maksymalizacji A. Druga pochodna A jest równa:
d 2A
, d fl
d t2'
A d / b i 2 r)
t
'i
(
\ _£\
-A
41 V
4 /7 '
Ponieważ A > 0, więc wartość drugiej pochodnej obliczona w punkcie 7> 0 jest ujemna, co upewnia nas, że rozwiązanie 7jest rzeczywiście wartością maksymalizującą zysk.
Zagadnienie wyrębu lasu Podobny problem wyboru najlepszego terminu dla realizacji przedsięwzięcia możemy rozpatrywać na przykładzie wyrębu lasu w celu sprzedaży drewna. Załóżmy, że wartość lasu jest następującą rosnącą funkcją czasu: . V = 2 /7, wyrażoną w tysiącach dolarów.
i— ln2 4t ~
2r
W konsekwencji optymalna liczba lat wzrostu lasu jest równa:
/=
d2A d (1 i > ' d ( l _! W l )d A r = — A - / 2 - r = A — - / 2- r + - / 2- r \— . d t2 d / 1,2 ) d / 1,2 J 1,2 J dt Ponieważ ostatni składnik znika, gdy obliczamy wartość drugiej pochodnej w punkcie równowagi (w punkcie optimum), gdzie dA/dr = 0, więc pozostaje nam:
. czyli
r= r,
ln 2 V 2r) '
Z rozwiązania tego wynika, że im wyższa jest stopa dyskontowa, tym wcześniej należy dokonać wyrębu lasu. Aby upewnić się, że 7jest rozwiązaniem maksymalizującym (a nie minimalizującym), trzeba sprawdzić warunek drugiego rzędu. Pozostawiamy to Czytelnikowi jako ćwiczenie. W tym przykładzie abstrahowaliśmy od kosztów sadzenia lasu, zakładając, że drzewa są już zasadzone, w kjórym to przypadku „utopiony” koszt sadzenia można wykluczyć z rozważań dotyczących decyzji optymalizacyjnych. Jeśli decyzja nie dotyczy terminu wy rębu lasu, lecz problemu, czy w ogóle sadzić las, to koszty sadzenia (poniesione obecnie) muszą być porównane z obecną wartością produkcji drewna, obliczoną dla t ustalonego na poziomie optymalnym 7. Na przykład, jeśli r = 0,05, to mamy: 7= i 0’6**1 T = (6,931)2 = 48,0 (lat)
0,10
)
oraz: A = 2 6,931e-0,05'48,0 = 122,0222e-2,40 = 122,0222 • 0,0907 = 11,0674 (tys. dolarów); zatem jedynie koszty sadzenia mniejsze niż A — przy założeniu, że koszty uprawy są równe zeru — uczynią przedsięwzięcie wartym zachodu. 20 — Podstawy...
3 0 6 PROBLEMY OPTYMALIZACJI
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 307
Ćwiczenie 10.6
Przykład 1. Znaleźć stopę wzrostu V = Ae", gdzie t oznacza czas. Wiemy już, że stopa wzrostu U jest równa r, ale sprawdźmy to, znajdując pochodną In V:
' ’7JT 1. Jeśli wartość wina rośnie zgódnie z funkcją V= Ke J , zamiast (10.22), jak długo kupiec powinien przechowywać wino? ■ j 2. Sprawdzić warunek drugiego rzędu dla zagadnienia wyrębu lasu.
/
3 . Jako uogólnienie zagadnień optymalizacji zilustrowanych w tym podrozdziale poka
zać, że: (a) dla dowolnej funkcji wartości V = f( t) i danej ciągłej stopy dyskontowej r, warunkiem pierwszego rzędu na to, by wartość bieżąca A obliczona dla V osiągała maksimum, jest, aby stopa wzrostu V była równa r; (b) warunek drugiego rzędu dostateczny dla maksimum w istocie sprowadza się do tego, aby stopa wzrostu V malała w miarę upływu czasu.
ln V = in A + rfln e = lnA + rt.
[Ajeststałe]
Wobec tego: d d r v = — ln V = 0 + — rt = r, At At co było do pokazania. Przykład 2. Znaleźć stopę wzrostu y = 4'. W tym przypadku mamy: lny = ln 4 ' = iln 4 , a zatem: d_ ry = — lny = ln4. dt Otrzymany wynik jest prawidłowy, ponieważ eta4 = 4 i w rezultacie y = 4 ' może być przepisane jako y = e
10.7. DALSZE ZASTOSOWANIA POCHODNYCH FUNKCJI WYKŁADNICZYCH I LOGARYTMICZNYCH Wzory na pochodne podane w podrozdz. 10.5 oprócz zastosowań do zagadnień optymalizacji mają inne pożyteczne zastosowania ekonomiczne.
Stopa wzrostu kombinacji funkcji Aby kontynuować rozważania, zbadajmy bieżącą stopę wzrostu iloczynu dwu funkcji czasu:
Znajdowanie stopy wzrostu y = uv, Gdy zmienna y jest funkcją czasu y = /( /) , jej bieżąca stopa wzrostu jest zdefiniowana jako6:
(10.23)
r„ s
dy/dr y
f'( t) funkcja krańcowa = ------- = --------- :--------------- . f(t) funkcja całkowita
'
Porównując powyższy wzór z (10.20) widzimy, że ten iloraz jest dokładnie równy pochodnej ln /(r) = lny. Aby zatem znaleźć bieżącą stopę wzrostu funkcji czasu f ( t ) , mo żemy — zamiast różniczkować ją względem t, a następnie dzielić przez f ( t ) — po prostu obliczyć jej logarytm naturalny, a potem różniczkować ln /(r) względem czasu7. Ta alternatywna metoda może okazać się prostszym podejściem, jeżeli f ( t ) jest wyrażeniem iloczynowym lub ilorazowym, które po zlogaiytmowaniu zredukuje się do sumy lub różnicy wyrażeń addytywnych.
6 Jeśli zmienna t nie oznacza czasu, wyrażenie (dy/df)/y jest nazywane względną stopą zmian y względem t. 7 Jeśli sporządzimy wykres logarytmu naturalnego funkcji f{ t) w zależności od t na dwu wymiarowym diagramie, to nachylenie krzywej będzie nam mówiło o stopie wzrostu/(f). Stanowi to uzasadnienie stosowania tzw. papierów ze skalą półlogarytmiczną.
gdzie
u= m ,
\
v = g (0 Logarytmując obie strony, otrzymujemy: lny = lnu + lnv. Szukana stopa wzrostu jest zatem równa:
d lny , =— d ,lnu + d rv= — — ,lny. y At y At K df Ale dwa składniki po prawej strome są to stopy wzrostu odpowiednio u i v. Otrzy mujemy zatem regułę: (10.24)
r M = ru+ rv,
czyli bieżąca stopa wzrostu iloczynu jest równa sumie bieżących stóp wzrostu czynników. Stosując podobną procedurę można wykazać, że stopa wzrostu ilorazu jest różnicą stóp wzrostu składowych (por. ćwiczenie 10.7—4): (10.25)
i (u/v) ru- rv.
Przykład 3. Jaka jest stopa wzrostu konsumpcji C przypadającej na 1 osobę, jeżeli stopa wrostu Cjest równa a , a stopa wzrostu liczby ludności H (od „head’ ’ — głowa) jest równa ¡3 ?
308 PROBLEMY OPTYMALIZACJI
FUNKCJE WYKŁADNICZE I LOGARYTMICZNE 309
Ponieważ konsumpcja przypadająca na 1 osobę jest równa CIH, więc jej stopa wzrostu powinna być równa: P(C/H) =
r C ~
rH — &
— P -
Rozważmy teraz bieżącą stopę wzrostu sumy dwu funkcji czasu: z = u + v,
d(lny) _ du _ dn dy d r __ ( d ^
V dy V d
Y
1 dy
1 dy
dy r
d(lnx)
y l,d ry n d y
y
y dr
y dr
dr y
dv
dy d r dv
l^dy
Ale to wyrażenie jest dokładnie elastycznością punktową funkcji. Ustanowiliśmy zatem ogólną zasadę, że dla funkcji y = /( r ) punktowa elastyczność y względem r jest równa:
« = /( * ), v = g (t).
gdzie
Zgodnie z tym pochodna ln y względem' ln x jest równa:
(10.28)
£yX—
Tym razem logarytm naturalny będzie równy:
d(lny) d (lnr)
[z (10.20)]
Należy podkreślić, że indeks y r w tym symbolu wskazuje na to, że chodzi nam o dwie zmienne r i y i nie implikuje mnożenia y przez r . Jest tu inaczej niż w przypadku r(WJ), gdzie indeks rzeczywiście oznacza iloczyn. Otrzymaliśmy alternatywny sposób obliczania punk towej elastyczności funkcji za pomocą logarytmów, który często może się okazać łatwiejszym podejściem, jeżeli dana funkcja występuje w postaci wyrażenia iloczynowego lub ilorazo wego.
Ale z (10.23) mamy ru = f ( t ) / f ( t ) , więc/ '( / ) = /( /) ru = uru. Podobnie mamy g \ t ) = vrv. W rezultacie możemy zapisać regułę:
Przykład 5. Znaleźć punktową elastyczność popytu, jeśli dana jest Q = k/P, gdzie k jest dodatnią stałą. Jest to równanie hiperboli prostokątnej (zob. rys. 2.8(d)); jak doskonale wiadomo, funkcja użyteczności o tej postaci ma we wszystkich punktach jednostkową elastyczność punktową. Aby to pokazać, zastosujemy (10.28). Ponieważ logarytm naturalny funkcji popytu jest równy:
ln z = ln (u + v)
[* ln w + ln v],
a zatem: d d r, = — In z = — ln(u + v) = dt dt 1 d (u + v )= u + v dr 1 U + V
V
U
(10.26)
Z(a+v)=
u+v
+
u +v
.
y
rv,
]nQ = ] n k - \n P , więc elastyczność popytu (Q względem P) jest rzeczywiście równa:
która oznacza, że stopa wzrostu sumy jest średnią ważoną stóp wzrostu składników. Na tej samej zasadzie mamy (por. ćwiczenie 10.7—5):
d(ln Q) ^ = d W
(10.27)
r(u- V)=
~ ru-------— rv. u —V u —y
Przykład 4. Eksport dóbr z pewnego kraju G = G {t) ma stopę wzrostu a l t , a eksport usług S = S ( t) ma stopę wzrostu bit. Jaka jest stopa wzrostu całkowitego eksportu? Ponieważ całkowity eksport X (t) = G (i) + S(f) stanowi sumę, więc jego stopa wzrostu powinna być równa: G
S
G (a \
S (b \
Ga + Sb
r*=x rc+x rs=Y \ j J+ x I t r Znajdowanie elastyczności punktowej Widzieliśmy, że dla danego y = / ( 0 pochodna lny mierzy bieżącą stopę wzrostu y. Zoba czymy teraz, co się stanie, jeśli dla danej funkcji y = / ( r ) zróżniczkujemy lny względem Inr, a nie względem x. Na początku wprowadziliśmy oznaczenie u s i n y i v s l n r . Możemy wtedy zaobser wować łańcuch zależności wiążący u z y, a następnie z x i y, jak następuje: u s in y ;
y = /(r);
= - 1’
czyli
N Wynik podany w (10.28) został otrzymany za pomocą reguły różniczkowania funkcji złożonej. Jest interesujące, że podobna reguła obowiązuje dla elastyczności, tzn. dla danej funkcji y = g(w), gdzie w = h(x)\ mamy: ■ (10.29)
eyx = Sy„ ewx.
Dowód jest następujący: _ (d j w V dw r )
dy dw w x
dy r
£yv WJt Vdw y J l d r w )
dw d r y w
dr y
£yx
Ćwiczenie 10.7 1. Znaleźć bieżącą stopę wzrostu: (a) y = 3 /2; (c) y = ab’; (b) y = a tc\ (d) y = 2 '(/2);
(e) y = t l 3'.
2. Znaleźć stopy wzrostu populacji, konsumpcji oraz konsumpcji przypadającej na 1 osobę, stosując logarytmy naturalne, jeśli wiadomo, że populacja rośnie zgodnie z funkcją H = Ha-2b:, a konsumpcja zgodnie z funkcją C = Coe“'.
3 1 0 PROBLEMY OPTYMALIZACJI
3. Jeśli y jest związana z * wzorem y = x k, to jaki będzie związek stóp wzrostu ry i rx? ■ 4. Udowodnić, że jeśli y = u h , gdzie u = / ( i ) i v - g ( t ) , to stopa wzrostu y będzie równa ry = ru - rv, jak pokazano w (10.25). 5. Udowodnić regułę dla stopy wzrostu (10.27). 6. Dana jest funkcja popytu Qd = k/P ”, gdzie k i n są dodatnimi stałymi. Znaleźć punktową elastyczność popytu ed, stosując (10.28) (por. ćwiczenie 8.1-5). 7. a. Dane jest y = wz, gdzie w = g(x) i z = A(*).Udowodnić, że: £yx
b.
S m
"P S
y
Dane jest y = u h , gdzie u = G(x) i v = H(x). Udowodnić, że: £yx
£ux
11. OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ
£vx‘
8. Dla danego y = f( x ) pokazać, że pochodna d(logi,y)/d(logi,i:) — logarytmy o podstawie b, a nie e — również mierzy elastyczność punktową £yx. 9. Pokazać, że jeśli popyt na pieniądz Afrfjest funkcją dochodu nardowego Y = Y(t) i stopy procentowej i = ¿(i), to stopa wzrostu Md może być wyrażona jako suma ważona rY i rt: rU d ~
£ Md Y r Y +
£ u d i ri,
gdzie wagami są elastyczności Md odpowiednio względem Y oraz i.
‘
10. Dla danej funkcji produkcji Q = F(K, L) znaleźć ogólne wyrażenie dla stopy wzrostu Q w zależności od stóp wzrostu K i L. \
Problem optymalizacji został omówiony w rozdz. 9; dotyczył wówczas funkcji celu z jedną zmienną decyzyjną. W rozdz. 10 rozważania zostały rozszerzone na przypadek wykładniczych funkcji celu, ale wciąż zajmowaliśmy się tylko jedną zmienną decyzyjną! Musimy teraz podać sposób znajdowania ekstremalnych wartości funkcji celu mającej dwie lub więcej zmiennych decyzyjnych. Tylko wtedy będziemy mogli zająć się problemami, przed którymi stoi np. firma wytwarzająca wiele produktów, dla której decyzja maksymalizująca zysk składa się z wyboru optymalnych poziomów produkcji kilku dóbr i optymalnej kombinacji kilku różnych nakładów. Omówimy najpierw przypadek funkcji celu z dwiema zmiennymi decyzyjnymi z = f(x, y), aby wykorzystać możliwości, jakie daje sporządzanie jej wykresu. Później wyniki analityczne rozszerzymy na przypadek n zmiennych, dla którego nie da się sporządzić wykresu. Niezależnie jednak od liczby zmiennych będziemy .zakładać, na ogół, że nasze funkcje celu, gdy są zapisane w postaci ogólnej, mają ciągłe pochodne cząstkowe dowolnego rzędu. Zapewni to gładkość i różniczkowalność funkcji celu i jej pochodnych cząstkowych. Dla funkcji wielu zmiennych wartości ekstremalne również są dwu rodzajów: (1) ab solutne, czyli globalne i (2) względne, czyli lokalne. Tak jak poprzednio, będziemy się koncentrować głównib na ekstremach względnych i wobec tego będziemy często opuszczać przymiotnik „względne” , zakładając, że ekstrema, o których mowa, są względne, chyba że stwierdzono inaczej. Warunki dla absolutnych ekstremów rozważymy jednak w podrozdz. 11.5.
11.1. RÓŻNICZKOWE WERSJE WARUNKÓW OPTYMALNOŚCI Rozważania w rozdz. 9, dotyczące warunków optymalności dla zagadnień z jedną zmienną decyzyjną, były prowadzone jedynie za pomocą pochodnych, a nie różniczek. Aby przy gotować się do omawiania zagadnień z dwiema lub więcej zmiennymi decyzyjnymi, warto wiedzieć, jak warunki te można w sposób równoważny sformułować, stosując różniczki.
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 313
312 PROBLEMY OPTYMALIZACJI
Warunek pierwszego rzędu Rozważmy funkcję z = f( x ) przedstawioną na rys. 11.1. W punkcie maksimum A, podobnie jak w punkcie minimum B, wartość z musi być stacjonarna. Innymi słowy, warunkiem : ;: koniecznym dla ekstremum z jest, aby dz = 0 dla nieskończenie małej zmiany x. Warunek ten stanowi różniczkową wersję warunku pierwszego rzędu. Chociaż warunek dz = 0 jest konieczny, oczywiście nie jest wystarczający dla minimum lub maksimum, gdyż punkt przegięcia C, na rys. 11.1 również ma tę własność, że dz = 0. -¿Jpg
z = /(* )
(dż=0)
0
*
w punkcie A, ale dz < 0 w punktach leżących po obu stronach A, oznacza, że dz niezmiennie maleje, gdy odsuwamy się od A w którąkolwiek stronę. Innymi słowy, warunek sprowadza się do d (dz) < 0 — czy li, w prostszym zapisie, d2z < 0 — dla dowolnych niezerowych wartości dr. Symbol d2z = d(dz), oznaczający różniczkę różniczki, jest zwany różniczką drugiego rzędu dla z, a podany powyżej warunek nałożony na d2z stanowi różniczkową wersję warunku drugiego rzędu dostatecznego dla maksimum. Zauważmy, że ujemność d2z dla maksimum z jest warunkiem wystarczającym, ale nie koniecznym. Jest tak, ponieważ w pewnych przypadkach d2z może być równe zeru (a więc nie być ujemne) dla maksimum z. Możliwość ta oczywiście bardzo przypomina przypadek dla testu Ał-tej pochodnej, gdzie maksimum może cechować zerowa wartość drugiej pochodnej. Rzeczywiście, w przypadku funkcji jednej zmiennej istnieje bardzo ścisły związek między znakiem różniczki drugiego rzędu d2z i znakiem pochodnej drugiego rzędu d2z/djc2, czyli f" (x ), co obecnie pokażemy. Jeśli dane jest d z = f'(x )d x , to d2z możemy otrzymać poprzez powtórne zróżnicz kowanie dz. Musimy przy tym pamiętać, że Ax, które w tym przypadku reprezentuje dowolny dany niezerowy przyrost x, należy podczas różniczkowania traktować jak stałą. W konsekwen cji dz może się zmieniać jedynie wskutek zmian f'(x ), ale ponieważ f ( x ) jest z kolei funk cją x, więc dz może się zmieniać jedynie wraz z x. Ze względu na to mamy: (11.2)
Rysunek 11.1
,,~K
d2z s d (dz) = d [f'(x ) dbc] = = [d /'(x )]d x =
[ż (11-1)] [At jest stałe]
= l f " ( x) dx] d r = f"(x) d r 2 Aby zobaczyć, że powyższy warunek jest równoważny wersji warunku pierwszego rzędu zawierającej pochodne: dz/djt = 0 lub f \ x ) = 0, przypomnijmy, że różniczka z = f(x) je st równa: (11.1)
dz = f'( x ) d.r.
,iV
.
Zwróćmy uwagę, że jeśli x się nie zmienia (
Warunek drugiego rzędu Punkt maksimum, np. punkt A na rys. 11.1, ma tę własność graficzną, że gdy przesuwamy się wzdłuż krzywej o nieskończenie małą odległość w lewo (d r < 0) i w prawo (d r > 0) od A, wówczas krzywa ta w obu kierunkach obniża się. Warunkiem dostatecznym uzyskania tego jest, aby dz < 0 po obu stronach A w bezpośrednim otoczeniu tego punktu1. Fakt, że dz = 0 1 Może to być wyjaśnione przez odwołanie się do (11.1). Niech dz < 0 po obu stronach A. Wtedy
f ( x ) i d r muszą mieć przeciwne znaki. Oznacza to, że na lewo od punktu A (dla d r < 0) f'(x ) musi być dodatnie, więc krzywa/ musi być rosnąca. Podobnie na prawo od A (dla d r > 0) f \ x ) musi być ujemne, więc krzywa / musi być malejąca. Zatem punkt A jest szczytem wzgórza.
-
Zwróćmy uwagę, że wykładnik 2 pojawiający się w (11.2) ma dwa całkowicie różne znaczenia. W symbolu d2z wykładnik 2 oznacza różniczkę drugiego rzędu zmiennej z, ale w symbolu d x2 = (djc)2 wykładnik 2 oznacza podnoszenie do kwadratu różniczki pierwszego rzędu dr. Wynik w (11.2) wyznacza bezpośredni związek między d2z i f" (x ). Ponieważ rozważamy jedynie niezerowe wartości dr, więc czynnik d r 2 jest zawsze dodatni; zatem d2z t f " ( x ) muszą mieć taki sam znak algebraiczny. Stanowi to potwierdzenie naszego wcześniejszego stwierdzenia, że warunek dla różniczek „d2z < 0 dla dowolnej niezerowej wartości At” jest równoważny warunkowi dotyczącemu pochodnej f" ( x ) < 0, jako warunkowi dostatecznemu na istnienie maksi mum z. Ale gdy rozpatrzymy przypadek minimum z, wówczas również z (11.2) wywnios kujemy, że dostateczny warunek dla pochodnej f ' \ z ) > 0 może być w sposób równoważny sformułowany jako „d2z > 0 dla dowolnych różnych od zera Wartości dx’ ’. Możemy w końcu stwierdzić, że warunki konieczne drugiego rzędu: dla maksimum z;
f ' \ x ) <Ó,
dla minimum Z:
f" ( x ) 3* 0
są równoważne warunkom: dla maksimum z: ,, . . dla minimum z;
d2z=S0 1 ,, . r dla dowolnych niezerowych wartości At d2z > 0 J
OPTYMALIZACJA W PRZYPADKU WIĘCEJ N E JEDNEJ ZMIENNEJ DECYZYJNEJ 315
314 PROBLEMY OPTYMALIZACJI
Warunki różniczkowe kontra warunki wykorzystujące pochodne Teraz, gdy pokazaliśmy możliwość wyrażenia warunków wykorzystujących drugie pochodne za pomocą dz i d2z, Czytelnik może zapytać, czemu zajmowaliśmy się wyprowadzaniem nowego zestawu warunków różniczkowych, skoro dysponowaliśmy już warunkami w postaci pochodnych? Odpowiedź jest następująca: warunki wykorzystujące różniczki — w przeci wieństwie do warunków wykorzystujących pochodne — są sformułowane w postaci, którą można bezpośrednio uogólnić z przypadku jednej zmiennej na przypadek dwu lub więcej zmiennych decyzyjnych. Konkretniej, warunki pierwszego rzędu (zerowa wartość dz) i drugiego rzędu (ujemność lub dodatniość d2z) obowiązują we wszystkich przypadkach, pod warunkiem, że zdanie „dla dowolnej różnej od zera wartości dx” zmodyfikujemy tak, aby uwzględnić zmianę liczby zmiennych decyzyjnych. Nie oznacza to jednak, że warunki dla pochodnych nie będą już odgrywać żadnej roli. Przeciwnie, ponieważ warunki dla pochodnych są bardziej wygodne w użyciu, więc — po przeprowadzeniu uogólnień za pomocą warunków różniczkowych na przypadek wielu zmiennych decyzyjnych — spróbujemy wyprowadzić i stosować warunki wyrażone w postaci pochodnych, odpowiednie dla tych przypadków.
zmiennej: punkt ekstremum musi być punktem stacjonarnym, a w punkcie stacjonarnym z musi być stałe dla dowolnych nieskończenie małych przyrostów dwu zmiennych x i y. W przypadku dwu zmiennych różniczka zupełna jest równa: (11.4)
d z = / , d r + / ydy.
Do spełnienia warunku (11.3) potrzeba i wystarcza, aby dwie pochodne cząstkowe f x i f y były jednocześnie równe zeru. Zatem równoważna wersja warunku pierwszego rzę du (11.3) dla pochodnych jest następująca: (11.5)
f , = fy = 0
Istnieje prosta graficzna interpretacja tego warunku. To, że w punkcie A na rys. 11.2(a) f x = 0 oznacza, że prosta styczna Tx przechodząca przez A i równoległa do płaszczyzny xz (przy ustalonym y) musi mieć nachylenie równe zeru. Na tej samej zasadzie to, że w pun kcie A f y = 0 oznacza, że prosta styczna Ty przechodząca przez A i równoległa do płasz czyzny yz (przy ustalonym x) musi również mieć nachylenie równe zeru. Czytelnik z łatwoś cią sprawdzi, że wymagania dotyczące prostych stycznych w rzeczywistości stosują się również do punktu minimum B na rys. 11.2(b). Jest tak, ponieważ warunek (11.5) — podobnie jak (11.3) — jest warunkiem koniecznym zarówno dla maksimum, jak i dla minimum.
11.2. WARTOŚCI EKSTREMALNE FUNKCJI DWU ZMIENNYCH 2A Dla funkcji jednej zmiennej decyzyjnej wartość ekstremalna jest reprezentowana graficznie na dwuwymiarowym wykresie przez szczyt wzgórza lub dno doliny. Dla dwu zmiennych decyzyjnych wykres funkcji z = f(x , y) staje się powierzchnią w przestrzeni trójwymiarowej i choć wartości ekstremalne są wciąż związane z wierzchołkami i wgłębieniami, te „wzgórza” i „doliny” mają teraz charakter trójwymiarowy. Będą one miały w tym nowym przypadku kształt odpowiednio kopuł i pucharów. Ilustrują to dwa diagramy przedstawione na rys. 11.2. Punkt A na diagramie (a), czyli wierzchołek kopuły, stanowi maksimum; wartość z w tym punkcie jest większa niż w jakimkolwiek punkcie z jego bezpośredniego otoczenia. Podobnie punkt B na diagramie (b), czyli dno pucharu, reprezentuje minimum; wszędzie w jego • bezpośrednim otoczeniu wartość funkcji przewyższa jej wartość w punkcie B. <«)
\ J :■.1
*
Warunek pierwszego rzędu
'
' Y
Rysunek 11.2 .
Dla funkcji:
warunek konieczny pierwszego rzędu dla ekstremum (maksimum lub minimum) ponownie obejmuje dz = 0. Ale ponieważ są tu dwie zmienne niezależne, więc dz jest teraz różniczką zupełną; zatem warunek pierwszego rzędu powinien być zmodyfikowany do postaci: (11.3)
dz = 0
dla dowolnych wartości d r i dy, które nie są jednocześnie równe zeru.
Uzasadnienie dla (11.3) jest podobne do wyjaśnienia warunku dz = 0 w przypadku jednej
Podobnie jak we wcześniejszych rozważaniach, warunek pierwszego rzędu jest koniecz ny, ale nie jest wystarczający do ustanowienia ekstremum. Można to zobaczyć na rys. 11.3. W punkcie C na diagramie (a) zarówno Tx, jak i Ty mają zerowe nachylenia, ale ten punkt nie kwalifikuje się jako ekstremum. Mógłby być minimum, gdyby patrzeć na niego w kierunku prostopadłym do płaszczyzny yz, ale mógłby być maksimum, gdyby patrzeć na niego w kierunku prostopadłym do płaszczyzny xz\ Punkt z takim „rozdwojeniem jaźni” jest nazywany, z powodów graficznych, punktem siodłowym. Podobnie punkt D na rys. 11.3(b), chociaż cechują go poziome Tx i Ty, również nie jest ekstremum; jego pjołożenie na skręco nej płaszczyźnie czyni z niego punkt przegięcia, obojętnie czy patrzymy na mego prostopadle
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 317
316 PROBLEMY OPTYMALIZACJI
(a)
<*>
Rysunek 11.3
do płaszczyzny xz, czy yz- Te kontrprzykłady zdecydowanie wykluczają warunek pierw szego rzędu jako warunek dostateczny dla ekstremum. • Aby wyprowadzić warunek dostateczny, musimy zważać na różniczkę zupełną drugiego rzędu, która jest związana z pochodnymi cząstkowymi drugiego rzędu.
które są nazywane mieszanymi pochodnymi cząstkowymi, ponieważ każda mierzy tempo zmian jednej pochodnej cząstkowej pierwszego rzędu względem „pozostałej” zmiennej. Należy pamiętać, że pochodne cząstkowe drugiego rzędu funkcji z = f( x , y), podobnie jak z i pierwsze pochodne f x i f y, również są funkcjami zmiennych x i y. Gdy fakt ten wy maga podkreślenia, f xx możemy zapisać jako /^ (x , y), a ja k o /* /x , y) itd. W tym samym stylu możemy stosować np. zapis f yx (1, 2) na oznaczenie wartości Z)* obliczonej dJa x = 1 i y = 2. Mimo iż f xy i f yx zostały zdefiniowane oddzielnie, będą one — zgodnie ze stwier dzeniem zwanym twierdzeniem Younga — identyczne, jeśli tylko obydwie mieszane pochodne cząstkowe są ciągłe. W tym przypadku porządek obliczania pochodnych nie ma znaczenia, gd y ż/), = fyx. Dla zwykłych typów konkretnych funkcji, jakie będziemy stosować, warunek ciągłości jest zwykle spełniony; dla funkcji ogólnych, jak wcześniej wspomniano, zawsze zakładamy, że warunek ciągłości jest spełniony. Możemy zatem na ogół oczekiwać, że napotkamy identyczne mieszane pochodne cząstkowe. W istocie twierdzenie stosuje się również do funkcji trzech lub więcej zmiennych. Na przykład dla funkcji z = g(u, v, w) mieszane pochodne cząstkowe będą charakteryzowane przez guv = gvu\ g*w= gwv itd., pod warunkiem, że wszystkie te pochodne cząstkowe są ciągłe. Przykład 1. Znaleźć cztery pochodne cząstkowe drugiego rzędu dla:
Pochodne cząstkowe drugiego rzędu Funkcja z = f(x, y) może utworzyć dwie pochodne cząstkowe pierwszego rzędu: dz a7
. 1
dz h ~dy'
a
CZy
d2z d ( d z 'l ~dxi = Jdxx { l ) f ) '
U J-
Oznaczenie f xx ma podwójny indeks wskazujący na to, że funkcja pierwotna / została dwukrotnie zróżniczkowana (cząstkowo) względem x, podczas gdy notacja d z/d x przypomi na d2z/d x 2, z wyjątkiem zastosowania symbolu cząstkowego. Zupełnie analogicznie możemy stosować drugą pochodną cząstkową: d T yu x
= x 3 + 5xy—y 2.
Pierwsze pochodne cząstkowe dla tej funkcji są równe: f x = 3x2 + 5y i f y = 5 x - 2y, a zatem powtórnie je różniczkując, otrzymujemy: fxx
Ponieważ f x sama jest funkcją x (oraz y), możemy mierzyć tempo zm ian/) względem x, przy ustalonym y, pewną pochodną cząstkową drugiego rzędu (lub drugą pochodną cząstkową) oznaczoną/ „ lub d2z/d x 2: d
Z
d2z
d (d z)
«yu
na oznaczenie tempa zmian f y względem y, gdy x jest ustalone. Przypomnijmy jednak, że f x jest również funkcją y i że f y jest również funkcja *■ Zatem można napisać dwie następne pochodne cząstkowe:
6x ,
fyX 5 ,
f Xy —5 ,
fyy = “ 2 .
Jak oczekiwano, f yx i f xy są identyczne. Przykład 2. Znaleźć wszystkie pochodne cząstkowe drugiego rzędu dla z = x 2e~y. W tym przypadku pierwsze pochodne cząstkowe są równe: f x = 2xe~y a zatem mamy: f xx = 2e~y;
i
f y = - x 2e~y, *
f yx = -2xe~y;
f xy = -2xe~y\
f yy = x 2e~y.
Ponownie widzimy, ż e fxy= fyx. Zauważmy, że wszystkie drugie pochodne są funkcjami pierwotnych zmiennych x i y. Jest to dostatecznie jasne w przykładzie 2, ale jest prawdą nawet dla przykładu 1, chociaż w tym przypadku zdarzyło się, że niektóre pochodne cząstkowe były stałymi funkcjami.
Różniczka zupełna drugiego rzędu Mając różniczkę zupełną dz daną w (11.4), możemy za pomocą pochodnych cząstkowych drugiego rzędu otrzymać wyrażenie dla różniczki zupełnej drugiego rzędu d2z, różniczku
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 319
3 1 8 PROBLEMY OPTYMALIZACJI
jąc dz. Powinniśmy przy tym pamiętać, że w równaniu d z = / id r + f,d y symbole d r i dy reprezentują dowolne dane przyrosty x i y; muszą one zatem podczas różniczkowania być traktowane jako stałe. W rezultacie dz zależy jedynie od f x i f y, a ponieważ f x i f y sa me są funkcjami x i y, więc dz — podobnie jak z — jest funkcją x i y. Aby otrzymać d2z stosujemy po prostu definicję różniczki podaną w (11.4) do dz. Zatem: 1 ■■/ (11.6)
d2z = d(dz) = - ^ ^ - d r + - ^ ^ - d y = óx dy
[por. (11.4)]
Warunek drugiego rzędu Stosując pojęcie d2z, możemy sformułować warunek drugiego rzędu dostateczny dla maksimum z = / ( r , y) w następujący sposób: (11.7)
d2z < 0
dla dowolnych wartości d r i dy, które nie są jednocześnie równe zeru.
y 4
= ~ ( f xd x + fydy)dx + ^ ( f xd x+ fydy)dy = = ( f xx dx + fxy dy) dx + (fyxdx + fyy dy) dy = = fxxd x2 + fxyd y d x + fyxd x d y + fyydy2 = -fxx dx2 + Ifry d r dy + fyy dy2.
, [/*>=/>*]
Zauważmy, że wykładnik 2 pojawiający się w (11.6) dwa razy spełnia różne funkcje: w symbolu d 2z wskazuje na różniczkę zupełną drugiego rzędu dla z, a w symbolu (dr)2 oznacza kwadrat różniczki pierwszego rzędu dr. Wynik w (11.6) wyraża wielkość d2z (zmiany dz) za pomocą danych wielkości d r i dy mierzonych od pewnego punktu (xo, yo) dziedziny funkcji. Aby jednak obliczyć d2z, musimy również znać wartości pochodnych cząstkowych drugiego rzędu f„ , fxy i f yy, wszystkie, obliczone w punkcie (ro, yo) — tak jak były nam potrzebne pochodne cząstkowe pierwszego rzędu do obliczenia dz z (11.4). Przykład 3. Dane jest z = r 3 + 5ry - y2. Znaleźć dz i d2z. Funkcja ta jest taka sama, jak w przykładzie 1. Zatem podstawiając różne pochodne tam obliczone do (11.4) i (11.6), otrzymujemy2: dz = (3 r2 + 5y)dr + (5 r - 2y) dy oraz:
: ’
^ ,-j,
d2z = 6 r d r 2+ lOdr dy - 2dy2. W punkcie r = 1 i y = 2 mamy na przykład: d z = 1 3 d r + dy
i
d2z = 6dr2 + lOdrdy - 2dy?.
Dla danych d r i dy w punkcie z = 1 i y = 2 należącym dodziedziny znak dz mówi o kierunku zmiany z, podczas gdy znak d2z wyjaśnia, czy dz jest rosnące (d2z > 0), czy malejące (d2z < 0). - - •- S ' ■- 'V 2 Alternatywnym sposobem otrzymania tych wyników jest bezpośrednie różniczkowanie funkcji: dz = d (r3) + d (5ry) - d (y2) = 3r 2d r + 5y dr + 5 r dy - 2y dy. Dalsze różniczkowanie dz
(pamiętamy, że d r i dy są stale) daje wtedy:
d2z = d (3r2) d r + d(5y) d r + d(5r) dy - d(2y) dy = = (6 rd r)d r + (5dy)dr+(5dr)dy - (2dy) dy = = 6r d r2 + lOdr dy - 2dy2.
’
Rysunek 11.4
Uzasadnienie dla (11.7) jest bardzo podobne do uzasadnienia warunku d2z dla przypadku jednej zmiennej i może być wyjaśnione za pomocą rys. 11.4, który przedstawia obraz powierzchni z łom ptaka. Niech punkt A na tej powierzchni — punkt leżący bezpośrednio nad punktem (r0, yo) dziedziny — spełnia warunek pierwszego rzędu (11.3). Wtedy A jest obiecującym kandydatem na maksimum. Czy rzeczywiście się kwalifikuje, zależy od kształtu powierzchni w otoczeniu A. Jeśli nieskończenie mały ruch od A w dowolnym kierunku na powierzchni (zob. striałki na rys. 11.4) niezmiennie powoduje zmniejszenie z, tzn. jeśli dz< 0 dla dowolnych wartości d r i dy, które nie są jednocześnie równe zeru, to A jest wierzchołkiem kopuły. Jeśli jednak wiadomo, że w punkcie A dz = 0, to warunek dz < 0 w sąsiednich punktach sprowadza się do stwierdzenia, że dz maleje, tzn. d2z = d(dz) < 0 dla dowolnych wartości d r i dy nie będących jednocześnie równymi zeru. Zatem (11.7) stanowi warunek wystarczający dla zidentyfikowania wartości stacjonarnej jako maksimum z. Analogiczne rozumowanie pokazałoby, że odpowiedni warunek drugiego rzędu wystarczający dla zidentyfikowania wartości stacjonarnej jako minimum z = / ( r , y) jest następujący: (11.8)
d2z > 0
dla dowolnych wartości d r i dy, które nie są jednocześnie równe zeru.
Powód, dla którego (11.7) i (11.8) są jedynie wystarczającym, ale nie koniecznym warunkiem na istnienie maksimum, jest taki, że ponownie możliwe jest, aby d2z przyjmowało
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 321
320 PROBLEMY OPTYMALIZACJI
wartość zero dla maksimum lub minimum. Z tego powodu konieczny warunek drugiego rzędu musi być sformułowany za pomocą nieostrych nierówności, jak następuje: (11-9)
dla maksimum z:
d2z '= 0
dla minimum z:
d2z 3= 0
dla dowolnych wartości d r i dy, które nie są równocześnie równe zeru.
W dalszym ciągu będziemy jednak zwracać większą uwagę na warunki dostateczne drugiego rzędu. Dla wygody postępowania, warunki drugiego rzędu dla różniczek mogą być przekształ cone w równoważne warunki dla pochodnych drugiego rzędu. W przypadku dwu zmiennych zawartych w (11.6) wymaga to wprowadzenia ograniczeń dotyczących znaków pochodnych cząstkowych drugiego rzędu /« , / ^ i f yy. Szczegółowe tłumaczenie tematu wymagałoby znajomości form kwadratowych, które zostaną omówione w następnym podrozdziale. W tym miejscu jednak zapiszemy główny wynik: dla dowolnych wartości d* i dy, które nie są jednocześnie równe zeru: d2j i < 0
wtw, gdy
f xx< 0;
f„ < 0;
f xxf yy > f% ,
>0
wtw, gdy
f xx > 0;
f yy>0\
f xxf yy>f% -
Widzimy, że znak d2z zależy nie tylko od f xx i f yy, które związane są z konfiguracją powierzchni wokół punktu A (rys. 11.4) w dwu podstawowych kierunkach pokazanych przez Tx (wschód— zachód) i Ty (północ—południe), lecz również od mieszanej pochodnej cząstkowej/^,. Rola, jaką odgrywa ta ostatnia pochodna cząstkowa, polega na zapewnieniu, aby rozważana powierzchnia miała (dwuwymiarowe) przekroje o takim samym typie konfiguracji (wzgórze lub dolina, w zależności od przypadku) nie tylko w dwu podstawowych kierunkach (wschód—zachód i północ—południe), lecz również we wszystkich innych możliwych kierunkach (takich jak północny wschód—południowy zachód). Powyższy wynik, wraz z warunkiem pierwszego rzędu (11.5), umożliwia skonstruowanie tabl. 11.1. Oczywiście wszystkie podane w niej drugie pochodne cząstkowe mają być obliczone w punkcie stacjonarnym, g d z ie /,- f y = 0. Należy również podkreślić, że warunek dostateczny drugiego rzędu nie jest konieczny dla ekstremum. W szczególności, jeśli wartość stacjonarna jest charakteryzowana przez f xxf yy = / \y w sprzeczności z tymi warunkami, to wartość stacjonarna może mimo to być ekstremum. Przy innym natomiast typie naruszenia Tablica 11.1
warunku dla punktu stacjonarnego, dla którego f xxf yy
f y = 2 x + 2y\
/„ = 4 8 x -6 ;
f yy = 2;
Warunek pierwszego rzędu wymaga spełnienia układu rów nań/j = 0 i / y = 0, tzn: 24jc2 + 2y - 6x = 0 , 2y + 2x = 0. Z drugiego równania wynika, że y = —x i po podstawieniu tej wartości do pierwszego równania otrzymujemy 24x2 - 8jc = 0, co prowadzi do pary rozwiązań: ii = 0
(implikuje, że yi = -X \ = 0),
£2 = y
(implikuje, że y2 = -1 /3 ).
Aby zastosować warunek drugiego rzędu, zauważmy, że gdy i i = yi = 0, to f xx jest równe -6 , podczas gdy fyy jest równe 2, więc f xxf yy jest ujemne i musi być mniejsze niż kwadrat f xy. Narusza to warunek drugiego rzędu. Fakt, ż e / « i / w mają przeciwne znaki, sugeruje oczywiście, że rozważana powierzchnia wygina się ku górze w jednym kierunku, a ku dołowi w drugim, tworząc w ten sposób punkt siodłowy. A co z drugim rozwiązaniem? Gdy obliczymy je dla i 2 = —, wówczas widzimy, że / « = 10, co w połączeniu z faktem, że f yy = fxy = 2, spełnia wszystkie trzy części warunku 1 . 1 drugiego rzędu dostatecznego dla minimum. Zatem przyjmując x = — i y - - — we wzorze na podaną funkcję, możemy otrzymać jako minimum z Wartość
(x, y, z) =
Konieczny pierwszego rzędu Dostateczny drugiego rzędu*
M o ż e b y ć s to s o w a n y ty lk o w te d y , g d y j e s t
Maksimum
Minimum
/» = /,= o
/,= /,= o
/« ,/„ < o
fxx,fyy> 0
i fxx fyy >fxy
i
spełniony w a r u n e k k o n i e c z n y pierwszego r zę d u .
fxxyfyy'*fxy
23 — . W tym przykładzie
istnieje zatem tylko jedno relatywne ekstremum (minimum), które może być reprezentowane przez trójkę uporządkowaną: (l
W arunek dla ekstrem um względnego z = f{ x ,y ) Warunek
f xy = 2.
-1 * 23 x
3 ’ 3 ’ 27
Przykład 5. Znaleźć wartości ekstremalne dla z = x + 2ey —e* —e2>’. Odpowiednie pochodne tej funkcji są równe: fx = 1-e* ;
f y = 2 e - 2 e 2>;
/ « = -e* ;
f y y ^ - 4e27;
% = 0.
Aby warunki konieczne były spełnione, musimy mieć: l - e Jt = 0, 2e - 2e2y = 0\ 21 — Podstawy...
322 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 323
ten układ równań ma tylko jedno rozwiązanie: x = 0 i y = —. Aby stwierdzić, jaki jest status wartości z odpowiadającej temu rozwiązaniu (wartości stacjonarnej), obliczamy pochodne drugiego rzędu w x = 0 i y = — i znajdujemy, że /Y = - 1 ; /yy = - 4e 1 /^ = 0. Ponieważ/), i f „ są ujemne i w dodatku (—1) (—4e) > 0, więc możemy stąd wnioskować, że rozważana wartość z, a mianowicie: ż = 0 + e - e ° - e 1= - 1 jest maksymalną wartością funkcji. Ten punkt maksymalny na danej powierzchni może być
i
1
^
oznaczony przez trójkę uporządkowaną (x, y , z) = 0, —, - 1 . Zapamiętajmy, że aby obliczyć drugie pochodne cząstkowe w x i y, trzeba naj pierw przeprowadzić różniczkowanie, a potem podstawić do pochodnych konkretne wartości x i y.
Ćwiczenie 11.2____________________
Różniczka zupełna drugiego rzędu jako forma kwadratowa Jeśli różniczki dx i dy w (11.6) traktujemy jako zmienne, a pochodne cząstkowe jako współczynniki, tzn. jeśli przyjmiemy:
■ ______ ______________ _
Za pomocą tabl. 11.2 znaleźć wartość lub wartości ekstremalne każdej z następujących czterech funkcji i określić, czy są to maksima, czy minima: 1. z = x2 + xy + 2y2 + 3. v 2. z = ~x2 + xy - y 2 + 2x + y.
drugiego rzędu dla ekstremum zależy bezpośrednio od znaku d2z, kryteria te bezpośrednio nas interesują. Na początek zdefiniujemy słowo „forma” . Jest to wyrażenie wielomianowe, w którym każdy składnik ma taki sam stopień. Nasze wcześniejsze spotkania z wielomianami były ograniczone do przypadku jednej zmiennej: a 0 + a tx+ ... + a„x". G d y ' występuje więcej zmiennych, każdy składnik wielomianu może zawierać jedną lub kilka zmiennych, a każda z nich jest podniesiona do nieujemnej potęgi całkowitej, np. 3x + 4x2y 3 - 7 y z - W szczególnym przypadku, gdy każdy składnik ma jednakowy stopień— tzn. gdy suma wykładników w każdym ze składników jest jednakowa — wielomian taki nazywamy formą. Na przykład 4 x -9 y + z jest form ą liniową trzech zmiennych, porueważ każdy z jego trzech składników jest jednomianem pierwszego stopnia. Natomiast wielomian 4x2 - xy + 3y2, w którym każdy składnik jest jednomianem drugiego stopnia (suma wykładników całkowitych = 2), stanowi formę kwadratową dwu zmiennych. Możemy też napotkać formy kwadratowe trzech zmiennych, np. x 2 + 2xy - yw + I w 2, lub nawet n zmiennych.
u sd r;
v = dy;
« = /« ;
ó = fyy‘,
( 11.10) h —f xy
[—fyx\,
- : “
3. z = ax2 + by2 + c; rozważmy każdy z trzech podpunktów: (a) a > 0, b> 0; (c) « i mają przeciwne znaki. (b) a < 0, b < 0; 4. ż = e2* - 2x + 2y2 + 3. 5. Rozważmy funkcję z = (x - 2)4 + (y - 3)4. a. Stwierdzić za pomocą intuicyjnego rozumowania, że z osiąga minimum (z = 0) w x = 2 i y = 3. b. Czy warunek konieczny pierwszego rzędu podany w tabl. 11.1 jest spełniony? c. Czy warunek dostateczny drugiego rzędu podany w tabl. 11.1 jest spełniony? d. Znaleźć wartość d2z. Czy spełnia ona konieczny warunek drugiego rzędu dla minimum przedstawionego w (11.9)?
11.3. ZAGADNIENIA DOTYCZĄCE FORM KWADRATOWYCH Ostatni wiersz wyrażenia (11.6) jest przykładem tzw .form kwadratowych, dla których istnieją ustalone kryteria określania ich znaków: czy są one zawsze dodatnie, ujemne, niedodatnie lub nieujemne dla dowolnych wartości dx i dy, które nie są obie równe zeru. Ponieważ warunek
to różniczka zupełna drugiego rzędu: Y. d2ż = fxxd x 2 + 2fxydxdy + fyydy2 może z łatwością być zidentyfikowana jako forma kwadratowa ą dwu zmiennych u i v: (11.60
q = au2 + 2huv + bv2.
W tej formie kwądratowej dx = u i d y = v występują w roli zmiennych, a drugie pochod ne cząstkowe są traktowane jako stałe. Jest to całkowite przeciwieństwo sytuacji, gdy różniczkowaliśmy dz, aby otrzymać d2z. Przyczyna takiej zamiany leży w odmiennej naturze zagadnienia, jakim się teraz zajmujemy. Warunek dostateczny drugiego rzędu dla ekstremum wymaga, aby d2z była na pewno dodatnia (dla minimum) i na pewno ujemna (dla maksimum) niezależnie od wartości, jakie mogą przyjąć dx i dy (pod warunkiem, że nie są jednocześnie równe zeru). Jest wobec tego oczywiste, że w obecnym kontekście dx i dy muszą być traktowane jako zmienne. Drugie pochodne cząstkowe będą natomiast przyjmowały konkretne wartości w punktach, które badamy jako możliwe punkty ekstremum, a zatem mogą być traktowane jako stałe. Główne pytarne wobec tego brzmi: jakie ograniczenia należy nałożyć na a, b i h w (11.60, aby zapewnić określony znak dla q, gdy u i v mogą przyjmować dowolne wartości?
3 2 4 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 325
Dodatnia i ujemna określoność
. 1 dodatnio określona] f ez > 0 1 „ <7jest \ . . 2 wtw, gdy \ M a b - h 2>0. ( ujemnie określona J ( a <0 J
(11.11) Ustalmy nazewnictwo: forma kwadratowa q (11.60 jest: dodatnio określona dodatnio pólokreślona ujemnie pólokreślona ujemnie określona
jeśli q jest stale
dodatnie nieujemne niedodatnie ujemne
( > 0),
0 * 0 ),
( « 0), (< 0),
niezależnie od wartości występujących w niej zmiennych,, nie wszystkich równych zeru. Jeśli q zmienia znak, gdy zmienne przyjmują różne wartości, to mówimy, że q jest nieokreślona. Jest jasne, że przypadek dodatniej i ujemnej określoności q = d2z jest związany z warunkami drugiego rzędu, dostatecznymi odpowiednio dla minimum i dla maksimum. Natomiast przypadekpółokreśloności jest związany z warunkami koniecznymi drugiego rzędu. Gdy q = d2z jest nieokreślona, wówczas stanowi to symptom istnienia punktu siodłowego.
Test wyznacznikowy dla określoności znaku Szeroko stosowany test określoności znaku q wymaga badania znaków pewnych wyznacz ników. Test ten jest łatwiejszy w zastosowaniu do dodatniej i ujemnej określoności (w przeciwieństwie do półokreśloności), tzn. łatwiejszy w przypadku warunków dostatecz nych (a nie koniecznych) drugiego rzędu. Ograniczymy tu nasze rozważania tylko do warunków dostatecznych3. Dla przypadku dwu zmiennych można łatwo wyprowadzić warunki dla określoności znaku q. Przede wszystkim widzimy, że znaki pierwszego i trzeciego składnika w (11.6') są niezależne od wartości zmiennych u i v, ponieważ zmienne te występują w kwadracie. Łatwo jest zatem określić warunki dla dodatniej lub ujemnej określoności samych tych składników, poprzez nałożenie ograniczeń na znaki a i b. Problem tkwi w środkowym składniku. Gdybyśmy jednak mogli przekształcić cały wielomian w wyrażenie, w którym zmienne u i v mogą występować tylko w kwadracie, określoność znaku q znów będzie łatwa do uchwycenia. Sposób wykonania takiego triku polega na uzupełnieniu kwadratu. Dodając do prawej strony (11.60 h2v2/a i odejmując od niej tę samą wielkość, możemy przepisać formę kwadratową w następujący sposób: Vv:; q - au 2 + OL 2huv + — v 2 + bL v2 a h 2 u + —V a
r h 2) 2h h2 i v 2 = a u* + ----UV H---- y V + b -----a / a V
J
Pamiętając, ż e a b —h 1 ma być w obu przypadkach dodatnie i — jako warunek wstępny dodatniości ab - h 2 — iloczyn ab też musi być dodatni (ponieważ musi być większy niż h 2), powyższe warunki automatycznie implikują, ie a l b muszą mieć jednakowe znaki. Otrzymany właśnie warunek może być sformułowany bardziej zwięźle za pomocą wyznaczników. Formę kwadratową (11.60 można uporządkować w postaci następującego kwadratowego wyrażenia symetrycznego: q = a u 2 + hu v + + huv + b v 2 ze składnikami kwadratowymi umieszczonymi na przekątnej i ze składnikiem 2huv po dzielonym na połowy umieszczonymi poza przekątną. Współczynniki tworzą teraz macierz symetryczną, w której a oraz b leżą na głównej przekątnej, a h poza przekątną. W tym świetle forma kwadratowa 1x 1 (skalar) jest wynikiem następującego mnożenia: q = [u v]
a
h
u
h
b
V
h — który nazywamy wyróżnikiem h b formy kwadratowej q i który od tej pory będziemy oznaczać przez | D stanowi klucz do zrozumienia kryterium (11.11), gdyż można je również wyrazić jako: Wyznacznik macierzy współczynników 2 x 2
. i dodatnio określona] 4 jest ] . wtw. [ ujemnie określona J
( 11.110
a
gdy
|a|>0
a
h
lal < 0
h
b
> 0.
Wyznacznik | a | = a jest podwyznacznikiem | D | zawierającym pierwszy element a h głównej przekątnej, jest więc żwany pierwszym minorem głównym | D |. Wyznacznik h b może również być traktowany jako podwyznacznik | D | ; ponieważ zawiera pierwszy i drugi element głównej przekątnej, więc zwany jest jego drugim minorem głównym. W obecnym przypadku mogą być tylko dwa minory główne i ich znaki służą do wyznaczania dodatniej lub ujemnej określoność? q. Gdy (11.110 zastosujemy, za pośrednictwem (11.10), dla różniczki zupełnej drugiego rzędu, wówczas otrzymamy:
a b -h 2
Teraz, gdy zmienne u i v występują tylko w wyrażeniach podniesionych do kwadratu, możemy przewidywać znak q całkowicie na podstawie współczynników a .b i h w następujący sposób:
3 Omówienie testu wyznacznikowego dla warunków koniecznych drugiego rzędu podano w książce Akiry Takayamy, Mathematical Economics, The Dryden Press, Hinsdale, IL. 1974, str. 118-120.
d2z jest
gdy
(dodatriio określona] [ujemnie określona j
i/.> o i W
U
wtedy i tylko wtedy,
fry
fy* fyy
Przypomnijmy, że ostatnia z powyższych nierówności implikuje, że i musźą przyjmować ten sam znak; widzimy więc, że jest to dokładnie Warunek dostateczny drugiego rzędu przedstawiony w tabl. 11.1.
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNE! 327
3 2 6 PROBLEMY OPTYMALIZACJI
Ogólnie, wyróżnikiem formy kwadratowej ą = au2 + 2 huv + bv2 jest symetryczny wyznacznik
a
h
h
b
. W szczególnym przypadku formy kwadratowej:
d2z = fxxd-r2 + Ifxydxdy + f„ dy2 jest wyznacznikiem, którego elementami są pochodne cząstkowe drugiego rzędu. Taki wyznacznik jest nazywany hesjanem. W przypadku dwu zmiennych hesjan jest równy: w y różnik-
IHI =
fxx fxy
i w świetle twierdzenia Younga ( / ^ = fyx) jest symetryczny, czyli taki, jaki wyróżnik być powinien. Należy starannie odróżniać hesjan od jakobianu omówionego w podrozdz. 7.6. Przykład 1. Czy q = 5u2 + 3«v + 2v2 jest dodatnio, czy ujemnie określona? Wyznacznikiem q jest
1,5
? ( « 1 . « 2 , « 3 ) = [« 1 « 2 « 3 ]
( 1 1 .1 2 0
ty* f ry
5>0
tości 1,2 i 3, a zatem wyrażenie z podwójną sumąjest równoważne podanej powyżej strukturze 3 x 3 . Taka kwadratowa struktura dla formy kwadratowej zawsze uważana jest za symetryczną, mimo iż zapisaliśmy pary współczynników (¿ I2, ¿ 21) lub ( ¿ 2 3 , ¿ 32), jak gdyby dwa elementy każdej pary były różne. Jeśli bowiem np. zdarzy się, że składnik formy kwadratowej zawierający zmienne «1 i u2 będzie równy 12«! «2, to zawsze przyjmujemy, że ¿ 12 = ¿21 = 6, czyli że ¿ i2« i«2 = ¿21 «2«1; podobną procedurę można zastosować do pozostałych elemen tów leżących poza przekątną, aby były symetryczne. Faktycznie, tę formę kwadratową o trzech zmiennych można ponownie wyrazić jako iloczyn trzech macierzy:
o minorach głównych:"'
2 5
1,5
1,5
2
¿11
¿12
¿13
¿21
¿22
¿23
¿31
¿32
¿33
Tak jak w przypadku dwu zmiennych, pierwsza macierz (wektor wierszowy) i trzecia macierz (wektor kolumnowy) zawierają po prostu spis zmiennych, a środkowa (D) jest symetryczną macierzą współczynników z wersji formy kwadratowej (11.12) zapisanej w postaci kwadratowej struktury. Tym razem jednak można w sumie utworzyć trzy minory główne jej wyznacznika, a mianowicie:
= 7,75 > 0; =
|D il —¿ u l
¿11
¿12
J “ 21
;
|D ,| =
-2 < 0
-2
1
= 1 > 0,
1 -1
f
¿12
« 1 + — — V ¿11
¿11 ¿ 2 2
(11.12)
q (u i, u2, U3,) = d n (u i) + d i2(ul u2) + di3(u1u3) +
U2+
¿ ,3
¿13
¿22
¿23
¿31
¿32
¿33
¿11
Y
— — «3 ¿11
—¿ 1? ^ “2+
Formy kwadratowe o trzech zmiennych Czy podobne warunki można otrzymać dla form kwadratowych o trzech zmiennych? Forma kwadratowa z trzema zmiennymi u u u2 i « 3 może być ogólnie zapisana jako:
¿12
¿21
gdzie | D,-1 oznacza i-ty minor główny4 wyznacznika |D |. Okazuje się, że warunki dodatniej lub ujemnej określoności mogą znów być sfomułowane w postaci pewnych ograniczeń nałożonych na znaki tych minorów głównych. Znaną już metodą uzupełniania do pełnego kwadratu, formę kwadratową (11.12) można przekształcić do postaci, w której trzy zmienne występują jedynie jako składniki pewnych kwadratów. Dokładniej, pamiętając, że a 12 = an itd:, mamy:
_
a zatem d2z jest ujemnie określona.
¿ u
¿22
zatem q jest dodatnio określona. Przykład 2. Jeśli dane są f a = - 2 ; = 1 i / w = - l w pewnym punkcie dla funkcji i = f(x, y), to czy d2z ma określony znak w tym punkcie niezależnie od wartości d r i dy? -2 1' z minorami głów Wyróżnikiem formy kwadratowej d z jest w tym przypadku 1 -1 nymi:
= u 'D u .
)
+
¿11 ¿23 ¿^¿13 «3 . .-----------
“ 11“ 22 ¿12
¿11 ¿2 2 ¿ 3 3 — ¿1 1 ¿ 2 3 “ ¿ 2 2 ¿ 23 ~ ¿ 3 3 ^ 2 + 2 ¿ l 2 ¿ 1 3 ¿ 2 3 .
+
:
d n d
22 — ¿11 2
(M3) "
Ta suma kwadratów będzie dodatnia (ujemna) dla każdych wartości « 1, «2 i
« 3.
nie
+ ¿2 1 ( « 2 « l ) + ¿ 2 2 ( Ml ) + ¿2 3 ( w2 “ 3) + + ¿3 1 ( “ 3 « l) + 3
dyiłu-sli-i)
+ ¿3 3 (« 3 ) =
3
= X X dijUiUj, i=lj=l
gdzie oznaczenie z podwójną sumą oznacza, że oba indeksy / oraz j mogą przyjmować war-
4 Do tej pory traktowaliśmy i-ty minor główny |D | jako podwyznacznik utworzony przez pozostawienie pierwszych elementów głównej przekątnej | D|. Ponieważ jednak pojęcie minora implikuje usunięcie czegoś z pierwotnego wyznacznika, Czytelnik może preferować traktowanie i-tego minora głównego alternatywnie, jako podwyznacznika utworzonego przez usunięcie ostatnich (n - i) .wierszy i kolumn |D|.
3 2 8 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 329
wszystkich zerowych, wtedy i tylko wtedy, gdy wszystkie współczynniki wyrażeń kwad ratowych będą dodatnie (ujemne). Ale trzy współczynniki (w podanej kolejności) można wyrazić ja to funkcje trzech głównych minorów, a mianowicie:
|D,|;
]D i
I P 2I IDi I
Narusza to warunki dla dodatniej i dla ujemnej określoności, zatem q nie jest ani dodatnio, ani ujemnie określona.
Formy kwadratowe n zmiennych
|D 2
Zatem dla dodatniej określoności mamy trzyczęściowy warunek konieczny i dostateczny:
Jako rozszerzenie powyższych rozważań na przykład n zmiennych, stwierdzimy, bez dowodu, że dla formy kwadratowej:
ID i | > 0, |D 2| > 0
(jeśli wiadomo już, że |D 11> 0),
| D 3| > 0
(jeśli wiadomo już, że |D 21> 0).
q(u it u2, ...,!<„)= Z i=lj=l = u' D
[gdzie dij = dji] u
[por. (11.120]
(1 x h ) (nxn){nx 1)
Innymi słowy, wszystkie trzy minory główne muszą być dodatnie. Natomiast dla ujemnej określoności warunek konieczny i dostateczny przyjmuje postać:
warunkiem koniecznym i dostatecznym dla dodatniej określoności jest, aby główne mino ry | D |, a mianowicie:
| D2| > 0
(jeśli wiadomo już, że |D 2j < 0),
|D 3f < 0
(jeśli wiadomo już, że |D 2|> 0 ) ,
du
¿12 |D 2| = ; ¿22 ¿21
D ,! * * ,;
•••;
|D n| =
¿..
¿12
¿21
•1
ID, | < 0,
¿nl dn2 tzn. trzy minory główne muszą zmieniać znak w ściśle określony sposób. Przykład 3. Określmy, czy q = «1 + 6«2 + 3«2- 2 « i « 2 - 4«2«3 jest dodatnio lub ujem nie określona. Wyróżnik q jest równy: 1 -1 0 -1 6 -2 0 -2 3
1 -1 -1
6
1 -1 = 5 > 0;
-1
0 -2
6
• dfux
były dodatnie. Odpowiedni warunek konieczny i dostateczny ujemnej określoności jest, aby minory główne zmieniały znaki w następujący sposób: IDi| < 0;
|D 2| > 0;
|D 3| < 0
(itd.),
= 11 > 0 ;
Test wartości własnych dla określoności znaków
3
Przykład 4. Określić, czy q = 2u2 + 3v2 - w2 4- 6iiv —8liw - 2vw jest dodatnio lub ujem nie określona. Wyróżnik może być zapisany jako: 2 3 -4 3 3 -1 - 4 -1 - 1 i stwierdzamy, że jego pierwszy minor główny jest równy 2 > 0, ale drugi minór główny jest równy: 3 = -3 < 0 . 3
*
0 -2
wobec tego forma kwadratowa jest dodatnio określona.
2 3
djn
czyli tak, żeby wszystkie minory główne o numerach nieparzystych były ujemne, a wszystkie minory główne o numerach parzystych były dodatnie. Minor główny o numerze n (| D„| = | D |) powinien być dodatni, jeśli n jest parzyste, ale ujemny, jeśli n jest nieparzyste. Można to zwięźlej wyrazić nierównością (—lj^lD^ | > Q.
o następujących minorach głównych:
1> 0;
.. d \n
W celu określenia znaku formy kwadratowej u 'D u, oprócz powyższego testu wyznacz nikowego można stosować alternatywny test wykorzystujący pojęcie tzw. wartości własnych macierzy D. Pojęcie to powstaje w zagadnieniu o następującym charakterze: dla danej macierzy D stopnia n chcemy znaleźć taki skalar r i taki wektor x * 0 o wymiarach n x 1, aby było spełnione równanie macierzowe: (11.13)
D
x =r x .
(nxn)(nxl)
(nxl)
Skalar r nazywany jest wartością własną macierzy D, a x wektorem własnym tej macierzy5. Równanie macierzowe Dx = rx może być przepisane jako Dx - r lx - 0, czyli:
5 Wartości własne (characteristic roots) są również znane pod nazwą latent roots lub eigenvalues. Wektory własne (characteristic vectors) są również nazywane eigenvectors (brak odpowiedników w nazewnictwie polskim).
3 3 0 PROBLEMY OPTYMALIZACJI
(11.130
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 331
(D —z l)x = 0,
X 2i + x \ = ( 2 x 2) 2 + X 2 = 5 * 2 = 1 ,
gdzie 0 ma wymiar n x 1. Jest to oczywiście układ n jednorodnych równań liniowych. Ponieważ chcemy znaleźć niezerowe rozwiązanie dla x, macierz współczynników (D - zł) — zwana macierzą charakterystyczną dla D — musi być osobliwa. Innymi słowy, jej wyznacznik musi znikać:
możemy zatem otrzymać (biorąc dodatni pierwiastek kwadratowy) x 2= l l [ s
oraz
*1 = 2*2 = 2 / / J . Zatem pierwszy wektor własny jest równy: '2 / ¡ 5 ' Vl =
(11.14)
|D - rl\ =
¿12 ¿22
dni
dn2
r
Óln •• ¿2n ..
1 //5 =
Podobnie dla drugiej wartości własnej r2 = - 2 z (11.130 otrzymujemy równame:
0.
dm - r
Równanie (11.14) jest nazywane równaniem charakterystycznym macierzy D. Ponieważ wyznacznik |D —r l | daje, w wyniku rozwinięcia Laplace’a, wielomian «-tego stopnia względem zmiennej r, (11.14) jest w istocie równaniem wielomianowym n-tego stopnia. Będzie tam zatem w sumie n pierwiastków (tą, . . . , r„), z których każdy stanowi wartość własną. Jeśli D jest symetryczne, jak to jest w przypadku formy kwadratowej, wartości własne zawsze będą liczbami rzeczywistymi, ale mogą przyjmować dowolny znak algebraiczny lub być zerami. ' " v Ponieważ dla każdej z wartości r wyznacznik ( D - r l ) znika, podstawienie każdej z nich (np. r;) do układu równań (11.13') da odpowiedni w ek to rx |,= v Dokładniej, ponieważ układ jest jednorodny, otrzymamy nieskończenie wiele wektorów odpowiadających pierwiast kowi r,. Możemy jednak zastosować normalizację (co objaśnimy poniżej) i wybrać pewien element tego nieskończonego zbioru, jako wektor własny odpowiadający /•,; ten wektor oznaczymy v,. Skoro mamy w sumie n wartości własnych, powinno być w sumie n odpowiadających im wektorów własnych. ’ Przykład 5. Znaleźć wartość i wektory własne macierzy
2
2
2
-1
i' 1
dn - r d2i
2
2
-ł-(-2 )
które ma rozwiązanie f
1
4 2
*1 *2
Xi =
2 1
*1 x2_
0" 0
- — x 2. Po normalizacji otrzymujemy:
V
* l+ * 2 = ~ ~ 2 X l
co daje x 2 = 2 l [ s i x\ v2 =
. Zatem drugi wektor charakterystyczny jest równy:
'1 / / 5 " 2 /¡ 5 .
Zbiór wektorów własnych otrzymanych w ten sposób ma dwie ważne własności. Po pierwsze, iloczyn skalamy vjv,- (i = 1, 2 ,...,« ) musi być równy jedności, gdyż:
. Podstawiając daną
=1^= 1. ¡=1
macierz zamiast D do (11.14), otrzymujemy równanie: 2
2 -r 2
Po drugie, iloczyn skalamy v'v, (gdzie i ^ j) może zawsze być przyjęty jako równy zeru7.
= r3 - r - 6 = 0
z pierwiastkami r t = 3 i r2 = - 2. Dla pierwszej wartości równanie macierzowe (11.13') przyjmuje postać: , ‘2 - 3 2
2 -1 -3
X l
x 2_
'- i 2
2 -4
*1 x2
o‘ 0
Ponieważ dwa wiersze macierzy współczynników są liniowo zależne, czego można było oczekiwać na podstawie (11.14), istnieje nieskończenie wiele rozwiązań, które można wyrazić równaniem x i = l x 2. Aby wymusić jednoznaczne rozwiązanie, normalizujemy je, nakładając? warunek * i + * 2 = 1 . Ponieważ: ■
6 Ogólniej — dla przypadku «-wymiarowego — wymagamy, aby:
I *1 = 1. J=1
7 Aby to pokazać, zauważmy, że korzystając z (11.13) możemy napisać Dy, = rjV, i Dv, = r,vi. Mnożąc z lewej strony obie strony każdego z tych równań przez odpowiedni wektor wierszowy, otrzymujemy: * Dr, = v’i ą vy= r2 v; , v'j Dv, = vjr;V, = r,
= r,V,v; .
[rf jest skalarem] = v'v,]
Ponieważ vjDv; i vj Dv, mają wymiary 1x1 i ponieważ są one wzajemnymi transpozycjami (przypomnijmy, że D' = D, gdyż jest symetryczna), więc muszą reprezentować ten sam skalar. Wynika stąd, że wyrażenia położone najbardziej po prawej stronie w tych dwu równaniach są równe; zatem odejmując otrzymujemy:
(rj ~ r,) v'v; = 0. Jeśli teraz tj * r, (różne wartości własne), to v',vj musi być równe zeru, aby równanie było spełnione i to dowodzi słuszności naszego postulatu. Jeśli ponadto tj = r, (wielokrotne własności własne), to okazuje się, że zawsze jest możliwe znalezienie dwu liniowo niezależnych znormalizowanych wektorów spełniających vjv; = 0. Zatem możemy w ogólności stwierdzić, że v' v; = 0, gdy tylko i * j.
3 3 2 PROBLEMY OPTYMALIZACJI
OPTYMALEACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 333
W sumie możemy wobec tego napisać: i
v',\j = 0
(/* /').
Te własności okażą się dalej użyteczne. Jeśli dwa wektory mają iloczyn skalamy równy zeru, to mówimy, że te wektory są ortogonalne (prostopadłe do siebie)8. Zatem każda para wektorów własnych macierzy D musi być ortogonalna. Druga własność, v' v,= 1, wskazuje na normalizację. Te dwie własności razem wzięte wyjaśniają, dlaczego wektory własne (v i,...,v „ ) są nazywane zbiorem wektorów ortonormalnych. Czytelnik powinien spróbować udowodnić ortonormalność dwu wektorów własnych znalezionych w przykładzie 5. Wyjaśnijmy, dlaczego za pomocą wartości własnych i wektorów własnych macierzy D można badać określoność formy kwadratowej u'Du. W skrócie idea polega na przekształ ceniu tTDu (które obejmuje nie tylko składniki w postaci kwadratów u \, ..., u2„, lecz rów nież składniki zawierające mieszane iloczyny takie, jak u\u2 i u2u3) do postaci zawierającej jedynie składniki w postaci kwadratów. Zatem podejście to jest podobne w swym założeniu do procesu uzupełniania do kwadratu stosowanego przy wyprowadzaniu testu wyznacznikowego. Jednak w obecnym przypadku przekształcenie ma tę dodatkową cechę, że każdy kwadratowy składnik ma jako współczynnik jedną z wartości własnych, tak więc znaki n wartości własnych będą dostarczać informacji wystarczającej do stwierdzenia określoności znaku formy kwadratowej. Przekształcenie, o którym mowa, jest następujące. Niech wektory własne V j,..., v„ utworzą kolumny macierzy T :
Przykład 6. Sprawdzić, że macierz
ri 0
o'
3
r2_
0
T = [v, v2] =
^
do formy kwadratowej iTD u :
- iTDu = (Ty)'D(Ty) = y 'T 'D T y = y'R y,
u 'D u = y 'R y = [y1 y2 ... y j
ri
0
0
r2
R = T 'D T =
2 /¡ 5 1/J5
-1 //T 2 /¡5
2 ¡5
_L ¡5
-1
_2_
¡5
¡5
1 '
"2 2
2
TT 1
~1 T
yi
ys.
2
■3 0" ° - 2_
Aby udowodnić wynik dotyczący diagonalizacji (11.16), rozpiszemy (częściowo) macierz R w następujący sposób:
R = T 'D T =
= riy? + r2y2+.- . + r„y‘„
v;i V2
0 v„; ei =
0 Y i e2= 1 0
Wersory te leżą na dwu osiach, więc są prostopadle. Widzimy jednocześnie, że e'e 2 = ejei = 0. * v-
D [v, v2 ... v„].
Możemy łatwo‘sprawdzić, że D [vt v2 ... v„] może być zapisany jako [Dvi Dv2 ... Dv„]. Ponadto, korzystając z (11.13), możemy dalej to zapisać jako [riV! r2v2 ... r„\„]. Widzimy zatem, że:
R= 0
o" -2
[z (4.11)]
gdzie R a T D T . W rezultacie pierwotna forma kwadratowa względem zmiennych ut została przekształ cona w inną formę kwadratową względem zmiennych y-t. Ponieważ zmienne ut oraz y,przybierają ten sam zakres wartości, przekształcenie nie wpływa na określoność formy kwadratowej. Możemy zatem równie dobrze badać znak formy kwadratowej y ' Ry. Ta ostatnia forma kwadratowa jest ciekawa, ponieważ macierz R okazuje się być macierzą diagonalną, która ma na głównej przekątnej wartości własne D, a poza tym same zera. Tak więc:
(11.16)
podana w przykładzie 5 może być
możemy zatem napisać:
(nxm )
= T
2
-1
Na podstawie wartości własnych znalezionych w przykładzie 5 macierz przekształce nia T musi być równa:
T = [v i, v2, ...,v „ ].
Zastosujemy następnie przekształcenie (
2
2
diagonalizowana do postaci macierzy:
1
v ;v ,-l
to
(11.15)
co jest wyrażeniem zawierającym jedynie składniki kwadratowe. Przekształcenie R = T 'D T umożliwia wobec tego procedurę diagonalizacji macierzy symetrycznej D do postaci szczególnej macierzy diagonalnej R.
r\ PlY^! r2v;v2 .. ■ r„v[v„ 0 riV2V! r2y2\2 ■■• r „ \2\„ = [nv, r2y 2 . ■ r„v„] = nv„'v1 r2y'„y2
■ r„y'„v„_
0
. .
0"
r2 . .
0
.•
ri
0
0
[z (11.15)] a jest to dokładnie to, co chcieliśmy pokazać. Na podstawie (11.16) możemy teraz formalnie sformułować test na określoność formy kwadratowej wykorzystujący wartości własne w następujący sposób:
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 335
334 PROBLEMY OPTYMALIZACJI
(a) q = u'Du jest dodatnio (ujemnie) określona wtedy i tylko wtedy, gdy każda wartość J własna D jest dodatnia (ujemna), (b) q = u'Du jest dodatnio (ujemnie) półokreślona wtedy i tylko wtedy, gdy wszystkie ; wartości własne D są nieujemne (niedodatnie), -r (c) q = u'Du jest nieokreślona wtedy i tylko wtedy, gdy niektóre wartości własne D są : dodatnie, a niektóre są ujemne.
6. Znaleźć wartości własne każdej z następujących macierzy:
8.
(a) [u v] (b)
[u
v]
' 4
2
u
2
3
V
3'
u
-2 1
-4
(c) [ x y]
‘5
2
X
4
0
y_
(d) [Ar dy]
V
f*y At fy* fyy_ dY /«
W punktach (b) i (c) poprzedniego zadania macierze współczynników nie są symetryczne względem głównej przekątnej. Sprawdzić, że po wyrównaniu elementów poza główną przekątną i przekształceniu ich odpowiednio w
-2
2
2
-4
otrzymamy takie same
formy kwadratowe, jak poprzednio. 3. Na podstawie macierzy współczynników (w wersji symetrycznej) i testu wyznacznikowego ]; stwierdzić, czy formy kwadratowe w ćwiczeniu l(a), (b) i (c) są określone dodatnio czy ujemnie. 4. Wyrazić każdą z poniższych form kwadratowych jako iloczyn macierzy zawierający ii symetryczną macierz współczynników: (a) q = 3u2 - 4 u v + l v 2; * (b) q = u2 + lu v + 3v2; (c) q - % u v - u 2 - 3 1 v 2; (d) q = 6 x y - 5 y 2 - 2 x 2; , ■■ (e) q —3wi —2«i U2 + 4«i W3 + Su\ 4 w2 —2.U2U2 1 (f) q = - u 2 + 4uv - 6 u w - 4v2 - I w 2. 5. Na podstawie wyróżników otrzymanych z symetrycznych macierzy współczynników z poprzedniego zadania stwierdzić, za pomocą testu wyznacznikowego, które z form kwadratowych są określone dodatnio, a które ujemnie.
(b) E =
'- 2
2
5 ;
3
(c) F =
4
2
2
1
Dla danej formy kwadratowej u'Du, gdzie D jest macierzą o wymiarach 2 x 2 , równanie charakterystyczne dla D można zapisać jako: dl] ~ r 1=0 (dl2 = d2i). «21 «22 “ r Obliczyć wyznacznik; wyznaczyć pierwiastki tego równania za pomocą wzoru na pierwiastki równania kwadratowego i wywnioskować, co następuje:
(b)
1. W wyniku bezpośredniego mnożenia macierzy wyrazić każdy z poniższych iloczynów macierzowych jako formę kwadratową:
;
Znaleźć wektory własne macierzy
(a)
Ćwiczenie 11.3
2
3 0_ 2 -4 2 3 Co można wywnioskować o znakach form kwadratowych u'Du, u'Eu i iTFu? Po równać wyniki z ćwiczeniem 11.3-3. 7.
Aby zastosować ten test, wystarczy jedynie znać wartości własne: wektory własne nie są A, potrzebne, chyba że chcemy znaleźć macierz przekształcenia' T. Test ten, w przeciwieństwie -Ą do opisanego powyżej testu wyznacznikowego, pozwala na jednoczesne sprawdzenie warunków koniecznych drugiego rzędu (część (b)) oraz warunków dostatecznych (część (a)). Ma on jednak pewną wadę. Gdy macierz D ma duże wymiary, wówczas rozwiązanie równania '■/ wielomianowego (11.14) w celu otrzymania wartości własnych potrzebnych w teście może okazać się trudne. W takim przypadku może być zatem preferowany test wyznacznikowy.
4
(a) D =
wr i
nie może wystąpić liczba urojona (liczba zawierająca 7 - 1 ); c 0 aby mieć krotne wartości własne, macierz D musi mieć postać 0 c
(c) w przypadku dodatniej lub ujemnej półokreśloności wyróżnik formy kwadratowej może znikać, tzn. możliwe jest |D | = 0.
11.4. FUNKCJE CELU ZAWIERAJĄCE WIĘCEJ NIŻ DWIE ZMIENNE Gdy w funkcji celu pojawia się n > 2 zmiennych decyzyjnych, nie można już sporządzić jej wykresu, chociaż wciąż możemy mówić o hiperpowierzchni w przestrzeni (n + l)-wymiarowej. Na takiej (niemożliwej do wykreślenia) hiperpowierzchni mogą również istnieć (n + l)-wymiarowe analogony wierzchołków kopuł i den pucharów. Jak je identyfikujemy?
Warunek pierwszego rzędu dla ekstremum Rozważmy funkcję trzech zmiennych decyzyjnych: Z = f{X
j ,
* 2 , * i)
z pochodnymi cząstkowymi pierwszego rzędu i drugimi pochodnymi cząstkowymi f j (&d2zldxjdxj), dla i , j - 1, 2, 3. Na mocy twierdzenia Younga mamy/i, =.£,■. Nasze wcześniejsze rozważania sugerują, że aby mieć maksimum lub minimum z, konieczne jest, aby dz = 0 dla dowolnych, nie wszystkich równych zeru, wartości d i], dt2 i dt3. Ponieważ dz jest teraz równe: (11.17)
dz = /id t, + f2dx2 + fsdxl
3 3 6 PROBLEMY OPTYMALIZACJI
J
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 337
.
i ponieważ d*i, d*2 i d*3 są dowolnymi (nieskończenie małymi) przyrostami zmiennych niezależnych i nie wszystkie są równe zeru, więc jedynym sposobem zagwarantowania zerowego dz jest, aby/i = / 2 = / 3 - 0. Zatem ponownie warunkiem koniecznym dla ekstremum jest to, aby wszystkie pochodne cząstkowe pierwszego rzędu były równe zeru, tak samo jak w przypadku dwu zmiennych9.
■i;
>.i :■|
Przy badaniu dodatniej lub ujemnej określoności d2z znów musimy, jak to zrobiliśmy w (11.160, traktować d*,-jako zmienne, które mogą przyjmować dowolne wartości (chociaż nie wszystkie równe zeru), oraz traktować pochodne/tf jako współczynniki, na które należy nałożyć pewne ograniczenia. Współczynniki w (11.18) prowadzą do symetrycznego hesjanu: /12
/n
f n fzs
fu
fn fn
Warunek drugiego rzędu
■-. . • . .H Spełnienie warunku pierwszego rzędu wyznacza pewne wartości z jako wartości stacjonarne funkcji celu. Jeśli stwierdzamy dla stacjonarnej wartości z, że d2z jest dodatnio określona, to wystarczy to do ustanowienia wartości z jako minimum. Analogicznie, ujemna określoność d2z jest warunkiem dostatecznym, aby wartość stacjonarna była minimum. Powstaje pytanie, jak wyrazić d2z, gdy w funkcji występują trzy zmienne i jak zbadać jej dodatnią lub ujemną określoność. Wyrażenie d2z można otrzymać, różniczkując dz podaną w (11.17). W trakcie tego procesu, jak w (11.6), powinniśmy traktować pochodne f jako zmienne, a różniczki d*, jako stałe. Mamy zatem: ^ (1 1 .1 8 )
f t = d«k) = ^ > -< U ,+ ^ ÓXi
d
. 1
ĆX2
(11.19)
•
fn f n d*i d*2 + / 13dX] d*3 +
+ / 21 d*2 d*) + fn d* 2 +
/ 23 d*2d*3 +
co jest formą kwadratową podobną do (11.12). W konsekwencji kryteria dodatniej i ujemnej określoności, jakie poznaliśmy wcześniej, mają tutaj bezpośrednie zastosowanie.
9 Szczególny przypadek występuje wówczas, gdy zajmujemy się funkcją z = /( * 1 , x2, *3 ) zdefiniowaną w sposób uwikłany równaniem F(z, *i, *2, * 3) = 0 ; gdy:
af
dF
af
dx,
dx2
dx3
ife
#
( i = l ’ 2’ 3v
*
*
|H 3| < 0
(d2z ujemnie określona),
|H)| > 0;
|H 2| > 0;
|H3| > 0
(d2z dodatnio określona).
/12 /13
/21 f n
fn
fn
fn
fn
z = 2x2 + XiX2 + 4* 2 + XiX2 + * 3 + 2. Warunek pierwszego rzędu dla ekstremum zakłada jednoczesne spełnienie następujących trzech równań: (f i =)
.
|H 2) > 0;
Przykład 1. Znaleźć wartość (lub wartości) ekstremalne dla:
—dF/dXi sprowadza się do warunku:
IHJ < 0;
W istocie, zamiast mówić, że różniczka zupełna drugiego rzędu d2z jest dodatnio (ujemnie) określona, można również przyjąć stwierdzenie, że macierz hesjanu H (którą należy odróżnić od wyznacznika hesjanu |H |) jest dodatnio (ujemnie) określona. Przy tym zastosowaniu należy jednak zauważyć, że określoność H dotyczy znaku formy kwadratowej d2z, z którą H jest związane, a nie znaku elementów H samych w sobie.
+ / i d* 3 d*i + fyi d*3d*2 + fys d*3,
— = — = — = 0,
[ minimum J ’
Przy stosowaniu tego warunku musimy obliczyć wszystkie minory główne w punkcie stacjonarnym, gdzie f =f 2 = / 3 - 0. Możemy oczywiście zastosować również test wartości własnych i połączyć dodatnią (ujemną) określoność d2z z dodatniością (ujemnością) wszystkich wartości własnych macierzy hesjanu:
0X 2
0
J maksimum]
0^3
a + — (/idxi + / 2d*2 + / d * 3)d*3 -
wtedy wanmek pierwszego rzędu f = f 2 = f i -
Z jest
jeśli
•
/11 /12 /21 f n
+ ^ < U ,=
0X2
dz
|H2I =
Wtedy, na podstawie kryteriów wyznacznikowych dla dodatniej i ujemnej określoności, możemy stwierdzić, że warunek dostateczny drugiego rzędu dla ekstremum z jest następujący:
+ rr— (/idxi + f2dx2 + /jd * 3)d*2 +
* ■ £ - » ¡ 5 -.
którego' kolejne minory główne mogą być oznaczone przez:
fp ® '■I:' ''
= ” ( /id * i+ /2d*2 + / 3d*3)d*1+
= /,, d*2 +
/l3
|H | = /21
. .iik :
4*!+ *2 + *3 = 0,
(f 2=)
*i + 8*2
( /3 = )
*1
=0,
■
ponieważ wartość mianownika d F/dz *
0
nie czyni różnicy.
22 — Podstawy...
+2*3
= 0.
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 3 3 9
338 PROBLEMY OPTYMALIZACJI
Ponieważ jest to liniowy jednorodny układ równań, w którym wszystkie trzy równania są niezależne (wyznacznik macierzy współczynników nie znika), istnieje jedyne rozwiązanie x t = x2= x3 = 0. Oznacza to, że jest tylko jedna wartość stacjonarna 1 - 2 . Wyznacznik hesjanu dla tej funkcji jest równy: /1 2
/1 1
|H | =
4
/.3
/2 1
fn ' fn
/3 1
fn
=
1
1 1 8 0
1 0
fn
|H 2| = 31;
-r
0
3
0
—2 —r
0
3
0
- 6 —r
=
0
i po obliczeniu staje się równaniem trzeciego stopnia:
2
r 2 + 8 r2 + 3 r - 18 = 0.
Wszystkie jego główne minory są dodatnie: |H ,| = 4;
zamiast elementów dy do tego równania. Zatem równanie charakterystyczne (dla pierwszego rozwiązania) jest następujące:
Metodą prób i błędów możemy rozłożyć to równanie na czynniki i przepisać jako:
|H ,| = 54,
(r + 2) (r2 + 6 r - 9) = 0.
a zatem na podstawie (11.9) możemy wnioskować, że f = 2 jest minimum. Przykład 2. Znaleźć wartość (lub wartości) ekstremalne dla:
Jak wskazuje czynnik (r+ 2), jedną z wartości własnych jest rx = - 2 . Pozostałe dwa pierwiastki można znaleźć, stosując wzory na pierwiastki trójmianu kwadratowego do
Z = - x ] + 3*1*3 + 2*2 - *2 - 3* 3-
drugiego czynnika; są one równe r2 = - 3 + ~ J l 2 i r3 = - 3 - — J l 2 . Ponieważ ri i r3 są
Pierwsze pochodne cząstkowe są równe:
ujemne, a r2 jest dodatnie, więc forma kwadratowa d2z jest nieokreślona i narusza w ten sposób warunki drugiego rzędu konieczne dla maksimum i konieczne dla minimum. Zatem pierwsze rozwiązanie (fi = 1) nie jest ekstremum, lecz punktem przegięcia. Dla drugiego rozwiązania sytuacja jest prostsza. Ponieważ kolejne minory główne:
/ i = -3*? + 3*3;
/ 2 = 2 - 2*2’,
/ 3 = 3 * i- 6*3.
Przyrównując wszystkie f do zera, otrzymujemy trzy równania — jedno nieliniowe i dwa liniowe: / -3*?
+ 3*3 = -2*2
3*1
0,
= -2 ,
-6 * 3 =
0.
' ft-;
'
Ponieważ drugie równanie daje *2 = 1, a trzecie równanie implikuje *i = 2*3, więc podstawienie ich do pierwszego równania daje dwa rozwiązania: ą. (0, (*I, *2, *3)
1,
1 2’
h
0 ),
co implikuje z =
o
17 co implikuje z = -j^-.
~A
|H | =
0
0 - 2 3
|H 2| = 6;
|H 3|= - 1 8
należycie zmieniają znak, więc test wyznacznikowy jest rozstrzygający. Zgodnie z (11.19) 17 . rozwiązanie z = — jest maksimum. 16 '
Przypadek n zmiennych
1,
Drugie pochodne cząstkowe, odpowiednio uporządkowane, dają nam hesjan: - 6*1
IH, | = —3;
3
0 0 -6
w którym pierwszy element ( - 6*1) redukuje się do Odia pierwszego rozwiązania (gdzie *1 = 0) i do - 3 dla drugiego rozwiązania gdy * i = y . Jest natychmiast oczywiste, że pierwsze rozwiązanie nie spełnia dostatecznego warunku drugiego rzędu, gdyż |H i| = 0. Możemy jednak odwołać się do testu wartości własnych po dalsze informacje. W tym celu stosujemy równanie charakterystyczne (11.14). Ponieważ testowaną formą kwadratową jest d2z, której wyróżnikiem jest wyznacznik hesjanu, powinniśmy oczywiście podstawić elementy hesjanu
Gdy mamy n zmiennych decyzyjnych, funkcja celu może być wyrażona jako: ż = /( * 1,*2, ••.,.**). Różniczka zupełna będzie wtedy równa: dz = fd x . + f2d*2 + ... +/„d*„, tak więc warunek konieczny dla ekstremum (dz = 0 dla dowolnych d*,) oznacza, że wszystkie n pochodnych cząstkowych pierwszego rzędu ma być równe zeru. Różniczka drugiego rzędu d2z znów będzie formą kwadratową, wyprowadzoną ana logicznie do (11.18) i wyrażaną w postaci struktury n x n . Współczynniki tej struktury, odpowiednio uporządkowane, dają teraz (symetryczny) hesjan:
|H | =
fn
•.. / u
Z.
fn
•
u
fnl
fln
•• fnn
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 341
340 PROBLEMY OPTYMALIZACJI
o minorach głównych IH J, |H 2| , .... |H„|, określonych jak poprzednio. Warunkiem drugiego rzędu dostatecznym dla ekstremum — jak poprzednio — jest to, że n minorów głównych ma być dodatnich (dla m in im um z) i że mają odpowiednio zmieniać znaki, a pierwszy ma być ujemny (dla maksimum z).
7.
a. Znaleźć wartości własne macierzy hesjanu z zadania 3. b Co można wywnioskować na podstawie otrzymanych wyników? c. Czy odpowiedź w punkcie (b) jest zgodna z wynikami powyższego testu wyznacz nikowego dla zadania 3?
Tablica 11.2 Test wyznacznikowy dla ekstrem um względnego z = / ( * i> *2ł •••>x„) Maksimum
Warunki
11.5. WARUNKI DRUGIEGO RZĘDU W ODNIESIENIU DO WKLĘSŁOŚCI I WYPUKŁOŚCI
Minimum
Warunek konieczny pierwszego rzędu
/.= /2 = ...= /* = 0
/ ,= / 2 = ...= / „ = 0
Warunek dostateczny drugiego rzędu*
|H ,| < 0; |H2| > 0; |H 3|< 0 ; ...;( -l) " |H „ |> 0
|H ,|, |H2| , ..., |H ,| > 0
* M o ż n a g o s to s o w a ć ty lk o p o s p e łn ie n iu w a r u n k u p ie r w s z e g o r z ę d u .
,
Podsumowując, mamy zatem — jeśli skupimy się na teście wyznacznikowym — kryteria wymienione w tabl. 11.2, która obowiązuje dla funkcji celu o dowolnej liczbie zmiennych decyzyjnych. W szczególnych przypadkach n — 1 lub n ~ 2. Gdy n = 1, wówcżas funkcją Celu jest z = f( x ) i warunki dla maksymalizacji (/i = 0 i |H i|< 0 ) sprowadzają się do /'( * ) = 0 i /" (* ) < 0, dokładnie takich, jakie poznaliśmy w podrozdz. 9.4. Gdy n = 2, wówczas funk cją celu jest z = /( * i , *2) i warunkiem pierwszego rzędu dla maksimum je st/i = / 2 = 0, podczas gdy warunek dostateczny drugiego rzędu przyjmuje postać: /u < 0
i
fu fn
fn —f n f n ~ f \ i > 0. fn
co jest po prostu powtórzeniem informacji przedstawionej w tabl. 11.1.
Ćwiczenie 11.4 Znaleźć wartości ekstremalne, jeśli istnieją, dla następujących pięciu funkcji. Stosując test wyznacznikowy, sprawdzić, czy są to minima czy maksima. 1.
Z = *1 + 3*2 -
3* 1*2 +
4 * 2*3 + 6 *3 .
2. z = 2 9 - ( * 1+*2 + * 3)3. z =
' J‘‘"
* l* 3 + * l - * 2 + * 2 * 3 + * 2 + 3*3-
4. z = e* + ey + ew2 - 2e“' - (* + y). 5. z = e2 tt c y+ c*2 - (2* -t 2e"' - >•).
!
6. Odpowiedzieć na poniższe pytania dotyczące macierzy hesjanów i ich wartości własnych. a. Które z powyższych zadań prowadzi do diagonalnej macierzy hesjanu? Czy w każdym z tych przypadków elementy diagonalne mają stały znak? b. Co można wywnioskować o wartościach własnych każdej znalezionej diagonalnej macierzy hesjanu? A co o określoności d2z? c. Czy wyniki testu wartości własnych są zgodne z w y n i k a m i , t e s t u wyznacznikowego?
Warunki drugiego rzędu — sformułowane dla minorów głównych wyznacznika hesjanu lub dla wartości własnych macierzy hesjanu — zawsze związane są z pytaniem o to, czy punkt stacjonarny jest szczytem wzgórza, czy dnem doliny. Innymi słowy, związane są z tym, jak krzywa, powierzchnia lub hiperpowierzchnia (zależnie od przypadku) wygina się w pobliżu punktu stacjonarnego. W przypadku jednej zmiennej decyzyjnej z = /(* ) konfiguracja wzgórza (lub doliny) przejawia się w postaci krzywej o kształcie odwróconej litery U (lub litery U). Dla funkcji dwu zmiennych z = /(* , y) konfiguracja wzgórza (doliny) przyjmuje postać powierz chni w kształcie kopuły (pucharu), jak pokazano na rys. 11.2(a) i (b). Gdy występują trzy lub więcej zmiennych decyzyjnych, wzgórza i doliny nie mogą już być narysowane, ale mimo to możemy myśleć o „wzgórzach” i „dolinach” na hiperpowierzchniach. Funkcja, która powoduje pojawienie się wzgórza (doliny) nad całą dziedziną, zwana jest funkcją wklęsłą (wypukłą)10. W obecnych rozważaniach przyjmiemy, że dziedziną jest całe R", gdzie n jest liczbą zmiennych decyzyjnych. Ponieważ kształt wzgórza lub doliny odnosi się do całej dziedziny, wklęsłość i wypukłość są oczywiście pojęciami globalnymi. W dokładniejszej klasyfikacji rozróżniamy z jednej strony wklęsłość i wypukłość, a z drugiej strony ścisłą wklęsłość i ścisłą wypukłość. W przypadku nie ścisłym wzgórze lub dolina mogą zawierać jedną lub więcej płaskich (a nie zakrzywionych) części, takich jak odcinki prostej (na krzywej) lub odcinki prostej i segmenty płaszczyzny (na powierzchni). Obecność słowa „ścisły” wyklucza takie odcinki prostej lub płaszczyzny. Dwie powierzchnie pokazane na rys. 11.2 ilustrują odpowiednio funkcje ściśle wklęsłą i ściśle wypukłą. Krzywa na rys. 6.5 jest natomiast wypukła (przedstawia dolinę), ale nie ściśle wypukła (zawiera odcinki prostej). Ściśle wklęsła (ściśle wypukła) funkcja musi być wklęsła (wypukła), ale odwrotne twierdzenie nie jest prawdziwe. , Ze względu na związek wklęsłości i ścisłej wypukłości z globalną konfiguracją wzgórza, ekstremum funkcji wklęsłej musi być wierzchołkiem — maksimum (a nie minimum), i to maksimum absolutnym (a nie względnym), gdyż wzgórze obejmuje całą dziedzinę. Jednakże to maksimum absolutne nie musi być jedyne, gdyż może wystąpić wiele maksimów, jeśli wzgórze ma płaski wierzchołek. Ostatnia możliwość może być odrzucona tylko wtedy, gdy określamy ścisłą wklęsłość, ponieważ jedynie wówczas wierzchołek będzie się składał z jednego punktu i maksimum bezwzględne będzie jednoznaczne. Jedyne (nie jedyne) maksimum bezwzględne bywa również nazywane mocnym (słabym) maksimum bezwzględ- nym. 10 Jeśli wzgórze (dolina) należy tylko do podzbioru 5 dziedziny, funkcję nazywamy wklęsłą (wypukłą) na S.
3 4 2 PROBLEMY OPTYMALIZACJI
Na mocy analogicznego rozumowania ekstremum funkcji wypukłej musi być absolutnym (czyli globalnym) minimum, które nić musi być jedyne. Ale ekstremum funkcji ściśle wypukłej musi być jednoznacznym minimum bezwzględnym. W dotychczasowych rozważaniach wklęsłość i wypukłość traktowaliśmy w wymiarze globalnym. Gdy są one jednak właściwe tylko dla części krzywej lub powierzchni (tylko w podzbiorze S dziedziny), wówczas związane z nimi maksimum i minimum są względne (lokalne) dla tego podzbioru dziedziny, ponieważ nie możemy być pewni, jaka jest sytuacja poza podzbiorem S. W naszych rozważaniach o określoności znaku d2z (lub macierzy H ) obliczaliśmy wartości minorów głównych wyznacznika hesjanu tylko w punktach stacjonar nych. Ograniczając w ten sposób weryfikację konfiguracji wzgórza lub doliny do .małego otoczenia punktu stacjonarnego, mogliśmy badać jedynie względne maksima i minima. Może się jednak zdarzyć, że d2z ma wszędzie określony znak, niezależny od punktu, w którym obliczono minory główne. W tym przypadku wzgórze lub dolina będą obejmowały całą dziedzinę i znalezione maksimum i minimum będą z natury absolutne. Dokładniej, jeśli d2z jest wszędzie ujemnie (dodatnio) półokreślone, to funkcja z = f (*i, x2, ...,* „) musi być wklęsła (wypukła), a jeśli d2z jest wszędzie ujemnie (dodatnio) określona, to fu n k cja/m u si być ściśle wklęsła (ściśle wypukła). Powyższe rozważania są podsumowane na schemacie przedstawionym na rys. 11.5 dotyczącym funkcji z = f( x u x2, ...,*„) różniczkowalnej dwukrotnie w sposób ciągły. Dla jasności skoncentrowaliśmy się wyłącznie na wklęsłości i maksimum, jednakże przedstawione związki pozostaną prawdziwe, jeśli słowa „wklęsły” , „ujemnie” , „maksimum” zostaną zastąpione odpowiednio przez „wypukły” , „dodatnio’’ i „minimum’’. Aby odczytać rys. 11.5, przypomnijmy, że symbol => (tutaj wydłużony, a nawet wygięty) oznacza „implikuje” . Gdy symbol ten rozciąga się od jednej ramki (np. prostokąta) do innej (np. owalu), oznacza to, że poprzedni implikuje (jest wystarczający dla) następny; oznacza też, że ten drugi jest konieczny dla poprzedniego. A gdy symbol => rozciąga się od jednej ramki przez drugą do trzeciej, oznacza to, że pierwsza wraz z drugą implikują trzecią. , . t Kiedy odczytujemy z góry na dół środkową kolumnę rys. 11.5, to widzimy, że warunek pierwszego rzędu jest konieczny dla z, aby było ono względnym maksimum, natomiast status względnego maksimum jest konieczny dla z, aby było ono maksimum absolutnym i tak dalej. Podobnie odczytując tę kolumnę z dołu do góry, widzimy, że fakt, iż z jest jedynym maksimum bezwzględnym, wystarcza, aby stwierdzić, że Z jest maksimum bezwzględnym, natomiast status z jako maksimum bezwzględnego jest z kolei wystarczający na to, aby Z było maksimum względnym i tak dalej. Trzy owale na samej górze odnoszą się do warunków pierwszego i drugiego rzędu w punkcie stacjonarnym Z■Dotyczą one zatem tylko minimum względnego. Natomiast romby i trójkąty w dolnej części opisują globalne własności, które umożliwiają nam wyprowadzenie wniosków dotyczących maksimum bezwzględnego. Wcześniej wskazywaliśmy tylko na to, że ujemna półokreśloność d2z w całym obszarze jest wystarczająca dla wklęsłości funkcji/, na rys. 11.5 dodaliśmy natomiast informację, że warunek ten jest również konieczny. W przeciwieństwie do tego, silniejsza własność ujemnej określoności d2z w każdym punkcie jest dostateczna, ale nie konieczna dla ścisłej wklęsłości / , ponieważ ścisła w klęsłość/jest niesprzeczna z zerową wartością d2z w punkcie stacjonarnym. Najważniejsza informacja przekazana na rys. 11.5 jest jednak zawarta w dwu wy dłużonych symbolach => przechodzących przez dwa romby. Symbol po lewej stronie stwierdza, że dla danej wklęsłej funkcji celu każdy punkt stacjonarny może natychmiast być identyfikowany jako maksimum bezwzględne. Idąc o krok dalej, widzimy, że symbol => po
OPTYMALIZACJA w PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 343
Rysunek 11.5
prawej strome wskazuje, że jeśli funkcja celu jest ściśle wklęsła, to punkt stacjonarny musi rzeczywiście być jedynym maksimum bezwzględnym. W obu przypadkach, jeśli spełniony jest warunek pierwszego rzędu, wklęsłość lub ścisła wklęsłość skutecznie zastępuje warunek drugiego rzędu jako dostateczny warunek dla maksimum — a nawet dla maksimum bezwzględnego. Moc tego nowego warunku dostatecznego staje się jasna, gdy przypomnimy sobie, że d2z może być równa żeru na wierzchołku, co powoduje niespełnienie warunku dostatecznego drugiego rzędu. Jednak wklęsłość lub ścisła wklęsłość może „poradzić” sobie nawet z takimi kłopotliwymi wierzchołkami, ponieważ gwarantuje, że warunek dostateczny wyższego rzędu jest spełniony nawet wtedy, gdy nie jest spełniony warunek drugiego rzędu. Z tego właśnie powodu często na samym starcie przyjmowane są założenia o wklęsłości, gdy model
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 345
344 PROBLEMY OPTYMALIZACJI
maksymalizacji jest formułowany dla ogólnej funkcji celu (i podobnie często przyjmuje się założenie o wypukłości dla modelu maksymalizacji). Wtedy bowiem wystarczy jedynie zastosować warunek pierwszego rzędu. Jeśli jednak używamy konkretnej funkcji celu, to nie możemy już po prostu przyjąć założenia o wklęsłości lub wypukłości. Przeciwnie, musimy tę własność sprawdzić.
Sprawdzanie wklęsłości i wypukłości Wklęsłość i wypukłość — ścisła lub nie — może być zdefiniowana (i sprawdzana) ńa kilka sposobów. Najpierw wprowadzimy geometryczną definicję wklęsłości i wypukłości funkcji dwu zmiennych z = f( x i, *2), podobną do wersji dla jednej zmiennej omówionej w podlozdz. 9.3:
Funkcja z = /( * 1, *2) jest wklęsła (wypukła) wtedy i tylko wtedy, gdy na jej wykresie — na powierzchni — dla każdej pary różnych punktów M i N odcinek MN leży albo na powierzchni, albo pod nią (nad hią). Funkcja jest ściśle wklęsła (ściśle wypukła) wtedy i tylko wtedy, gdy odcinek M N leży całkowicie pod (nad) powierzchnią, z wyjątkiem punktów M i N. Przypadek funkcji ściśle wklęsłej jest zilustrowany na rys. 11.6, gdzie M i N, dwa dowolne punkty powierzchni, są połączone przerywanym odcinkiem i pogrubionym łiilaem utworzonym z punktów na powierzchni leżących dokładnie nad odcinkiem. Ponieważ ścisła wklęsłość wymaga, aby odcinek MN leżał całkowicie poniżej łuku M N (z wyjątkiem M i N) dla dowolnej pary punktów M i N, powierzchnia musi mieć kształt kopuły. Analogicznie, powierzchnia funkcji ściśle wypukłej musi mieć kształt pucharu. Jeśli chodzi o funkcje wklęsłe
i wypukłe (nie ściśle), to ponieważ odcinek MN może leżeć na samej powierzchni, więc pewna część powierzchni, a nawet cała powierzchnia może być płaszczyzną— płaską, a nie zakrzywioną. Aby ułatwić uogólnienia do nie dającego się narysować przypadku «-wymiarowego, definicja geometryczna musi być „przetłumaczona” w równoważną wersję algebraiczną. Powróćmy do rys. 11.6. Niech u = («1, uf) i v = (tą, v2) będą dowolnymi dwiema różny mi parami uporządkowanymi (wektorami 2-elemen to wy m i) należącymi do dziedziny z = /( * i, *2)- Wtedy odpowiadające im wartości z (wysokość powierzchni) będą równe /( u ) = /( « ,, u2) i /(v ) = f(v u v2). Założyliśmy, że zmienne mogą przyjmować wszystkie wartości rzeczywiste, więc jeśli u i v należą do dziedziny, to wszystkie punkty odcinka uv również należą do dziedziny. Każdy punkt wspomnianego odcinka jest z natury „średnią ważoną” u i v. Możemy zatem oznaczyć11 ten odcinek przez 0 u + (l — 0 )v, gdzie 0 —- w przeciwieństwie do u i v — jest (zmiennym) skalarem o zbiorze wartości 0 =S 0 sg 1. Na tej samej zasadzie odcinek MN, reprezentujący zbiór wszystkich średnich ważonych /(u ) i/(v), może być wyrażony jako 0/(u) + (1 - 0 )f(y ), znów dla 0 zmieniającego się od 0 do 1. A co z lukiem M N na powierzchni? Ponieważ łuk ten pokazuje wartości funkcji/obliczone w różnych punktach odcinka uy, więc może być zapisany po prostu jak o / [ / u + (1 - 0) v]. Stosując te oznaczenia, możemy teraz sformułować następującą definicję algebraiczną. i wklęsła 1 F u nkcja/ jest j w r wtedy i tylko wtedy, gdy dla dowolnej pary różnych punktów u i v należących do dziedziny / i dla 0 < 0 < 1: (11.20)
0 /(u ) + (1 - 0 )/(v ) wysokość punktu ' odcinka
/[6»u + (1 - 6»)v]. wysokość punktu na luku
Aby wykluczyć dwa końcowe punkty M i N, ograniczyliśmy 0 tylko do otwartego przedziału (0, 1). Definicję tę można z łatwością przystosować do ścisłej wklęsłości i wypukłości, zastępując nieostre nierówności i 2= przez -^.odpowiednio — ścisłe nierówności < i >. Zaletą definicji algebraicznej jest to, że można ją .stosować do funkcji dowolnej liczby zmiennych, gdyż wektory u i v w tej definicji mogą'doskonale być interpretowane jako wektory «-wymiarowe, a nie dwuwymiarowe. Z (11.20) można dość łatwo wyprowadzić trzy twierdzenia dotyczące wklęsłości i wypukłości. Zostaną one sformułowane dla funkcji fix ) i g(*), ale x może być również interpretowany jako wektor zmiennych; tzn. twierdzenia te są prawdziwe dla dowolnej liczby żmiennych. Twierdzenie I (funkcja liniowa) Jeśli f( x ) jest funkcją liniową, tó jest zarówno funkcją wklęsłą, jak i wypukłą, ale nie ściśle.
Rysunek 11.6
..i'
: %
11 Wyrażenie w postaci średniej ważonej 0 u + (1 - 0 )v , dla każdej wartości i?¡pomiędzy 0 a 1, ma techniczną ńażwę wypukłej kombinacji wektorów u i V. Pozostawiając dokładniejsze wyjaśnienia do dalszej części tego podrozdziału, możemy zauważyć, że gdy 0 = 0, wówczas dane wyrażenie redukuje się do Wektora v i podobnie, gdy 0 = 1 , wówczas wyrażenie redukuje się do wektora u. Pośrednia war tość 0 daje natomiast średnią dwu wektorów ii i v.
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 3 4 7
346 PROBLEMY OPTYMALIZACJI
Taki sam wniosek obowiązuje tym bardziej, jeśli g(x) jest ściśle wklęsła, tak ja k /(* ), tzn. jeśli (11.22) jest ostrą nierównością, podobnie jak (11.21). Dowodzi to drugiej części twierdzenia dla przypadku wklęsłego. Dowód dla przypadku wypukłego jest po dobny. To twierdzenie, które jest prawdziwe również dla sumy więcej niż dwu funkcji wypukłych (wklęsłych), może się niekiedy okazać użyteczne, gdyż umożliwia rozczłon kowanie zadania sprawdzania wklęsłości lub wypukłości funkcji złożonej ze składników. Jeśli składniki te, badane osobno, są wklęsłe (wypukłe), wystarczy to, aby stwierdzić, że funkcja stanowiąca ich surńę jest wklęsła (wypukła).
T w ie rd zen ie I I (fu n k cja przeciw na)
Jeśli /(* ) jest funkcją wklęsłą, to - /(* ) jest funkcją wypukłą i vice versa. Podobnie, jeśli/(* ) jest funkcją ściśle wklęsłą, to - /(* ) jest funkcją ściśle wypukłą i vice versa. Twierdzenie III (sum a funkcji) Jeśli /(* ) i g (x ) są funkcjami wklęsłymi (wypukłymi), to /(* ) + g(*) jest również funkcją wklęsłą (wypukłą). Jeśli/(* ) i g(x) są wklęsłe (wypukłe) i dodatkowo jedna z nich lub obie są ściśle wklęsłe (ściśle wypukłe), to f( x ) + g(x) jest ściśle wklęsła (ściśle wypukła).
Przykład 1. Sprawdzić, czy z = x 2 + x 2 jest wklęsła lub wypukła. Aby zastosować (11.20), założymy, że u = (m , uf) i v = (yj, v2) będą dwoma różnymi punktami dziedziny. Mamy wtedy:
Twierdzenie I wynika z faktu, że wykresem funkcji liniowej jest linia prosta, płaszczyzna lub hiperpłaszczyzna, tak więc „odcinek prostej M N ’ zawsze pokrywa się z .Jukiem M N ". W konsekwencji dwa warunki zapisane w (11.20) są jednocześnie spełnione jako równości, co powoduje, że funkcja kwalifikuje się jednocześnie jako wklęsła i wypukła. Ale ponieważ nie jest spełniony warunek definicji w postaci ostrej nierówności, więc funkcja liniowa nie jest ani ściśle wypukła, ani ściśle wklęsła. Podstawą twierdzenia II jest fakt, że definicje wklęsłości i wypukłości różnią się jedynie zwrotem nierówności. Przypuśćmy, że / jest wklęsłe; wtedy:
/ ( “ )= /(« i> «2) = « ?+ «2, / ( v ) = / ( v i , v2) = v? + v2 oraz: / [ 0 u + (1 - 6) v] = f [ 6 Ul + (l-ć> )v!,
0 /(u ) + (1 - 0 ) /( v ) < f ( 6 U+ (1 - 0)v].
wartość *1
Mnożąc obustronnie przez —1 i odpowiednio zmieniając zwrot nierówności, otrzymuje
=
[6 Ul +
(1
-
6 )
0k2 + ( 1 - 0 ) v 2] = wartość ^
V j ] 2 + [ 0 n2 +
(1 -
0 )
v2] 2.
my: Po podstawieniu tych wyrażeń do (11.20), odjęciu wyrażenia po prawej stronie od wyrażenia po lewej i uporządkowaniu stwierdzamy, że różnica jest równa:
6 [ - f( u)] + (1 - 0) [-/(v )] > - f [ 6 n + (1 - 0) v]; jest to jednak dokładnie warunek mówiący, że - fix ) jest wypukła. Zatem twierdzenie jest uzasadnione dla przypadku wklęsłej funkcji f{x). Geometryczna interpretacja tego wyniku jest bardzo prosta: symetryczne odbicie wzgórza względem płaszczyzny podstawy lub hiperpłaszczyzny podstawy jest doliną. Inne przypadki można udowodnić w podobny sposób. Aby sprawdzić uzasadnienie twierdzenia HI, przypuśćmy, że fix ) i g(x) są wklęsłe. Wtedy spełnione są następujące nierówności: (11.21) (11.22)
0(1 - 0 ) (n 2 + w2) + 6(1 - 0 )(v 2+ v 2) - 2 0 ( l - 6 ) («]V! + «2v2) = = 0 ( 1 - 0 ) [ ( « 1- V 1)2+ («2-V 2)2]. Ponieważ 0 jest dodatnim ułamkiem, więc 0(1 —0) musi być dodatnie. Ponadto po nieważ («1, uf) i (vj, v2) są różnymi punktami, ćo oznacza, że U[ + V! lub u2 ^ v2, więc wyrażenie w nawiasach kwadratowych również musi być dodatnie. Zatem w (11.20) mamy ostrą nierówność i z = x \ + x \ jest ściśle wypukła. Podobnie możemy sprawdzać osobno każdy ze składników. Ponieważ każdy z nich wzięty oddzielnie jest funkcją ściśle wypukłą, więc ich suma jest również ściśle wypukła. Ponieważ ta funkcja jest ściśle wypukła, więc ma jedyne minimum bezwzględne. Łatwo sprawdzić, że tym minimum jest z - 0 osiągane w punkcie *1 = x2 = 0 i że jest ono rzeczywiście minimum bezwzględnym i jedynym, gdyż każda para uporządkowana (*j, x2) * (0, 0) prowadzi do wartości z > 0.
0 /(u ) + ( l - 0 ) / ( v ) = S / [ 0 u + ( l - 0 ) v ] , 0g(u) + ( l- 0 ) g ( v ) = S g [ 0 u + ( l - 0 ) v ] .
Dodając je, otrzymujemy nową nierówność: (11.23)
0[f(u) + g(u)] + ( 1 - 6 ) (f(Y) + g(v)] = s /[0 u + (1 - 0)v] + g (6 u + (1 - 0)v],
ale to jest dokładnie warunek na to, aby f(x ) + g(x) była wklęsła. Zatem twierdzenie jest udowodnione dla przypadku wklęsłego. Dowód dla przypadku wypukłego jest podobny. Przechodzimy do drugiej części twierdzenia DI. N iech/(*) będzie ściśle wklęsła. Wtedy (11.21) staje się ścisłą nierównością: (11.210
Przykład 2. Sprawdzić, czy z = - * 2 - x \ jest wklęsła lub wypukła. Funkcja ta jest przeciwna do funkcji z przykładu 1. Zatem na mocy twierdzenia n jest ściśle wklęsła.
0f(u) + (1 - 6)f(v) < f[ 6 u + (1 - 0)v],
Dodając ją do (11.22), widzimy, że suma wyrażeń stojących po lewej stronie tych dwu nierówności jest ostro mniejsza niż suma wyrażeń po prawej stronie, niezależnie od tego, czy w (11.22) spełnione jest <, czy = . Oznacza to, że również (11.23) jest ostrą nierównością, czyniąc w ten sposób [/(* ) + g(x)] ściśle wklęsłą.
-
Przykład 3. Sprawdzić, czy z = (* + y)2 jest wypukłe lub wklęsłe. Mimo iż argumenty oznaczono symbolami * i y, a nie *1 i x2, możemy przyjąć u = (m , uf) i v = (v,, v2) na oznaczenie dwu różnych punktów dziedziny, z indeksem i odpowiadającym ¡-tej zmiennej. Mamy wtedy:
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNE) ZMIENNEJ DECYZYJNEJ 349
348 PROBLEMY OPTYMALIZACJI
/(U ) = /(« ! , M2) = (« i + M2)2, / ( V ) = / ( V l , V2) = ( V i + V 2) 2,
f [ 6 u + (1 - 0) v] = [0u, + (1 -0 ) V, + 0«2 + (1 - 0) v j 2 = = [0(«1 + K2) + (1 - 0) (V i + v2)]2. Po podstawieniu tych wyrażeń do (11.20), odjęciu wyrażenia po prawej stronie od wyrażenia po lewej i uporządkowaniu składników zobaczymy, że ich różnica jest równa: 0(1 - 0) («, + u2)2 - 20(1 - 0) (u, + u2) (Vl + v2) + 0(1 - 0) (vi + v2)2 = = 0(1 - 0)
[(«i
+ U2) -
(V j
+ v2)]2.
Tak jak w przykładzie 1, 0(1 - 0) jest dodatnie. Kwadrat wyrażenia w nawiasach kwadratowych jest nieujemny (tym razem nie można wykluczyć, że jest równy zeru). Wobec tego (11.20) jest spełnione jako nieostra nierówność, a zatem funkcja (x + y)2 jest wypukła, chociaż nie jest ściśle wypukła. Odpowiednio do tego funkcja ta ma minimum absolutne, które jednak nie musi być minimum jedynym. Łatwo sprawdzić, że minimum absolutne Z = 0 jest osiągane wtedy, gdy tylko i + y = 0. To, że jest to minimum absolutne, łatwo stwierdzić na podstawie faktu, że gdy tylko x + y 0, wówczas z będzie większe niż Z = 0. To, że nie jest ono jednoznaczne, wynika z tego, że nieskończenie wiele par (x , y) spełnia warunek x + y = 0.
Funkcje różniczkowalne Definicja wklęsłości i wypukłości sformułowana tak, jak w (11.20), nie zawiera pochodnych, a zatem nie wymaga różniczkowalności. Jeśli jednak funkcja jest różniczkowalna, to wklęsłość i wypukłość mogą również być zdefiniowane za pomocą jej pierwszych pochodnych. W przypadku jednej zmiennej definicja jest następująca:
{
wklcsls I !> wtedy i tylko wtedy, gdy dla każdego wypukłaJ danego punktu u i diDwolnego innego punktu v dziedziny funkcji:
Funkcja róźniczkow
(11.24)
/(v )C
/( « ) + / '( « )
Rysunek 11.7
przypadku nachylenie odcinka prostej AC jest mniejsze niż nachylenie stycznej AB. Jeśli krzywa nie jest ściśle wklęsła, to może zawierać odcinek prostej, tak więc np. łuk AC może stać się odcinkiem prostej i pokrywać z odcinkiem prostej AB, czyli być liniową częścią krzywej. W takim przypadku nachylenie AC jest takie samo, jak nachylenie AB. Te dwie sytuacje razem wzięte implikują, że: DC ^nachylenie odcinka AC = ^
m
- m
f'( u )
(= nachylenie AB).
Jeżeli obie strony tej nierówności pomnożymy przez dodatnią wielkość (v - u), to otrzymujemy wynik (11.24) dla funkcji wklęsłej. Taki sam wynik otrzymalibyśmy, roz ważając wartości x < u. Jeśli mamy do czynienia z dwiema lub większą liczbą zmiennych, to definicja wymaga niewielkiej modyfikacji:
j wklęsła Funkcja różniczkowalna/(x) = f ( x {, . . . , xn) jest \ ? wtedy i tylko wtedy, gdy dla * {wypukła J każdego danego punktu u = («i, ...,« „ ) i każdego innego punktu v = (v,, . . . , v„) należących do dziedziny:
Wklęsłość i Wypukłość będą ścisłe, jeśli nieostre nierówności w (11.24) zastąpimy nierównościami ostrymi < i >. Interpretacja geometryczna jest następująca: defijueja ta opisuje krzywą Wklęsłą (wypukłą) jako krzywą leżącą ną lub nad (pod) wszystkimi prostymi do niej Stycznymi. Aby krzywa kwalifikowała Się jako ścisłą (ściśle wypukła), musi natomiast lężeć dokładdje pdd (powyżej) każdą prostą styczną, z wyjątkiem punktów styczności. Niech na rys. 11.7 punkt A będzie dowolnym danym punktem pa krzywej o wysokości /(« ) i zć styczną AB. Zwiększamy x począwszy od wartości U. Wtedy krzywą ściśle wklęsła (taka, jak narysowana), aby utworzyć wzgórze, musi Zaginać się i coraz bardziej oddaląć od prostej stycznej, tak iż punkt C, o wysokości /(v ), musi leżeć poniżej punktu B. W tyin
(11.240 gdzie
/ ( v ) j & j / ( u ) + l f ( u ) < y j - .u ) , u) = df/dxj jest obliczona w punkcie u = (m , . . . , u n).
Definicja ta wymaga, aby wykres funkcji wklęsłej (wypukłej)/(x) leżał na albo pod (nad) wszystkimi stycznymi do niego płaszczyznami lubhiperpłaszczyznami. Dla ścisłej wklęsłości i wypukłości nieostre nierówności w (11.24') powinny być zastąpione ostrymi nierównoś
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 351
3 50 PROBLEMY OPTYMALIZACJI
ciami. Będzie to oznaczało, że wymagamy, aby wykres ściśle wklęsłej (ściśle wypukłej) funkcji leżał ściśle poniżej (powyżej) wszystkich stycznych do niego płaszczyzn lub hiperpłaszczyzn, z wyjątkiem punktu styczności. Rozważmy w końcu funkcję z = f( x u . .. ,x n), która jest dwukrotnie różniczkowalna w sposób ciągły. Dla takiej funkcji istnieją pochodne cząstkowe drugiego rzędu, a zatem jest zdefiniowana dzz. Wklęsłość i wypukłość mogą być wtedy sprawdzone na podstawie znaku d2z: ; ■"■'pS; Funkcja dwukrotnie różniczkowalna w sposób ciągły z = f( x \, . . . , x n) jest
{
wklęsła ] (ujemnie 1 ^ | wtedy i tylko wtedy, gdy d2z jest wszędzie | dodatnio| pdłokreślona.
(11-25)
fwklęsła 1 , , Wspomniana funkcja jest ściśle j WypU]cja j wte ^
. „ me
, .
, gdy
to, że d2z może przyjmować zerową wartość w punkcie stacjonam ym funkcjC (T której wiemy, że jest ściśle wklęsła lub ściśle wypukła. Oczywiście właśnie dlatego ujemna (dodatnia) określoność d2z jest przedstawiona w (11.25) jako warunek tylko dostateczny, ale nie konieczny, ścisłej wklęsłości (ścisłej wypukłości). Przykład 5. Za pomocą warunków dla pochodnej sprawdzić, czy funkcja z = x 2 + x 2 jest wklęsła lub wypukła. Tym razem zastosujemy (11.240, a nié (11.24). Niech u = (wi, u2) i v = (vi, v2) będą dowolnymi dwoma punktami dziedziny/ wtedy obie strony (11.240 przyjmują postać: lewa strona
= v2 + v2,
/
prawa strona = u \ + u l + 2n. (vi - Wi)4 2u2 (v2 - w2) . I “ 1 Po odjęciu prawej strony od lewej i uporządkowaniu, możemy zapisać ich różnicę jako: v2 - 2vii/i + u2 + v2 - 2v2w2 + u2 = (v\ - Ui)2 + (v2 - u2)2.
d2z jest wszędzie i J [ określona. dodatnioj Przypomnijmy, że aspekty wklęsłości i ścisłej wklęsłości zawarte w (11.25) zostały już uwzględnione na rys. 11.5. Przykład 4. Za pomocą warunków wykorzystujących pochodne sprawdzić, czy funkcja z - - x 4jest wklęsła lub wypukła. Zastosujemy najpierw (11.24). Wyrażenia po lewej i prawej stronie tej nierówności przyjmują teraz postać - v 4 i -w 4- 4 w 3( v - u). Odejmujemy drugie wyrażenie od pierwszego i otrzymujemy ich różnicę: 4
- v 4 + u4 + 4 w3(v - u) = (v - u) = ( v -w ) [ - ( v 3 +
v
2u +
v u
2
V
—
4
U + 4u a 3
--------------
[rozkładamy na czynniki]
v —w
+ u 3) + 4u3].
1
f i i —2 > 0
i
fn
fn
2
0
fu
fu
0
2
= 4> 0
niezależnie od punktu, w którym obliczamy drugie pochodne. Zatem d2z jest wszędzie dodatnio określona, czyli spełnia warunek dostateczny ścisłej wypukłości. W tym przykładzie (11.240 i (11.25) prowadzą do tego samego wniosku.
[z (7.2)]
Byłoby dobrze, gdyby wyrażenie w nawiasie kwadratowym było podzielne przez (v —w), gdyż wtedy moglibyśmy wyłączyć przed nawias czynnik (v —u) i otrzymać wyrażenie podniesione do kwadratu (v —u)2, co ułatwiłoby określenie znaku. Okazuje się, że tak rzeczywiście jest. Zatem podana powyżej różnica może być zapisana jako: —(v - u)2 [v2 + 2 vu + 3 u2] = —(v - u ) 2 [(v + u)2 + 2u2] . Jeśli v ^ w, to znak tego wyrażenia musi być ujemny. Ponieważ w (11.24) mamy ostrą nierówność, więc funkcja z ——x 4 jest ściśle wklęsła. Oznacza to, że ma jedyne maksimum absolutne. Można łatwo sprawdzić, że tym maksimum jest z = 0 osiągana dla x = 0. Ponieważ funkcja ta jest dwukrotnie różniczkowalna w sposób ciągły, możemy również zastosować (11.25). Mamy tu tylko jedną zmienną, więc z (11.25) wynika: d2z = f" ( x ) d x 2 = - l 2 x 2dx2.
Skoro (vi, v2) ^ (u\ , u2), więc różnica ta jest zawsze dodatnia. Mamy zatem w (11.240 ostrą nierówność > i z = x 2 + x 2 jest ściśle wypukła. Zauważmy, że ten wynik potwierdza po prostu to, co uzyskaliśmy poprzednio w przykładzie 1. Jeśli chodzi o zastosowanie (11.25), to — ponieważ fi. = 2 x { i f 2 = 2x2 — mamy:
[z (11.2)]
Wiemy, że dx2jest dodatnie (rozważamy tylko niezerowe przyrosty x); ale —12x2 może być ujemne lub równe zeru. Możemy zatem co najwyżej wywnioskować, że d2z jest w każdym punkcie ujemnie półokreślone i że z = - x 4 jest (nie ściśle) wklęsła. Wniosek wynikający z (11.25) jest oczywiście słabszy niż ten, który otrzymaliśmy wcześniej z (11.24), a mianowicie, że z = - x 4jest ściśle wklęsłe. Tym, co ogranicza nas do słabszego wniosku, jest
Funkcje wypukłe a zbiory wypukłe Po wyjaśnieniu znaczenia przymiotnika „wypukły’’, zastosowanego do funkcji, musimy niezwłocznie wyjaśnić jego znaczenie w przypadku opisu zbioru. Mimo iż zbiory wypukłe i funkcje wypukłe są ze sobą związane, stanowią jednak odrębne pojęcia i jest ważne, aby ich nie mylić. Dla ułatwienia zaczniemy od geometrycznego opisu zbioru wypukłego. Niech S będzie zbiorem punktów w przestrzeni dwu- lub trójwymiarowej. Jeśli dla dowolnych dwu punktów w S odcinek prostej łączący te dwa punkty jest całkowicie zawarty w 5, to mówimy, że S jest zbiorem wypukłym. Powinno być oczywiste, że prosta spełnia tę definicję i jest zbiorem wypukłym. Na mocy umowy zbiór złożony z jednego punktu oraz zbiór pusty (nie zawierający żadnych elementów) są również traktowane jako zbiory wypukłe. Dodatkowe przykłady są pokazane na rys. 11.8. Koło — cały okrąg i wszystkie punkty przezeń otoczone — jest zbiorem wypukłym, ponieważ odcinek łączący dowolne dwa punkty koła jest całkowicie zawarty w kole; przykładami mogą być odcinek ab (łączący dwa punkty brzegowe) oraz odcinek cd (łączący dwa punkty wewnętrzne). Zauważmy jednak, że sam okrąg nie jest zbiorem wypukłym. Podobnie trójkąt lub pięciokąt nie są zbiorami wypukłymi, ale wraz ze wszystkimi objętymi przezeń punktami płaszczyzny są zbiorami wypukłymi. Pozostałe dwie figury
3 5 2 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 353
z rys. 11.8 nie są zbiorami wypukłymi. Figura w kształcie palety jest wklęsła (wcięta), zatem odcinek taki, jak gh, nie jest całkowicie zawarty w zbiorze. Jeśli chodzi o figurę w kształcie klucza, jest ona nie tylko wcięta, lecz w dodatku ma otwór, co jest jeszcze jedną przyczyną, że nie jest wypukła. Mówiąc ogólnie, aby zbiór punktów kwalifikował się jako wypukły, nie może zawierać otworów i jego brzeg nie może być nigdzie wcięty.
Rysunek 11.8
Geometryczna definicja wypukłości dotyczy również zbiorów punktów w przestrzeni trójwymiarowej. Na przykład pełny sześcian jest zbiorem wypukłym, a wydrążony walec nie. Natomiast dla przestrzeni cztero wymiarowej lub wyższego wymiaru geometryczne interpreta cje stają się mniej oczywiste. Musimy wtedy odwołać się do algebraicznej definicji zbiorów wypukłych. W tym celu wprowadzamy pojęcie wypukłej kombinacji wektorów (punktów), która jest szczególnym rodzajem kombinacji liniowej. Liniową kombinację dwu wektorów u i v można zapisać jako:
gdzie ki i k2 są dwoma skalarami. Gdy skalary te należą do przedziału domkniętego (0,1) i icłi suma jest równa jedności, wówczas kombinację liniową nazywamy kombinacją wypukłą i zapisujemy ją jako: ;%/ 0u + ( l - 0 ) v
Vi v2
«2
jako dwa punkty o współrzędnych równych odpowiednio («i, w2) i (vi> v2). Jeśli narysujemy inny wektor q tak, aby 0 q u v tworzyły równoległobok, to (na mocy rozważań z rys. 4.3) mamy: u = q + v,
czyli
q = u -v .
Wynika stąd, że dowolna wypukła kombinacja wektorów u i v (nazwijmy ją w) może być przedstawiona jako część wektora q, ponieważ: w = 0 u + (1 - 0 ) \ - 0 u + v - 0 v = 0(u^-y) + v = 0 ą + v.
kiU + &2v,
(11.26)
Ul
II >
u=
(O ^ ^ ^ l).
Przykładem wypukłej kombinacji może być np. y
Ponieważ oba
współczynniki są dodatnimi ułamkami o sumie równej 1, taka kombinacja liniowa może być interpretowana jako średnia ważona tych dwu wektorów12. Wyjątkową cechą kombinacji (11.26) jest to, że dla każdej dopuszczalnej wartości 0 otrzymujemy sumę wektorów leżącą na odcinku łączącym punkty u i v. Można to pokazać za pomocą rys. 11.9, gdzie narysowaliśmy dwa wektory:
12 Interpretacja ta była wcześniej stosowana przy omawianiu funkcji wypukłych i wklęsłych.
Aby zatem narysować wektor w, wystarczy po prostu dodać Oą i v znaną metodą równoległoboku. Jeśli skalar 0 jest dodatnim ułamkiem, to wektor Oą będzie po prostu skróconą wersją wektora q ; zatem Oą musi leżeć na odcinku O q. Suma Oą i v musi wobec tego być wektorem w leżącym na odcinku uv, gdyż nowy równoległobok został po prostu otrzymany ze starego przez przesunięcie w dół boku qu. Dokładne położenie wektora w będzie się oczywiście zmieniało w zależności od wartości skalara 0 ; gdy 0 będzie przyjmować wartości od zera do jedności, wówczas w będzie się zmieniać od u do v. Zatem zbiór wszystkich punktów odcinka uv wraz z u i v odpowiada zbiorowi wszystkich kombinacji liniowych wektorów u i v. Z uwagi na powyższe, zbiór wypukły można zdefiniować w następujący sposób: Zbiór S jest wypukły wtedy i tylko wtedy, gdy dla dowolnych dwu punktów u e S i S i dla każdego skalara 0 e (0, 1) jest prawdą, że w = 0 u + (l - 0) v e S. Ponieważ definicja ta jest algebraiczna, można więc ją stosować niezależnie od wymiaru przestrzeni, do której należą wektory u i v. Gdy porównamy definicję zbioru wypukłego z definicją funkcji wypukłej z (11.20), to 23 — Podstawy...
35 4 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 355
zauważymy, że mimo iż w obu występuje ten sam przymiotnik „wypukły” , jednak znaczenie tego słowa jest w obu kontekstach radykalnie odmienne. Przy opisie funkcji „wypukła” określa sposób wygięcia krzywej lub powierzchni — musi ona tworzyć dolinę. Przy opisie zbioru słowo to określa sposób „upakowania’ ’ punktów zbioru — nie mogą pozostawać żadne dziury, a brzeg zbioru nie może mieć żadnych zagłębień. Zatem funkcja wypukła i zbiór wypukły są różnymi obiektami matematycznymi. A jednak funkcje wypukłe i zbiory wypukłe są ze sobą związane. Przede wszystkim, jeśli definiujemy funkcję wypukłą, to jej dziedzina musi być zbiorem wypukłym. Jest tak, ponieważ definicja (11.20) wymaga, aby dla dowolnych dwu punktów u i v należących do dziedziny wszystkie wypukłe kombinacje u i v — mianowicie 0 u + (1 - 0)v, 0 ^ 6 ^ 1 — również należały do dziedziny, co jest oczywiście innym sposobem powiedzenia, że dziedzina musi być zbiorem wypukłym. Aby warunek ten mógł być spełniony, przyjęliśmy wcześniej dość rygorystyczne założenie, że dziedzina składa się z całej przestrzeni n -wymiarowej (gdzie n oznacza liczbę zmiennych decyzyjnych), która rzeczywiście jest zbiorem wypukłym. Teraz, gdy dysponujemy pojęciem zbioru wypukłego, możemy znacznie osłabić to założenie. Wystarczy bowiem przyjąć, że dziedzina jest pewnym wypukłym podzbiorem R n, a nie całą przestrzenią R n. Istnieje jeszcze jeden związek między funkcjami wypukłymi a zbiorami wypukłymi. Jeśli / ( x) jest funkcją wypukłą, to dla każdej stałej k otrzymujemy zbiór wypukły: (11.27)
S* = { x \ f ( x ) ^ k } .
[f(x) wypukła]
Pokazano to na rys. 11.10(a) dla przypadku jednej zmiennej. Zbiór S 52 składa się ze wszystkich wartości x odpowiadających tej części krzyw ej/, która leży pod przerywaną linią poziomą lub na tej linii. Jest zatem równy odcinkowi osi poziomej oznaczonemu po grubionymi punktami. Zauważmy, że dla innej wartości k zbiór będzie innym odcinkiem osi poziomej, ale wciąż będzie zbiorem wypukłym. Idąc o krok dalej, możemy zauważyć, że nawet funkcja wklęsła jest powiązana ze zbiorami wypukłymi w podobny sposób. Po pierwsze, definicja funkcji wklęsłej w (11.20) jest — podobnie jak w przypadku funkcji wypukłej — sformułowana dla dziedziny stanowiącej zbiór wypukły. Ponadto nawet funkcja wklęsła — powiedzmy g(*) — może generować
związany z nią zbiór wypukły dla danej stałej k. Ten zbiór wypukły to: (11.28)
S^ = { x \g (x )^ k } .
[$(*) jest wklęsła]
Pojawia się tu znak 2* zamiast Geometrycznie, co pokazano na rys. 11.10(b) dla przypadku jednowymiarowego, zbiór S5* zawiera wszystkie wartości * odpowiadające tej części krzywej g(x)> która leży na przerywanej linii poziomej lub nad nią. Jest to zatem, jak poprzednio, odcinek na osi poziomej — zbiór wypukły. Chociaż rys. 11.10 ilustruje przypadek jednowymiarowy, to jednak definicje S i w (11.27) i (11.28) nie są ograniczone do funkcji jednej zmiennej. Obowiązują one wtedy, gdy * interpretujemy jako wektor, tzn. x = [*i x2 ... *„]. W tym jednak przypadku (11.27) i (11.28) określają zbiory wypukłe w przestrzeni n- wymiarowej. Ważne jest, aby pamiętać, że mimo iż funkcja wypukła implikuje (11.27) i funkcja wklęsła implikuje (11.28), to jednak odwrotne stwierdzenie nie jest prawdziwe (11.27) może bowiem być spełnione dla funkcji, która nie jest wypukła, a (11.28) —- dla funkcji, która nie jest wklęsła. Powiemy o tym więcej w podrozdz. 12.4.
Ćwiczenie 11.5 1. Za pomocą (11.20) sprawdzić, czy następujące funkcje są lub nie są wklęsłe, wypukłe, ściśle wklęsłe, ściśle wypukłe: (a) z = x 2; (b) z = x j + 2x1;(c)z = 2x2- x y + y 2. 2. Za pomocą (11.24) lub (11.24') sprawdzić, czy następujące funkcje są lub nie są wklęsłe, wypukłe, ściśle wklęsłe, ściśle wypukłe: (a) z = - x 2; (b) z = ( * i+ * 2) 2; (c) z = - x y . 3. Biorąc pod uwagę odpowiedz otrzymaną dla zadania 2(c), stwierdzić, czy można byłoby zastosować twierdzenie E l do podzielenia na części zadania sprawdzania wypukłości lub wklęsłości funkcji z = 2x2 - x y + y 2 z przykładu l(c). Odpowiedź uzasadnić. 4. Czy następujące obiekty stanowią wypukłe zbiory w przestrzeni trójwymiarowej: (a) precel; (b) kręgiel; (c) doskonała kulka. 5. Równanie x 2 + y 2 = 4 przedstawia okrąg o środku (0, 0) i promieniu 2. a. Podać geometryczną interpretację zbioru {(*, y)\x2 + y 2 ^ 4}. b. Czy ten zbiór jest wypukły? 6. Narysować każdy z następujących zbiorów i sprawdzić, czy jest wypukły: (a) {(*, 3')|>’= e x}; (c) {(*, y )|y 13 - x 2}; (b) {(*, y)|;y>e*}; (d) {(*, y)\xy> 1; Jt>0,;y> 0}. 7. Dane są u =
(a)
(a)
Rysunek 11.10
(b)
7" ; 7_
"l0"
6 (b)
iv=
"4“ _8
. Które z podanych wektorów są kombinacjami u i v: "6,2"
"5,2" ;
(c)
_8,2_ -7’6. 8. Dla danych dwóch wektorów u i v w przestrzeni dwuwymiarowej znaleźć i naszkicować: (a) zbiór wszystkich kombinacji liniowych u i v;
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 357
356 PROBLEMY OPTYMALIZACJI
(b) zbiór wszystkich nieujemnych kombinacji liniowych u i v; u i y.
(c) zb ió r w szy stk ich k om b in acji w y p u k ły c h
9. a. Przepisać (11.27) i (11.28) dla szczególnego przypadku, gdy funkcje / i g mają n niezależnych zmiennych, b. Niech n = 2 i niech fu nkcja/ ma kształt taki, jak trzymany pionowo wafelek do lodów w kształcie stożka, a funkcja g niech ma kształt piramidy. Opisać zbiory i S 3*.
Przyrównujemy obie pochodne do zera, tak aby był spełniony warunek konieczny dla maksimum, i otrzymujemy układ równań: \ 4 g i + g 2 = Pio, Q\ + 4 g 2 = P2o, o jednoznacznym rozwiązaniu: -
4Pio - P2q
fil= 11.6. ZASTOSOWANIA E ’.ONOMICZNE Na początku rozdziału przytoczyliśmy przykład firmy produkującej wiele wyrobów jako ilustrację ogólnego zagadnienia optymalizacji przy więcej niż jednej zmiennej decyzyjnej. Teraz możemy poradzić sobie z tym i innymi tego typu zagadnieniami.
Przykład 7. Przyjmijmy najpierw, że mamy firmę produkującą dwa wyroby w warun kach doskonałej konkurencji. Ponieważ przy doskonałej konkurencji ceny obu wyrobów są dane jako egzogeniczne, oznaczamy je odpowiednio P i0 i P2o. Funkcja przychodu firmy będzie następująca: ^ = ^ io 2 i + P 20G2» gdzie Qi reprezentuje poziom produkcji /-tego produktu w założonej jednostce czasu (np. tydzień, miesiąc). Zakładamy, że funkcja kosztu dla tej firmy jest równa: C = 2Q \ + QlQ1 + 2 Q l Zauważmy, że dCldQ x = 4QX+ Q2 (koszt krańcowy pierwszego wyrobu) jest funkcją nie tylko Qi, lecz również Q2. Podobnie koszt krańcowy drugiego wyrobu również zależy częściowo od poziomu produkcji pierwszego wyrobu. Zatem widzimy, że zgodnie z przyjętą funkcją produkcji oba wyroby są technicznie powiązane w procesie produkcji. Funkcja zysku badanej firmy może być teraz zapisana w postaci: f t - R - C = P i0Qi + P 20Q2 - 2 Q \ - Q xQ2- 2 Q \ i jest funkcją dwu zmiennych decyzyjnych (Q\ i g 2), w której występują dwa parametry wyrażające cenę. Naszym zadaniem jest znalezienie takich poziomów Qx i Q2, które łącznie będą maksymalizowały k . W tym celu znajdujemy najpierw pochodne cząstkowe pierwszego rzędu funkcji zysku:
15
•=
:
4P20 - Pio
02~
15
:
Jeśli np. Pio = 1 2 i i>2o=18, to fi, = 2 i fi2 = 4, co daje zysk optymalny = 48 w założonej jednostce czasu. Aby upewnić się, że jest to zysk maksymalny, sprawdzamy warunek drugiego rzędu. Pochodne cząstkowe otrzymane przez różniczkowanie (11.29) tworzą następujący hesjan: |H | =
Przykłady dotyczące firm produkuj ących wiele wyrobów
' >x\
#11 #21
#12
-4
-1
#22
~1
-4
Ponieważ | Hi | = - 4 < 0 i | H 21= 15 > 0, więc macierz drugich pochodnych (czyli d2z) jest określona ujemnie, a rozwiązanie maksymalizuje zysk. W istocie, d2z jest w tym przypadku wszędzie ujemnie określone, gdyż znaki minorów głównych nie zależą od punktu, w którym pochodne zostały obliczone. Wobec tego zgodnie z (11.25) funkcja celu musi być ściśle wklęsła, a znaleziony wcześniej maksymalny zysk jest rzeczywiście jedynym maksimum absolutnym. Przykład 2. Przenieśmy teraz zagadnienie z przykładu 1 do sytuacji rynku monopolistycz nego. Na mocy tego samego założenia o strukturze rynku należy tak przekształcić funkcję przychodu, aby uwzględnić fakt, że ceny obu wyrobów będą się teraz zmieniać w zależności od poziomów produkcji (zakładamy, że są one identyczne z poziomami sprzedaży, nie uwzględ niamy bowiem możliwości gromadzenia zapasów). Dokładny sposób, w jaki zmieniają się ceny w zależności od poziomu produkcji, opisują funkcje popytu na dwa wyroby firmy. Załóżmy, że funkcje popytu, z jakimi styka się monopolistą, są następujące: g i = 4 0 - 2 P i + P2, m M >
f t- .5 tP .- P ,.
Pokazują one, żę konsumpcja dwu dóbr jest powiązana; są one mianpwicię dobrami substytucyjnymi, ponieważ wzrost ceny jednego z nich zwiększa popyt na drugie. Równanie (11.30) wyraża wielkości popytu Qi i Q2 jako funkcje ceny, ale dlą naszego celu wygod niejsze będzie, jeśli wyrazimy ceny Pi i P 2 jako funkcje wielkości sprzedaży Q\ i g 2,,tzn. jeśli będziemy mieć funkcje przeciętnego przychodu dlą dwu. produktów. Ponieważ (11.30) można przepisać jako: -2 P i + P 2 = g i - 40, P t - P 2 = G 2 -1 5 , możemy (traktując Qx i Q2 jak parametry) zastosować wzór Cramęra i znaleźć rozwiązanie dla P i i P 2:
358 PROBLEMY OPTYMALIZACJI
(11.300
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 359
Dyskryminacja cenowa
Pl = 5 5 - 2 i - & >
P2 = 1 0 - Q l - 2 Q 2. Stanowią one szukane funkcje przeciętnego przychodu, gdyż Pi = ARi i P 2 = AR2. W konsekwencji funkcja całkowitego przychodu firmy może być zapisana jako: p = P i G i + P 2 G 2 = ( 5 5 - e I - e 2) e 1+ ( 7 0 - e 1- 2 g 2) e 2= = 552! + 7 0 0 2 - 2Q xQ2- Q l - 2 Q l
[z (11.30')]
Jeśli znów przyjmiemy, że całkowita funkcja kosztu jest równa:
Nawet dla firmy wytwarzającej jeden wyrób może pojawić się zagadnienie optymalizacji obejmujące dwie lub więcej zmiennych decyzyjnych. Będzie tak na przykład wtedy, gdy firma monopolistyczna sprzedaje jeden produkt na dwu lub więcej oddzielnych rynkach (np. krajowym i zagranicznym) i musi wobec tego podjąć decyzję, jakie ilości ( G i , G 2 itd.) będzie sprzedawać na poszczególnych rynkach w celu maksymalizacji zysku. Popyt na tych rynkach będzie na ogół zróżnicowany i — przy różnych elastycznościach popytu — maksymalizacja zysku będzie wymagała dyskryminacji cen. Podamy matematyczne wyprowadzenie tego znanego wniosku. ^
c = 2 i + G 1G 2 + Q l ,
to funkcja zysku będzie równa: (11.31)
# = P - C = 5 5 G i + 70G 2- 3 G i G 2 - 2 G i -3 G 2
i jest funkcją celu z dwiema zmiennymi decyzyjnymi. Gdy tylko znajdziemy poziomy produkcji Qi i Q2jmaksymalizujące zysk, będziemy mogli za pomocą (11.300 łatwo obliczyć optymalne ceny P x i P2. Funkcja celu ma następujące pochodne cząstkowe pierwszego i drugiego rzędu: # i = 55 - 3G2 - 4 g i ; #11 — —4 ;
# 2 = 70 - 3Gi - 6 G2;
# 1 2 — #21 — —3 ;
#22 = “ 6 .
Aby spełniony był warunek pierwszego rzędu dla maksimum K, musi zachodzić #1 = #2 = 0, to znaczy: 4 g 1+
3
G 2 = 55, '
3Gi + 6 G2 = 70,
Przykład 3. Weźmy tym razem pod uwagę trzy zmienne, tzn. trzy oddzielne rynki. Zastosujemy tu funkcje w postaci ogólnej. Zgodnie z tym zakładamy, że nasza firma monopolistyczna ma następujące funkcje całkowitego przychodu i całkowitego kosztu. *
= * l ( G l ) + * 2 ( G 2) + t f 3 ( G 3) ,
C = C ( Q );
G = Gi + G2 + Q3>
gdzie Ri oznacza funkcję przychodu i-tego rynku, a nie jest symbolem takim, j a k / . Każda taka funkcja przychodu w naturalny sposób implikuje pewną strukturę popytu, która na ogół będzie różna od tej, jaka występuje na pozostałych dwu rynkach. Po stronie kosztów natomiast postulujemy tylko jedną funkcję kosztu, ponieważ tylko jedna firma produkuje dla tych trzech rynków. Ponieważ G - Gi + G2 + G3» więc koszt całkowity C również jest w gruncie rzeczy funkcją 2 i , G2, G3>które stanowią zmienne decyzyjne modelu. Możemy oczywiście przepisać C(G) jako C (2 i + G2 + G3). Należy jednak zauważyć, że chociaż ta ostatnia wersja zawiera trzy zmienne niezależne, to funkcję należy mimo to traktować jako mającą tylko jeden argument, gdyż suma Q tak naprawdę jest pojedynczą wielkością. W przeciwieństwie do tego, jeśli funkcja jest zapisana w postaci C(Gi , G2, Qs), to należy uważać, że argumentów jest tyle samo, ile zmiennych niezależnych. Funkcja zysku jest teraz równa:
a zatem rozwiązaniem są następujące poziomy produkcji (w przyjętej jednostce czasu): (Gi, & ) =
tt= R 1(Gi)
2^
Podstawiając ten wynik do (11.30') i (11.31), otrzymujemy: 2 P 2 = 46 —
Ponieważ hesjan jest równy i
- C(G)
1 488 —
i -4
-3
-3
-6
im-c m R
■ *.=« i( fi.) - c '(Q )
ae gdyż - ^ 7- = 1 dQi
(w jednostce czasu). (11.32)
|H i| = —4 < 0
+
i ma następujące pierwsze pochodne cząstkowe13:
8’ 7 3
1 Pi = 39 — ;
+ R2m
x 2 = R'2{Q2) - C
'{ Q ) ~ ^ R i { Q i ) - C \ Q ) ,
gdyż
dQ_ =
ae2
, więc mamy:
|H 2| = 15 > 0,
więc wartość 1t rzeczywiście reprezentuje zysk maksymalny. Znaki minorów głównych również w tym przypadku nie zależą od punktu, w którym je obliczamy. Zatem macierz drugich pochodnych jest wszędzie określona ujemnie, co powoduje, że funkcja celu jest ściśle wklęsła i ma jednoznaczne minimum bezwzględne.
0 U2
d<2 * 3= R i m - c '(Q ) ~ =R i m o Q3
iiy łW c
\
q ).
13 Aby znaleźć r)C/r)Q„ stosujemy wzór na pochodną funkcji złożonej: dC _ dC dQ aa~ d q aa'
,"
1
360 PROBLEMY OPTYMALIZACJI OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 361
Przyrównując jednocześnie do zera wszystkie trzy pochodne, otrzymujemy:' gdzie
c '( Q ) = R im = R im = R z m , to znaczy:
Poziomy Qi, 0 2 i 03 powinny zatem być tak dobranej aby przychód krańcowy (MR,) na każdym rynku był równy kosztowi krańcowemu MC całkowitej produkcji 0 . Aby zobaczyć, jakie są tego skutki, jeśli chodzi o dyskryminację cenową, sprawdzimy najpierw, jaki jest związek MR na danym rynku z cenami na tym samym rynku. Ponieważ przychód na każdym rynku jest równy R, = R,0,, więc przychód krańcowy musi być równy: —Pt f . . i l [z (8.4)] < edi> gdzie Sdi — punktowa elastyczność popytu na"/-tym rynku — jest w normalnej sytuacji ujemna. W rezultacie związek między MR,- i R* można również wyrazić równaniem: / 1 'N _1_ (11.33) MR, = Pi 1 ‘ da
dg,
= Ri
[
¿Qi
\£di\
Przypomnijmy, że \edi\ jest na ogół funkcją R,, więc jeśli wybrano już 0/ i została określona R,, to \edi\ przyjmie konkretną wartość, która może być większa od jedności, mniejsza albo równa jedności. Ale jeśli \edi\ < 1 (popyt jest nieelastyczny w punkcie), to jej odwrotność będzie większa od jedynki i wyrażenie w nawiasie w (11.33) będzie ujemne, co implikuje ujemną wartość MR,-. Podobnie, jeśli \edi\ = 1 (jednostkowa elastyczność), to MR, będzie przyjmować wartość zerową. Ponieważ MC dla firmy jest dodatni, więc warunek pierwszego rzędu MC = MR, wymaga, aby firma działała przy dodatnim poziomie MR,. Zatem wybrane przez firmę poziomy sprzedaży 0, muszą być takie, aby odpowiednia punktowa elastyczność popytu na każdym rynku była większa od 1. . Ti% Warunek pierwszego rzędu MRi = MR2 = MR3 można teraz wyrazić za pośrednictwem (11.33) w postaci: r r 1 \ / 1 1^ \ l= P3 1 - = P2 1 \£dl\ \£dl\ 1^31 Można stąd bezpośrednio wysnuć wniosek, że im mniejsza jest wartość | ed\ (przy danym poziomie produkcji) na pewnym rynku, tym wyższa musi być cena żądana na tym rynku, a stąd :— jeśli chcemy zmaksymalizować zysk — wynika dyskryminacja cenowa. Aby zapewnić maksymalizację zysku, zbadajmy warunki drugiego rzędu. Znajdujemy za pomocą (11,32) pochodne cząstkowe drugiego rzędu: n u = R"(Q i) - C"(Q )
001
= R [ ' m ~ C "(Q ),
d<2 Z * = R ?((h) ~ C "(Q ) 3 ^ - = R ' , ' m - C"(0), d03 / T i3 =
^31
=
#32 —
H=
-C "
-C "
- C ' R i'- C " -C "
-C "
-C "
R "-C "
Warunki drugiego rzędu są zatem spełnione, jeśli: 1) |H i| = jRi' - C " < 0; tzn. nachylenie MR,- jest mniejsze niż nachylenie MC dla całej produkcji (por. położenie punktu L na rys. 9.6(c)); ponieważ każdy ż trzech rynków może być „pierwszym” rynkiem, wynika stąd również, że R " — C " < O i R ” —C " < 0; 2) |H 2| = (R" - C") (R " - C ") - (C ")2 > 0; czyli R[’R % -{ R ? * R i ’)C " > 0; 3) (Hal = R 1 R 2 R 3 - (R 1 R 2 + R " R ” + R ”R " )C " < 0 . Dwie ostatnie części tego warunku nie tak łatwo interpretować ekonomicznie, jak część pierwszą. Zauważmy, że gdybyśmy założyli, że wszystkie funkcje w postaci ogólnej R,(0«) są wklęsłe, a funkcja ogólna C (0 ) jest wypukła, czyli funkcja - C ( 0 ) jest wklęsła, to funkcja zysku — jako suma funkcji wklęsłych — byłaby wklęsła, co zapobiegłoby potrzebie sprawdzania warunku drugiego rzędu. Przykład 4. Aby uczynić powyższy przykład bardziej konkretnym, nadamy mu teraz wersję numeryczną. Załóżmy, że nasza firma monopolistyczna ma konkretne funkcje przeciętnych przychodów: p 1= 63 - 4 0 !,
więc
R\ —P \0 i == 6 3 0 i - 4 0 ? ,
P 2= 105 - 5 0 2 ,
więc
R2 = P 20 2 = lO 502- 5 0 2 ,
p 3= 7 5 - 6 0 3 ,
więc
R3 = P 3Q3 = ‘7503 - 6 0 1
i że funkcja kosztii całkowitego jest następująca: C = 2 0 + 1 50; wtedy funkcje krańcowe będą równe: = 63 - 8 0 i ;
R 2 = 105 - 1O02; R3' = 7 5 - 1 2 0 3; C '= 1 5 . * Gdy każdy przychód krańcowy R ' przyrównamy do kosztu krańcowego C ' całkowitej produkcji, wówczas znajdziemy ilości równowagi: 0 i = 6, a więc:
0 2= 9
i
03
= 5,
e = i & = 20. 1=1
= R "(Q i) - C"(Q ) - H - - R i ' m - C "(Q ), 002
J T ł 2 =: JT 2 1 =
= 1, więc (po skróceniu oznaczeń pochodnych) otrzymujemy:
R\ - C "
M C = M R i — M R2 = M R3.
da
oQi
Podstawiając te wyniki do równań przychodu i kosztu, otrzymujemy 679 jako całkowity zysk z potrójnej rynkowej operacji handlowej. Ponieważ jest to konkretny model, musimy więc sprawdzić warunek drugiego rzędu (czyli wklęsłość funkcji celu). Drugie pochodne cząstkowe są równe:
#^23 =
R{' = - 8 ;
R2' = - 1 0 ;
R3' = -1 2 ;
C " = 0,
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 363
362 PROBLEMY OPTYMALIZACJI
a zatem wszystkie trzy części dostatecznego warunku drugiego rzędu podane w przy kładzie 3 są należycie spełnione. Za pomocą funkcji przeciętnych przychodów łatwo obliczyć, że firma za swój produkt powinna żądać różnych cen Pi = 39, P2 = 60 i P 3 = 45 na trzech różnych rynkach. Jak można łatwo sprawdzić, punktowa elastyczność popytu jest najniższa dla drugiego rynku, na którym żądano najwyższej ceny.
Decyzje firmy dotyczące nakładów Zamiast poziomów produkcji 2/ zmiennymi decyzyjnymi firmy mogą być również poziomy nakładów.
Ponieważ PoQa (cena wyrobu pomnożona przez produkt krańcowy nakładu a) przed stawia wartość produktu krańcowego nakładu a (VMPa), pierwsze równanie mówi po prostu, że bieżąca wartość VMPfl powinna być równa danej cenie nakładu a. Drugie równanie jest sformułowaniem takiego samego wymagania dla nakładu b. Zapamiętajmy, że aby było spełnione (11.35), krańcowe produkty w ujęciu fizycznym Qa i Qb muszą być dodatnie, gdyż P0, Pao, Pbo i e“r/ mają dodatnie wartości. Ma to ważną interpretację w postaci izokwanty zdefiniowanej jako miejsce geometryczne takich kombinacji czynników, które dają taki sam poziom produkcji. Gdy sporządzimy wykres izokwant na płaszczyźnie ab, będą one na ogół wyglądały tak, jak na rys. 11.11. Ponieważ każda z nich odpowiada ustalonemu poziomowi produkcji, wzdłuż każdej izokwanty musi być: dQ = Qada + Qbdb = Ot z czego wynika, że nachylenie izokwanty można wyrazić w postaci:
Przykład 5. Załóżmy, że mamy następującą sytuację dotyczącą hipotetycznej firmy. 1. Dwa nakłady a i Z? są stosowane w procesie produkcji pojedynczego wyrobu Q. 2. Ceny obu nakładów PaiPb, podobnie jak cena produktu P, są poza zasięgiem kontroli firmy; będziemy je więc oznaczać odpowiednio symbolami Pa0, Pbq i Po3. Przeprowadzenie procesu produkcyjnego zajmuje t0 lat (t0jest pewną dodatnią stałą); przychody ze sprzedaży muszą być zatem odpowiednio zdyskontowane, zanim będziemy mogli je porównać z poniesionymi kosztami. Stopa dyskontowa, składana w sposób ciągły, jest równa r0. Przy założeniu 1 możemy zapisać ogólną funkcję produkcji Q = Q(a, b), z krańcowymi produktami fizycznymi Qa i Qb. Założenie 2 umożliwia nam zapisanie kosztu całkowitego jako:
(11.36)
d — = da
bQ a Qb
(MPPo')
MPPb
Izokwanty
C = aPa0 + bPbo, a przychód całkowity jako: R = PoQ(a , b). Aby jednak zapisać funkcję zysku, musimy najpierw zdyskontować przychód, mnożąc go przez stałą e_r°'°, którą — dla uniknięcia skomplikowanych indeksów — będziemy zapisywać jako e~". Zatem funkcja zysku jest równa: #=
PoQ(a, b)er rt- aPa0 - bPM,
gdzie a i b są jedynymi zmiennymi decyzyjnymi. Aby zmaksymalizować zysk, konieczne jest, aby pierwsze pochodne cząstkowe: K,
dn da
= PoQae~rt- P *
(11.34) dx nb =
~db
= Po2&e n - P b
były równe zeru. Oznacza to, że: (11.35)
PoQae-rt = Pao
i
PoQbe-rt = Plbo-
yl
Rysunek 11.11
^
Przyjęcie dodatnich wartości dla Qa i Qb oznacza zatem ograniczenie wyboru czyn ników — dokonanego przez firmę — tylko do odcinków izokwant o nachyleniu ujemnym. Na rys. 11.11 odpowiedni obszar działania jest ograniczony do zacienionego obszaru określonego przez dwie tzw. ridge lines, co można przetłumaczyć jako krawędzie. Poza zaciemnionym obszarem, gdzie izokwanty mają dodatnie nachylenie, krańcowy produkt jednego z nakładów musi być ujemny. Na przykład przejście od kombinacji nakładów M do kombinacji N oznacza, że przy ustalonej wielkości nakładu b wzrost nakładu a prowadzi nas na niższą izokwantę (o mniejszej wielkości produkcji); zatem Qa musi być ujemne. Podobnie przejście od M ' do N ' ilustruje ujemność Qb. Natomiast gdy ograniczamy się do zacienionego obszaru, każda izokwanta może być opisana funkcją postaci b =
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 365
3 64 PROBLEMY OPTYMALIZACJI
Warunek drugiego rzędu dotyczy pochodnych cząstkowych drugiego rzędu funkcji /r, które można otrzymać z (11.34). Pamiętając o tym, że Qa i Qb — jako pochodne — same są funkcjami zmiennych a i b\ możemy znaleźć 7taa, n ab - n bcL i n bb oraz utworzyć z nich hesjan: (11.37)
|H | =
fląa ab
Wab
P*Q aatrt PoQabe-rt
f lb b
PoQab&~rt PoQbbZ~rt
Na to, aby wartość stacjonarna n była maksimum, wystarcza, żeby: IH jjcO ,
[tzn. Kaa < 0, co może wystąpić wtedy i tylko wtedy, gdy Q aa < 0 ]
|H 2| = |H |> 0 ,
[tzn. n aa Kbb> co może wystąpić wtedy i tylko Wtedy, gdy Qbb > Q lh\
a zatem warunek drugiego rzędu można sprawdzać za pomocą albo pochodnych 7rijf albo pochodnych g iy, zależnie od tego, które łatwiej obliczyć. Symbol Qaa oznacza stopę zmian Qa (= M P P J w miarę wzrostu a przy ustalonym nakładzie b\ podobnie Qbb oznacza stopę zmian Qb (=MPPb), gdy zmienia się tylko nakład b. Zatem warunek dostateczny. drugiego rzędu wymaga, między innymi, aby MPP dla obu nakładów był malejący dla wybranych poziomów nakładów a i b. Jednak malejące MPPfl i MPP^ nie gwarantują spełnienia warunku drugiego rzędu, gdyż dotyczy on również Qab = Qbat która mierzy stopę zmian MPP jednego nakładu, gdy zmienia się wielkość drugiego nakładu. Po bliższym zbadaniu okazuje się, że podobnie jak warunek pierwszego rzędu mówi, że izokwanta ma mieć ujemne nachylenie dla wybranej kombinacji nakładów (co pokazano w zacienionej strefie na rys. 11.11), tak warunek drugiego rzędu służy do tego, by stwierdzić, że ta sama izokwanta jest ściśle wypukła dla wybranej kombinacji nakładów. Krzywizna izokwanty jest związana ze znakiem drugiej pochodnej d2b łd a 2. Aby ją otrzymać, musimy obliczyć pochodną zupełną (11.36) względem ¿z, pamiętając, że Qa i Qb są funkcjami pochodnymi zależnymi od a i b i że ponadto na izokwancie b samo jest funkcją a, tzn.:
d2b ^ r= -„ 2 d a2 Q2b
(11-40)
Q aaQ b ~ Q baQ a ~ Q a b Q a + Q bbQ \
= - j^ [ Q a a { Q bf - 2 Q abQaQb+ Q bb(Qa)i \. Qb Zwróćmy uwagę, że wyrażenie w nawiasach kwadratowych (w ostatnim wierszu) jest formą kwadratową względem dwu zmiennych Q a i Q b - Jeśli jest spełniony warunek dostateczny drugiego rzędu, czyli jeśli: Q aa
Q ab
Q ab
Q bb
Q aa< 0
> 0,
to na mocy (11.11') wspomniana forma kwadratowa musi być ujemnie określona. Powoduje to z kolei, że d2b ld a 2 jest dodatnia, gdyż Qb musi być dodatnie ze względu na warunek pierwszego rzędu. Zatem spełnienie warunku dostatecznego drugiego rzędu oznacza, że odpowiednia izokwanta (o nieujemnym nachyleniu) jest —- jak to postulowano — ściśle wypukła dla wybranej kombinacji nakładów. Pojęcie ścisłej wypukłości zostósowane do izokwanty b = ę (a )t którą wykreślamy na dwuwymiarowej płaszczyźnie ab, powinno być dokładnie odróżniane od tego samego pojęcia zastosowanego do samej funkcji produkcji Q(a, b), której wykres jest sporządzony w trój wymiarowej przestrzeni abQ. Jeżeli natomiast mamy zastosować pojęcie ścisłej wklęsłości lub wypukłości do funkcji produkcji w obecnym kontekście, to dla uzyskania pożądanego kształtu izokwanty musimy postawić warunek, by Q(a, b) była ściśle wklęsła w przestrzeni trójwymiarowej (miała kształt kopuły), co stoi w jaskrawej sprzeczności z wymaganiem, aby odpowiednia izokwanta była ściśle wypukła w przestrzeni dwuwymiarowej (miała kształt litery U lub części U). Przykład 6. Załóżmy, że procenty są kapitalizowane kwartalnie przy danej stopie kwartalnej i0. Załóżmy też, że proces produkcji trwa dokładnie jeden kwartał. Funkcja zysku przyjmuje wtedy postać: 7t = P o Q (a ,b )(\ + ioT1 ~ aPa0 - bPb0.
Qa = Qa(a, b)\
Qb = Qb(a, b)
i
b = ę(a).
Obliczanie pochodnej zupełnej przebiega w następujący sposób: d2b da2
d ( da
1 f
d& Sdb j da Q l{
<2a] Q>j
d a' {¿a j da
Ponieważ b jest na izokwancie funkcją a,więc wzór na pochodną zupełną daje: d Qa ^ d Q a db da
db
dQa
db
da
Uba da
da
da
db
da
dQb _ da
PQb(\ +
Ćwiczenie 11.6
db bb da
JoG a(l + io)_1 “ PaO = 0,
Uaa’
(11.39) dQb _ d Q b db
Warunek pierwszego rzędu jest teraz następujący:
ab '
Po podstawieniu (11.36) do (11.39), a potem podstawieniu wyniku do (11.38) możemy zapisać drugą pochodną jako:
1. Jeśli firma konkurencyjna z przykładu 1 ma funkcję kosztu C = 2Q2 + 2Ql zamiast poprzedniej, to: (a) czy produkcja dwu dóbr wciąż jest technicznie powiązana,
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 367
3 66 PROBLEMY OPTYMALIZACJI
(b) jakie będą nowe optymalne poziomy Qi i Q2, (c) jaka jest wartość 7Ti2 i jakie ma to znaczenie ekonomiczne? 2. Firma produkująca dwa wyroby znalazła się w sytuacji, którą obrazują funkcje popytu i kosztu: fi, = 4 0 2PiP2; Q2 = 3 5 - P 1- P 2; C = Q \ + 2 Q l+ W . a. Znaleźć poziomy produkcji spełniające warunki pierwszego rzędu dla maksymalizacji zysku (używać ułamków). b. Sprawdzić dostateczny warunek drugiego rzędu. Gzy można wnioskować, że to zagadnienie ma jedyne maksimum bezwzględne? c. Jaki jest maksymalny zysk? 3. Na podstawie cen i ilości równowagi podanych w przykładzie 4 obliczyć punktową elastyczność popytu \edi\ (dla i = 1, 2, 3). Który rynek ma najwyższą, a który najniższą elastyczność popytu? 4. Załóżmy, że funkcja kosztu z przykładu 4 zostanie zastąpiona przez C = 20 + 15 <2 + Q2. a. Znaleźć nową funkcję kosztu krańcowego. b. Znaleźć nowe ilości równowagi (używać ułamków). c. Znaleźć nowe ceny równowagi. d. Sprawdzić, czy spełniony jest warunek dostateczny drugiego rzędu. . 5. Jak należałoby zapisać funkcję zysku z przykładu 6, jeśli spełnione są następujące warunki: (a) odsetki są kapitalizowane co pół roku przy stopie rocznej /0, a proces produkcji trwa przez rok; (b) odsetki są kapitalizowane co kwartał przy stopie procentowej i0 rocznie, a proces produkcji trwa przez 9 miesięcy. 6. Jeśli dana jest Q = Q(a, b \ to jak należałoby zapisać algebraicznie izokwantę dla poziomu produkcji równego np. 260?
11.7. ASPEKTY OPTYMALIZACJI ZWIĄZANE ZE STATYKĄ PORÓWNAWCZĄ Optymalizacja, jako szczególna odmiana analizy równowagi statycznej, również podlega badaniom w rodzaju statyki porównawczej. Idea polega na sprawdzeniu, jak zmiana dowolnego parametru wpłynie na położenie równowagi modelu, co w obecnym kontekście dotyczy optymalnych wartości zmiennych (i optymalnych wartości funkcji celu). Ponieważ nie stosuje się tu żadnych nowych metod ponad te, które przedstawiono w części 3 niniejszej pracy, możemy więc przejść bezpośrednio do ilustracji opartych na przykładach podanych w poprzednim podrozdziale.
Rozwiązania dla postaci zredukowanej W przykładzie 1 w podrozdz. 11.6 mieliśmy do czynienia z funkcją z dwoma parametrami (zmiennymi egzogenicznymi) P\0 i P2o; nie jest więc niespodzianką, że optymalne poziomy
produkcji dla analizowanej tam firmy wytwarzającej dwa wyroby były wyrażone dokładnie jako funkcje tych parametrów: _ 4Pio - P 20 0 i = - -----------15
. 1
4P2o -P io 0 2= ----------— 15
.
Są to rozwiązania dla postaci zredukowanej i wystarczy proste obliczenie pochodnych cząstkowych, aby zbadać wszystkie własności tego modelu dotyczące statyki porównawczej, a mianowicie: 3Gi
4
dP10 ~ 15 ;
dQx
1
dP20 " 1 5 ;
dQ2
1
dQ2
4
dPio "
15 ;
dP20
15 ’
W celu maksymalizacji zysku każdy wyrób firmy powinien być produkowany w większej ilości wówczas, gdy rośnie jego cena rynkowa lub gdy spada cena drugiego produktu. Oczywiście wnioski te wynikają jedynie z konkretnych założeń dotyczących rozpa trywanego modelu. Należy podkreślić, że wpływy zmiany Pio na Q2 i zmiany P2o na Q\ są konsekwencją przyjętych technicznych powiązań po stronie produkcji dla tych dwu dóbr i że gdyby nie było takich powiązań, to mielibyśmy: aći dP20
ag2 dPu
Przechodząc do przykładu 2 (z podrozdz. 11.6), zauważamy, że optymalne poziomy
2
produkcji były tam podane numerycznie, jako Qx = 8 i Q2 = 7 — i nie występowały żadne parametry. Rzeczywiście, wszystkie stałe w modelu były numeryczne, a nie parametryczne. W momencie gdy dochodzimy do etapu rozwiązania, liczby te tracą swą tożsamość w wyniku wszystkich działań arytmetycznych. Chcemy przez to podkreślić, że wykorzystywanie stałych liczbowych jest nacechowane brakiem ogólności i że w otrzymanym rozwiązaniu równowagi nie są widoczne aspekty statyki porównawczej. Z drugiej jednak strony, jeśli nie używamy stałych liczbowych, to nie mamy gwarancji, że zagadnienie automatycznie będzie mogło podlegać analizie statyki porównawczej. Na przykład zagadnienie dyskryminacji cen (przykład 3 z podrozdz. 11.6) zostało pierwotnie sformułowane w celu jbadania warunków równowagi (maksymalizacji zysku) i nie wprowa dzano w nim żadnych parametrów. Wynika stąd, że jeśli nawet zagadnienie zostało postawione dla ogólnych funkcji, to — chcąc przeprowadzić badania nad statyką porównawczą — trzeba je przeformułować.
Modele z funkcjami w postaci ogólnej Zagadnienie dotyczące decyzji o wielkości nakładów, przedstawione w przykładzie 3 w po przednim podrozdziale, ilustruje przypadek, gdy funkcja sformułowana w postaci ogólnej zawierała kilka parametrów. Parametrów tych powinno być nie mniej niż pięć (Po, P a0, Pbo, r i f, gdzie — podobnie jak poprzednio — pominęliśmy indeksy 0 dla r0 i t0). Jak możemy otrzymać własności modelu związane ze statyką porównawczą?
368 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA W PRZYPADKU WIĘCEJ NIŻ JEDNEJ ZMIENNEJ DECYZYJNEJ 369
Odpowiedzią jest zastosowanie twierdzenia o funkcji niejawnej. W przeciwieństwie jednak do modeli równowagi niecelowej, czyli modeli rynku lub dochodu narodowego, dla których przeprowadziliśmy obliczenia, zaczynając od warunków równowagi, obecnie, poszukując celowej równowagi, musimy przeprowadzić obliczenia dla warunków opty malizacji pierwszego rzędu. Dla przykładu 5 warunki te były sformułowane w (11.35). Gdy przeniesiemy wszystkie składniki w (11.35) na lewą stronę i pokażemy w jawny sposób, że Qa' i Qb są funkcjami endogenicznych zmiennych decyzyjnych a i b, wówczas możemy przepisać warunki pierwszego rzędu, stosując zapis taki, jak w (8.20): F \a , b\ P0, Pm , Pbo, r,
(11.41) , b; P0, Pad, Pbo,
tj = PoQa(a,b)er"
Korzystając ze wzoru Cramera, otrzymujemy rozwiązanie: da =
Zakładamy, że funkcje F l i F 2 mają ciągłe pochodne cząstkowe. Można zatem stosować twierdzenie o funkcji uwikłanej, pod warunkiem, że jakobian tego układu równań względem zmiennych endogenicznych a i b nie znika dla początkowego położenia równowagi. Wspomniany jakobian jest po prostu hesjanem dla funkcji n z przykładu 5:
dPo
(11.42)
dF 1 ~db
dF 2
dF 2
|J | = da
PoGaat-"
Ul
db ^ {QaQab- Q bQaa)P^-2n
PoQ«bt-r' = |H |.
db
PoQabt~n
[z (11.37)]
PoQbbe '"
Jeśli zatem zakładamy, że jest spełniony dostateczny warunek drugiego rzędu dla maksymalizacji, to |H | musi być dodatnie, więc również |J | musi być dodatnie w począt kowym położeniu równowagi, czyli optimum. W tym przypadku twierdzenie o funkcji niejawnej pozwala na zapisanie dwóch funkcji w postaci uwikłanej: ? (11.43)
:
fSi ■
d —d(Po» Pao» Pbo, J*» 0» b = b(PQ, Pa0, Pbo, r, i)
oraz dwóch tożsamości: (11.44)
PoQa(a, ¿7)e-rt- P aO= 0, PoQb(&, b)o~rt —Pbo = 0,
Ai. Aby zbadać statykę porównawczą dla tego modelu, należy najpierw obliczyć różniczkę zupełną każdej z tożsamości (11.44). Pozwolimy teraz, aby wszystkie zmienne egzogeniczne zmieniały się, więc wynik różniczkowania zupełnego będzie obejmował d a, db oraz dP0> dPa0, dPb0, d r id t . Jeśli po lewej stronie zostawimy tylko składniki zawierające da i db, to otrzymamy: ■mi (11.45)
Należy podkreślić, że wszystkie pierwsze i drugie pochodne Q mają być obliczone w punkcie równowagi, tzn. dla a i b. Widać też, że współczynniki przy da i db po lewej stronie są to dokładnie elementy jakobianu z (11.42).
Ul
Wyniki te można otrzymać inną metodą, a mianowicie różniczkując dwie tożsamości w (11.44) w sposób zupełny względem P0 (przy ustalonych pozostałych zmiennych), pamiętając, że P0 może wpływać na a i b za pośrednictwem (11.43). Przeanalizujemy teraz znaki pochodnych statyki porównawczej w (11.46). Przy założe niu, że spełniony jest warunek dostateczny drugiego rzędu, jakobian w mianowniku musi być dodatni. Warunek drugiego rzędu implikuje również, że Qaa i Qbb są ujemne, podobnie jak warunek pierwszego rzędu implikuje, że Qa i Qb są dodatnie. Ponadto wyrażenie P0er2rtjest na pewno dodatnie. Zatem, jeśli Qab > 0 (jeśli zwiększanie jednego nakładu spowoduje wzrost MPP dla drugiego nakładu), to możemy wnioskować, że obie pochodne (9aldP 0) i (dbldP0) będą dodatnie, z czego wynika, że wzrost ceny wyrobu spowoduje wzrost zużycia obu nakładów w położeniu równowagi. Jeśli natomiast Qab < 0, to znak każdej pochodnej w (11.46) będzie zależeć od względnej siły oddziaływania dodatniego i ujemnego w wyrażeniach w nawiasach po prawej stronie. Następnie przyjmijmy, że zmienia się tylko zmienna egzogeniczna r. W tym przypadku znikają wszystkie składniki po prawej stronie (11.45) z wyjątkiem składników zawierają cych dr. Dzieląc przez d r ^ 0, otrzymujemy następujące równanie macierzowe: PoQaae n PoQ,be-rr (da/dr) Po QhbC~rl_ _(db/dr)_
PoQab^n
~PoQJe-rf PoQbtZ~n
z rozwiązaniem: (d a ''
t{QaQhh- Q bQgb){P o ^r,f
dr
Ul
\
J
(11.47)
PoQaaC rtda + P0Qabe rtdb = - Q ae rtdP0 + dPa0 + P0Qate ndr + PoQare~rtd t, PoQabt~rtda + PoQbbt~rtdJb = - Q be~rtdP0 + dPb0 + P o & ń T ^d r + P0Qb re~rtdt. -
(QbQab-QaQbb) P o £ ^
(11.46) dPo
da
r Qbe n
0,
r, i) = PaQb(a, b )e~" - Pb0 = 0.
dF1
a.
PoQaae n P o O a b ^ '(da/dPo) P o Q b b C - r,_ Jdb/dPo)_
PoQabZ~n
1 P
1
Aby wyprowadzić poszczególne pochodne statyki porównawczej, których jest w sumie dziesięć (dlaczego?), przyjmiemy teraz, że za każdym razem zmienia się tylko jedna zmienna egzogeniczna. Załóżmy, że zmienia się tylko P0. Wtedy dP0 * 0, ale dPa0 = dPb0 = d r = d t = 0, więc po prawej stronie każdego równania w (11.45) pozostaje tylko pierwszy składnik. Dzieląc obie strony przez dP0 i interpretując iloraz d a/d P 0 jako pochodną statyki porównawczej (da/dPo) (podobnie dla ilorazu db/dP0\ możemy zapisać równanie macierzowe:
-
M
v
db_
t(Q bQaa - QaQgb){P0Z-n)2
dr
Ul
J
Obie te pochodne statyki porównawczej będą ujemne, jeśli Qab będzie dodatnie, ale będą miały nieokreślony znak, jeśli Qab będzie ujemne. 24 — Podstawy...
370 PROBLEMY OPTYMALIZACJI
Za pomocą podobnej procedury możemy określić wpływ zmian pozostałych parametrów. W istocie, ze względu na symetrię między r i t w (11.44) jest oczywiste, że (dałdt) i (dbldt) muszą wyglądać podobnie do (11.47). Zbadanie wpływu zmian P ao i P bo pozostawiamy Czytelnikowi. W trakcie tego badania można zauważyć, że ograniczenia dotyczące znaku — wynikające z warunku dostatecznego drugiego rzędu — będą użyteczne przy obliczaniu pochodnych statyki porównawczej, gdyż pozwalają wyznaczyć znaki Q aa i Q b b oraz jakobianu | J | w początkowym punkcie równo wagi (w punkcie optimum). Zatem warunek drugiego rzędu nie tylko pozwala na odróżnienie m aksim um i minimum, lecz również odgrywa kluczową rolę w badaniu przesunięć położenia równowagi.
12. OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ
Ćwiczenie 11.7 W następnych trzech zadaniach założyć, że Ga* > 0. 1. Na podstawie modelu opisanego równaniami od (11.41) do (11.44) znaleźć pochodne statyki porównawczej (ddldPa0) i (dbldPw). Zinterpretować ekonomiczny sens wyników. Przeanalizować następnie wpływ zmiany Pb0 na a i b. 2. Mamy zagadnienie przedstawione w przykładzie 6 podrozdz. 11.6. a. Ile jest tam parametrów? Wymienić je. b. Postępując zgodnie z procedurą opisaną równaniami od (11.41) do (11.46) i zakładając, że jest spełniony warunek dostateczny drugiego rzędu, znaleźć pochodne statyki porównawczej (
W poprzednim rozdziale przedstawiono ogólną metodę znajdowania względnych ekstremów funkcji celu dwu lub więcej zmiennych decyzyjnych. Ważną cechą tych rozważań było to, że wszystkie zmienne decyzyjne były od siebie niezależne, tak więc decyzja podjęta dla jednej zmiennej nie wpływała na wybór wartości dla pozostałych zmiennych. Na przykład firma produkująca dwa wyroby mogła wybrać dowolną wartość dla Gi i dowolną wartość dla Q 2 i te dwa wybory nie ograniczały się nawzajem. Jeśli wspomniana firma musi z jakiegoś względu przestrzegać ograniczenia (w rodzaju kontyngentu produkcji) postaci Gi + Q 2 = 950, znika niezależność zmiennych decyzyjnych. W tym przypadku poziomy produkcji Gi i Q 2 maksymalizujące zysk firmy będą nie tylko jednocześnie określane, lecz również należne, ponieważ im większy jest Gi, tym mniejszy musi być g 2. aby w sumie pozostawały na poziomie ustalonej liczby 950. Mamy tu do czynienia z optimum warunkowym spełniającym warunek dotyczący ilości produkcji, różniącym się od optimum bezwarunkowego omówionego w poprzednim rozdziale. Istnieją różne związki między dwiema zmiennymi. W przykładzie 2 w podrozdz. 11.13 dwa wyroby firmy były powiązane pod względem konsumpcji (były substytutami) oraz produkcji (co odzwierciedlała funkcja kosztów), ale ten fakt nie kwalifikował zagadnienia do problemu optymalizacji warunkowej, ponieważ dwie zmienne określające produkcję były wciąż niezależne jajco zmienne decyzyjne. Tylko zależność zmiennych jako zmiennych decyzyjnych powoduje powstanie optimum warunkowego. W tym rozdziale będziemy rozważać tylko ograniczenia w postaci równań, takie jak Gi + G2 = 950. Będą nas interesować przede wszystkim względne ekstrema warunkowe, chociaż w podrozdz. 12.4 omówimy również ekstrema absolutne.
12.1. WPŁYW WARUNKÓW OGRANICZAJĄCYCH Podstawową przyczyną formułowania warunków jest konieczność należytego uwzględnie nia pewnych czynników ograniczających występujących w rozważanym zagadnieniu op tymalizacji.
3 72 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 373
Widzieliśmy już, jakie ograniczenia dotyczące wyborów optymalnych wynikały z rów nania opisującego ilości wytwarzanych produktów. Obecnie rozważmy przypadek konsumen ta o prostej funkcji użyteczności: (12.1)
warunkowym — wierzchołek krzywej w kształcie odwróconej litery U, czyli krzywej znajdującej się nad linią ograniczenia. Na ogół można oczekiwać, że maksimum warunkowe będzie miało mniejszą wartość niż maksimum bezwarunkowe, chociaż może się przypadkiem zdarzyć, że oba mają taką samą wartość. Ale maksimum warunkowe nigdy nie może przewyższać maksimum bezwarunkowego.
U = x lx2 + 2 xl.
Ponieważ użyteczności krańcowe — pochodne cząstkowe U\ = dU /dxi i U2 = dU łdx2 — są tu dodatnie dla dodatnich wartości *1 i *2, więc aby zmaksymalizować U bez żadnych ograniczeń, konsument powinien nabywać nieskończone ilości obu dóbr, co jest rozwiązaniem nie mającym praktycznego sensu. Aby zagadnienie maksymalizacji miało sens, należy uwzględnić siłę nabywczą konsumenta, tzn. włączyć do zadania ograniczenie budżetowe. Jeśli konsument ma zamiar wydać na dwa dobra pewną sumę, np. 60 $, i jeśli aktualne ceny są równe Pio = 4 i P 20 = 2, to ograniczenie budżetowe będzie wyrażone równaniem liniowym: (12.2)
Maksimum bezwarunkowe
m -
ĄfC'--
4jcx+ 2x2 = 60.
l Vii/A t' '.
Takie ograniczenie, podobnie jak wspomniane wcześniej dotyczące ilości produktów, czyni wybór *i i *2 wzajemnie zależnym. Zagadnienie polega obecnie na tym, aby zmaksymalizować (12.1) przy ograniczeniu sformułowanym w (12.2). Matematycznie ograniczenie to (nazywane też warunkiem ograniczającym) zawęża dziedzinę, a zatem również wartości funkcji celu. Dziedziną (12.1) jest zbiór {(*!, x2): x x ^ 0, x2 ^ 0}. Graficznie jest ona reprezentowana na rys. 12.1(a) przez nieujemną ćwiartkę płaszczyzny *i*2. Gdy jednak dodamy ograniczenie budżetowe, wówczas możemy dopuścić jedynie te wartości zmiennych, które spełniają to równanie, więc dziedzina natychmiast zredukuje się do zbioru punktów leżących na linii budżetu. Będzie to automatycznie wpływało również na zbiór wartości funkcji celu; odpowiedni będzie tylko ten podzbiór powierzchni użyteczności, który leży bezpośrednio nad linią budżetu. Wspomniany podzbiór (przekrój powierzchni) może wyglądać jak krzywa na rys. 12.1(b), gdzie U jest zaznaczone na osi pionowej, a linia budżetu z diagramu (a) jest umieszczona na osi poziomej. Interesuje nas jedynie wyznaczenie maksimum dla krzywej na rys. 12.1(b). W ogólnym przypadku, dla funkcji z = /(* , y), różnica między ekstremum warunkowym i bezwarunkowym może być pokazana na trójwymiarowym wykresie przedstawionym na rys. 12.2. Ekstremum bezwarunkowym jest wierzchołek całej kopuły, ale ekstremum
'A
# •'?£v
Rysunek 12.2 IMv
Interesujące jest, że gdybyśmy dodali jeszcze jedno ograniczenie, przecinające to pierwsze w jednym punkcie płaszczyzny *y, to oba razem wzięte ograniczyłyby dziedzinę do tego jednego punktu. Znalezienie ekstremum stałoby się wtedy banalne/ We właściwie sformułowanym zagadnieniu liczba i natura warunków, powinny być takie, aby ograniczyć, ale nie wyeliminować, możliwość wyboru. Ogólnie mówiąc, liczba ograniczeń powinna być mniejsza od liczby zmiennych decyzyjnych.
• ^ w.
12.2. ZNAJDOWANIE WARTOŚCI STACJONARNYCH
# ■
W. (*) Rysunek 12.1
M
-
M '■m .
Weźmy prosty przykład określony przez (12.1) i (12.2). Nie stosując żadnej nowej techniki rozwiązań, można łatwo znaleźć maksimum warunkowe. Ponieważ z warunku (12.2) wynika: ( 12.20
60 - 4*1 = 30 - 2*!, *2 = -----
możemy więc powiązać ograniczenie z funkcją celu, podstawiając (12.20 do (12.1). Otrzymujemy w rezultacie funkcję celu tylko jednej zmiennej: U = x i (30 - 2*0 + 2*! = 3 2 * i- 2 * i,
3 7 4 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 3 75
z którą możemy sobie poradzić poznanymi wcześniej metodami. Przyrównując dU/dxi = 32 -4*1 do zera, otrzymujemy rozwiązanie x { = 8, co na mocy (12.2') daje natychmiast x 2 = 30 - 2 • 8 = 14. Z (12.1) możemy teraz obliczyć1 wartość stacjonarną U = 128, a ponieważ druga pochodna jest równa d2U ld x i= - 4 < 0, więc ta wartość stacjonarna stanowi maksimum (warunkowe) dla U. Gdy jednak sam warunek ograniczający jest skomplikowaną funkcją lub gdy musimy uwzględnić kilka warunków, technika podstawiania i eliminacji zmiennych może stać się zadaniem zbyt uciążliwym. Co ważniejsze, jeśli ograniczenie pojawia się w takiej postaci, że nie można jej rozwiązać w celu wyrażenia jednej zmiennej (x2) jako jawnej funkcji drugiej zmiennej (*i), to metoda eliminacji będzie w istocie bezużyteczna — nawet gdyby było wiadomo, że x2jest uwikłaną funkcją x lt tzn. nawet wtedy, gdyby były spełnione warunki twierdzenia o funkcji uwikłanej. W takim przypadku możemy sięgnąć do metody (nieokreślonego) mnożnika Lagrange'a, która — jak zobaczymy — ma wielkie zalety analityczne.
i pierwsze równanie automatycznie gwarantuje spełnienie warunku ograniczającego. Zatem w wyniku włączenia warunku do funkcji Lagrange’a Z i traktowania mnożnika Lagrange’a jako dodatkowej zmiennej, możemy otrzymać ekstremum warunkowe U (dwie zmienne decyzyjne) przeszukując po prostu wartości stacjonarne funkcji Z, jako nie poddanej ograniczeniom funkcji trzech zmiennych decyzyjnych. Rozwiązując (12.4) względem wartości zmiennych krytycznych, znajdujemy xi = 8; x2= 1 4 (i A = 4). Jak oczekiwaliśmy, wartości xi i x2 zgadzają się z odpowiedziami otrzymanymi wcześniej metodą podstawiania. Ponadto z (12.3) widać jasno, że Z = 128; jest to — tak jak być powinno — równe otrzymanej wcześniej wartości U. W ogólnym przypadku dla danej funkcji celu: (12.5)
przy warunku: (12.6)
g(x, y) = c,
gdzie c jest stałą2, możemy zapisać funkcję Lagrange’a jako:
Metoda mnożnika Lagrange^a Istota metody mnożnika Lagrange’a polega na tym, że zagadnienie znalezienia ekstremum warunkowego sprowadzamy do takiej postaci, do której można zastosować warunek pierwszego rzędu taki, jak dla zagadnień dotyczących ekstremum bezwarunkowego. Dla danego zagadnienia maksymalizacji U = X\X2 + 2xi przy warunku 4xi + 2x2 = 60 (z (12.1) i (12.2)) zapiszmy tzw.funkcję Lagrange’a, która jest zmodyfikowaną wersją funkcji celu obejmującą warunek ograniczający: (12.3)
z = f( x t y)
Z = X i X2 + 2 xi + A ( 6 0 - 4 x i - 2 x2).
Symbol A, reprezentujący pewną na razie nieokreśloną liczbę, jest zwany (nieokreś lonym) mnożnikiem Lagrange’a. Gdybyśmy w jakiś sposób mogli być pewni, że 4xi + 2x2 = 60, tak iż warunek będzie spełniony, to ostatni składnik w (12.3) będzie znikać niezależnie od wartości A. W takim przypadku Z będzie tożsame z U. Ponadto, po usunięciu ograniczenia musimy jedynie szukać bezwarunkowego maksimum Z, zamiast warunkowego maksimum U, względem dwu zmiennych Xi i x2. Pytanie brzmi: jak spowodować zniknięcie wyrażenia z A w (12.3)? Taktyką, która do tego prowadzi, jest po prostu traktowanie Ajako dodatkowej zmiennej w (12.3), tzn. rozważenie Z = Z (A , x u x2). Wtedy bowiem warunek pierwszego rzędu dla ekstremum bezwarunkowego będzie się składał z układu równań:
(12.7)
Z = /(x , y) + X [c -g (x ,y )].
Dla stacjonarnych wartości funkcji Z, traktowanej jako funkcja trzech zmiennych A, x i y , warunek konieczny jest następujący: Zx = c - g ( x , y) = 0, (12.8)
Z x = f x - X g x =
0,
Zy = f y — X gy =
0.
Ponieważ pierwsze równanie w (12.8) jest po prostu powtórzeniem (12.6), więc stacjonarne wartości funkcji Lagrange’a Z automatycznie będą spełniać warunki dla pierwotnej funkcji z. A ponieważ wyrażenie A[c - g(x, y)] jest teraz na pewno równe zeru, więc wartości stacjonarne Z w (12.7) muszą być identyczne z tymi, które występują w (12.5) przy warunku (12.6). Zilustrujemy metodę następującymi dwoma przykładami. Przykład 1. Znaleźć ekstremum funkcji: Z = xy
przy warunku
x + y = 6.
Pierwszym krokiem jest zapisanie funkcji Lagrange’a: Z= xy + X (6 -x -y ).
Zx (= 9Z/9A) = 60 - 4*i - 2jc2 = 0, (12.4)
Dla stacjonarnej wartości Z musi być koniecznie:
Z x (= dZ!dxx) = *2 + 2 - 4A = 0, Z2 (= dZldx2) = x j - 2A = 0
'
ty.
1 Przypomnijmy, że w ćwiczeniu 9.4-2 przyjęto tę samą technikę podstawiania w celu znalezienia maksymalnej powierzchni, stosując warunek (dostępna ilość siatki drucianej) do wyeliminowania jednej z dwu zmiennych (długości lub szerokości klombu).
2 Można również włączyć stałą c do funkcji występującej w warunku, tak iż (12.6) przyjmie postać G(x, y) = 0, gdzie G(x, y )- g (x , y ) - c . W tym przypadku (12.7) powinno być zastąpione przez Z = f(x , y) + A[0 - G(x, y)] =f{x, y) - AG(x, y). Wybrano wersję (12.6), gdyż później ułatwi to badanie efektu statyki porównawczej zmiany stałej występującej w warunku (zob. (12.6)).
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 377
3 7 6 PROBLEMY OPTYMALIZACJI
Zx = 6 - x - y = 0
"
Z x-y-k-0
v
Zy = x - X = 0
J
i ta relacja powoduje, że d* i dy zależą od siebie nawzajem. Warunek konieczny pierwszego rzędu przyjmuje zatem postać dz = 0 (z (12.9)), przy warunku g = c, a zatem również przy warunku dg = 0 (z (12.10)). Patrząc na (12.9) i (12.10) widzimy, że aby był spełniony warunek konieczny, musimy mieć:
* + y = 6,
czyli
‘ -A
+ y = 0,
[ -A + *
= Ó. ( i 2.1i)
Teraz na podstawie wzoru Cramera lub inną metodą możemy znaleźć:
A= 3;
* = 3;
y = 3.
Wartością stacjonarną jest Ż = z = 9, Trzeba dla niej sprawdzić warunek drugiego rzędu, zanim będzie można stwierdzić, czy jest to maksimum lub minimum (lub żadne z nich). Kwestię tę podejmiemy później. Przykład 2. Znaleźć ekstremum funkcji: Z=*2+*2
przy warunku
8x
8y
Można, sprawdzić ten wynik, rozwiązując (12.10) względem dy i podstawiając je do (12.9). Warunek (12.11) wraz z ograniczenietn g(*, y) = c stanowią dwa równania, z których można obliczyć3 wartości krytyczne * i y. . Czy podejście wykorzystujące różniczkę zupełną daje taki sam warunek pierwszego rzędu, jak metoda mnożnika Lagrange’a? Porównajmy (12.8) z otrzymanym właśnie wynikiem. Pierwsze równanie w (12.8) stanowi po prostu powtórzenie ograniczenia; nowy wynik również wymaga, aby było ono spełnione. Ostatnie dwa równania z (12.8) można przepisać, odpowiednio, jako:
*x + 4*2 = 2.
Funkcją Lagrange’a jest Z = x \ + x \ + A(2 - xx - 4*2) i warunek konieczny dla jej war tości stacjonarnej jest następujący: * i + 4*2 = 2,
Za = 2 - *i - 4*2 = 0
— A + 2*i
czyli
Z i= 2*i —A = 0
A = iL .
-4 A
Z2= 2*2 —4A = 0
= 0, + 2 * 2 = 0.
— = 2i
(12.11') 8x
^-=2;
8y
przekazują one dokładnie tę samą informację, co (12.11). Podczas gdy podejście wykorzys tujące różniczkę zupełną daje jedynie wartości * i y, to metoda mnożnika Lagrange’a daje również wartość Ajako bezpośredni produkt uboczny. Okazuje się, że A stanowi miarę wrażliwości Z (i f) na przesunięcie ograniczenia. Wobec tego metoda mnożnika Lagrange’a ma tę zaletę, że rozwiązanie zawiera pewną „wbudowaną” informację dotyczącą statyki porównawczej.
Wartość stacjonarna Z, określona przez rozwiązanie: 4 l7 ;
_ 2 TT
8
_ 4 jest zatem równa Z = f = — . Ponownie należy sprawdzić warunek drugiego rzędu, zanim
będzie można orzec, czy z je st maksimum lub minimum.
Podejście wykorzystujące różniczkę zupełną W trakcie rozważań dotyczących bezwarunkowego ekstremum z = f( x , y) stwierdzono, że konieczny warunek pierwszego rzędu może być sformułowany za pomocą różniczki zupeł nej dz w następujący sposób: (12.9)
Interpretacja mnożnika Lagrange’a
*2~ 17 Aby pokazać, że Arzeczywiście mierzy wrażliwość Ż na zmianę warunku ograniczającego, przeprowadzimy analizę statyki porównawczej dlą warunku pierwszego rzędu (12.8). Ponieważ A, * i y są endogeniczne, więc jedyną dostępną zmięnną egzogeniczną jest para metr c występujący w ograniczeniu. Zmiana c spowoduje przesunięcie krzywej ograniczającej na płaszczyźnie *y, a przez to zmianę rozwiązania optymalnego. W szczególności wzrost c (większy budżet lub większe ilości produkcji) pokaże, jaki jest wpływ złagodzenia ograniczeń na rozwiązanie optymalne, Aby przeprowadzić analizę statyki porównawczej, skorzystamy z twierdzenia o funkcji uwikłanej. Przyjmujemy, żę trzy równania w (12.8) mają postać F (A , *, y; c) = 0 (dla j= 1,2,3) i zakładamy, że mają one ciągłe pochodne cząstkowe, Musimy najpierw sprawdzić, że następujący jakobian dla zmiennych endogenicznych (gdzie - f yx i gxy - gyx):
dz = fxdx + fydy = 0.
Stwierdzenie to pozostaje prawdziwe po dodaniu warunku g(x, y) = c. Jednak w obecno ści warunku ograniczającego nie możemy już — tak jak poprzednio — traktować różniczek d* i dy jako „dowolnych” przyrostów. Jeśli g(x, y) = c, to dg musi być równe dc, które jest równe zeru, gdyż c jest stają. Zatem:
3 Zauważmy, że warunek g = c wciąż trzeba rozważać razem z (12.11), mimo iż wykorzystaliśmy równanie dg = 0 — czyli (12.10) — przy wyprowadzeniu (12.11). Chociaż g = c koniecznie implikuje dg = 0, twierdzenie odwrotne nie jest prawdziwe: dg = 0 implikuje jedynie, że g = stałej (niekoniecznie c). Jeśli nie uwzględnimy zatem warunku, to nierozważnie „zgubimy” część informacji dotyczącej zagadnienia.
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 379
378 PROBLEMY OPTYMALIZACJI
dFl
(12.12)
|J | =
dF1
dF1
"aT
dx
dy
dF 2
dF2
dF2
dl
dx
dy
dF 3
dF 3
'dF3
dl
dx
dy
Przypadki n zmiennych i wielu ograniczeń
0
-
~gx
-gy
~gx
fXX-IgXX
fxy —lgxy
-gy
fxy —lgxy
fyy
—Ągyy
X = X(c);
x = x (c);
y = y(c)
Wynika stąd, że funkcja Lagrange’a będzie równa: Z = /( * i, x2y..., xn) + 1 [c - g (x i, *2, ..., *„)] i warunek pierwszego rzędu dla tej funkcji będzie miał postać następującego układu (n + 1) równań:
Zi —f\ —Ig i = 0, Z2 = fi - Ig i —0,
c - g ( x , y ) = 0, A & y y - Z g & f ) * 0, f y ( x , y ) - l g y( x , y ) = 0.
Zn = fn ~ Ign = 0-
A teraz, ponieważ optymalna wartość Z zależy od (12.15)
i
, tzn.:
2 = f( x ,y ) + l[ c - g ( x ,y ) ] ,
więc możemy ze względu na (12.13) traktować Żjako funkcję jednej zmiennej c. Różniczku jąc Ź zupełnie względem c, otrzymujemy: dZ
„ dx
dy
dl
dc
dc
dc
dc
- ^ zzf x — + f y - r - + [ c - g ( x , y ) ] —
dx _ (fx - %gx)— +
=
+ l
1-
dy dl (fy-Xgy) -^+[c-g(x,y)]
8y dc TT . ~fc +
dZ dc
Podobnie jak poprzednio, pierwsze z tych równań powoduje, że warunek ograniczający jest spełniony, chociaż koncentrujemy naszą uwagę na funkcji Lagrange’a bez ograniczeń. Gdy mamy więcej warunków, wówczas również możemy stosować metodę mnożnika Lagrange’a, ale wówczas musimy wprowadzić dó funkcji Lagrange’a tyle takich mnożników, ile jest ograniczeń. Załóżmy, że funkcja n zmiennych podlega jednocześnie dwu ogranicze niom:
dJć 8x dc
gdzie wszystkie pochodne f x, f yi g x i g y są obliczone w punkcie optymalnym. Na mo cy (12.14) pierwsze trzy składnild po prawej stronie znikają. Pozostaje nam prosty wynik: (12.16)
g ( x u x 2, ...,x rt) = c.
ZA= c ~ g ( x 1,* 2, ...,x„) = 0,
i wszystkie one mają ciągłe pochodne. Mamy ponadto tożsamości:
(12.14)
z = f( x u x2i ...,*„) przy warunku:
nie zn ik a dla położenia optymalnego. W tym momencie nic nie wskazuje na to, że tak miałoby być. Ale nasze poprzednie doświadczenia dotyczące statyki porównawczej problemów optymalizacyjnych (por. (11.42)) sugerują, że jakobian jest ściśle związany z warunkiem dostatecznym drugiego rzędu i że jeśli ten warunek dostateczny jest spełniony, to jakobian będzie miał wartość różną od zera w punkcie równowagi (optimum). Pozostawiając udowodnienie tego faktu na później, kontynuujemy nasze rozważania, zakładając, że | J | ź 0. Jeśli tak jest, to X, Je i y możemy wyrazić jako funkcje uwikłane parametru c: (12.13)
Uogólnienie metody mnożnika Lagrange’a dla n zmiennych może być z łatwością dokonane, jeśli przyjmiemy indeksowane oznaczenia dla zmiennych decyzyjnych. Funkcja celu będzie miała postać:
- x
co uprawomocniło nasz postulat, że wartość rozwiązania dla mnożnika Lagrange’a stanowi miarę wpływu, jaki ma zmiana parametru c warunku ograniczającego na wartość optymalną funkcji celu. Potrzebne jest tu pewne ostrzeżenie. Aby ta interpretacja 1 była możliwa, Z musi być wyrażone dokładnie tak, jak w (12.7). W szczególności ostatni składnik trzeba zapisać jako X [c -g (x ,y )], a m c jako l [ g ( x , y ) - c ] .
g ( x i,x 2, ...,x n) = c
i
h(xu jc2, ... ,x n) = d.
Przyjmujemy wtedy 1 i /¿jako dwa nieokreślone mnożniki i skonstruujemy następującą funkcję Lagrange’a: h z = f(x u x2 i. . . t xn) + l [ c - g ( x u *2, ..., JC„)] + + ¿l[d- h(xu x2t ...,*„)]• Funkcja ta będzie przyjmowała te same wartości co pierwotna funkcja celu, gdy będą spełnione warunki ograniczające, tzn. gdy znikną ostatnie składniki w funkcji Lagrangeła. Mamy teraz w sumie (n + 2) zmiennych, gdyż również 1 i JJ. traktujemy jako zmienne; wobec tego warunek pierwszego rzędu będzie w tym przypadku stanowił następujący układ n + 2 równań: Zx = c - g(xu x2, ...,x n) = 0, ZM= d - h ( x 1, *2,
Z\ =fi - Igi - flhi = 0
(i = l, 2 , . . . , ń).
380 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 381
Równania te można zazwyczaj rozwiązać względem wszystkich oraz A i fi. Podobnie jak poprzednio, pierwsze dwa równania warunku koniecznego są po prostu powtórzeniem dwu warunków ograniczających.
Ćwiczenie 12.2_______
______
_ _
1. Za pomocą metody mnożnika Lagrange’a znaleźć stacjonarne wartości dla z: (a) z= xy, przy warunku x + 2 y = 2; (b) z = x (y + 4), przy warunku x + y= 8; (c) z = x - 3 y - j r y , przy warunku x + y = 6; (d) z = 7 - y + x2, przy warunku ;t + y = 0.
odgrywa A w rozwiązaniu optymalnym4, różni się w sposób podstawowy od tej, jaką odgrywa x i y. Nie czyni szkody traktowanie Ajako jeszcze jednej zmiennej decyzyjnej przy omawianiu warunku pierwszego rzędu. Musimy jednak być ostrożni i nie stosować na ślepo do obecnego przypadku z ograniczeniami warunków drugiego rzędu wyprowadzonych dla zagadnienia bez warunków ograniczających. Powinmśmy raczej wyprowadzić nowe warunki. Jak zobaczymy, nowe warunki można ponownie sformułować za pomocą różniczki zupełnej drugiego stopnia d2z. Jednakże obecność ograniczeń pociąga za sobą pewne istotne modyfikacje kryterium.
Różniczka zupełna drugiego rzędu „
2. Dla powyższego zadania sprawdzić, czy niewielkie złagodzenie ograniczenia spowoduje zmniejszenie lub zwiększenie optymalnej wartości z. W jakim stopniu? 3. Dla każdego z następujących przykładów zapisać funkcję Lagrange’a i warunek pierw szego rzędu dla wartości stacjonarnych (bez rozwiązywania równań): (a) z = x + 2y + 3w + x y -y w , przy warunku * + y + 2w = 10; (b) z = x 2 + 2xy + yw2, przy warunkach 2x + y + w2 = 24 i x + w = 8. 4. Jak należy zmodyfikować funkcję Lagrange’a i warunek pierwszego rzędu, jeśli warunek ograniczający jest zapisany w postaci G(x, y) = 0, a nie g(x, y) = c l 5. Przy omawianiu podejścia wykorzystującego różniczkę zupełną wskazano, że gdy dane jest ograniczenie g(x, y) = c, to możemy wnioskować, że dg = 0. Na tej samej zasadzie możemy następnie wnioskować, że d2g = d(dg) = d(0) = 0. Ale w trakcie wcześniejszych rozważań dotyczących ekstremum bezwarunkowego funkcji z = f(x 1 y) mieliśmy sytuację, że wartości dz = 0 towarzyszyła dodatnio lub ujemnie określona d2z, a nie d2z = 0. Jak można wyjaśnić tę niezgodność postępowania w obu przypadkach? 6. Jeśli zapiszemy funkcję Lagrange’a w postaci Z = f ( x , y) + A [g(x, y) - c], a nie (12.7), to czy możemy interpretować mnożnik Lagrange’a tak, jak w (12.16)? Podać ewentualną nową interpretację.
Wspomniano już, że ponieważ ograniczenie g(x, y) = c oznacza dg = gxdx + gydy = 0, jak w (12.10), więc d r i dy nie są już dowolne. Możemy oczywiście przyjąć np. d r jako dowolny przyrost, ale wtedy dy musi być traktowane jako zależne od d r i zawsze tak dobrane, aby było spełnione (12.10), tzn. aby dy = -{ g xlgy)dx. Mówiąc inaczej: gdy tylko określona jest wartość dr, wówczas dy zależy od gx i gyi ale ponieważ te ostatnie zmienne zależą z kolei od zmien nych x i y, więc dy będzie również zależało od x i y. Oczywiście nie można wtedy dłużej stosować podanego wcześniej wzoru (11.6) dla d2z, który zakłada dowolność d r i dy. Aby znaleźć odpowiednie nowe wyrażenie dla d2z, musimy podczas różniczkowania traktować dy jako zmienną, która zależy od x i y (jeśli d r mamy traktować jako stałą). Zatem: a2 a ,a ^ ^ 9(dz) j d z = d(dz) = —r— d r + -d y = dx dx =
(fx<& + fydy)dx +
d
(fxd x + f ydy)dy =
f 3 ( d y) j fxxfa + fxydy +fy dr + dx \ / 3(dy) " dy = fyx&C + f y y f y + f y dy J =fxxdx2 + fxydydx +fx $ ^ L dx +fyxdxdy +
12.3. WARUNKI DRUGIEGO RZĘDU Wprowadzenie m nożnika Lagrange’a jako dodatkowej zmiennej umożliwia zastosowanie do zagadnienia ekstremum warunkowego takiego samego warunku pierwszego rzędu, jaki stosowaliśmy dla zagadnień ekstremum bezwarunkowego. Kuszące byłoby pójście o krok dalej i przeniesienie również koniecznych i dostatecznych warunków drugiego rzędu. Tego jednak robić nie wolno. A to dlatego, że chociaż Ź jest standardowym rodzajem ekstremum względem zmiennych decyzyjnych, to jednak nie jest nim względem mnożników Lagrange’ą. Dokładniej, na podstawie (12.15) możemy zobaczyć, że — odwrotnie niż dla x i y jeśli X zostanie zastąpione przez dowolną inną wartość A, to nie będzie to miało żadnego wpływu na Ż, ponieważ [c —g(x, y)] jest równe tożsamościowe zeru. Zatem rola, jaką
2 , f m ) dy.
+ fy y& y2 + f y
y
dy
Ponieważ trzeci i szósty składnik mogą być zredukowane do:
4 W ogólniejszej strukturze optymalizacji warunkowej, znanej jako programowanie nieliniowe, które zostanie omówione w jednym z następnych rozdziałów, pokażemy, że przy warunkach w postaci nierówności, jeśli Ż jest maksimum (minimum) względem x i y, to będzie w rzeczywistości minimum (maksimum) względem A. Innymi słowy, punkt (A, xf y) jest punktem siodłowym. Obecny przykład — gdy Z jest prawdziwym ekstremum względem x i y, ale jest niezmiennicze względem A — może być traktowany jako zdegenerowany przypadek punktu siodłowego. Natura rozwiązania (X, Jt, y) jako punktu siodłowego prowadzi również do ważnego pojęcia „dualności” . Ale ten temat lepiej odłóżmy na później.
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 383
382 PROBLEMY OPTYMALIZACJI
d(dy) • -3(d dx+ — fy dx dy
dy = fyd(dy)= fyd2y,
więc szukanym wyrażeniem dla d2z jest: (12.17)
d2z =fxxdx2 + 2fxydxdy + fyydy2 + fyd2y,
co różni się od (11.6) tylko ostatnim składnikiem fydfy. Ten ostatni składnik jest składnikiem pierwszego stopnia (d2y nie jest tym samym, co (dy)2); zatem jego obecność w (12.17) dyskwalifikuje d2z jako formę kwadratową. Jednakże d2z musi być przekształcone w formę kwadratową za pomocą ograniczenia g(x, y) —c. Ponieważ ograniczenie to implikuje, że dg = 0 i d2g = d(dg) = 0, więc korzystając z procedury zastosowanej przy wyprowadzeniu (12.17) otrzymujemy: (d2g =) gxxdx2 + 2gxyd x d y + gyydy2 + gydfy = 0. Rozwiązując to ostatnie równanie względem d2y i podstawiając do (12.17), eliminu jemy wyrażenie pierwszego stopnia d2y i zapisujemy d2z w postaci następującej formy kwadratowej: d2z =
dx2 + 2 U ~ - 8 x y |d*dy + fyy *y ) S
h ~Syy ~ dy2.
ZXX—fxx ~ A.gXX, ZXy —fxy ~ hgxy —Zyx , ZJyy —fyy ~ KSyy są dokładnie równe tym wyrażeniom w nawiasach. Stosując zatem funkcje Lagrange a, możemy ostatecznie wyrazić d2z jako: (12.17')
Hesjan obrzeżony
Sy
Korzystając z (12.11'), pierwszy współczynnik w nawiasie można sprowadzić do (fxx —^Sxx) i podobnie można postąpić w stosunku do innych składników. Obliczając jednak pochodne cząstkowe pochodnych z (12.8) stwierdzamy, że następujące pochodne drugiego rzędu:
(12.18)
jednocześnie równe zeru), które spełniają liniowy warunek ograniczający (12.10), a więc gxdx + gydy = 0. Warunki konieczne drugiego rzędu są zatem następujące: — dla maksimum z: d2z ujemnie półokreślone, przy warunku dg = 0, — dla minimum z: d2z dodatnio półokreślone, przy warunku dg = 0, a warunki dostateczne drugiego rzędu są takie: — dla maksimum z: d2z określone ujemnie, przy warunku dg = 0, — dla minimum z: d2z określone dodatnio, przy warunku dg = 0. W dalszym ciągu skoncentrujemy się na warunkach dostatecznych drugiego rzędu. Ponieważ pary (dc, dy) spełniające warunek gxdc-ł- gydy = 0 stanowią po prostu podzbiór zbioru wszystkich możliwych dc i dy, więc określoność znaku przy warunkach ograniczają cych jest mniej restrykcyjna — tzn. łatwiejsza do spełnienia — niż określoność przy braku ograniczeń omówiona w poprzednim rozdziale. Innymi słowy, warunek dostateczny drugiego rzędu jest dla zagadnienia ekstremum warunkowego warunkiem słabszym niż dla ekstremum bezwarunkowego. Jest to dobra wiadomość, gdyż w przeciwieństwie do warunków koniecz nych, które — aby służyć efektywnie — muszą być restrykcyjne, warunki dostateczne muszą być słabe, aby były naprawdę użyteczne5.
d2z = Z xxd x2 + Zxydxdy + + Z yxd y d x + Zyydy2.
Współczynniki w (12.17') są po prostu drugimi pochodnymi cząstkowymi Z względem zmiennych decyzyjnych x i y; razem mogą one zatem utworzyć hesjan.
Warunek dostateczny drugiego rzędu można wyrazić, podobnie jak w przypadku ekstremum bezwarunkowego, w postaci wyznacznikowej. W przypadku ekstremum warunkowego zamiast jednak hesjanu |H | napotkamy tzw. hesjan obrzeżony (bordered Hessian). Przygotowując się do zdefiniowania tego pojęcia, przeanalizujemy najpierw warunki określoności znaku formy kwadratowej dwu zmiennych przy ograniczeniu liniowym, np.: q = auz + 2huv + bv2,
przy warunku
a u + p y = 0.
Ponieważ z ograniczenia wynika, że v = - ( a lj5 )u , więc q możemy zapisać jako funkcję jednej zmiennej: 2 ^ 2 q = au1 - 2 h ^ - u 1 + b ^ I u 2 = (a P 1- 2 h a p + b a 2) '^ r . P P Jest oczywiste, że q jest dodatnio (ujemnie) określone wtedy i tylko wtedy, gdy wyrażenie w nawiasie jest dodatnie (ujemne). Tak się składa, że następujący symetryczny wyznacznik: 0
cc ¡i
a
a
P
h b
h = 2 h a P - a f} 2 - b a 2
Warunki drugiego rzędu
jest dokładnie liczbą przeciwną do wspomnianego wyrażenia w nawiasie. Możemy w konsek-
Dla ekstremum warunkowego z = f( x , y), przy warunku g(x, y) = c, warunki konieczne i dostateczne drugiego rzędu dotyczą znaku różniczki zupełnej drugiego rzędu d2z obliczonej w punkcie stacjonarnym. Występuje tu jednak ważna różnica. W obecnym kontekście zajmujemy się określonością lub półokreślonością d2z nie dla wszystkich możliwych wartości cLti dy (które nie są jednocześnie równe zeru), ale jedynie dla tych wartości dc i dy (które nie są
5 „Milionowe konto bankowe w dolarach” jest oczywiście warunkiem dostatecznym, aby „móc pozwolić sobie na dobry obiad” . Ale niezmiernie ograniczona stosowalność tego warunku czyni go praktycznie bezużytecznym. Bardziej sensownym warunkiem dostatecznym mogłoby być coś w rodzaju „dwudziestu dolarów w portfelu” , co jest znacznie mniej restrykcyjnym wymaganiem finansowym.
384 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 385
wencji stwierdzić, że:
{
dodatnio określone
q jest
przy warunku a u + fiv = 0
ujemnie określone
wtedy i tylko wtedy, gdy
0
a
P
a
a
h
P
h
b
< 0,
Teraz, gdy wyprowadziliśmy warunki dostateczne drugiego rzędu, łatwo sprawdzić, że (zgodnie z tym, co powiedzieliśmy wcześniej) spełnienie ich będzie gwarantowało, że jakobian zmiennych endogenicznych (12.12) nie znika dla stanu optymalnego. Po pod stawieniu (12.18) do (12.12) i pomnożeniu pierwszej kolumny i pierwszego wiersza jakobianu przez -1 (co nie zmienia wartości wyznacznika) widzimy, że: 0
> 0. (12.19)
|J | =
Zyx
Należy zwrócić uwagę na to, że wyznacznik zastosowany w tym kryterium jest po prostu wyznacznikiem pierwotnej formy kwadratowej
a
h
h
b
z brzegiem umieszczonym u góry i po
lewej stronie. Ponadto brzegi składają się z dwu współczynników cc i p warunku ogranicza jącego oraz zera na głównej przekątnej. Ten obrzeżony wyznacznik jest symetryczny. Przykład 1. Sprawdzić, czy q = 4u 2 + 4wv + 3v2 przy warunku u - 2v = 0 jest dodatnio lub ujemnie określona. Najpierw tworzymy wyznacznik obrzeżony: 0
1 -2
1
4
2
-2
2
3
który jest symetryczny dzięki temu, że współczynnik przy uv podzielono na dwie połowy przed wstawieniem ich do wyznacznika. Ponieważ wyznacznik ten jest ujemny (-27), więc q musi być dodatnio określona. Gdy wzór q —4w2 + 4wv + 3v2 porównamy z formą kwadratową d2z przedstawioną w (12. i 7'), wówczas zobaczymy, że zmienne u i v stają się odpowiednio ćx i dy i wyznacznik
8x
gy
ZXX Zx) = |H |. Z y:
Jakobian dla zmiennych endogenicznych jest zatem identyczny z obrzeżonym hesjanem — wynik ten przypomina (11.42), gdzie pokazano, że dla bezwarunkowego ekstremum jakobian zmiennych endogenicznych jest równy zwykłemu hesjanowi. Jeśli, przy spełnionym warunku dostatecznym, mamy |H |^ 0 dla optimum, to | J | też musi być różny od zera, W konsekwencji, gdy stosujemy tu twierdzenie o funkcji uwikłanej, nie będzie czymś niewłaściwym zastąpienie zwykłego warunku | J | & 0 przez warunek |H | ^ 0. W ten sposób będziemy postępować przy analizowaniu statyki porównawczej zagadnień warunkowej optymalizacji. Przykład 2. Wróćmy do przykładu 1 z podrozdz. 12.2 i sprawdźmy, czy znaleziona wtedy wartość stacjonarna stanowi maksimum czy minimum. Ponieważ Zx = y - A i Z y - x - X , więc pochodne cząstkowe drugiego rzędu są równe Zxx- 0; Zxy - Z yx- \ ; Zyy = 0. Potrzebne nam elementy brzegowe są równe gx = 1 i gy = 1. Zatem: 0 |H |=
1
1 0 1
1 1 = 2 > 0,
1 0
co dowodzi, że wartość z - 9 stanowi maksimum. . Ponadto, ponieważ ograniczeniem dla formy kwadratowej
(zwykły) jest hesjanem
jest g^cLc + g^dy = 0, więc a ~ g x i P = gy- Zatem dla tych wartości dx i dy, które speł niają wspomniane ograniczenie, mamy następujące wyznacznikowe kryterium określoności znaku d2z: d2z jest
Jdodatnio określone! [ujemnie określone 0
wtedy i tylko wtedy, gdy
gx
j
przy warunku dg = 0 gx
8y
Zx,
Z Xy
8y ZyX Zyy
f\<
0, |> l 0.
Wyznacznik po prawej stronie, zwany często obrzeżonym hesjanem, oznaczamy symbolem |H |; kreska na górze oznacza brzeg. Na tej podstawie możemy wnioskować, że dla danej wartości stacjonarnej funkcji z = f( x , y) lub Z = f( x , y) + A [c- g(x, y)]_dodatni |H | wystarcza, aby stwierdzić, że jest to względne maksimum z\ podobnie ujemne |H | wystarcza, aby stwierdzić, że jest to minimum. Wszystkie pochodne występujące w |H | powinny być obliczone dla wartości krytycznych x i y.
' Przykład 3. W przykładzie 2 z podrozdz. 12.2 widzimy, że Z x = 2*i - A i 2^ = 2jc2 - 4A. Wynika stąd, że Zn = 2; Zł2 = Z21 = 0; Z22 = 2. Z warunku Xi + 4x2 = 2 otrzymujemy gi = 1 i g 2 = 4, z czego wynika, że obrzeżony hesjan jest równy: 0 |H | =
1 4 s‘= - 3 4 < 0
i wartość z = — stanowi minimum. 17
Przypadek n zmiennych Gdy funkcja celu przyjmuje postać z = f(x 1 , a 2, ..., xn) przy warunku g(xi, x2, x n) = c, wówczas warunek drugiego rzędu zależy od znaku d2z. Ponieważ różniczka ta jest — podlegająca ograniczeniu — formą kwadratową zmiennych dxi, dx2, ...,d r „ spełnia jących równanie: 25 — Podstawy...
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 387
386 PROBLEMY OPTYMALIZACJI
(dg=)g1d x i+ g 2dx 2 + ... + gndxn = 0, więc warunki dla dodatniej lub ujemnej określoności d2z są związane z obrzeżonym hesjanem. Ale tym razem warunki te muszą być wyrażone za pomocą obrzeżonych minorów głównych hesjanu. Dla obrzeżonego hesjanu: gi
0
|H | =
g1
Z ll
gl
Z
21
gi
...
Warunek
Maksimum
.. .
Zin
22
...
Ząn
Minimum
Warunek konieczny pierwszego rzędu
Zx = Z\ = Z ą= ...= Z n = 0
Zx—Z \—Zji—... =Zn = 0
Warunek dostateczny drugiego rzędu*
|H2|> 0 ; jfiUl> 0 ;
|fi2|, |fi3| , ..., |H„| < 0
gn
Zi2 Z
Tablica 12.1 Test wyznacznikowy dla względnego ekstremum warunkowego z = f ( x l9 x 29, . . 9x H) przy w arunku g (x u x 2, . . . , x n) = c; dla Z = f( x u x 2, .:., x n) + A [c - g (x l9 x l9 ..., x n)]
|H3| < 0; (-1)41H„| > 0
* M o ż n a g o s to s o w a ć ty lk o w te d y , g d y j e s t s p e łn io n y w a r u n e k k o n ie c z n y p ie rw s z e g o r z ę d u .
Sn
Z n\ Z n2
»..
Zjm.
jego kolejne obrzeżone minory główne mogą być zdefiniowane jako: o
|H 2| =
gi gi
gl
g2
Zn
Z12
Zą 1
|H 3| =
Z12
o
gl
gl
gi
Zn
Z12 Z13
gi
Z21
Z22
g 3 Z31
gs
itd.;
Z23
Z32 Z33
Przypadek wielu zmiennych Gdy w zagadnieniu pojawia się więcej niż jedno ograniczenie, wtedy warunek drugiego rzędu obejmuje hesjan z więcej niż jednym brzegiem. Załóżmy, że mamy n zmiennych decyzyjnych i m warunków ograniczających (m < ń) postaci gJ(xl9 . .. ,x n) = Cj. Wtedy funkcja Lagrange’a przyjmie postać: m
ostatni z nich jest równy |H „| = |H |. W nowo wprowadzonych oznaczeniach pozioma kres ka nad H ponownie oznacza „obrzeżony” , a indeks oznacza stopień minora głównego, do którego dopisujemy brzeg. Na przykład |H 2| zawiera drugi minor główny zwykłego he sjanu obrzeżony przez 0, gi i g2; podobnie jest dla pozostałych symboli. Warunki dodat niej i ujemnej określoności d2z są wtedy następujące:
d2z jest
i dodatnio określone 1 [ujemnie określone j
wtedy i tylko wtedy, gdy
Z —f ( x i, . . . , xn) + ^ Zj [Cj g^(xi, . . . , xn)], ;'= i a obrzeżony hesjan będzie następujący: 0
0
.. .
0
8i
0
0
.
0
sl
sl
0
0
.. .
0
81
81
sl
S 21 ••
82
•• s ‘n
■
■••
sl
przy warunku dg = 0
IH2I,
| H3|,_ ...,
IH 21> 0;
| H31<0 ;
Si
| H„| <0, |H„|>0
itd.
W pierwszym przypadku wszystkie obrzeżone minory główne, poczynając od |H 2|," muszą być ujemne, a w drugim przypadku ich znaki muszą się kolejno zmieniać. Podobnie jak poprzednio, dodatnio określone d2z wystarcza, aby stwierdzić, że dana wartość stacjonar na z jest minimum, a ujemnie określone d2z wystarcza, aby stwierdzić, że z jest maksi mum. Możemy już podsumować kryteria dla warunkowego ekstremum względnego -— por. tabl. 12.1. Proszę zauważyć, że kryterium podane w tablicy nie jest zupełne. Ponieważ warunek dostateczny drugiego rzędu nie jest konieczny, więc niespełnienie podanego kryterium nie wyklucza możliwości, że dana wartość stacjonarna jest mimo wszystko maksimum lub minimum, zależnie od sytuacji. W wielu ekonomicznych zastosowaniach ten (relatywnie mniej restrykcyjny) warunek dostateczny drugiego rzędu albo jest spełniony, albo też zakłada się, że jest spełniony. A zatem informacja zawarta w tablicy jest dostateczna. Porównanie wyników zawartych w tabl. 12.1 z tymi z tabl. 11.2 (dla przypadku bezwarun kowego ekstremum) powinno okazać się pouczające.
sl
sl
••
8 " Zn
Z12 •-
81
Z 21 Z 22
8m n
Zn,
..
Zln Zan
..... S ln
sl
Zn2 -
Znn
gdzie gJ. = -g— są pochodnymi cząstkowymi funkcji występujących w warunkach ograni czających, a symbole Z z podwójnymi indeksami oznaczają — jak poprzednio — pochodne cząstkowe drugiego rzędu funkcji Lagrange’a. Zwróćmy uwagę, że obrzeżony hesjan — dla większej przejrzystości — podzielono na cztery bloki. Blok górny po lewej stronie zawiera same zera, a dolny po prawej jest po prostu zwykłym hesjanem. Pozostałe dwa bloki, zawierające pochodne gj, są symetryczne względem głównej przekątnej, co powoduje, że elementy całego obrzeżonego hesjanu są rozmieszczone symetrycznie. Dla |H | można utworzyć różne obrzeżone minory główne. Ten, który zawiera Z22 jako
388 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 389
ostatni element głównej przekątnej, będziemy oznaczać symbolem |H 2|. Włączając jeszcze jeden wiersz i jeszcze jedną kolumnę, tak iż pojawia się Z33, otrzymujemy |H 3| itd. Przy tych oznaczeniach możemy sformułować warunek dostateczny drugiego rzędu w kategoriach znaków następujących (n - m) obrzeżonych minorów głównych: | H m+i |,
| H m+2|, . . . , | H n |
(= | H | ) .
Dla maksimum funkcji z warunkiem dostatecznym jest, aby te obrzeżone minory zmieniały znak, przy czym znak |H m+i| jest taki, jak dla (-1 )OT+1. Dla minimum funk cji z warunkiem dostatecznym jest, aby wszystkie te obrzeżone minory główne miały ten sam znak, i to taki, jak dla ( - l ) m. To, czy liczba warunków jest nieparzysta, czy parzysta, stanowi istotną różnicę, ponieważ (-1) podniesione do potęgi nieparzystej ma znak przeciwny do tego, jaki miałoby dla potęgi parzystej. A gdy m = 1, wówczas podany właśnie warunek sprowadza się do tego, który podano w tabl. 12.1.
1. Za pomocą obrzeżonego hesjanu określić, czy wartość stacjonarna z otrzymana w każ dej części ćwiczenia 12.2-1 stanowi maksimum lub minimum. 2. Przy formułowaniu warunków dostatecznych drugiego rzędu dla maksimum i minimum warunkowego określiliśmy znaki |H 2|, |f i 3|, |H 4| itd., ale nie |H i|. Zapisać odpowiednie wyrażenie dla |i ł i | i sprawdzić, że zawsze ma on znak ujemny. 3. Odwołując się do drugiej własności wyznaczników (por. podrozdz. 5.3), pokazać, że: (a) zmieniając odpowiednio .dwa wiersze i dwie kolumny lub dwie kolumny |H 2| i należycie zmieniając znak wyznacznika po każdym przestawieniu, można przekształ cić go w wyznacznik: Z a g1
Z21
%22 g i \
gl
g2 0
(b) za pomocą podobnej procedury |f i 3| może być zapisane jako: Zn
Z a Z13
gi
Z>i Z3i
Z?2 Z 23 Z32 Z33
gi g3
g 2
0
g l
g 3
W podrozdz. 11.5 pokazano, że w przypadku zagadnienia ekstremum bezwarunkowego wiedza o tym, że funkcja celu jest wklęsła lub wypukła, zastępuje potrzebę sprawdzania warunku drugiego rzędu. W kontekście optymalizacji warunkowej można również obyć się bez warunku drugiego rzędu, jeśli powierzchnia lub hiperpowierzchnia ma odpowiedni kształt. Ale tym razem pożądany kształt to quasi-wklęsłość (a nie wklęsłość) dla maksimum oraz quasi-wypukłość (a nie wypukłość) dla minimum. Pokażemy, że quasi-wklęsłość (quasi-wypukłość) jest słabszym warunkiem niż wklęsłość (wypukłość). Należało tego oczekiwać, gdyż warunek dostateczny drugiego rzędu, bez którego chcemy się obyć, dla zagadnień optymalizacji warunkowej jest również słabszy (d2z ma być dodatnio lub ujemnie określone tylko dla tych dxit które spełniają dg = 0) niż dla zagadnień optymalizacji bezwarunkowej (d2z określone dodatnio lub ujemnie dla wszystkich dx,).
Charakterystyka geometryczna
Ćwiczenie 12.3
Zn
12.4. QUASI-WKLĘSŁOŚĆ I QUASI-WYPUKŁOŚĆ
Jaki alternatywny sposób „obrzeżania” minorów głównych hesjanu sugerują te wyniki? 4. Zapisać obrzeżony hesjan dla zagadnienia warunkowej optymalizacji przy czterech zmiennych decyzyjnych i dwóch warunkach ograniczających. Sformułować dla tego zagadnienia warunki dostateczne drugiego rzędu dla maksimum i dla minimum.
Quasi-wklęsłość lub quasi-wypukłość, podobnie jak wklęsłość i wypukłość, może być ścisła lub nie. Przedstawimy najpierw geometryczną charakterystykę tych pojęć: Niech u i v będą dowolnymi dwoma różnymi punktami dziedziny (pewnego zbioru wypukłego) funkcji / i niech obrazem odcinka uv w dziedzinie funkcji będzie taki łuk M N na wykresie funkcji, że punkt N leży wyżej lub ha tym samym poziomie, co punkt M. Mówimy wtedy, że fu n k cja /je st quasi-wklęsła (quasi-wypukła), jeśli wszy stkie punkty łuku M N różne od M i N leżą wyżej lub na tym samym poziomie, co punkt M (niżej lub na tym samym poziomie, co punkt N ). Mówimy, że funkcja/ jest ściśle quasi-wklęsła (ściśle quasi-\vypukla), jeśli wszystkie punkty łuku M N różne od M i N leżą ściśle powyżej punktu M (ściśle poniżej punktu N). Jest więc jasne, że każda ściśle quasi-wklęsłą (ściśle quasi-wypukła) funkcja jest quasi-wklęsła (quasi-wypukła), ale twierdzenie przeciwne nie jest prawdziwe. Dla lepszego zrozumienia tematu przyjrzyjmy się ilustracjom na rys. 12.3 sporządzonym dla przypądku jednej zmiennej. Na diagramie (a) odcinek prostej uv należącej do dziedziny ma obraz w postaci jakiego łuku MN, że N leży wyżej niż M. Ponieważ wszystkie punkty pomiędzy M i N na wspomnianym łuku leżą ściśle powyżej punktu M, więc łuk ten spełnia warunek ścisłej quasi-wklęsłości. Aby jednak możną było zakwalifikować krzywą jako quasi-wklęsłą, łuki dla wszystkich możliwych par (w, v) powinny spełniać ten sam warunek. Jest tak rzeczywiście dla funkcji na diagramie (a). Ta samą funkcja spełnia również warunek dla (nie ścisłej) quasi-wklęsłości. Nie spełnia jednak warunku dla quąsi-wypukłości, ponieważ niektóre punkty łuku M N leżą wyżej niż N, co dla funkcji quasi-wypukłej jest zabronione. Funkcja na diagramie (b) ma przeciwny kształt. Wszystkie punkty łuku M 'N ' leżą niżej ńiż N'; to samo Występuję dla Wszystkich możliwych łuków. Zatem funkcja na diagramie (b) jest ściśle quasi-wklęsła. Czytelnik może sprawdzić, żę spełnia ona również warunek dla (nie ścisłej) quasi-wypukłości, ąle nie spełnia Warunku dla quąsi-wklęsłości.
390 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 391
ponieważ wszystkie łuki na tej powierzchni, których przykładami są M N i M 'N \ speł niają warunek polegający na tym, że wszystkie punkty każdego łuku pomiędzy jego końcami leżą wyżej niż dolny koniec łuku. Wracając do diagramu (a), powinniśmy zauważyć, że przedstawiona na nim powierzch nia jest również quasi-wklęsła. Chociaż na diagramie (a) nie narysowaliśmy żadnych przykładowych łuków M N i M 'N ', nie jest trudno sprawdzić, że wszystkie możliwe łuki rzeczywiście spełniają warunek dla ścisłej quasi-wklęsłości. Uogólniając, funkcja ściśle wklęsła musi być ściśle quasi-\vklęsła, chociaż odwrotne stwierdzenie nie jest prawdziwe. Udowodnimy to bardziej formalnie w następnych punktach.
Rysunek 12.3
Definicja algebraiczna
Diagram (c) wyróżnia się tym, że występuje tu poziomy odcinek prostoliniowy M "N ", którego wszystkie punkty leżą na tej samej wysokości. W rezultacie odcinek ten — zatem również cała krzywa— może jedynie spełniać warunek dlaąuasi-wklęsłości, ale nie dla ścisłej quasi-wklęsłości. Mówiąc ogólniej, funkcja quasi-wklęsła, która nie jest jednocześnie wklęsła, ma wykres przypominający kształtem dzwon lub jego część, a funkcja quasi-wypukła ma wykres przypominający kształtem odwrócony dzwon lub jego część. Dzwon może mieć (chociaż nie jest to wymagane) zarówno fragmenty wklęsłe, jak i wypukłe. Quasi-wklęsłość (quasi-wypukłość) z powodu mniej ograniczającej charakterystyki jest słabszym warunkiem niż wklęsłość (wypukłość). Na rys. 12.4 przedstawiliśmy ścisłą wklęsłość i ścisłą quasi-wklęsłość w przypadku dwuwymiarowym. Obie funkcje, których wykresy pokazano, są rosnące, ponieważ wykresy zawierają, odpowiednio, jedynie wznoszące się fragmenty kopuły dzwonu. Powierzchnia na diagramie (a) jest ściśle wklęsła, ale powierzchnia na diagramie (b) na pewno nie, gdyż w pobliżu podstawy dzwonu ma ona fragmenty wypukłe. Jest jednak ściśle quasi-wklęsła,
Powyższa charakterystyka geometryczna może być zapisana za pomocą definicji algebraicz nej, co ułatwi uogólnienie jej na przypadek większej liczby wymiarów: f quasi-wklęsła 1 ' . „ < f wtedy i tylko wtedy, [ quasi-wypukłaj gdy dla dowolnej pary różnych punktów u i v należących do (wypukłej) dziedziny / id la O < 0 < l: fu n k c ja /je s t
(12.20)
/(v ) * / ( « )
=>f[du +(1 - 0)v] |
Aby przystosować tę definicję do ścisłej quasi-wklęsłości i quasi-wypukłości, dwie . [ > /( « ) ] nieostre nierówności po prawej stronie należy zastąpić ostrymi nierównościami j
Pouczające może być porównanie (12.20) z (11.20). Z definicji tej wynikają z łatwością następujące trzy twierdzenia. Zostaną one sformułowane dla funkcji fix ) , gdzie x można interpretować jako wektor zmiennych x = [ x i x2 ... xn]. \
Tw ierdzenie I (funkcja przeciwna) Jeśli f{ x ) jest quasi-wklęsła (ściśle quasi-wklęsła), to - f{ x ) jest quasi-wypukła (ściśle quasi-wypukła).
Tw ierdzenie II (wklęsłość k o n tra quasi-wklęsłość) Każda funkcja wklęsła (wypukła) jest quasi-wklęsła (quasi-wypukła), ale odwrotne twier dzenie nie jest prawdziwe. Podobnie, każda funkcja ściśle wklęsła (ściśle wypukła) jest ściśle quasi-wklęsła (ściśle quasi-wypukła), ale odwrotne twierdzenie nie jest prawdziwe.
Tw ierdzenie n i (funkcja liniowa) Rysunek 12.4
(a)
W
Jeśli f( x ) jest funkcją liniową, to jest zarówno quasi-wklęsła, jak i quasi-wypukła.
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 393
392 PROBLEMY OPTYMALIZACJI
Twierdzenie I wynika z faktu, że przy mnożeniu nierówności przez -1 zmieniamy jej zwrot. Niech f ( x ) będzie quasi-wklęsła, z /(v ) ^ f{u ). Wtedy na mocy (12.20) f [ 0 u + ( 1 - 0) v] ^ f (u). Jeśli chodzi natomiast o funkcję - /( * ) , to po pomnożeniu obu nierówności p rz e z -1 otrzymujemy: i
została zilustrowana) zbiór S * jest wypukły. Funkcja na diagramie (b) jest natomiast quasi-wypukła, ponieważ zbiór 5^ jest wypukły. Funkcja na diagramie (c) — funkcja monotoniczna — różni się od dwu pozostałych tym, że oba zbiory i 5^ są wypukłe. Zatem funkcja ta jest zarówno quasi-wklęsła, jak i quasi-wypukła.
-/[0 ii + ( l - f l v ] f - / ( i i ) .
Interpretując - /( « ) jako wysokość punktu N i - /(v ) jako wysokość punktu M, widzimy, że funkcja - /(* ) spełnia warunek quasi-wypukłości podany w (12.20). Kończy to dowód jednego z czterech przypadków podanych w twierdzeniu; dowody dla pozostałych trzech przypadków są podobne. Dla twierdzenia II udowodnimy jedynie, że z wklęsłości wynika quasi-wklęsłość. Niech f( x ) będzie wklęsła. Na mocy (11.20) mamy: f [ 0 u + (1 - 6) v] ^ df(u) + (1 - 0)/(v). Załóżmy teraz, ż e /(v ) mniejsza niż /(w), tzn.:
wtedy każda średnia w ażona/(v ) i f (u) nie może być («)
(b)
Łącząc dwie powyższe nierówności, otrzymujemy: f l 6 u + (1 - 6) v] 5*f ( u )
dla
/(v ) ^ / ( « ) ,
co jest zgodne z definicją quasi-wklęsłości podaną w (12.20). Jednak warunek dla quasi-wklęsłości nie może zagwarantować wklęsłości. Gdy twierdzenie II jest udowodnione, otrzymujemy natychmiast twierdzenie Ul. Wiemy już, że funkcja liniowa jest zarówno wklęsła, jak i wypukła, chociaż nie ściśle. Na podstawie twierdzenia II funkcja liniowa musi zatem być zarówno quasi-wklęsła, jak i quasi-wypukła, chociaż nie ściśle quasi-wklęsła i nie ściśle quasi-wypukła. W przypadku funkcji wklęsłych i wypukłych istnieje pożyteczne twierdzenie mówiące, że suma funkcji wklęsłych (wypukłych) jest również wklęsła (wypukła). Niestety, twierdzenia nie można uogólnić na przypadek funkcji quasi-wklęsłych i quasi-wypukłych. Na przykład suma dwu funkcji quasi-wklęsłych nie musi koniecznie być quasi-wklęsła (por. ćwicze nie 12.4-3). Niekiedy łatwiej będzie sprawdzić quasi-wklęsłość i quasi-wypukłość na podstawie następującej definicji: funkcją /( x ), gdzie x jest wektorem zmiennych, i quasi-wklęsła ) jest < . ' r wtedy i tylko wtedy, gdy dlą każdej stałej k zbiór [ quasi-wypukłaj (12.21)
^
|
Zbiór S-
Zbiór S* (c)
Rysunek 12.5 Zauważmy, że chociaż można stosować (12.21) do sprawdzania quasi-wklęsłości i quasi-wypukłości, tg jednak nie można za ich pomocą odróżnić ścisłej i nieścisłej odmiany tych własności. Ponadto, własności definiujące podane w (12.21) nie są dostateczne dla wklęsłości i wypukłości. W szczególności dla funkcji wklęsłej, która siłą rzeczy musi być quasi-wklęsła, możemy wywnioskować, że jest zbiorem wypukłym, ale jeśli wiadomo, że jest zbiorem wypukłym, to możemy jedynie wnioskować, że fu n k cja/jest quasi-wklęsła (ale niekoniecznie wklęsła).
jest zbiorem wypukłym.
Zbiory S25i S45były wcześniej wprowadzone (rys. 11,10) pq to, aby pokazać, że funkcja wypukła (lub hawet funkcja wklęsła) może spowodować powstanie zbioru wypukłego. Tutaj wykorzystujemy te dwa zbiory w teście na quasi-wklęsłość i quasi-wypukłość. Trzy funkcje na rys. 12.5 zawierają odcinki wklęsłe i wypukłe, a zatem nie są ani wklęsłe, ani wypukłe. Ale funkcja na diagramie (a) jest quasi-wklęsła, ponieważ dla każdej wartości k (tylko jedna z nich
Przykład 1. Sprawdzić, czy funkcja z - x 2 (x > 0) jest quasi-wklęsła lub quasi-wypukła. Łatwo sprawdzić geometrycznie, że funkcja ta jest wypukła, a nawet ściśle wypukła. Jest zatem quasi-wypukła. Co ciekawe, jest również quasi-wklęsła. Jej wykres — prawa połówka krzywej o kształcie litery U, zaczynająca się w początku układu współrzędnych i rosnąca w szybkim tempie — podobnie jak na wykresie 12.5(c), może utworzyć zarówno zbiór wypukły 5^, jak i wypukły
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 395
394 PROBLEMY OPTYMALIZACJI
Jeśli chcemy zamiast tego zastosować (12.20), to najpierw przyjmujemy za u i v dowolne dwie różne nieujemne wartości x. Wtedy: /(w) = w2;
Funkcja różniczkowalna jednej zmiennej f(x ) jest
/ ( v) = v2;
f [ 0 u + (1 - 0)v] = [Su + (1 - 6 )v]2.
\ quasi-wklęsła 1
wtedy i tylko wtedy,
[ quasi-wypukła]
gdy dla dowolnej pary różnych punktów u i v należących do dziedziny:
Załóżmy, ż e /(v ) ^ /(« ), to znaczy v2 ^ u2; wtedy v 5* w, dokładniej v> u (gdyż w i v są różne). Ponieważ średnia ważona [Ou + (1 - 6)v\ musi leżeć pomiędzy u i v, więc mo żemy zapisać podwójną nierówność: v2>[0m + ( 1 - 0 ) v ] 2 >w2
dla
0< $< l
/ ( v) > / [ 0 w+ ( 1 - 0 ) v] > / ( k)
dla
O <0<1.
lub:
Na mocy (12.20) oznacza to, że fu n k cja/jest zarówno quasi-wklęsła, jak i quasi-wypukła — tak naprawdę ściśle quasi-wklęsła i ściśle quasi-wypukła. Przykład 2. Pokazać, że z = f( x , y )= x y (x, y ^ O ) jest quasi-wklęsła. Zastosujemy kryterium (12.21) i pokażemy, że zbiór S2*= {(x, y ) : x y ^ k} jest wypukły dla każdego k. W tym celu przyjmijmy xy = k, aby otrzymać warstwicę dla każdej wartości k. Podobnie jak x i y, tak samo k powinno być nieujemne. W przypadku gdy k> 0, warstwica jest hiperbolą prostokątną w pierwszej ćwiartce płaszczyzny xy. Zbiór 5^, złożony ze wszystkich punktów leżących na hiperboli prostokątnej lub nad nią, jest zbiorem wypukłym. W przypadku gdy k = 0, warstwica xy = 0 ma kształt litery L, utworzonej przez nieujemne połówki osi x i y. Zbiór tym razem równy całej nieujemnej ćwiartce, jest również zbiorem wypukłym. Zatem na mocy (12.21) funkcja z = xy (x9 y ^ 0) jest quasi-wklęsła. Należy starannie rozróżniać kształt warstwie xy = k (które są zdefiniowane na płasz czyźnie xy) i kształt powierzchni z = xy (która jest określona w przestrzeni xyz). Cecha po wierzchni z (quasi-wklęsła w przestrzeni trójwymiarowej) jest tym, co chcemy udowodnić; kształt warstwie (wypukłe w przestrzeni dwuwymiarowej dla dodatnich k) interesuje nas tutaj jedynie jako środek opisu zbiorów S58 w celu zastosowania kryterium (12.21). Przykład 3. Pokazać, że z = f(x, y) = ( x - a)2 + (y - b)1 jest quasi-wypukła. Zastosuje my ponownie (12.21). Przyjmując (x - a)2 + (y - b ) 2 = k widzimy, że k musi być nieujemne. Dla każdego k warstwica jest okręgiem na płaszczyźnie xy o środku (a, b) i promieniu ^[k. Ponieważ S*5 = {(jc, y ) : (x - a)2 + ( y - b)2 ^ k} jest zbiorem wszystkich punktów leżących na okręgu lub wewnątrz niego, więc jest zbiorem wypukłym. Jest to prawdą nawet wtedy, gdy k = 0, czyli wtedy, gdy okrąg degeneruje się do pojedynczego punktu (0, 0) — ponieważ na mocy umowy pojedynczy punkt jest traktowany jako zbiór wypukły. Zatem dana funkcja jest quasi-wypukła.
( 12.22) Quasi-wklęsłość i quasi-wypukłość będą ścisłe, jeśli nieostrą nierówność po prawej stronie zastąpimy ostrą nierównością > 0. Gdy mamy dwie lub więcej zmiennych niezależ nych, wówczas definicję trzeba zmodyfikować w następujący sposób: Funkcja różniczkowalna f ( x i, jest
quasi wklęsła I [ quasi-wypukła j
j tyjj^o wtedy, gdy dla dowolnych dwu różnych punktów
u = ( « i ,..., un) i v = (vi, . . . , vn) należących do dziedziny: iLfj(u) (Vj-Uj) 7=1
(12.220
! 0,
X /( v ) (Vj-Uj) 7=1
gdzie: / = df/dxj i ma być obliczona w punkcie u lub v, w zależności od przypadku. Ponownie, dla ścisłej quasi-wklęsłości i quasi-wypukłości nieostrą nierówność po prawej stronie należy zastąpić ostrą nierównością > 0 . W końcu, jeśli funkcja z = f( x i, . . . ,x n) jest dwukrotnie różniczkowalna w sposób ciągły, to quasi-wklęsłość i quasi-wypukłość mogą być sprawdzane przy użyciu pierwszych i drugich pochodnych cząstkowych funkcji ustawionych w obrzeżony wyznacznik:
(12.23)
|B |
0
fi
fi
fn
Ji
/u
fu
fln
fz
fil
fu
fln
fn
fn l
fn l
fnn
Ten obrzeżony wyznacznik przypomina obrzeżony hesjan (H | omówiony w poprzednim podrozdziale. Ale w przeciwieństwie do niego, brzeg | B i składa się z pierwszych pochodnych funkcji/, a nie funkcji g pochodzącej z dodatkowego ograniczenia. Ponieważ |B | zależy jedynie od pochodnych funkcji /, do charakteryzowania kształtu funkcji możemy więc stosować |B | wraz z jego kolejnymi minorami głównymi:
Funkcje różniczkowalne (12.24) Definicje (12.20) i (12.21) nie wymagały różniczkowalności funkcji/. Jeśli jednak jest ona różniczkowalna, to quasi-wklęsłość i quasi-wypukłość można zdefiniować za pomocą pierwszych pochodnych.
xn)
iBi! =
0 fi fi
fu
0 fi ¡B2| = f i f n
fi
fi fu
fu
fn
|B„| = ¡B|.
Sformułujemy tu dwa warunki; jeden jest konieczny, a drugi dostateczny. Oba odnoszą
396 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 397
się do quasi-wklęsłości i quasi-wypukłości w dziedzinie6 składającej się jedynie z nieujemnego ortantu («-wymiarowy analogon nieujemnej ćwiartki), to znaczy dla Xi, ..., xn ^ 0. Na to, aby z = f( x i , . . . , xn) była quasi-wklęsła dla nieujemnego ortantu, konieczne jest, aby: nieparzyste! (12.25) |B i| 0; |B 2|& 0 ; ...; jeśl i n jest parzyste J ’
{
|B„|j^jo,
gdy tylko wartości pochodnych cząstkowych są obliczone w nieujemnym ortancie. Dla quasi-wypukłości jest konieczne, aby: (12.250
|B x| ^ 0;
|B 2| ^ 0 ;
...;
|B rt| ^ 0 .
Warunkiem dostatecznym na to, a b y /b y ła quasi-wklęsła na nieujemnym ortancie, jest to, aby: f< ] (12.26)
IB1|< 0 ;
|B 2|> 0 ;
...;
jeśh
f nieparzyste] wJe s t j pa^ yst^ J>
gdy tylko pochodne cząstkowe są obliczone w nieujemnym ortancie. Dla quasi-wypukłości odpowiednim warunkiem dostatecznym jest, aby: (12.260
|B i| < 0;
|B 2| < 0 ;
...;
|B rt|< 0 .
Warunek | B i | ^ 0 w (12.25) i (12.250 jest automatycznie spełniony, ponieważ [Bil = - / ? ; przytoczono go tutaj jedynie dla symetrii. Natomiast warunek |B i| < 0 w (12.26) i (12.260 nie jest automatycznie spełniony. Przykład 4. Funkcja z = f( x u x2) = x xx2 (jci, x2 ^ 0) jest quasi-wklęsła (porównaj przy kład 2). Sprawdzimy to za pomocą (12.220* Niech w = (wi, u2) i v = (vj,v2) będą dwoma dowolnymi punktami dziedziny. Wtedy f( u ) = UiU2 i/( v ) = v2v2. Załóżmy, że: (12.27)
/(v )^ /(w ),
czyli
v 1v2 ^ m 1m2
(vi, v2,
uu
«2 ^ 0).
Ponieważ pochodnymi cząstkowymi funkcji / są / = x2 i f 2 = x u więc (12.220 spro wadza się do warunku: /
Musimy rozważyć cztery możliwości dotyczące wartości u\ i u2. Po pierwsze, jeśli ui = u2 = 0, to (12.28) jest oczywiście spełnione. Po drugie, jeśli ux = 0, ale u2 > 0 , to (12.28) sprowadza się do warunku u2vi ^ 0, który również jest spełniony, gdyż u2 i Vi są nieujemne. Po trzecie, jeśli > 0 i u2 = 0, to (12.28) sprowadza się do warunku 0 ^ -w iv2, który też jest spełniony. Po czwarte, załóżmy, że ui i u2 są dodatnie, a zatem vi i v2 również są dodatnie. Odejmując v2Ui od obu stron (12.27), otrzymujemy: (12.29)
v2(vi-w i)5* ui(u2- v 2f
Mamy tu trzy cząstkowe możliwości: 1. Jeśli u2 = v2, to vi 2* Ui. Rzeczywiście powinno być Vi > uu gdyż {uu u2) i (vi, v2) są różnymi punktami. Fakt, że u2 = v2 i vi > uu implikuje, że warunek (12.28) jest spełniony. 2. Jeśli u2 > v2, to musimy mieć vi > uu co wynika z (12.29). Mnożąc obie strony (12.29) przez u2/v 2, otrzymujemy: (12.30)
u2 m2(vi - ui) ^ — Ui (u2 - v2) > ui (iu2 - v2) V2
a zatem (12.28) znów jest spełnione. 3. Ostatnią możliwością cząstkową jest u2 < v2, z czego wynika, że u2łv 2jest dodatnim ułamkiem. W tym przypadku prawdziwy jest pierwszy wiersz (12.30). Drugi wiersz też jest prawdziwy, ale tym razem z innego powodu: ułamek (w2/v2) pomnożony przez liczbę ujemną (m2 - v2) daje iloczyn większy niż sama ta liczba. Ponieważ (12.28) jest spełniona w każdej możliwej sytuacji, więc funkcja z = X\X2 (jci, x2 ^ 0) jest quasi-wklęsła. Wobec tego warunek konieczny (12.25) powinien być spełniony. Ponieważ pochodne cząstkowe funkcji / są równe: f l — X2 \
f l ~ X iJ
fll= fl2 = 0 \ \
(12.28)
f i 2 —f i i
= 1»
więc odpowiednie minory główne możemy zapisać: 0 |B i| =
0
x2
x2 0
= -x2 ^ 0;
| B 2| =
x2 ' xi
x2 0 1
fi 00 (vx- wó + / 2(w) ( v2 - u2) = u2(vi - wó + ui (v2 - u2) ^ 0 lub po uporządkowaniu: .
j • W2 , gdyz — >1 v2
1 = 2x i X2 ^ 0, 0
a zatem (12.25) rzeczywiście jest spełnione. Zauważmy jednak, że warunek dostateczny (12.26) jest spełniony tylko w dodatnim ortancie.
u2( v i - u i ) ^ «i(w2 - v 2). Przykład 5. Pokazać, że z = /(* , y ) = x ay b (x, y > 0; 0
6 Chociaż wklęsłość (wypukłość) funkcji w dziedzinie wypukłej można zawsze rozszerzyć do wklęsłości (wypukłości) w całej przestrzeni, to jednak quasi-wklęsłości i quasi-wypukłości nie można rozszerzyć. Na przykład wnioski w powyższych przykładach 1 i 2 nie będą obowiązywać, jeśli zmienne mogą przyjmować ujemne wartości. Dwa warunki podane tutaj są oparte na artykule Kennetha J. Arrowa i Alaina C. Enthovena, Quasi-Concave Programming, „Econometrica” 1961, October, s. 797 (twierdze nie 5). Uwaga ich skupia się na funkcjach quasi-wklęsłych; nasze rozszerzenie obejmujące funkcje quasi-wypukłe wykorzystuje fakt, że funkcja przeciwna do funkcji quasi-wklęsłej jest funkcją quasi-wypukłą.
fx = a x ° - y - ,
fy =
f xx = a ( a - \ ) x a- 2y b;
fxy=fyX= abxa- 1y b- 1;
zatem minory główne |B | mają następujące znaki: |B ,| =
0 fx
/x
f xx
= —(ax
y ) <0,
bxa yh~ 1 ;
fyy = b(b - \)x “y b- 2,
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 399
398 PROBLEMY OPTYMALIZACJI
Absolutne i względne ekstrema
0 /, |B j| = fx fxx fy
= [2a2b2- a{a -
\ ) b 2 - a2b (b- \)] x ia~2y 2b- 2 > 0.
fy*fyy
Spełniony jest zatem warunek dostateczny ąuasi-wklęsłości (12.26). Dana funkcja jest w istocie ąuasi-wklęsła, chociaż nie da się tego stwierdzić na podstawie kryterium (12.26).
Dokładniejsze spojrzenie na obrzeżony hesjan Obrzeżony wyznacznik |B |, zdefiniowany w (12.23), różni się od obrzeżonego hesjanu: U Si
1 82 Zn Z a
82
Z n
8n
8
Zn
Z
1
22
Pełniejszy obraz związków między quasi-wklęsłością i warunkami drugiego rzędu przed stawiono na rys. 12.6 (potrzebna jest odpowiednia modyfikacja, aby dostosować ten rysunek do quasi-wypukłości). Rysunek ten, skonstruowany w tej samej konwencji i odczytywany w ten sam sposób, co rys. 11.5, pokazuje związki między quasi-wklęsłością a absolutnymi i względnymi maksimami warunkowymi. W trzech owalach w górnej części zapisano wa runki pierwszego i drugiego rzędu dla względnego maksimum warunkowego. Prostokąty w środkowej kolumnie, podobnie jak na rys. 11.5, ilustrują natomiast wzajemne relacje między pojęciami maksimum względnego, maksimum absolutnego i jednoznacznego maksimum absolutnego.
8n Z m
jest punktem stacjonar przy warunku
Z in
^ . . . , x n)=c S.
Zn2
[warunek pierwszego rzędu]
Znn
pod dwoma względami: (1) elementami brzegowymi w |B | są pochodne cząstkowe pierwszego rzędu funkcji/, a nie g i (2) pozostałe elementy w |B | są to pochodne cząstkowe drugiego rzędu funkcji/, a nie funkcji Lagrange’a Z. Jednak w szczególnym przypadku, gdy warunek jest liniowy g(xi, . .. ,x n) = a\X\ + ... + anxn = c (jest to przypadek często spotykany w ekonomii; por. podrozdz. 12.5 i 12.7), sprowadza się do Wtedy bowiem funkcja Lagrange’a jest równa:
X /
V V
d2*
jest ujemnie określona w punkcie z przy warunku dg=0 [warunek dostateczny drugiego rzędu] ^
,
określona niedodatnio w punkcie ź przy wanjnku d^=0 [warunek konieczny drugiego rzędu] -
\
/
y
Z = f( x i, . . . 9xn) + X [ c - a i X i - . . . ~ a nxn], tak więc: Zj = fj- X a j
oraz
Z ij= fij.
maksimum warunkowym
Widzimy więc, że liniowa funkcja występująca w warunku ograniczającym ma pierwsze pochodne gj = aj. Ponadto gdy jest spełniony warunek pierwszego rzędu Z; = / - Xaj = 0, wówczas fj = Xdj, czyli/• = Xgj. Zatem brzeg w |B | jest to po prostu brzeg |H | pomnożony przez dodatnią liczbę X. Wyłączając X kolejno z poziomego i pionowego brzegu |H | (por. podrozdz. 5.3, przykład 5), otrzymujemy:
/fie s t
z est absoutnym maksimum warunkowym
|B | = Z2|fi|.W konsekwencji, w przypadku liniowego warunku ograniczającego dwa obrzeżone wyznaczniki zawsze mają taki sam znak w punkcie stacjonarnym dla Z. Na tej samej zasadzie minory główne |B X| i |H ,| (z = 1, 2 ,...,« ) muszą'mieć również takie same znaki w tym punkcie. Wynika stąd, że jeśli obrzeżony wyznacznik |B | spełnia warunek dostateczny dla ąuasi-wklęsłości w (12.26), to obrzeżony hesjan |H | musi spełniać warunek dostateczny drugiego rzędu dla maksimum warunkowego podany w tabl. 12.1. Podobny związek istnieje między quasi-wklęsłością i warunkiem drugiego rzędu dla minimalizacji przy liniowym warunku ograniczającym.
z
Rysunek 12.6
Jest jedynym absolutnym maksimum warunkowym
ściśle \ ąuasi-wklęsła, a zbiór określony warunkami \ je s t wypukły V
400 PROBLEMY OPTYMALIZACJI
Ale naprawdę interesująca informacja jest zawarta w dwóch rombach i przechodzących przez nie wydłużonych symbolach =». Symbol po lewej oznacza, że jeśli spełniony jest warunek pierwszego rzędu i jeśli spełnione są dwa zastrzeżenia zapisane wewnątrz rombu, to mamy warunek dostateczny dla absolutnego warunkowego maksimum. Pierwsze zastrzeżenie jest takie, że funkcja/m a być jawnie ąuasi-wklęsła (explicitly quasiconcave) — jest to nowy termin, który musimy teraz zdefiniować. Funkcja / jest jawnie ąuasi-wklęsła wtedy i tylko wtedy, gdy: /(v ) > /(« ) = >f[0u + (1 - G)v] > /(« ). Własność podana w definicji oznacza, że gdy tylko pewien punkt napowierzchni/(v) leży wyżej niż inny punkt fiu ) , to wszystkie punkty pośrednie — tzn. punkty powierzchni położone dokładnie nad odcinkiem uv należącym do dziedziny funkcji — muszą również leżeć wyżej niż/(w). Wymaganie to powoduje wykluczenie możliwości występowania na tej powierz chni poziomych fragmentów płaszczyzny7. Warunek dla jawnej quasi-wklęsłości nie jest tak silny jak warunek dla ścisłej quasi-wklęsłości, ponieważ ten ostatni wymaga, aby f[ 0 u + (1 - 0)v] > f(u ) nawet d la /(v ) =/(m), z czego wynika, że wykluczone są również fragmenty płaszczyzny, które nie są poziome8. Drugie zastrzeżenie w rombie po lewej stronie polega na tym, że zbiór {(jci, ...,* „ ): : g(xu ..., xn) = c} ma być wypukły. Jeśli jednak warunek ograniczający ma postać równości, wspomniany zbiór może być wypukły wtedy i tylko wtedy, gdy funkcja g występująca w warunku jest liniowa (np. linia prosta w przypadku przestrzeni dwuwymiarowej). Zatem drugie zastrzeżenie oznacza po prostu, że warunek ograniczający jest równaniem liniowym. Gdy spełnione są oba zastrzeżenia, będziemy mieć do czynienia z częścią powierzchni (lub hiperpowierzchni) w kształcie dzwonu, nie zawierającą poziomych fragmentów, położoną dokładnie ponad prostą (lub płaszczyzną, lub hiperpłaszczyzną) należącą do dziedziny. Lokalne maksimum znajdujące się na takim podzbiorze powierzchni musi być absolutnym maksimum warunkowym. Romb po prawej stronie rys. 12.6 zawiera silniejszy warunek ścisłej quasi-wklęsłości. Ściśle quasi-wklęsła funkcja musi być jawnie quasi-wklęsła, chociaż twierdzenie odwrotne nie jest prawdziwe. Zatem jeśli zastąpimy jawną quasi-wklęsłość warunkiem ścisłej quasi-wklęsłości, to absolutne maksimum warunkowe jest wciąż zapewnione. Ale tym razem to absolutne maksimum warunkowe musi być jednoznaczne, ponieważ jeśli powierzchnia nie zawiera żadnego fragmentu płaszczyzny, to możliwość występowania wielokrotnych ma ksimów warunkowych jest tym samym wykluczona.
Ćwiczenie 12.4
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 401
(b) (c) (d) (e) (f)
nie jest quasi-wypukła; nie jest wypukła; nie jest wklęsła; nie jest ani wklęsła, ani wypukła; jest wklęsła i wypukła.
2. Czy następujące funkcje są quasi-wklęsłe? Czy są ściśle quasi-wklęsłe? Sprawdzić to najpierw graficznie, a potem algebraicznie za pomocą (12.20) (zakładamy, że x ^ 0): (a) fix ) = a; (b) f{x ) = a + bx ib > 0); (c) fix ) ~ a + cx2 (c < 0). V 3. a. Załóżmy, że wykres funkcji z = fix ) jest krzywą o ujemnym nachyleniu w kształcie prawej połówki dzwonu, leżącą w pierwszej ćwiartce i przechodzącą przez punkty (0, 5), (2, 4), (3, 2) i (5, 1). Załóżmy, że wykresem z = gix) jest linia prosta o doda tnim nachyleniu, pod kątem 45° do obu osi, przechodząca przez początek układu współrzędnych. Czy funkcje/(* ) i g(*) są quasi-wklęsłe? b. Sporządzić wykres sumy funkcji fix ) + g{x). Czy funkcja będąca sumą jest quasi-wklęsła? 4. Badając wykresy funkcji i stosując (12.21), sprawdzić, czy następujące funkcje są quasi-wklęsłe, quasi-wypukłe, jednocześnie quasi-wklęsłe i quasi-wypukłe, czy też nie występuje żaden z tych przypadków: (a) fix ) = x 3- 2 x ; (b) fi* u x2) = 6xx - 9x 2; ic) f i x u x 2) = x 2 ~ ln x 1. 5. a. Sprawdzić, że funkcja trzeciego stopnia z = a x 3 + bx2 + cx + d w ogólnym przypadku nie jest ani quasi-wklęsła, ani quasi-wypukła. b. Czy możliwe jest nałożenie takich ograniczeń na parametry funkcji, aby była ona jednocześnie quasi-wklęsła i quasi-wypukła dla x 2* 0? 6. Za pomocą (12.22) sprawdzić, czy z = x 2 ix 2s 0) jest quasi-wklęsła lub quasi-wypukła. 7. Pokazać, że z = xy (x, y 2* 0) nie jest quasi-wypukła. 8. Za pomocą obrzeżonych wyznaczników sprawdzić, czy następujące funkcje są qua si-wklęsłe lub quasi-jvypukłe: (a) z = - x 2- y 2 (*, y > 0); (b) z = - ( x + l ) 2- ( y + 2)2 (* ,y > 0 ).
1. Narysować wykres ściśle quasi-wklęsłej funkcji z = /(* ), która: (a) jest również quasi-wypukła; 7 Przypuśćmy, że powierzchnia zawiera poziomy fragment płaszczyzny P taki, że f{u) e P i /(v) g P. Wtedy punkty pośrednie znajdujące się na P będą na tej samej wysokości co /(w), co narusza pierwsze zastrzeżenie. 8 Niech powierzchnia zawiera nachylony fragment płaszczyzny P f taki, że f i u ) =/(v) i oba leżą na Pf. Wtedy wszystkie pośrednie punkty również będą leżały na P ' i mają tę samą wysokość, co/(« ); stanowi to naruszenie wspomnianego warunku dla ścisłej quasi-wklęsłości.
12.5. MAKSYMALIZACJA UŻYTECZNOŚCI I POPYT KONSUMPCYJNY Maksymalizacja funkcji użyteczności była wcześniej przytaczana jako przykład optymalizacji warunkowej. Przeanalizujemy teraz dokładnie to zagadnienie. Dla uproszczenia zakładamy, że nasz hipotetyczny konsument może dokonywać wyboru spośród dwu dóbr, przy czym oba 26 — Podstawy...
4 0 2 PROBLEMY OPTYMALIZACJI
dobra mają ciągłe i dodatnie funkcje krańcowej użyteczności. Ceny obu dóbr są określone przez rynek,-a zatem są egzogeniczne; w podrozdziale tym pominiemy indeks równy zeru w oznaczeniu ceny. Jeśli siła nabywcza konsumenta jest daną wielkością B (oznaczenie pochodzi od słowa budżet), postawione zagadnienie będzie polegało na maksymalizacji gładkiej funkcji użyteczności (indeksu użyteczności): U - U(x, y)
m U y > 0)
przy warunku: xPx + yPy = B.
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 403
Krzywa obojętności jest zdefiniowana jako miejsce geometryczne kombinacji x i y, dla których poziom użyteczności U jest ustalony. Oznacza to, że na krzywej użyteczności mu si być: dU = Uxdx + Uydy = 0, z czego wynika, że dy/dx= UJUy. Zgodnie z tym, jeśli sporządzimy wykres krzywej obojętności na płaszczyźnie xy, tak jak na rys. 12.7, to jej nachylenie d yld x musi być równe liczbie przeciwnej do ilorazu użyteczności krańcowych U JU y (ponieważ zakładamy, że Ux, Uy > 0, więc nachylenie krzywej obojętności musi być ujemne). Odwrotnie, ponieważ UJUy jest liczbą przeciwną do nachylenia krzywej obojętności, więc musi reprezentować krańcową stopę substytucji dwu dóbr.
Krzywe obojętności
Warunek pierwszego rzędu
nachylenie=
Funkcja Lagrange’a dla tego modelu optymalizacji jest równa: Z = U (x i y) + X ( B - x P x - y P y).
dx
Uy I
Linia budżetu
Jako warunek pierwszego rzędu otrzymujemy następujący układ równań:
nachylenie
=
dX Py i
Z x ~ B —xPx - yPy = 0, (12.31)
Z x = U x - X P x = 0, Zy= U y-A P y = 0.
Ponieważ dwa ostatnie równania są równoważne równości: (12.310
Ł Ł Żjc *y
a,
więc warunek pierwszego rzędu wymaga spełnienia (12.310 przy ograniczeniu budżetowym — pierwszym równaniu układu (12.31). Równość (12.310 wyraża po prostu stwierdzenie znane z klasycznej teorii konsumpcji, że aby zmaksymalizować użyteczność, konsumenci muszą tak rozdzielić swe budżety, aby dla każdego dobra proporcja między użytecznością krańcową i ceną była taka sama. Konkretniej, w położeniu równowagi, czyli optymalnym, proporcje te muszą mieć wspólną wartość X, Jak stwierdziliśmy wcześniej, X mierzy wpływ — rozważany w ramach statyki porównawczej — jaki na wartość optymalną funkcji celu wywiera zmiana wartości stałej występującej w warunku ograniczającym. Mamy zatem X = (dU ldB); znaczy to, że optymalna wartość mnożnika Lagrange’a może być interpretowana jako krańcowa użyteczność pieniądza (budżetu pieniężnego) przy maksymalizacji użyteczności przez konsumenta. Jeśli przepiszemy warunek (12.310 w postaci: i;;
to warunek pierwszego rzędu może być interpretowany inaczej, a mianowicie w odniesieniu dp krzywych obojętności.
Rysunek 12.7
A jakie znaczenie ma P JP yl Zobaczymy, że ten iloraz jest liczbą przeciwną do nachylenia wykresu ograniczenia budżetowego. Ograniczenie budżetowe xPx + yPy = B można również zapisać:
więc gdy sporządzimy jego wykres na płaszczyźnie xy tak, jak na rys. 12.7, otrzymamy linię prostą o nachyleniu - P JP y (przecinającą oś y w punkcie o współrzędnej B /P y). W świetle tych rozważań okazuje się, że nowa wersja warunku pierwszego rzędu — (12.31") plus ograniczenie budżetowe — pokazuje, że w celu zmaksymalizowania użyteczności konsument musi tak rozdysponować budżet, aby nachylenie linii budżetu (na której musi pozostawać) było równe nachyleniu pewnej krzywej obojętności. Warunek ten jest spełniony na rys. 12.7(a) w punkcie E, w którym linia budżetu jest styczna do pewnej krzywej obojętności.
404 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 405
Warunek drugiego rzędu Jeśli obrzeżony hesjan w rozpatrywanym zagadnieniu jest dodatni, tzn. gdy: P x
(12.32)
|H | =
Ux,
U,
= 2PxPy Uxy - P 2y
- PlUyy > 0
(gdzie wszystkie pochodne są obliczone dla wartości krytycznych x i y ), wówczas wartość stacjonarna U na pewno będzie maksimum. Obecność pochodnych Uxx, Uyy i Uxy w (12.32) sugeruje jasno, że spełnienie tego warunku wymaga nałożenia pewnych ograniczeń na funkcję użyteczności, a zatem na krzywe obojętności* Co to za ograniczenie? Rozważmy najpierw nachylenie krzywych obojętności. Można pokazać, że dodatnie |H | oznacza ścisłą wypukłość krzywej obojętności (nachylonej ku dołowi) w punkcie styczności E. To, że krzywa opada, jest gwarantowane przez ujemne dy/dx { - - U J U y), a jej ścisła wypukłość będzie gwarantowana przez dodatnią wartość d2y /d x2. Aby otrzymać wyrażenie dla d2y /d r 2, możemy zróżniczkować - U x/Uy względem x, ale musimy przy tym pamiętać nie tylko o tym, że Ux i Uy (jako pochodne) są funkcjami x i y, ale i o tym, że wzdłuż ustalonej krzywej obojętności y sama jest funkcją x. Zgodnie z tym Ux i Uy mogą być traktowane jako funkcje samego jc, wobec czego możemy otrzymać pochodną zupełną: / d2y d d Uy 1 f d Ux ux) (12.33) dx2 d r uyj = ~ u n U y~ ^ - U* dx Ponieważ a: może wpływać na Ux i Uy nie tylko bezpośrednio, lecz również za pośrednictwem y, więc otrzymujemy: (12.34)
dy dUx = UXX+ U dx ,y^ ;
d Uy dv - - T J + 77 —— dx u *y+ u >y d x '
gdzie dy /d x odnosi się do nachylenia krzywej obojętności. W punkcie styczności E — jedy nym punkcie odpowiednim dla rozważań o warunku drugiego rzędu — nachylenie to jest identyczne z nachyleniem ograniczenia budżetowego, tzn. dy/cbc = ~Px!Py. Możemy zatem zapisać (12.34) jako: dUx = UXX- U „ dr
(12.34')
Ł i / ĆbC ^
* yy P y'
w punkcie styczności. Jest też prawdą, że ścisła wypukłość krzywej obojętności w punkcie styczności implikuje spełnienie warunku dostatecznego (12.32). Jest tak, ponieważ moż liwość zerowej wartości d2y /d r2 dla ściśle wypukłej krzywej jest wykluczona, jeżeli krzywe obojętności mają ujemne nachylenie i nie zawierają punktów stacjonarnych. Zatem rezultatem ścisłej wypukłości może być tylko dodatnie d2y /d r 2, a zatem — na mocy (12.330 — dodat nie |H |. Przypomnijmy jednak, że pochodne w |H | muszą być obliczone jedynie dla wartości krytycznych r i y. Zatem ścisła wypukłość krzywej obojętności, jako warunek dostateczny, odnosi się tylko do punktu styczności i jest możliwe, aby krzywa zawierała fragment wklęsły z dala od punktu E, co pokazano na rys. 12.7(a) za pomocą fragmentu zaznaczonego linią przerywaną. Jeśli natomiast wiadomo, że funkcja użyteczności jest gładka, rosnąca i ściśle ąuasi-wklęsła, to każda krzywa obojętności będzie wszędzie wypukła. Taka funkcja użyteczności ma powierzchnię taką, jak na rys. 12.7(b). Gdy tę powierzchnię przetniemy płaszczyzną równoległą do płaszczyzny xy, wówczas otrzymamy za każdym razem przekrój, którego rzut na płaszczyznę xy staje się ściśle wypukłą, malejącą krzywą obojętności. W takim przypadku niezależnie od tego, gdzie wypadnie punkt styczności, warunek dostateczny drugiego rzędu będzie zawsze spełniony. Prócz tego może istnieć tylko jeden punkt styczności, a mianowicie ten, dla którego otrzymujemy jednoznaczne absolutne maksimum wartości funkcji użyteczności możliwe do osiągnięcia dla danej linii budżetu. Wynik ten oczywiście dokładnie odpowiada temu, co pokazano w prawym rombie na rys. 12.6. Kilkakrotnie przypominaliśmy, że warunek dostateczny drugiego rzędu nie jest koniecz ny. Podamy przykład maksymalizacji użyteczności, gdy (12.32) nie jest spełnione. Przy puśćmy, że — jak pokazano na rys. 12.7(b) — odpowiednia krzywa obojętności zawiera odcinek liniowy pokrywający się z częścią linii budżetu. Mamy wtedy oczywiście maksima wielokrotne, gdyż warunek pierwszego rzędu UxIUy - P xIPy jest teraz spełniony w każdym punkcie odcinka liniowego na krzywej obojętności, w tym w E u E2 i E3. W istocie są to absolutne maksima warunkowe. Ponieważ jednak na odcinku prostej d2y/d x2 jest zerem, mamy więc na mocy (12.33') |H [ = 0. Zatem w tym przypadku osiągnięto maksymalizację, chociaż warunek dostateczny drugiego rzędu (12.32) jest naruszony. Fakt, że na krzywej obojętności pojawia się odcinek liniowy, wskazuje na obecność nachylonego fragmentu płaszczyzny na powierzchni użyteczności. Zdarza się to wtedy, gdy funkcja użyteczności jest jawnie ąuasi-wklęsła, a nie ściśle ąuasi-wklęsła. Jak pokazano na rys. 12.7(b), punkty E u E2 i E$ leżące na tej samej (najwyższej osiągalnej) krzywej oboję tności odpowiadają tej samej wartości, stanowiącej absolutne maksimum użyteczności przy danym liniowym ograniczeniu budżetowym. Odwołując się do rys. 12.6 zauważamy, że wynik ten jest całkowicie zgodny z informacjami zapisanymi w rombie po lewej stronie.
Podstawiając (12.34') do (12.33) i korzystając z informacji, że: u = uz P± x
r,
[Z (12.31")]
>
a następnie wyłączając UyIP 2 przed nawias, możemy ostatecznie (12.33) przekształcić w:
m -m
d-2 - 2p*pyu*y2 dx2
ILP l
|H1
uyp y
Jest jasne, że gdy spełniony jest warunek dostateczny drugiego rzędu (12.32), to druga pochodna w (12.33') jest dodatnia i odpowiednia krzywa obojętności jest ściśle wypukła
Analiza statyki porównawczej W naszym modelu konsumpcji ceny Px i Py są egzogeniczne, podobnie jak wielkość budże tu B. Jeśli założymy, że spełniony jest warunek dostateczny drugiego rzędu, to możemy przeanalizować własności statyki porównawczej modelu na podstawie warunku pierwszego rzędu (12.31), traktowanego jako układ równań Fj = 0 0 = 1 ,2 , 3), gdzie każda funkcja Fj ma ciągłe pochodne cząstkowe. Jak wykazano w (12.19), jakobian zmiennych endogenicznych dla tego układu równań musi mieć taką samą wartość, jak obrzeżony hesjan, tzn. | J | = |H |.
406 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 407
Wtedy zatem, gdy spełniony jest warunek drugiego rzędu (12.32), | J [ musi być dodatni, różny od zera dla początkowego optimum. Można więc zastosować twierdzenie o funkcji uwikłanej i wyrazić optymalne wartości zmiennych endogenicznyeh jako funkcje uwikłane zmiennych egzogenicznych: X = Z (P x,P y,B ), (12.35)
(12.39)
dB = Tj T
\
dB
y Tj T
y = y ( P x,P y, B). Wiemy, że funkcje (12.35) mają ciągłe pochodne, które dostarczają informacji o statyce porównawczej. W szczególności pochodne ostatnich dwu funkcji f i y — opisujących kształtowanie się popytu konsumenta — pokazują, jak konsument zareaguje na zmiany cen i zmiany budżetu. Aby znaleźć te pochodne, musimy przekształcić (12.31) w następujący układ tożsamości równowagi: B - x P x - y P y = 0, (x, y)- X/5, = 0,
.
.
.
- P x dx - Py d y - x d Px + y d P y - d £ ,
(12.41)
-P x ~Py
XdPy.
1 i/„ UyX
1
1
----1 0 (12.38)
t/,v (dx/dB) = Uyy_ Q y/dB )
0
~PX
-1
~PX
i/«
0
~P y
u yx
0
-l‘
-P x
(12.42)
(12.43)
dpx
(c)x/()P x) =
Uyx (d y /d P x)_
1
"
0
-p x
) “ Tj T —Py
X
Tj T
-Py
-
~PX i/xx
i
U,,
iJi -P y Uyx
X
X 0
~Py'
X
uxy
0
Uyy
—*
~PX uxy
X
0
IJI
~Py
ui
-P y
1 dPx
0
9 Równanie macierzowe (12.38) można również otrzymać w wyniku różniczkowania zupełnego (12.36) względem B przy uwzględnieniu rozwiązań uwikłanych w (12.35).
" 0 X /d P xj
VxxUv
(d x ^
0
Jak można sprawdzić, uporządkowanie elementów w macierzy współczynników jest dokładnie takie samo, jak dla jakobianu |J |, który ma taką samą wartość, jak hesjan |H |, chociaż ten ostatni ma Px i Py (a nie —Px i —Py) w pierwszym wierszu i pierwszej kolumnie. Za pomocą wzoru Cramera możemy obliczyć wszystkie trzy pochodne statyki porównawczej, ale zajmiemy się tylko dwiema:
-p x
Wynikają stąd następujące pochodne statyki porównawczej:
Aby zbadać skutki zmiany wielkości budżetu (zwanego również dochodem konsumenta), przyjmujemy, że dPx = dP
U yy
-P y
(Z^dJc* U ^ d y = Z d P x,
- P yd X + U yxd x + U y y d y =
0
i
i 0
Po obliczeniu różniczki, zupełnej kolejno dla każdej tożsamości (przy czym każda zmienna może zmieniać wartość) i uwzględnieniu tego, że Uxy = Uyx, otrzymujemy liniowy układ równań:
- P xd X +
~ py
1
Uy { x , y ) - X P y = 0.
(12.37)
u xy
i
Ux
-P y
0
Na mocy warunku drugiego rzędu | J | = |H | jest dodatnie, podobnie jak Px i Py. Nie stety, skoro brak nam dodatkowej informacji dotyczącej stosunku wielkości PXi Py, i Uy, nie jesteśmy w stanie stwierdzić, jakie są znaki tych dwu pochodnych statyki porównawczej. Oznacza to, że gdy wzrasta budżet (lub dochód) konsumenta, wówczas optymalne wielkości zakupów x i y mogą albo wzrosnąć, albo zmaleć. Jeżeli np. x zmniejsza się w wyniku wzrostu B, to produkt* jest nazywany dobrem gorszej jakości (inferior good), w przeciwieńst wie do dobra normalnego (normal good). Przeanalizujemy następnie skutek zmiany Px. Przyjmując tym razem dPy = dB = 0 i dPx ^ 0, a potem dzieląc (12.37) przez dPXi otrzymujemy inne równanie macierzowe: 1
(12.36)
-1
~PX
1
(12.40)
x = x (P x,P y,B ),
0
fd x )
Ul
Uyy
o -p x
=Jj| -p . ~PX
u x
~Py
Uyx
~ Py
= Ti + T2,
[Ti oznacza i-ty składnik]
Uyy
-Px Ua uyx o X
0
~ PX
IJI
~Py
UyX
= t3+ t4
Jak interpretujemy te dwa wyniki? Pierwszy z nich (dx/dPx) pokazuje, w jaki sposób zmiana Px wpływa na optymalną wielkość zakupu *; stanowi zatem podstawę do badania funkcji popytu naszego konsumenta na dobro *. Są tu dwa składniki. Pierwszy z nich, T\ , można na podstawie (12.39) zapisać jako —(dx/dB)x. Wobec tego Ti wydaje się być miarą wpływu zmiany wartości B (budżetu lub dochodu) na optymalny zakup *, przy czym samo * stanowi wagę. Ponieważ jednak pochodna ta jest oczywiście związana ze zmianą ceny, więc Ti trzeba interpretować jako efekt dochodowy zmiany ceny. Przy wzroście ceny Px spadek realny dochodu konsumenta wywiera na * podobny wpływ, jak prawdziwy spadek B\ stąd
408 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 409
użycie składnika -(d x ld B ). Jest zrozumiałe, że im ważniejsze miejsce w całkowitym budże cie zajmuje dobro x, tym większy będzie efekt dochodowy — i dlatego w Ti pojawia się czynnik wagowy x. Interpretacja taka może być udowodniona bardziej formalnie, jeśli efektywny spadek dochodu konsumenta wyrazimy różniczką dB = -x d P x. Mamy wtedy: dB dPx r d x)_
(12.44) Ti = -
' a * 'I dB
dB y
ie U
co pokazuje, że Ti jest miarą wpływu zmiany d P x na x za pośrednictwem B, tzn. miarą efektu dochodowego. Jeśli teraz zrekompensujemy konsumentowi efektywny spadek dochodu, płacąc gotówką sumę równą dB, to wtedy — po zneutralizowaniu efektu dochodowego — w pochodnej sta tyki porównawczej (dxldPx) pozostaje składnik T2, który mierzy zmianę x spowodowaną wyłącznie substytucją jednego dobra przez inny wywołaną zmianą ceny, tzn. efekt sub stytucyjny zmiany Px. Aby to wyjaśnić, wróćmy do (12.37) i sprawdźmy, jak zmienia się sytuacja pod wpływem kompensacyjnej zmiany dochodu. Gdy badamy wpływ samego dPx (dla dPy = dB = 0), wówczas pierwsze równanie w (12.37) można zapisać jako - P xdx - P y d y = xdP x. Ponieważ miarą spadku dochodu jest wyrażenie xdPx (występujące tylko w pierwszym równaniu), zatem wskutek zrekompensowania spadku dochodu składnik ten przyjmuje wartość zero. A wtedy wektor wyrazów wolnych w (12.41), poprzednio równy X "0‘ (dx/dPx)dla kompensacyjnej X , zostaje zastąpiony przez X , a pochodna .0 _ dochodu przyjmie postać: l
dx v
dP^
J
kom pensow ana
Tj T
Proporcjonalne zmiany cen i dochodu
0.
.
0
0
~Py
X
-P x
=
Uyy
0
~Py
X
0
U l
-P y
~Py
=
Uyy
Możemy zatem (12.42) zapisać w postaci: dx 'j
(12.420 \
dPx J
= r i + r 2= \
dB
nio, krzywa malejąca. Ale w przypadku, gdy Txjest dodatnie i dominuje nad T2 (np. wtedy, gdy x jest istotną pozycją w budżecie konsumenta i wskutek tego stanowi przeważający czynnik wagowy), wzrost Px spowoduje w istocie zwiększenie zakupu x. Jest to szczególna sytuacja charakteryzująca popyty na to, co nazywane jest dobrami Giffena. Zwykle oczywiście oczekujemy, że (dx/dPx) będzie ujemne. Zbadajmy teraz pochodną statyki porównawczej podanej w (12.43), czyli (dyldPx) = T3 + T4, która dotyczy mieszanego wpływu (cross effect) zmiany ceny * na optymalne zakupy y. Składnik T3 jest uderzająco podobny do składnika T\ i podobnie jak on interpretowany jest jako efekt dochodowy1-. Zauważmy, że czynnikiem wagowym jest tu ponownie x (a nie y). Jest tak, ponieważ badamy wpływ zmiany Px na dochód, a wielkość tego wpływu zależy od tego, jakie znaczenie w budżecie konsumenta ma x (a nie y). Drugi składnik, czyli T4, jest zmianą efektu substytucji. Znak T3 — zgodnie z (12.40) —- zależy od takich czynników, jak UXXi Uyx itd. i jest nieokreślony, jeśli na model nie nałożono dodatkowych ograniczeń. Jednakże efekt substy tucji Tą na pewno będzie w naszym modelu dodatni, gdyż X, Px, Py i | J | są dodatnie. Oznacza to, że jeśli nie przeważy ujemny efekt dochodowy, to wzrost ceny x spowoduje zawsze wzrost zakupów y. Innymi słowy w kontekście rozważanego modelu, gdzie konsument dokonuje, wyboru spośród dwu dóbr, dobra te muszą być w stosunku do siebie substytutami. Mimo iż powyższa analiza dotyczy efektów zmiany Px, otrzymane wyniki można łatwo dostosować do przypadku zmiany ceny Py. Model nasz ma tę cechę, że x i y są w nim dokładnie symetryczne. Aby zatem wywnioskować, jakie są efekty zmiany Py, wystarczy jedynie w otrzymanych powyżej wynikach zamienić miejscami x i y.
x + J
efekt dochodowy
jB - j x P x- j y P y = 0.
(d x
W
Interesujące jest również zbadanie, jak zmiana wszystkich parametrów P Xi P y i B w tej samej proporcji wpłynie na x i y. Takie pytanie znajduje się wciąż w kręgu zainteresowań statyki porównawczej. Gdy obie ceny i dochód są powiększone w tym samym stopniu, tzn. pomnożone przez tę samą stałą j y wówczas każdy składnik w ograniczeniu budżetowym wzrośnie k-krotnie i ograniczenie przyjmuje postać:
k om p en so w an a
efekt substytucyjny
Wynik ten, w którym pochodna statyki porównawczej (dxldPf) jest rozłożona na dwa składniki, czyli efekt dochodowy i efekt substytucyjny, jest szczególnym przypadkiem tzw. równania Słuckiego dla dwu dóbr. Co można powiedzieć o znaku (dx/dPx) l Efekt substytucyjny T2jest oczywiście ujemny, ponieważ | J | > 0 i X> 0 (por. (12.31'))* Efekt dochodowy Ti, zgodnie z (12.39), ma natomiast znak nieokreślony. Gdyby był ujemny, zwiększyłoby to T2 i w takim przypadku wzrost Px musiałby spowodować zmniejszenie zakupów x t a krzywa popytu klienta maksymalizującego użyteczność miałaby nachylenie ujemne. Gdyby natomiast był dodatni, ale miał dość małą wielkość, osłabiłoby to efekt substytucyjny, chociaż łącznym wynilaem byłaby, jak poprzed-
Ponieważ wspólny czynnik j można skrócić, więc to nowe ograniczenie jest w istocie takie samo, jak stare. Funkcja użyteczności jest niezależna od tych parametrów. W konsekwen cji poprzednie wartości x i y zapewniające równowagę zostaną zachowane; oznacza to, że położenie równowagi konsumenta w naszym modelu jest niezmiennicze względem zmian obu cen i dochodu w jednakowych proporcjach. W rozważanym obecnie modelu konsument nie
10 Jeśli potrzebne jest mocniejsze uzasadnienie, że T3 reprezentuje efekt dochodowy, można - korzystając z (12.40) i (12.44) — napisać:
r 3= - ® x = f [dB]
^
{dB)dPx'
a zatem T3 jest efektem dla y wynikającym ze zmiany Px za pośrednictwem czynnika dochodu B.
410
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 411
PROBLEMY OPTYMALIZACJI
podlega „iluzji pieniądza’ ’ (money illusion). Symbolicznie opisujemy tę sytuację równaniami:
b. Czy z założenia, że krzywe obojętności są ściśle wypukłe, wynika, że występuje malejąca użyteczność krańcowa dla dóbr x i y l
x ( P X i P y t B ) = x ( j P x J P y J B ) , y ( P x, P y : B ) = y ( j P x , j P y J B ) .
Funkcje x i y z podaną własnością niezmienniczości nie są zwykłymi funkcjami, lecz stanowią przykład szczególnej klasy funkcji zwanych funkcjami jednorodnymi, mających interesujące zastosowania ekonomiczne. W następnym podrozdziale zbadamy zatem te funkcje. -
Ćwiczenie 12.5 1. Dane jest U = (* + 2) (y + 1) oraz Px = 4, Py = 6 i B = 130. a. Zapisać funkcję Lagrange’a. b. Znaleźć optymalne wielkości zakupu * i y. c. Czy jest spełniony warunek drugiego rzędu dla maksimum? d. Czy odpowiedź (b) daje nam jakieś informacje dotyczące statyki porównawczej? 2. Załóżmy, że U - (x + 2)(y + 1), ale tym razem nie nadajemy konkretnych wartości numerycznych parametrom wyrażającym ceny i dochód. a. Zapisać funkcję Lagrange’a. b. Znaleźć x , y i X wyrażone w zależności od parametrów Px, Py i B . c. Sprawdzić warunek drugiego rzędu dla maksimum. d. Przyjmując Px = 4; Py = 6 i B = 130, sprawdzić, czy odpowiedź dopoprzedniego zadania jest prawdziwa. 3. Czy otrzymane w ćwiczeniu 12.5-2 rozwiązanie daje informację z zakresu statyki porównawczej? Znaleźć wszystkie, jakie się tylko da, pochodne statyki porównawczej, określić ich znak i zinterpretować ich znaczenie ekonomiczne. 4. Dla funkcji U = (* + 2) (y + 1) i ograniczenia xPx + yPy = B z zadania 12.5-2 znaleźliśmy już Uij i |H | oraz * i X. Wiemy ponadto, że | J | = |H |. a. Podstawić je do (12.39) i (12.40) oraz znaleźć (dxldB) i (dyfdB ). b. Podstawiając do (12.42) i (12.43), znaleźć (3x/dPx) i (dy/dPx). Czy te wyniki są zgod ne z wynikami otrzymanymi w zadaniu 12.5-3? 5. Czy zdanie: „jeśli pochodna (dx/dPx) jest ujemna, to prawdopodobnie * nie może być dobrem niższego rzędu” jest prawdziwe? Skomentować. 6. Gdy badamy efekt samego dPx, wówczas pierwsze równanie w (12.37) sprowadza się do ~Pxd x - Pydy = xdP x. Jeżeli wynagrodzimy konsumentowi stratę efektywnego dochodu i usuniemy składnik xdP x, to równanie przyjmuje postać - P xdx - Pydy = 0. Pokazać, że ten ostatni wynik można również otrzymać w procedurze kompensacji, w trakcie której otrzymujemy ustalony optymalny poziom użyteczności konsumenta U (a nie ustalony efektywny dochód), tak iż składnik T2 może być alternatywnie interpretowany jako (3*/3P*)t/=const- (Wskazówka: skorzystać z (12.31")). 7. a. Czy z założenia o malejącej użyteczności krańcowej dla dóbr x i y wynika, że krzywe obojętności są ściśle wypukłe?
12,6. FUNKCJE JEDNORODNE Mówimy, że funkcja jest jednorodna stopnia r, jeśli pomnożenie każdego z jej argumentów przez stalą j spowoduje zmianę wartości funkcji w proporcji j r, to znaczy jeśli: f ( j * i , — J x n) = j rf
xn).
Ogólnie rzecz biorąc j może przyjmować dowolną wartość. Aby jednak powyższe równanie miało sens, (jx i, ...,j x n) nie może wykraczać poza dziedzinę funkcji /. Z tego powodu w zastosowaniach ekonomicznych zwykle zakłada się, że stała j jest dodatnia, ponieważ większość zmiennych ekonomicznych nie przyjmuje wartości ujemnych. Przykład 1. Jeżeli każdą zmienną funkcji f{ x ,y ,w ) = x fy + 2w l3 x pomnożymy przez j, to otrzymamy: x j x 2 (/w) x 2w n fOX,jy,jw) = -r- + — — = - + — =f(pc, y, W) = j f ( x , y , w), jy 3 0 ) y 3x W przykładzie tym wartość funkcji wcale się wszystkich zmiennych niezależnych w jednakowej — wartość funkcji została pomnożona przez j°(= 1). cją jednorodną stopnia zero. Czytelnik zauważy, że funkcjex i y wspomniane są jednorodne stopnia zero.
nie zmieniła pod wpływem zmian proporcji, czyli — można by rzec Powoduje to, że fu n k c ja /je st funk na końcu poprzedniego podrozdziału
Przykład 2. Jeżeli każdą zmienną niezależną występującą w poniższej funkcji po mnożymy przez j: X 2
2 w2
g(.x, y,w) = — •+-, y x to otrzymamy: , u * r , 2 ( j w f . f x 2 2w 2^ 8 (j x , j y , jw ) = — — + — :— = j — + — = jg ( x ,y y w). jy jx y x Funkcja g jest funkcją jednorodną stopnia 1 (pierwszego); pomnożenie każdej zmiennej przez j spowoduje dokładnie /k ro tn ą zmianę wartości funkcji. Przykład 3. Rozważmy teraz funkcję h(x, y, w) = 2*2 -f- 3yw ~ w 2. Pomnożenie ar gumentów przez j daje tym razem: h
)- (jw )2 = j 2h (x, y , w). (jw
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 413
412 PROBLEMY OPTYMALIZACJI
Funkcja h jest więc jednorodna stopnia drugiego, w tym przypadku podwojenie wartości każdego z argumentów spowoduje czterokrotny wzrost wartości funkcji.
Liniowa jednorodność Przy omawianiu funkcji produkcji powszechnie stosuje się funkcje jednorodne pierwszego stopnia. Funkcje te często nazywane są funkcjami liniowo jednorodnymi (linearly homogeneous). Przysłówek „liniowo’* dotyczy przymiotnika „jednorodny” . Niektórzy autorzy stosują nieco mylące nazewnictwo: liniowe funkcje jednorodne lub nawet liniowe ijednorodne funkcje, co sugeruje całkowicie błędnie, że same funkcje są liniowe. Na przykładzie funk cji g powyższego przykładu 2 widzimy, że funkcja, która jest jednorodna stopnia pierwszego, wcale nie musi być funkcją liniową. Zatem Czytelnicy powinni unikać używania terminów „liniowe funkcje jednorodne” i „liniowe i jednorodne funkcje” , chyba że rozważana funkcja jest rzeczywiście jednorodna. Zauważmy jednak, że nie jest błędem mówienie o „liniowej jednorodności” , gdy myślimy o jednorodności stopnia 1, ponieważ do określenia rzeczownika (jednorodność) potrzebny jest przymiotnik (liniowa). . Ponieważ głównym obszarem zastosowań funkcji liniowo jednorodnych jest teoria produkcji, przyjmijmy jako podstawę naszych rozważań funkcję produkcji w postaci:
(12.46)
(12.47)
Q = f(K , L).
W łasność II Gdy dana jest liniowo jednorodna funkcja produkcji Q = f(K , L), wówczas krańcowe produkty w jednostkach fizycznych MPP*, i MPP* mogą być wyrażone jako funkcje samego k. Aby znaleźć produkty krańcowe, zapisujemy najpierw produkt globalny: Q = L
(12.48)
dk a j — =— dK
f*! ~ L1 ;
dQ
(12.49)
=L Dla danej liniowo jednorodnej funkcji produkcji Q = f(K , L) przeciętny produkt pracy w jednostkach fizycznych (averąge physical product of labor) (APPL) i przeciętny produkt kapitału w jednostkach fizycznych (average physical product of capital) (APP*) są funkcjami ilorazu kapitału i pracy k = KIL. Aby to udowodnić, mnożymy kążdą zmienną niezależną w (12.45) przez czynniky = 1IL. Na mocy liniowej jednorodności spowoduje to zmianę wielkości produkcji z Q na jQ = QIL, Prawa strona wzoru (12.45) przyjmie odpowiednio postać:
'i f ł
fK
'
L’>
= /( * , W-
Ponieważ symbole K i L wszędzie, gdzie występują w funkcji pierwotnej, należy zastą pić przez k i l , więc w rezultacie prawa strona staje się funkcją samego ilorazu kapitału i prą cy, powiedzmy ę (k ); jest to funkcja jednego argumentu k, minio iż argument ten zależy od obu zmiennych niezależnych K i L. Porównując obie strony równąhia* otrzymujemy:
dk _ d (K ^ U
~ dL
l
\
L
J
-K U '
Wyniki różniczkowania są następujące:
Własność I
=/
[z (12.46)]
a potem liczymy pochodne Q względem K i L. Poniższe wyniki wstępne będą tu pomocne:
Niezależnie od tego, czy rozważamy zagadnienia na szczeblu mikro czy makro, matematyczne założenie o liniowej jednorodności sprowadza się do założenia ekonomicznego o stałych przychodach skali, ponieważ liniowa jednorodność oznacza, że zwiększenie wszystkich nakładów (zmiennych niezależnych) y-krotnie zawsze spowoduje dokładnie y-krotne zwiększenie produkcji (wartości funkcji). Jakie unikalne własności ma ta liniowa jednorodna funkcja produkcji?
'
« Ł , m . L K k
Ponieważ oba produkty przeciętne zależą jedynie od k, więc z liniowej jednorodności wynika, że dopóki nie zmienia się wartość ilorazu K IL (niezależnie od wartości K i L), dopóty produkty krańcowe również będą stałe. Zatem dla funkcji produkcji jednorodnej stopnia pierwszego APPL i APP* są jednorodne stopnia zero względem zmiennych K i L, ponieważ zmiany K i L w jednakowej proporcji (nie zmieniające wartości k) nie zmienią wielkości produktów przeciętnych.
(12.45') (12.45)
A P P ,. ® K
d
d ę (k )
dk
= L
(12.50)
dQ
MPPl^
dcp(k) dk
dK
dK
= cp\k);
[pochodna funkcji złożonej] [z (12-48)]
d
= 3L [L^ )] = d
=
ę (k ) + L
=
q>(k) + L ę '( k )
= ę (k ) + Lq>\k)
3k ~dL ’ -K 1}
= q > (k )-k ę '(k )9 co dowodzi, że MPP* i MPPL są funkcjami samego k.
[pochodna iloczynu] [pochodna funkcji złożonej] [z (12.48)]
414 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 415
Podobnie jak produkty przeciętne, również produkty krańcowe pozostaną nie zmienione dopóty, dopóki iloraz kapitału i pracy jest ustalony; są zatem jednorodne stopnia zero względem zmiennych K i L.
Funkcja produkcji Cobba-Douglasa Jedną z konkretnych funkcji produkcji, szeroko stosowaną w rozważaniach ekonomicznych, jest funkcja produkcji Cobba-Douglasa:
Własność III (twierdzenie E ulera)
(12.51)
Jeśli Q = f(K , L) jest liniowo jednorodna, to:
gdzie A jest dodatnią stałą, a a jest dodatnim ułamkiem. Najpierw zajmiemy się funkcją w postaci ogólnej, a mianowicie:
dQ
* a f +L
dQ
(12.52)
e'
Dowód: K ~ +L = K ę \ k ) + L [ę»(*> - K ę'(k)] = oK oL = K ę \k ) + = L(p(k) = Q.
L ę ( k )- K ę '(k ) =
[z (12.49), (12.50)]
Q = A K aL l~ay
Q = A K aLK
gdzie p jest innym dodatnim ułamkiem, który może, ale nie musi, być równy 1 - a . Oto niektóre z głównych cech tej funkcji: (1) jest ona jednorodna stopnia ( a + f i f (2) w szczególnym przypadku, gdy a + fi= 1, jest ona liniowo jednorodna; (3) jej izokwanty mają wszędzie ujemne nachylenie i jest ściśle wypukła dla dodatnich wartości K I L oraz (4) jest ściśle quasi-wklęsła dla dodatnich K i L. To, że funkcja jest jednorodna, można łatwo zobaczyć na podstawie faktu, że po zastąpieniu K i L odpowiednio przez jK i jL produkcja przyjmie wartość:
L [z (12.457)]
Wynik ten jest prawdziwy dla każdej wartości K i L; dlatego własność ta może być zapisana jako tożsamość. Oznacza ona, że wartość funkcji liniowo jednorodnej można zawsze wyrazić w postaci sumy składników, każdy składnik jest równy iloczynowi zmiennej niezależnej i pochodnej cząstkowej pierwszego rzędu względem tej zmiennej, niezależnie od tego, jakie wielkości nakładów rzeczywiście zastosowano. Należy jednak starannie odróżniać tożsamość K ^ p + L ^ p = Q (twierdzenie Eulera, które odnosi się do przypadku, gdy oK ćL dQ dQ \ funkcja Q =f{ K , L) ma stałe przychody skali) od równania d<2 = dK + ~ ^ r dL (różniczka oK oL zupełna g dla dowolnej funkcji g =/(AT, L)). Ekonomicznie własność ta oznacza, że przy założeniu stałych przychodów skali, jeśli za każdy czynnik produkcji płaci się tyle, ile wynosi jego produkt krańcowy, to produkt globalny zostanie całkowicie rozdzielony pomiędzy nakłady czynników lub — co jest równoważne — czysty zysk ekonomiczny będzie równy zeru. Ponieważ sytuacja ta jest opisem równowagi długookresowej w warunkach czystej konkurencji, sądzono niegdyś, że w ekonomii mają sens . tylko liniowo jednorodne funkcje produkcji. Tak oczywiście nie jest. Zerowy zysk ekonomicz- ■ ny w długim okresie powstaje wskutek konkurencji niezależnie od tego, jakie cechy ma , występująca w rzeczywistości funkcja produkcji. Zatem nie jest konieczne, aby funkcja produkcji zapewniała rozdzielenie całego produktu dla wszystkich par K i L. Ponadto, gdy na rynku czynników produkcji istnieje niedoskonała konkurencja, wówczas wynagrodzenie dla każdego z czynników może być różne od jego produktu krańcowego, a zatem twierdzenie Eulera nie będzie mogło być stosowane do opisu zaistniałej sytuacji. Mimo wszystko często wygodnie jest stosować liniowo jednorodne funkcje produkcji, gdyż mają one wiele pożytecznych własności matematycznych.
A (jK ) aU L ^ = j a+H A K aL ^) = j a^ Q y co oznacza, że funkcja jest jednorodna stopnia a +¡3. W przypadku gdy a + fi = 1, wystąpią stałe przychody skali, ponieważ funkcja będzie liniowo jednorodna (zauważmy jednak, że funkcja ta nie jest liniowa, byłoby zatem mylące nazywanie jej „funkcją liniową jednorodną’ ’ lub „liniową i jednorodną’’). To, że izokwanty tej funkcji mają nachylenie ujemne i że jest ona ściśle wypukła, można sprawdzić na podstawie znaków pochodnych dK /d L i d2K fdL 2 (lub znaków d L /d K i d2L/dA 2). Dla każdej dodatniej wielkości produkcji Q0 (12.52) można zapisać jako: A K aL fi = Q 0
(A,
K,L, Q0 > 0).
Gdy obliczymy logarytmy naturalne obu stroń równości i przeniesiemy składniki na lewą stronę, otrzymamy równanie: x lnA + a ln K + jftlnL - l n g 0 = 0, które określa ATjako uwikłaną11 funkcję L. Na mocy reguły dla funkcji uwikłanej i reguł dla logarytmów otrzymujemy zatem: dK _
dFIdL _
p lL _
fiK
'
~dL ~ ~ dFfdK ~ ~~~a/K ~~~ ~aL K °* = - Ł ± 'K \ a dL L J « lJ
p
i
2 LH K/ \ Znaki tych pochodnych wskazują na to, że każda izokwanta ma wszędzie kształt opadający i że jest ściśle wypukła na płaszczyźnie LK dla dodatnich wartości K i L. Jest to [
a
11 Założenia twierdzenia o funkcji uwikłanej są spełnione, ponieważ F (wyrażenie po prawej stronie) ma ciągłe pochodne cząstkowe i ponieważ d Fl d K - a t K * 0 dla dodatnich wartości K.
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 417
416 PROBLEMY OPTYMALIZACJI
oczywiście możliwe tylko dla funkcji, która jest ściśle quasi-wklęsła dla dodatnich wartości K i L. Proszę porównać przykład 5 z podrozdz. 12.4, gdzie omówiono podobną funkcję. Rozważmy teraz przypadek, gdy cc + fi — 1 (właściwa funkcja Cobba—Douglasa) i na tej podstawie sprawdźmy podane wcześniej trzy własności liniowej jednorodności. Przede wszystkim całkowita produkcja może być w tym przypadku wyrażona jako: ( Q = A K al } ' a = A I— L = L A ka, L
(12.510
gdzie wyrażenie A k a jest konkretną postacią stosowanego wcześniej ogólnego oznaczenia (p(k). Zatem produkty przeciętne są równe:
d Q ld K ~ q ! k ' = £ qk' a zatem powyższe wyrażenie opisujące udział pracy jest dokładnie równe eQL. Jakie znaczenie ma stała A? Dla danych wartości K i L wielkość A będzie proporcjonalnie zwiększać poziom Q. Zatem A może być traktowane jako parametr wydajności, tzn. jako wskaźnik stanu technologii.
Rozszerzenie wyników
APP ^
fi
fi^
^
APP^ f = f ^ —
X . = Afc"
Omówiliśmy liniową jednorodność w szczególnym kontekście funkcji produkcji, ale przyto czone własności są również prawdziwe w innych sytuacjach, pod warunkiem, że zmienne K, L i Q zostaną odpowiednio zinterpretowane. Ponadto możliwe jest rozszerzenie wyników na przypadek więcej niż dwu zmiennych. Każdą zmienną funkcji liniowo jednorodnej:
i oba równania są teraz funkcjami samego k. Różniczkując następnie Q = A K aL l~a,otrzymujemy produkty krańcowe:
oK
tego nakładu w całkowitej produkcji. Możemy również interpretować wykładnik każdej zmiennej określającej nakład jako elastyczność, ponieważ podane wyżej wyrażenie okreś lające udział kapitału jest równoważne tożsamości:
= A a K a- lLria- l)= A a
= A a k a~ \
y = /( * i, *2, ...,* „)
(12.54)
możemy znów podzielić przez x\ (tzn. pomnożyć przez Hx\) i otrzymać wynik: (K' = A ( 1 - a ) k a, a- a) L . /
^ - = A K a(1 oL
*3
Xn
*1 Xi V
*i
r X 2
które również są funkcjami samego Ł W końcu korzystając z (12.54), możemy sprawdzić twierdzenie Eulera:
[jednorodność stopnia 1] y
podobny do (12.45'). Można ponadto z łatwością uogólnić twierdzenie Eulera do postaci: n
li,Xifi = y , 7=i
K ^ - + L ^ - = K A a k a- l + L A ( l - a ) k a= oK oL f Ka + 1 — CL = LAk° Lk \
= L A k c(( a + l - a ) = L A k(*=Q.
[z (12.510]
Wykładnikom a i fi liniowo jednorodnej funkcji produkcji Cobba-Douglasa można przypisać interesujące znaczenie ekonomiczne. Jeśli zakładamy, że każdy nakład ma cenę równą jego produktowi krańcowemu, to względny udział całkowitego produktu przypisany kapitałowi będzie równy: K(dQldK) Q
_
[twierdzenie Eulera] X
gdzie pochodne cząstkowe pierwotnej fu n k cji/(m ian o w icie/) są również jednorodne stop nia zero względem zmiennych tak jak w przypadku dwu zmiennych. Powyższe rozszerzenia mogą być również łatwo uogólnione na przypadek jednorodnej funkcji stopnia r. Z definicji jednorodności mamy: y = x[ę
x2 *3 X i
X i
N
~a‘
[jednorodność stopnia r]
X\
zatem zmodyfikowana wersja twierdzenia Eulera przyjmie postać: n X Xifi s ry, /=i
K A ak*’ 1 _ L A ka
'
[twierdzenie Eulera]
Podobnie względny udział pracy będzie równy: L (d Q /d L )_ L A (l-a )k ? _ Q ~ LAk* ”
a
'
a zatem wykładnik każdej zmiennej wyrażającej nakład jest równy względnemu udziałowi
gdzie do zmiennej y po prawej stronie dołączono czynnik r. Ponadto pochodne cząstkow e/ pierwotnej funkcji / będą jednorodne stopnia ( r - 1) względem zmiennych *f. Można za tem zauważyć, że przypadek liniowej jednorodności jest po prostu szczególnym przypad kiem powyższego wzoru, dla r = 1. 27 — Podstawy...
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 419
418 PROBLEMY OPTYMALIZACJI
Ćwiczenie 12.6 1. Sprawdzić, czy następujące funkcje są liniowe. Jeśli tak, to określić, jakiego stopnia. (a)
f ( x , y)
(b) (c)
c. Znaleźć funkcję MPP*. Czy MPP* jest wciąż funkcją samego k, tak jak w przypadku liniowej jednorodności? d. Czy funkcja MPP* jest jednorodna względem K i L I Jeśli tak, jakiego stopnia?
■
f ( x , y ) = (x2- y 2) i ;. • f ( x , y ) = x 3- x y + y ;3
(d)
f( x , y) = 2x + y + 3 ^ ix y \
(e)
f( x , > y,v) = - L +
12.7. KOMBINACJA NAKŁADÓW ZAPEWNIAJĄCA MINIMALNY KOSZT
2
w
(i) f ( x , y , w ) = x 4 - 5ywi . zamiast
2. Pokazać, że funkcja (12.45) może być również wyrażona jako
Q —L ę
rK \
L
3. Na podstawie twierdzenia Eulera udowodnić, że przy stałych przychodach skali: (a) jeśli M PP*=0, to APPL jest równe MPPL; (b) jeśli MPP l = 0, to APP* jest równe MPP*. 4. Na podstawie wzorów (12.46)—(12.50) sprawdzić, czy przy założeniu stałych przychodów skali prawdziwe są następujące stwierdzenia: (a)
Jako inny przykład optymalizacji warunkowej omówimy zagadnienie dotyczące znajdowania kombinacji nakładów — zapewniającej minimalizację kosztu— dla wytworzenia określonego poziomu produkcji go reprezentującego specjalne zamówienie klienta. Zastosujemy tu funkcję produkcji w postaci ogólnej; potem wspomnimy o jednorodnych funkcjach produkcji.
- ,( K
krzywa APPL może być wykresem funkcji zmiennej niezależnej k -
na ta jest zaznaczona na osi poziomej; (b) miarą MPP* jest nachylenie krzywej APPL; (c) APP* jest mierzone przez nachylenie wektora wodzącego dla krzywej APP/,; (d) MPPl = APPl - k(MPP*) = APPjr - k (nachylenie APPz). 5. Na podstawie (12.53) i (12.54) sprawdzić, że funkcja produkcji Cobba-Douglasa spełnia związki podane w punktach (b), (c) i (d) poprzedniego zadania. 6. Dla funkcji produkcji Q = A K aLp pokazać, że: (a) jeśli a + p > 1, to mamy rosnące przychody skali; (b) jeśli a + p < 1, to przychody skali są malejące; (c) ot i P są elastycznościami cząstkowymi produkcji odpowiednio względem nakładów kapitału i pracy. 7. Niech produkcja będzie funkcją trzech nakładów: Q = A K aLbN c. a. Czy ta funkcja jest jednorodna? Jeśli tak, jakiego stopnia? b. Przy jakim warunku mielibyśmy stałe przychody skali, a przy jakim rosnące przychody skali? c. Znaleźć część produktu przypadającego na nakład A, jeśli jego cena jest równa jego produktowi krańcowemu. 8. Załóżmy, że funkcja produkcji Q = g(K , L) jest jednorodna stopnia 2. a. Zapisać równanie wyrażające własność jednorodności stopnia 2 dla tej funkcji. b. Wyrazić Q w zależności od ę(k), zgodnie z (12.45')-
Warunek pierwszego rzędu Przy założeniu, że dana jest gładka funkcja produkcji o dwu zmiennych oznaczających nakłady Q - Q{a> b), gdzie g a, Qb > 0, i przyjęciu, że obie ceny nakładów są egzogeniczne (ponow nie pomijamy zerowy indeks), możemy sformułować zagadnienie polegające na minimali zacji kosztu: C = aPa + bPb, przy warunku ograniczającym dotyczącym produkcji: Q(ct,b) = Q0. Funkcja Lagrange*a jest zatem równa: Z = aPa + bPb + ¡1 [g 0 - Q(a, b)]. Aby był spełniony warunek pierwszego rzędu dla minimum C, poziomy nakładów (zmienne decyzyjne) muszą spełniać następujący układ równań: Z ^ Q 0 ~ Q (a ,* ) = 0, Za = Pa —juQa = 0, Zb = Pb-juQ b = 0. Pierwsze równanie tego układu jest po prostu powtórzeniem warunku ograniczającego, a z dwu ostatnich równań wynika warunek:
(12'55)
Pa
Pt
r a
' "
'
•
W punkcie, w którym kombinacja nakładów jest optymalna, iloraz ceny nakładu i krańcowego produktu musi być taki sam dla każdego nakładu. Ponieważ iloraz ten mierzy koszty przypadające na jednostkę produktu krańcowego, więc mnożnik Lagrange’a można
420 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 421
interpretować jako krańcowy koszt produkcji dla optymalnej kombinacji czynników. Ta interpretacja jest oczywiście całkowicie zgodna z tym, co stwierdziliśmy wcześniej w (12.16), a mianowicie, że optymalna wartość mnożnika Lagrange’a mierzy efekt statyki porównaw czej, który wyraża wpływ wyrazu wolnego warunku ograniczającego na optymalną wartość funkcji celu, to znaczy fi = (§ C/§ Qo), gdzie symbol § oznacza, że jest to cząstkowa pochodna zupełna. Równanie (12.55) można też zapisać w postaci:
£ -■ § •
-
co Czytelnik powinien porównać z (12.31"). Warunek pierwszego rzędu zapisany w tej po staci może być wyjaśniony za pomocą izokwant i krzywej stałego kosztu. Z (11.36) dowiedzieliśmy się, że iloraz QJQb jest liczbą przeciwną do nachylenia izokwanty, tzn. że jest on miarą krańcowej stopy technicznej substytucji a zamiast b (MRTS^). W rozważanym modelu produkcja jest ustalona na poziomie Qo; brana jest zatem pod uwagę tylko jedna izokwanta — pokazana na rys. 12.8 — o ujemnym nachyleniu. Iloraz PJPb reprezentuje natomiast liczbę przeciwną do nachylenia linii stałego kosztu (isocost) — pojęcie porównywalne z linią budżetu w teorii konsumenta. Linia stałego kosztu, zdefiniowana jako miejsce geometryczne wszystkich kombinacji nakładów mających taki sam koszt całkowity, może być opisana równaniem: Co = aPa + bPb
lub
Cq P a b = —-----Pb Pb
gdzie Co jest parametrem i oznacza koszt. Jeżeli sporządzimy wykres na płaszczyźnie ab tak, jak na rys. 12.8, to otrzymamy z tego równania rodzinę linii prostych o ujemnym nachyleniu - P J P b (i przecinających oś pionową w punkcie o współrzędnej Co!Pb)- Rów-
Rysunek 12.8
ność dwu ilorazów sprowadza się wobec tego do równości nachyleń izokwanty i wybranej linii stałego kosztu. Ponieważ musimy pozostać na danej izokwancie, warunek ten pozwala więc wyznaczyć punkt styczności E i kombinację czynników (a, b).
Warunek drugiego rzędu Aby koszt był minimalny, wystarczy (jeśli spełniony jest warunek pierwszego rzędu), by obrzeżony hesjan był ujemny, tzn. aby: 0
|H | =
Qa
Qb
Qa
PQ aa
~PQ ab
Qb
~pQ ba
~ llQ b b
~
P ( Q aaQ b -
2 Q a b Q a Q b + Q b b Q l) < 0 .
Ponieważ maksymalna wartość p (koszt krańcowy) jest dodatnia, sprowadza się to do warunku, że wyrażenie w nawiasie, jeśli obliczymy jego wartość w punkcie E, ma być ujemne. Na podstawie (11.40) przypominamy, że krzywizna izokwanty jest reprezentowana przez drugą pochodną: ~1 (Q a a Q b ~ Z Q a b Q a Q h + Q bbQ a ) y
w której pojawia się to samo wyrażenie w nawiasie. Ponieważ Q b jest dodatnie, więc z tego, że spełniony jest warunek dostateczny drugiego rzędu, wynika, że d2b /d a 2 jest dodatnie — tzn. izokwanta jest ściśle wypukła — w punkcie styczności. W obecnym kontekście ze ścisłej wypukłości izokwanty wynika również, że warunek dostateczny drugiego rzędu jest spełniony. Ponieważ izokwanta ma nachylenie ujemne, więc ścisła wypukłość oznacza, że d2b/da2 może być wyłącznie dodatnie (zerowa wartość d2b /d a 2jest możliwa tylko w punkcie stacjonarnym na izokwancie), co z kolei zapewnia, że |H | < 0 . Jednakże warunek dosta teczny |H | < 0 (a zatem ścisła wypukłość izokwanty) w punkcie styczności nie jest sam przez się konieczny dla minimalizacji C. Dokładniej, C może być zminimalizowane nawet wte dy, gdy izokwanta jest (nieściśle) wypukła; w sytuacji analogicznej do przedstawionej na ryś. 12.7(b) — gdy występują wielokrotne minima przy d2b łd a 2 = 0 i |H | = 0 w każdym punkcie. Przy omawianiu modelu maksymalizacji użyteczności (podrozdz. 12.5) podkreślono, że gładka, rosnąca, ściśle quasi-wklęsła funkcja użyteczności U = U (x, y) ma na płaszczyźnie xy krzywe obojętności, które są wszędzie ściśle Wypukłe i mają ujemne nachylenie. Ponieważ pojęcie izokwanty jest niemal takie samo jak pojęcie krzywej obojętności12, możemy więc przez analogię wnioskować, że gładka, rosnąca, ściśle quasi-wklęsła funkcja produkcji Q ~ Q (a , b) prowadzi do izokwant na płaszczyźnie ab\ które są wszędzie ściśle wypukłe i obniżające się. Jeśli przyjęto taką funkcję produkcji, ta oczywiście warunek dostateczny drugiego rzędu będzie zawsze spełniony. Ponadto jest jasńe, że otrzymane C będzie jedynym absolutnym minimum warunkowym.
12 Obie są warstwicami. Różnią Się jedynie obszarem zastosowań; krzywe obojętności są stosowane w modelu konsumpcji, a izokwanty w modelu produkcji.
422 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 423
Ścieżka ekspansji Zajmijmy się teraz jednym z aspektów statyki porównawczej dla tego modelu. Załóżmy, że ceny nakładów są ustalone, przyjmijmy, że Qq stopniowo wzrasta (przechodzimy na coraz wyższe i wyższe izokwanty) i prześledźmy, jaki ma to wpływ na kombinację b!a zapewniającą minimalny koszt. Każde przesunięcie izokwanty spowoduje oczywiście pojawienie się nowego punktu styczności ż wyższą linią stałego kosztu. Miejsce geometryczne takich punktów styczności, zwane ścieżką ekspansji firmy y służy do opisu wszystkich kombinacji -— zapewniających minimalny koszt — potrzebnych do wytworzenia różnych wielkości produkcji g 0- Dwie możliwe postaci ścieżki ekspansji przedstawiono na rys. 12.9. Jeżeli założymy, że izokwanty są ściśle wypukłe (a zatem spełniony jest warunek dru giego rzędu), to ścieżkę ekspansji będzie można otrzymać bezpośrednio z warunku pierwszego rzędu (12.55'). Zilustrujemy to na przykładzie ogólnej funkcji produkcji Cobba-Douglasa. Warunek (12.55') wymaga, aby iloraz cen nakładów był równy ilorazowi produktów krańcowych. Dla funkcji Q - A a ab & oznacza to, że każdy punkt ścieżki ekspansji musi spełniać warunek: (12.56)
£a_ Pb
fi. Qb
A a a a lb &
ab
Aaafii>P~l
Ta'
z czego wynika, że iloraz optymalnych nakładów musi być równy: (12.57)
4 = — = const., a aPb
ponieważ a , fi i obie ceny nakładów są stałe. Wynika stąd, że wszystkie punkty na ścieżce ekspansji muszą mieć taki sam ustalony iloraz czynników; tzn. ścieżka ekspansji musi być linią prostą przechodzącą przez początek układu współrzędnych. Pokazano to na rys. 12.9(b), gdzie ilorazy czynników w różnych punktach styczności (AE/ OA , A 'E ' / OA ' i A "E "/O A") są sobie równe.
To, że ścieżka ekspansji jest liniowa, jest cechą funkcji produkcji Cobba-Douglasa niezależnie od tego, czy a + p - 1, czy nie, ponieważ wyprowadzenie wyniku (12.57) nie wykorzystuje założenia a-\- p - 1. Ponadto każda jednorodna funkcja produkcji (niekoniecz nie Cobba-Douglasa) będzie miała liniową ścieżkę ekspansji dla każdego zestawu cen nakładów. Dzieje się tak z następującego powodu: jeśli funkcja produkcji jest jednorodna stopnia r, to obie funkcje produktów krańcowych Qa i Qb muszą być jednorodne stopnia ( r - 1 ) względem nakładów a i b, zatem j-krotne zwiększenie obu nakładów spowoduje { j r~1)-krotne zwiększenie obu wartości Qa i Qb, więc ich iloraz Q JQ b nie zmieni się. Wobec tego, jeśli warunek pierwszego rzędu P J P b -Q J Q b jest spełniony przy danych cenach nakładów przez pewną szczególną kombinację wielkości nakładów (a0, b0), to musi być spełniony przez kombinację (j a 0, j b 0) — dokładnie tak, jak to pokazano za pomocą ścieżki ekspansji na rys. 12.9(b). i Chociaż każda jednorodna funkcja produkcji powoduje powstanie liniowej ścieżki ekspansji, to jednak interpretacja ścieżki ekspansji będzie się istotnie różnić dla różnych stopni jednorodności. Na rys. 12.9(b) odległość OE jest równa odległości E E \ więc punkt E ' ma współrzędne dwa razy większe niż punkt E. Jeśli teraz funkcja produkcji jest jednorodna stopnia pierwszego, to produkcja w punkcie Er musi być równa podwojonej (2 1= 2) produkcji w punkcie E. Ale jeśli stopień jednorodności jest równy dwa, to produkcja E ' będzie czterokrotnie większa (22 = 4) niż produkcja w E. Zatem odległości izokwant odpowiadają cych wartościom g = l , g = 2, ..., itd. będą bardzo różniły się dla różnych stopni jednorodności funkcji produkcji.
Funkcje homotetyczne (jednokładne) Wyjaśniliśmy już, że dla danego zestawu cen nakładów, jeśli funkcja produkcji jest jednorodna (dowolnego stopnia), to ścieżka ekspansji będzie liniowa. Ale nie jest to cechą jedynie funkcji jednorodnych, ponieważ liniowe ścieżki ekspansji związane są również z szerszą klasą funkcji, zwanych funkcjami jednokładnymi (lub homotetycznymi; ang. homothetic functions). Funkcja jednokładna jest to funkcja złożona postaci: (12.58)
H = h [Q (a i b)]
[ ń '(g )* 0 ],
gdzie Q(a, b) jest funkcją jednorodną stopnia r. Mimo iż otrzymujemy ją z funkcji jednorodnej, funkcja jednokładna H = H (a t b) na ogół nie jest jednorodna względem zmiennych a i b. Niemniej jednak ścieżki ekspansji dla H (a, b) są liniowe, podobnie jak dla Q(a, b). Jest tak dlatego, że w każdym punkcie na płaszczyźnie ab izokwanta H ma dokładnie takie samo nachylenie jak izokwanta g : (12.59)
nachylenie izokwanty H = - — = = y Hb h \Q )Q b Qa
= - — = nachylenie izokwanty g .
Qb
(a)
Liniowość ścieżki ekspansji Q(ay b) jest równoważna warunkowi: Qa
Rysunek 12.9
Qb
b = stałe dla każdego ustalonego —. a
^
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 425
424 PROBLEMY OPTYMALIZACJI
W tym przykładzie Q(a, b) jest jednorodna stopnia a + p . Okazało się, że H(a, b) również jest jednorodna, ale stopnia 2 ( a + p ) . Jednak z reguły funkcja jednokładna nie musi być koniecznie jednorodna.
Na podstawie (12.59) otrzymujemy natychmiast: Ha b - — = stałe dla każdego ustalonego —, Hb a
(12.60)
a to dowodzi, że H (a, b) również ma liniowe ścieżki ekspansji. Pojęcie jednokładności jest ogólniejsze niż pojęcie jednorodności. W istocie każda funkcja jednorodna automatycznie należy do rodziny funkcji jednokładnych, ale funkcja jednokładna może być funkcją spoza rodziny funkcji jednorodnych. To, że funkcja jednorodna jest zawsze funkcją jednokładną, można sprawdzić na podstawie (12.58). Gdy założymy, że H = h (Q ) przyjmuje postać H = Q — przy czym h'(Q) = dFIfdQ = 1 — wówczas funkcja Q, która jest tożsama z funkcją //, jest oczywiście jednoldadna. Poniżej, w przykładzie 2, pokażemy, że funkcja jednoldadna nie musi być jednorodna. W definicji funkcji jednokładnej / / zapisaliśmy w (12.58), że h'{Q) ^ 0. Pozwala to uniknąć dzielenia przez zero w (12.59). Rozważania matematyczne uzasadniają wymagania, aby h '(Q )* 0, natomiast względy ekonomiczne wymagają silniejszego ograniczenia h'(Q) > 0. Jeśli bowiem H (a, b) ma — podobnie jak Q(a, b) — służyć jako funkcja produkcji, tzn. jeśli H ma oznaczać wielkość produkcji, to Ha i Hb muszą prowadzić w tym samym kierunku, co Qa i Qb dla funkcji Q(a, b). Zatem H (a, b) musi być monotonicznie rosnącą transformacją funkcji Q(a, b). Jednokładne funkcje produkcji (również szczególny przypadek, czyli jednorodne funkcje produkcji) mają tę interesującą własność, że elastyczność (cząstkowa) optymalnej wielkości nakładu danego czynnika względem poziomu produkcji jest taka sama dla każdego nakładu. Przypomnijmy, że liniowość ścieżki ekspansji dla funkcji jednokładnych oznacza, że iloraz optymalnych wielkości nakładów bla nie zależy od egzogenicznego poziomu produkcji / / 0, a zatem d (5 /tf)/3 //0 = 0, czyli: 1 ^ r)h db a~ dH0
r ?)/7 da ^ b= 0. dH 0
[pochodna ilorazu]
s
V
Po pomnożeniu przez a 2H0 i uporządkowaniu, otrzymujemy: da ~\tj oH0
Ho db H0 ~ ~ tt r » a dH 0 b
czyli
£aHo~ ŚEhoi
Przykład 2. Niech / / = e G, gdzie Q - A a ab Ponieważ Q(a, b) jest jednorodna i ti(Q ) = e Gjest dodatnia, więc H{a, b) jest jednokładna. Dla tej funkcji: H (a ,b ) = exp(AaatA) i można łatwo sprawdzić, że: Ha
A a a a~lbfiexp(Aaab^)
~~Hb
A a ap b f}-1cxp(AaabP)
ab
Wynik ten jest oczywiście identyczny z (12.61). Jednak tym razem funkcja jednokładna nie jest jednorodna, ponieważ: H(ja>jb) = exp [A (ja)a (jb)
= exp {Aaabpj a+P) =
= [exp (ĄaabP)]ja+fi= [H(a, b)]ja+/3 * j rH(a, b).
Elastyczność substytucji Statyka porównawcza zajmuje się również wpływem zmiany wartości ilorazu Pa/P b na kombinację nakładów bla, zapewniającą minimalny koszt, przy ustalonym poziomie produk cji Q0 (tzn. gdy pozostajemy na tej samej izokwancie). Gdy wzrasta (egzogeniczny) iloraz cen P JP b , możemy zazwyczaj oczekiwać, że wzrośnie również iloraz optymalny nakładów b la , ponieważ będzie następowała substytucja nakładu b (który jest teraz relatywnie tańszy) zamiast nakładu a. Kierunek substytucji jest jasny, ale jaki jest jej zakreśl Zakres substytucji nakładów można zmierzyć za pomocą następującego wzoru określającego elastyczność punktową, zwaną elastycznością substytucji i oznaczoną symbolem a :
co jest właśnie powyższym stwierdzeniem. (12 62) Przykład 1. Niech H = Q 2, gdzie Q - A a ab^. Ponieważ Q(a, b) jest jednorodna i h'{Q) = 2Q jest dodatnie dla dodatniej produkcji, więc H(a, b) jest jednokładna dla Q > 0 . Sprawdzimy, że spełnia óną (12.60). Przede wszystkim po podstawieniu otrzymujemy:
0._ względny przyrost (E/a) względny przyrost (Pa/P b) d(b/a) b la
H = Q 2 = (AaabP)2 = A 2ą 2aB ą zatem nachylenie izokwant H wyraża się wzorem: (12.61)
Ha Hb
A 22 a a 2a- lb 2fi ab A 2a 2a2 p b 2P-1 pa *
Wynik ten spełnia warunek (12.60) i oznacza, że ścieżki ekspansji są liniowe. Porównanie (12.61) z (12.56) pokazuje również, że funkcja spełnia (12.59).
d (E/a) _
d ( P J P b) d{P JP b) b l a
P JP b
P JP b
Wartość (jm oże być dowolną liczbą z przedziału od 0 do <*>; im większa jest
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 427
426 PROBLEMY OPTYMALIZACJI
doskonałymi substytutami. Zauważmy, że jeśli b id jest traktowane jako funkcja P JP b , to elastyczność crznów będzie ilorazem funkcji krańcowej i funkcji przeciętnej13. W celu zilustrowania tej tezy obliczymy elastyczność substytucji dla uogólnionej funkcji produkcji Cobba-Douglasa. Sprawdziliśmy wcześniej, że w tym przypadku kombinacja nakładów minimalizujących koszt jest określona wzorem: l= ź a
[z (12.57)]
a
Równanie to ma postać y = ax, dla której zarówno dyldx (funkcja krańcowa), jak i y lx (funkcja przeciętna) są równe stałej a, tzn.: d {bid) _ P dCP J P b )
.
a
b id _ P P JP b
a
Podstawiając te wartości do (12.62), otrzymujemy natychmiast wynik <7= l;'tzn, że cechą uogólnionej funkcji produkcji Cobba-Douglasa jest stała, jednostkowa elastyczność sub stytucji. Zauważmy, że wyprowadzenie tego wyniku nie jest wcale związane z założeniem cx + p = 1. Zatem elastyczność substytucji dla funkcji produkcji Q = A aab^ będzie równa jedności nawet wtedy, gdy a + p ^ l .
funkcji Cobba-Douglasa; służy jako wskaźnik poziomu technologii. Parametr 8 (parametr podziału) dotyczy, podobnie jak a w funkcji Cobba-Douglasa, względnego udziału czyn ników w produkcji, natomiast parametr cr (parametr substytucji), który nie ma odpowiednika w funkcji Cobba-Douglasa, określa wartość, jaką przyjmie (stała) elastyczność substytucji, co wykażemy dalej. Najpierw jednak zobaczymy, że ta funkcja jest jednorodna stopnia pierwszego. Jeśli K i L zastąpimy przez jK i jL, to produkcja zmieni Wartość z Q na: A [8{jK T p + (1 - 8){jD TpT llp= A {j-r\8K JP+ (1 - S)L~p]}~1Ip = = (j~pT VpQ =jQW konsekwencji funkcja CES, podobnie jak wszystkie liniowo jednorodne funkcje produkcji, ma stałe przychody skali, można dla niej stosować twierdzenie Eulera i ma produkty przeciętne i produkty krańcowe jednorodne stopnia zero względem zmiennych K i L. Możemy również zauważyć, że izokwanty generowane przez funkcję produkcji CES mają zawsze ujemne nachylenie i są ściśle wypukłe dla dodatnich wartości K i L. Aby to pokazać, znajdziemy najpierw wyrażenie dla produktów krańcowych QL i QK- Stosując symbol [...] na oznaczenie [SK~P + (1 - S)L~P], otrzymujemy: (12.64)
Funkcja produkcji CES
Ai - ~P
(1 - 5 )A [...]-) =
Nieco później zaczęto powszechniej stosować inną postać funkcji produkcji14, tzw. CES (ang. constant elasticity of substitution), która również ma stałą elastyczność substytucji, ale może dawać ero wartości różnej od 1. Równanie tej funkcji, zwanej funkcją produkcji CES,Jest następujące: (12.63)
A l+P
—
0 < 5 < 1;
Ap
-l
gdzie K i L reprezentują dwa czynniki produkcji, a A, S i p są trzema parametrami. Para metr A (parametr efektywności) odgrywa taką samą rolę, jak współczynnik A w przypadku
=
13 Można wyrazić er w inny sposób. Ponieważ w punkcie styczności mamy zawsze:
P O
— = — = MRTSa&, Pb @b
[MRTSflz,— krańcowa stopa technicznej stubstytucji a zamiast b\
to elastyczność substytucji może być równoważnie zdefiniowana jako: d (bid)
(J—-
względny przyrost {bla)
względny przyrost MRTSai,
—
bla d {QJQb) Q JQ b
d(bla)
—
L
>0
x
[z (12.63)]
i podobnie: (12.65)
(12.62)
r.. .]-(I Ap
( 1 - 5 ) [ q V*p
Q=A[8K-P + ( l - 8 ) L - pT vp (A > 0;
j
8 Q i+ p =— > 0, dK Ap K \ y
dQ
co jest określone dla dodatnich wartości K i L. Zatem nachylenie izokwant (gdy K jest zaznaczone na osi pionowej, a L na osi poziomej), jest równe: (12.66)
d K — = dL
Ql
(1
< 0.
[por. (11.36)3
d{QJQb) bla. QJ Q b
14 K.J. Arrow, H.B. Chenery, B.S. Minhas, R.M. Solow, Capital-Labor Substitution and Econo mic Efficiency, „Review of Economics and Statistics” 1961, August, s. 225-250.
Teraz można łatwo sprawdzić, że d2A7dL2 > 0 (zostawiamy to Czytelnikowi jako ćwiczenie), z czego wynika, że izokwanty są ściśle wypukłe dla dodatnich K i L. Można również pokazać, że funkcja produkcji CES jest quasi-wklęsła dla dodatnich K i L. Dalsze różniczkowanie (12.64) i (12.65) pokazuje, że drugie pochodne funkcji mają następujące znaki:
428 PROBLEMY OPTYMALIZACJI
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 429
a _ ( i - 5 ) ( i + p ) / Q \ Q l l ~Q <0, QlL~ d L QL-~ Ap
*
dK ^
Ap
[Ql L - Q < 0 na mocy
(12.68)
twierdzenia Eulera]
f Q kk - Q <0, K2 K v J
[lQk K - Q < 0 na mocy
funkcja krańcowa C7—funkcja przeciętna
Qk
(1 - 5 ) ( l + p )
Ap
\
L
twierdzenia Eulera] p = 0
>0.
1+p
Pokazuje to, że er jest stałą, której wartość w następujący sposób zależy od wartości parametru p: -1 < p < 0
Qkl — Qlk —
1
0
o 1, o '—1, a< L
Znaki pochodnych, prawdziwe dla dodatnich K i L, umożliwiają nam sprawdzenie dostatecznego warunku ąuasi-wklęsłości (12.26). Jak Czytelnik może sprawdzić:
Funkcja Cobba-Douglasa jako szczególny przypadek funkcji CES
|2M = - e l < 0 , \B21= 2Q k Ql Qkl ~ Qk Qll —Ql Qkk > 0, a zatem funkcja CES jest quasi-wklęsła dla dodatnich/ŚT i L. W końcu skorzystamy z (12.64) i (12.65) do znalezienia elastyczności substytucji funk cji CES. Aby spełniony był warunek dla kombinacji minimalizującej koszt Q J Qk - P J P k , gdzie PL i PK oznaczają odpowiednio ceny usług pracy (stawki płac) i ceny usług kapita łowych, musimy mieć: ■ 1 -5
1+/?
[zob. (12.66)] Pk
Zatem iloraz optymalnych nakładów jest równy (przy wprowadzeniu skrótowego oznaczenia c): 1/(1+p) 1 /( 1 + P ) f p > 1/(1 +p) (12.67) j = 1 -5
A
Traktując (KIL) jako funkcję (P J P k)» znajdujemy związane z nimi funkcje krańcowe i funkcje przeciętne: d funkcja krańcowa = d(PLIPK)
Pl \+ p \P K
(K /L)r(P .m * 0 - t
, . . ML funkcja przeciętna = --------- = c P JP k ^
a zatem elastyczność substytucji jest równa15: 15 Oczywiście moglibyśmy otrzymać ten sam wynik, logarytmując najpierw obie strony (12.67):
ln
1 i +p
=ln c + -
ln
'?L
a następnie stosując wzór na elastyczność (10.28): d(ln KIL)
1
W ostatnim wzorze założenie p = 0 prowadzi do jednostkowej elastyczności substytucji, która — jak wiemy — jest cechą funkcji Cobba-Douglasa. Sugeruje to, że (liniowo jednorodna) funkcja Cobba-Douglasa stanowi szczególny przypadek (liniowo jednorodnej) funkcji CES, Trudność polega na tym, że funkcja CES, podana w (12.63), nie może być zdefiniowana dla p - 0, ponieważ niemożliwe jest dzielenie przez zero. Niemniej jednak można udowodnić, że przy p -> 0 funkcja CES dąży do funkcji Cobba-Douglasa. W dowodzie wykorzystamy technikę zwaną regułą UHopitala. Reguła ta dotyczy obliczania granicy funkcji f(x ) = 171^ , prZy x —^ a (gdzie a może być skończone lub n(x) nieskończone), gdy licznik m(x) i mianownik n(x) albo: (1) oba dążą do zera przy x —> a, co powoduje pojawienie się wyrażenia postaci 0/0, albo (2) oba dążą do +<» przy x - ^ a , co powoduje pojawienie się wyrażenia postaci o o / o o (lub o o / — o o ? lub — o o / o o , lub — ° ° / — ° ° ) . Jeśli wyrażenie to przyjmuje jedną z tych postaci, to nie można obliczyć wartości granicy /(x), niemniej jednak można wyznaczyć jej wartość na podstawie wzoru: (12.69)
lim rri^ l = l i m *->«n(;t) *-+an(x)
[
r
e
g
u
ł
a
L ’Hopitala]
Przykład 3. Znaleźć granicę (1 - x 2)/(l - x ) przy x —> 1. W tym przypadku m(x) i n(x) dążą do zera, gdy * dąży do jedności. Ponieważ m'(x) = -2 x i n (x) = -1 , możemy więc zapi sać: * 1 —x 2 —2x lim - ----- = lim ——= lim 2x - 2. i —x —1 *-»i Odpowiedź jest taka sama, jak odpowiedź otrzymana inną metodą w przykładzie 2 w podrozdz. 6.4. Przykład 4. Znaleźć granicę (2x + 5)/(;t + 1) przy x —>«>. Gdy x dąży do nieskończoności, wówczas m(x) i n(x) też dążą do nieskończoności. Ponieważ m'(x) = 2 i n'(x)= 1» więc możemy zapisać: ■ 2^ + 5 ■2 . hm = lim - = 2.
OPTYMALIZACJA PRZY WARUNKACH W POSTACI RÓWNAŃ 431
430 PROBLEMY OPTYMALIZACJI
Ponownie otrzymujemy taką samą odpowiedz, jak otrzymana inną metodą w przykła dzie 3 w podrozdz. 6.4. Może się okazać, że wyrażenie po prawej stronie w (12.69) również ma postać 0/0 lub oo/oo9 czyli taką, jak wyrażenie po lewej stronie. W tym przypadku możemy powtórnie zastosować regułę L ’Hopitala, tzn. możemy znaleźć granicę m"(x)ln"(x) przy x - ^ a \ przyjąć, że ta granica jest rozwiązaniem. Może się również okazać, że mimo iż dana funkcja/(x), której granicę chcemy obliczyć, pierwotnie nie miała postaci m(x)/n(x)}która po przejściu do granicy zgodna jest ze schematem 0/0 lub <»/©°, jednak odpowiednie przekształcenie spowoduje, że do f(x) będzie można zastosować regułę (12.69). Przykładem takiej sytuacji będzie obliczanie granicy funkcji CES (12.63) — traktowanej teraz jako funkcja Q(p) —- przy p —» 0. Funkcja Q(p) nie ma postaci m(p)/n(p). Jeśli jednak podzielimy obie strony (12.63) przez A i obliczymy logarytmy naturalne, to otrzymamy rzeczywiście wyrażenie tej postaci, a mianowicie: (12.70)
i*
p
n ip )
Ponadto przy p —» 0 mamy m(p) —» - ln [ 5 + 1 - 8] = - I n l = Ó i również n(p) —» 0. Można zatem zastosować regułę L ’Hópitala do znajdowania granicy ln (Q/A). Gdy to już będzie zrobione, można będzie znaleźć również granicę Q; ponieważ Q l A - e ln(G/A), czyli Q = A t]n(Q/A\ więc: (12.71)
produkcji reprezentowanymi przez trzy izokwanty, jeśli funkcja Q jest jednorodna: (a) stopnia 1; (b) stopnia 2? 2. Jaki będzie typ krzywej otrzymanej dla przypadku uogólnionej funkcji Cobba-Douglasa, jeśli sporządzimy wykres ilorazu bla jako funkcji ilorazu Pa/Pbl Czy wynik zależy od założenia a + ¡3= 1? Na podstawie tej krzywej odczytać, jaka jest elastyczność substytucji. 3. Czy funkcja produkcji CES ma malejące przychody dla każdego czynnika przy wszystkich dodatnich wartościach czynnika? 4. Pokazać, że dla izokwanty funkcji CES d 2KldL2 > 0 . 5. a. W jakich proporcjach występuje część produktu przypadająca na pracę do części produktu przypadającej na kapitał dla funkcji CES, jeśli każdy czynnik produkcji jest opłacany zgodnie z jego produktem krańcowym? Czy większa wartość 8 oznacza większy względny udział kapitału? b. Czy dla funkcji Cobba-Douglasa stosunek udziału pracy do udziału kapitału zależy od ilorazu KIL I Czy dla funkcji CES otrzymamy taką samą odpowiedź? 6. a. Dla funkcji produkcji CES wykluczona jest możliwość, aby p = -1 . Gdyby jednak było p = -1 , to jaki byłby ogólny kształt izokwant dla dodatnich K i L I b. Czy er jest określona dla p = -1 ? Jaka jest granica przy p —>-1 ? c. Podać ekonomiczną interpretację powyższych wyników. 7. Pokazać, że jeśli funkcję CES zapiszemy jako Q = A [8K~P + (1 - 8)L~p]'r/p, gdzie r > 0 jest nowym parametrem, to możemy uwzględnić rosnące przychody skali i malejące przychody skali.
lim 2 = lirnAeln(G/A)=A elimIn(GM).
Na podstawie (12.70) obliczymy najpierw m (p) i n (p ) potrzebne w regule L ’Hópitala. Druga z pochodnych jest równa po prostu n (p ) = 1, a pierwsza wynosi:
8. Obliczyć następujące granice: x
m \p ) =
^
l5K~P + ( 1 _
=
[pochodna funkcji złożonej]
(b) lim *->o
[
8K-p + { 1 - 5 ) 1 - ^
Na mocy reguły L ’H6pitala otrzymujemy zatem: lic i-g A
p~*o
p->o n (p)
1
2 -
x
- \ 2
(a) lim ——; *->4 x —4
9.
e* —1 ; x
5 * -e* (c) lim : x—>0 x ln * (d) lim — . *->- *
.
Za pomocą reguły L’Hopitala pokazać, że: xx (a) lim — = 0; (c) lim x x = 1. (b)
lim * ln * = 0;
Na podstawie tego wyniku, jeśli e podniesiemy do potęgi lim ln (QIA)t otrzymamy po prostu K hl} ~ 5. Zatem z (12.71) otrzymujemy w końcu wynik: ]imQ = A K sL1~s9 p->0 co powoduje, że granicą funkcji CES przy p —» 0 rzeczywiście jest funkcja Cobba-Douglasa.
Ćwiczenie 12.7 L Załóżmy, że izokwanty na rys. 12.9(b) otrzymano dla pewnej jednorodnej funkcji produkcji Q = Q(ci, b). Skoro OE = E E ' = E 'E ", to jakie muszą być proporcje między poziomami
12.8. KILKA UWAG KOŃCOWYCH W czwartej części książki omówiliśmy podstawowe techniki optymalizacji. Przebyliśmy nieco uciążliwą drogę: 1) od przypadku jednej zmiennej decyzyjnej do bardziej ogólnego przypadku n zmien nych, 2) od wielomianowej funkcji celu do funkcji wykładniczej, 3) od ekstremum bezwarunkowego do ekstremum warunkowego.
432 PROBLEMY OPTYMALIZACJI
Większa część rozważań obejmowała „klasyczne” metody optymalizacji, których podstawą jest rachunek różniczkowy, a główne narzędzia stanowią pochodne różnych rzędów. Jedną ze słabości takiego podejścia do optymalizacji jest pewna krótkowzroczność. Chodzi o to, że warunki pierwszego i drugiego rzędu dla pochodnych lub różniczek pozwalają zazwyczaj bez trudu odnaleźć; ekstrema względne, czyli lokalne, ale zidentyfikowanie ekstremów absolutnych, czyli globalnych, wymaga dodatkowych informacji lub dalszych badań. Szczegółowe omówienie wklęsłości, wypukłości, quasi-wklęsłości i quasi-wypukłości zostało pomyślane jako pożyteczna „odskocznia” z obszaru ekstremów względnych do obszaru ekstremów absolutnych. ^ Poważniejszym ograniczeniem takiego podejścia jest niezdolność radzenia sobie z wa runkami ograniczającymi zapisanymi w postaci nierówności. Z tego powodu na przykład ograniczenie budżetowe w modelu maksymalizacji użyteczności zostało sformułowane w następujący sposób: całkowite wydatki mają być dokładnie równe (a nie „mniejsze lub równe” ) określonej sumie. Innymi słowy, ograniczenia podejścia wykorzystującego rachunek różniczkowy powodują, że konsument pozbawiony jest w naszym modelu możliwości zaoszczędzenia części dostępnych funduszy. Z tych samych względów nie nałożyliśmy na zmienne decyzyjne w jawny sposób ograniczenia mówiącego, że mają one być nieujemne, jak by to dyktował zdrowy rozsądek ekonomiczny. W istocie mogliśmy używać nierówności tylko w charakterze specyfikacji modelu (np. Qa > 0; < 0). Nierówności te odgrywały rolę przy określaniu znaków rozwiązań matematycznych, ale same nie były obiektem operacji matematycznych. Ograniczeniami w postaci nierówności zajmiemy się przy okazji omawiania pro gramowania matematycznego (liniowego i nieliniowego), które reprezentuje „nieklasyczne” podejście do optymalizacji. Tematem tym zajmiemy się jednak dopiero w szóstej części książki. Tymczasem, aby Czytelnik mógł ogarnąć pełny zakres kategorii analizy ekonomicz nej, czyli statykę —>statykę porównawczą —> dynamikę, w kolejnej, piątej, części omówimy metody analizy dynamicznej. Jest to właściwsze z dydaktycznego punktu widzenia, ponieważ techniki matematyczne analizy dynamicznej są związane z poznanymi właśnie metodami rachunku różniczkowego. Czytelnicy, którzy pragną zająć się programowaniem matematycznym, mogą opuścić część piątą i przejść od razu do części szóstej. Nie napotkają żadnych trudności metodologicz nych.
CZĘŚĆ
PIĄTA ANALIZA DYNAMICZNA
13. DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY
Termin „dynamika” w odniesieniu do analizy ekonomicznej miał różne znaczenia w różnych okresach i dla różnych ekonomistówl. Jednak obecnie termin ten jest powszechnie stosowany na oznaczenie rodzaju analizy, w którym celem jest albo prześledzenie i zbadanie szczególnych ścieżek czasowych dla zmiennych, albo zbadanie, czy — jeśli wystarczy czasu — te zmienne będą dążyć do pewnych wartości równowagi. Ten rodzaj informacji jest ważny, ponieważ wypełnia istotną lukę w naszych badaniach dotyczących statyki i statyki porównaw czej. Przyjmowaliśmy w nich zawsze arbitralne założenie, że proces ekonomicznego dostosowania nieuchronnie prowadzi do równowagi, W analizie dynamicznej zmierzymy się natomiast bezpośrednio z problemem „osiągalności” położenia równowagi zamiast pozbyć się go za pomocą założeń. Bardzo ważną cechą analizy dynamicznej jest datowanie zmiennych, co powoduje, że w sposób jawny uwzględniamy czas. Można to uczynić dwoma sposobami: czas można traktować jako zmienną ciągłą lub jako zmienną dyskretną. W pierwszym przypadku coś dzieje się ze zmienną w każdym momencie (np. ciągła kapitalizacja odsetek); w drugim przypadku zmienna podlega zmianie tylko raz w ciągu każdego okresu (np. odsetki są dodawane tylko na końcu każdego półrocza). W pewnych kontekstach jedna z tych dwu koncepcji będzie bardziej odpowiednia niż druga. Omówimy najpierw przypadek czasu ciągłego, związany z matematycznymi technikami rachunku całkowego i równań różniczkowych. Później, w rozdz. 16 i 17, zajmiemy się przypadkiem czasu dyskretnego i zastosowaniem metod równań różnicowych.
1 Fritz Machlup, Statics and Dynamics: Kaleidoscopic Words, „Southern Economic Journal” 1959, October. s. 91-110; reprint w: Machlup, Essays on Economic Semantics, Prentice-Hall, Inc., Englewood Cliffs, N J. 1963, s. 9-42.
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY 437
436 ANALIZA DYNAMICZNA
a więc jest naprawdę rozwiązaniem dla naszego modelu dynamicznego. (Równanie (13.1) również jest funkcją czasu, dlaczego więc nie można go traktować jako rozwiązanie?) Ten model populacji, mimo swej prostoty, stanowi przykład kwintesencji zagadnień dynamiki ekonomicznej. Dla danego schematu zachowania zmiennej w czasie chcemy znaleźć funkcję, która opisuje ścieżkę czasową tej zmiennej. W trakcie poszukiwania rozwiązania pojawia się pewna dowolna stała (lub pewne dowolne stałe), ale — jeśli dysponujemy wystarczającymi dodatkowymi informacjami w postaci warunków początkowych — możemy znaleźć konkretne jej (ich) wartości. W zadaniach prostszego typu, takich jak przytoczone powyżej, można znaleźć roz wiązanie, stosując rachunek całkowy. Polega oh ria znajdowaniu funkcji pierwotnej dla danej funkcji pochodnej. W bardziej skomplikowanych przypadkach możemy skorzystać ze znanych metod gałęzi matematyki zwanej równaniami różniczkowymi. Ponieważ równanie różniczkowe jest zdefiniowane jako równanie składające się z wyrażeń zawierających pochodne lub różniczki, więc (13.1) można z pewnością traktować jako takie właśnie równanie. Znajdując zatem jego rozwiązanie, rozwiązaliśmy w istocie — wprawdzie niezmiernie proste — równanie różniczkowe. Przejdźmy teraz do omówienia podstawowych pojęć rachunku całkowego. Ponieważ przy omawianiu rachunku różniczkowego przyjęliśmy dla zmiennej niezależnej oznaczenie x, a nie i, więc przez analogię tu również będziemy tak postępować. Jednak dla wygody będziemy oznaczać funkcję pierwotną i jej funkcję pochodną symbolami F(x) i/(x), zamiast u ży w a ć/'.
13.1. DYNAMIKA I CAŁKOWANIE Za pomocą modelu statycznego znajdujemy — ogólnie mówiąc — takie wartości zmiennych ■ i endogenicznych, które spełniają pewne określone warunki równowagi. Modele optymalizacji ';
m ' — = r 1/2. di
Spróbujemy wyjaśnić, jakie ścieżki czasowe dla populacji H = H(t) mogą dać stopę zmian taką, jak w (13.1). Czytelnik na pewno zauważył, że gdybyśmy znali funkcję H = H(t), to moglibyśmy za pomocą różniczkowania znaleźć pochodną dH/dt. Ale w zagadnieniu, którym się teraz zajmujemy, jest dokładnie odwrotnie: mamy odnaleźć funkcję pierwotną na podstawie danej funkcji pochodnej. Matematycznie, potrzebna jest nam operacja odwrotna do różniczkowania, czyli odwrotność rachunku różniczkowego. Odpowiednia metoda, znana jako całkowanie lub rachunek całkowy, zostanie omówiona później. Na razie zadowolimy się obserwacją, że funkcja H(t) = 2 tin rzeczywiście ma pochodną postaci (13.1), zatem wydaje się, że może być rozwiązaniem naszego zadania. Problem polega na tym, że istnieją również inne funkcje, takie jak H(t) = 2 tm + 15 lub H(t) = 2t m + 99, lub ogólniej: ' (13.2)
H(t) = 2t m + c
13.2. CAŁKI NIEOZNACZONE Istota całek
(c = dowolna stała),
Wspomniano już, że całkowanie jest przeciwne do różniczkowania. Jeśli różniczkowanie danej funkcji pierwotnej F(x) daje pochodną/(*), to możemy scałkować /(*), aby otrzymać Fix), pod warunkiem, że dysponujemy dodatkową informacją, która pozwala wyznaczyć wartość stałych dowolnych pojawiających się w procesie całkowania. Funkcję F(x) nazywamy całką (ang. integral) lub funkcją pierwotną (ang. antiderivative) funkcji/(*). Te dwa sposoby postępowania można porównać do dwu sposobów badania drzewa genealogicznego: cał kowanie przypomina wyszukiwanie „pochodzenia” funkcji/(*), podczas gdy różniczkowanie polega na znajdowaniu „potomstwa” funkcji F(x). Zauważmy jednak różnicę: różniczkowalna funkcja F(x) zawsze ma tylko jednego „potomka” , mianowicie jedyną pochodną /(*), a funkcja pochodna/(*) może być przypisana nieskończonej liczbie możliwych „rodziców” , ponieważ jeśli F(x) jest całką /(*), to musi nią być również F(x) plus dowolna stała, jak widzieliśmy w (13.2). Potrzebny nam jest specjalny zapis na oznaczenie całkowania /(*) względem x. Standardowym oznaczeniem jest:
które mają dokładnie tę samą pochodną (13.1). Nie można zatem wyznaczyć jednej ścieżki czasowej, dopóki nie zostanie w pewien sposób określona wartość stałej c. Aby to osiągnąć, ^ należy włączyć do modelu dodatkową informację, zwykle w postaci warunku początkowego lub warunku brzegowego. Jeśli dysponujemy wiedzą o początkowej wielkości populacji H(0), tzn. o wartości H(t) 'Ą f dla t = 0, np. H(0) = 100, to można będzie określić wartość stałej c. Podstawiając t = 0 do (13.2), otrzymujemy: H(0) = 2 ■0 m + c = c.
"
Ale skoro H(0) = 100, to również c = 100 i (13.2) przyjmie postać: .
(13.2')
H(t) = 2 tm + 100,
w
‘
gdzie stała c nie jest już dowolna. Ogólniej, dla każdej danej populacji początkowej H(0) § ścieżka czasowa będzie równa:
jf(x )d x . (13.2")
H(t) = 2 tm + H(0),
zatemi \wielkość populacji H w każdym momencie będzie w naszym przykładzie stanowić sumę ości populacji początkowej H(0) H i0) i drugiego składnika zależnego od zmiennej (czasowej t. wielkości Taka ścieżka czasowa rzeczywiście przedstawia całkowitą trajektorię zmiennej H w czasie.
-
Symbol po lewej stronie — wydłużona litera S (jest tu pewien związek z sumowaniem, co wyjaśnimy później) — jest nazywany znakiem całki (integral sign),/(jc) nazywamy funkcją podcałkową (ang. integrand), a część dx — podobnie jak dx w symbolu operatora
438 ANALIZA DYNAMICZNA
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY 439
różniczkowania d/dr — przypomina, że operacja całkowania ma być przeprowadzona względem zmiennej x Można jednak również traktować f(x)ó x jako całość i interpretować ją jako różniczkę funkcji pierwotnej F(x) (tzn. dF(x) =f(x)óx). Wtedy znak całki na początku może być odczytywany jako instrukcja odwrócenia procesu różniczkowania, który spowodo wał pojawienie się różniczki. Przy tych oznaczeniach możemy napisać: (13.3)
~ F (x ) ćx
(Jl
Przykład 4. Znaleźć j^[jFćx. Ponieważ ^[x3 = x 2, mamy więc n = ^ i wobec tego:
- f ( x ) =>J / W d r +
gdzie obecność c, dowolnej stałej całkowania (constant of integration), przypomina o licz nych „przodkach” funkcji podcałkowej. Całka J /( x ) d r jest dokładniej nazywana całką nieoznaczoną fu n k c ji/^ ) (w przeciwień stwie do całki oznaczonej, którą omówimy w następnym podrozdziale), gdyż nie ma określonej wartości liczbowej. Ponieważ całka ta jest równa F(x) + c, więc jej wartość będzie się na ogół zmieniać wraz ze zmianą x (nawet, jeśli określimy wartość stałej). Zatem całka nieoznaczona sama jest funkcją zmiennej x, podobnie jak funkcja pochodna.
j
(V?dt = ^ + c = ^ A /? + <:. 5
5
2 Przykład 5. Znaleźć
dr (x * 0). Ponieważ l/x 4 = x~4, więc n = - 4 , a zatem całka jest
równa: f 1 ,
jc“4+1
1
-4 + 1
3x3
\- ^ d x = — — - + c = - — 3 + c.
JxĄ
Poprawność wyników całkowania zawsze można sprawdzić za pomocą różniczkowania; jeśli całkowanie jest poprawne, pochodna całki musi być równa wyrażeniu podcałkowemu. Na podstawie wcześniej poznanych wzorów na pochodne prostej funkcji wykładniczej i logarytmicznej:
Podstawowe reguły całkowania Podobnie jak w przypadku różniczkowania, możemy podać pewne reguły całkowania. Jak można oczekiwać, reguły całkowania zależą od poznanych wcześniej reguł różniczkowania. Na przykład na podstawie następującego wzoru na pochodną funkcji potęgowej:,
d — e* = e* dx
i
d l — ln;c = dbc x
(* > 0 )
otrzymujemy dwie następne podstawowe reguły różniczkowania.
d r x n+l ^ n+1
Jldjc = x + c
(« * -D Reguła U (dla funkcji wykładniczej) \
widzimy, że wyrażenie x n+li{n + 1) jest funkcją pierwotną dla funkcji pochodnej x n. Jeśli zatem podstawimy te funkcje zamiast F(jc) if(x ) do (13.3), to możemy sformułować otrzymany wynik w postaci reguły różniczkowania.
Je*dr = ex + c. Reguła U l (dla logarytmów)
Reguła I (dla potęg)
(xnćx = - ^— x n+l + c J n+ 1
*
Cl - d r = In * + c Jx
(*>0).
( n * ~ 1).
Przykład 1. Znaleźć j x 3dx. Mamy tu n = 3, a zatem: ix 3ćx = ~ x 4 + c. J Ą
Ciekawe, że funkcja podcałkowa w regule Ul ma postać l/x = x~\ co jest szczególną postacią funkcji potęgowej x n dla n = - 1. Ta funkcja podcałkowa nie była dopuszczalna dla reguły potęgowej, ale teraz mamy dla niej odpowiedni wzór, regułę dla logarytmów. W powyższym sformułowaniu reguła logarytmiczna podlega ograniczeniu x > 0, gdyż logarytmy nie są zdefiniowane dla ujemnych wartości x. Można podać ogólniejsze sfor mułowanie tego wzoru, uwzględniające ujemne wartości *, tzn.:
Przykład 2. Znaleźć jxdx. Ponieważ n = 1, więc mamy: ix d r = - x 2 + c. J 2 Przykład 3. Czemu jest równe JlcU ? Aby znaleźć tę całkę, przypomnijmy, że x° - 1, zatem możemy podstawić do wzoru n = 0 i otrzymać: ;;
f x- d r = ln ]x| + c
(* ^ 0 ),
stąd wynika, że również (d/dt)ln \x\ = l/x, podobnie jak (d/dr)ln* = 1Jx. Czytelnik powinien się upewnić, że zastąpienie zmiennej x (z ograniczeniem x > 0) przez \x\ (z ograniczeniem x ź 0) nie narusza prawdziwości wzoru.
440 ANALIZA DYNAMICZNA
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY 441
Jeśli chodzi o oznaczenia, należy podkreślić, że całkę J-cL t zapisuje się niekiedy
a zatem (w wyniku dodawania) otrzymujemy: (13.5)
M o i* . J x Jako warianty reguł U i ID podamy dwie następujące reguły:
jf(x )ó x + ¡g(x)óx = F(x) + G (x )+ c l + c2.
.
*
Ponieważ stałe c, ci i c2 mają dowolną wartość, więc możemy przyjąć, że c = ci + c2. Wtedy prawe strony wzorów (13.4) i (13.5) stają się równe, więc lewe strony też muszą być równe. Kończy to dowód reguły IV.
Reguła D a Przykład 6. Znaleźć J (*3 + x + 1) dx Na mocy reguły IV całkę tę można zapisać jako sumę trzech całek: j x 3óx + \x ć x + Jdr. Ponieważ w przypadkach 1, 2 i 3 obliczyliśmy już wartości poszczególnych całek, możemy po prostu połączyć wyniki i otrzymać:
jf'(x )e m dx = em + c. Reguła H I a [ 7 7 7 dx = In/(x) + c J /(*)
( 4 > xą (x3 + x + l)d* = — + Ci + V4 )
/-
(f(x) > 0)
lub: ln |/W | + c
(/(* )* 0);
podstawą tych dwu reguł są wzory dla pochodnych (10.20).
Reguły dla działań arytmetycznych
czyli w ostatecznej odpowiedzi łączymy trzy stałe indeksowane w jedną stałą c. Ogólnie stosowaną praktyką jest łączenie wszystkich dowolnych stałych całkowania pojawiających się w trakcie obliczeń w jedną stałą całkowania występującą w końcowej odpowiedzi.
Przykład 7. Znaleźć
Podane powyżej wzory ilustrują zasadę, jaka rządzi wszystkimi regułami całkowania. Każda reguła zawsze odpowiada pewnemu wzorowi dla różniczkowania, a na końcu zawsze pojawia się dowolna stała, która pokazuje, że daną funkcję podcałkową można otrzymać dla całej rodziny funkcji pierwotnych (i której później ma być nadana konkretna wartość na podstawie warunków brzegowych). Dla bardziej skomplikowanych funkcji podcałkowych przydatne będą niżej podane wzory.
fx 2l > — 1"c2 + (x + c3) = — + — + x + c, ^2 /
2e + — dx Na mocy reguły IV możemy oddzielnie '1 l x + 5^
całkować dwa składniki funkcji podcałkowej, a potem zsumować. Ponieważ składnik 2e2* ma postać f'( x ) e f{x\ jak w regule Ha dla/(Jt) = 2x, więc całka jest równa e2* + cv Podobnie drugi składnik \AxJ{lx2 4- 5) ma postać f'(x)!f(x), dla f(x ) = l x 2 + 5 > 0. Zatem, na podstawie reguły Dla, całka jest równa ln(7x2 + 5) + c2. Możemy zatem napisać: A 14* 2e + -~jx 2 + j d^ = e 2x + ln(7x2 + 5) + c.
Jl
V
Reguła IV (całka sumy) Reguła V (całka Doczynu) Całka sumy skończonej liczby funkcji jest sumą całek tych funkcji. W przypadku dwu funkcji oznacza to, że: I [/(* ) + g 001 d* = 1 /W dx + Jg (x)dx.
Całka iloczynu liczby k przez funkcję podcałkową (k jest stała) jest równa iloczynowi liczby k przez funkcję podcałkową. Symbolicznie: jkf(x)ó x = k\f(x)hx.
Reguła ta jest naturalną konsekwencją faktu, że:
dx
^-[F(.x) + G (x )] = ~ F (x )+ ^ -G (x )= f(x ) + g(.x). cbc ax A
B
C
Ponieważ A = C, możemy więc na podstawie (13.3) zapisać: (13.4)
J
[f(x) + g(x)] dx = F(x) + G(x) + c.
Ale z faktu, że B = C, wynika: jf(x)dx = F(x) + c1
i
Jg(x)óx = G(x) + c2,
Wzór ten oznacza, że stały czynnik można wyłączyć przed znak całki. (Uwaga: zmienny czynnik nie może być w ten sposób wyłączony). Aby udowodnić tę regułę, przypomnijmy, że k razy f(x ) oznacźa to samo, ćo suma k składników/(*); zatem na mocy reguły IV: ¡kf(x)dx = ![/(* )+ /(* ) + ••• + f(x)]óx = jf(x)
k składników
Przykład 8. Znaleźć \- f( x ) ćx. Tutaj k = - 1, a zatem: \-f(x )d x = -¡f(x)ń x, żatem całka funkcji prżeciwnej do danej jest przeciwna do całki funkcji danej.
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY 443
442 ANALIZA DYNAMICZNA Przykład 9. Znaleźć ¡2x2dx. Wyłączając czynnik 2 i stosując regułę I, otrzymujemy: ^ 2 x 2dx = 2J ;x 2ćx = 2 v
3 +q
Ponieważ f(u ) (du/dx) jest pochodną Fiu), więc z (13.3) wynika, że całka (funkcja du pierwotna) d l a / ( m)-^— musi być równa: v f du ) f ( u ) — dx = F(u) + c.
Przykład 10. Znaleźć ¡3x2dx. W tym przypadku wyłączenie stałego czynnika daje: Czytelnik z pewnością zauważy, że ten sam wynik powstaje w rezultacie skrócenia dwu wyrażeń d r po lewej stronie.
x3 " f 0 c , 3x dx = 3 x dx = 3 = x 3 + c. J J 3 +Cl V
/
Zauważmy, że w przeciwieństwie do poprzedniego przykładu składnik x 3 w końcowej odpowiedzi jest pozbawiony współczynnika ułamkowego. Ten „ładny” wynik bierze się stąd, że 3 (stały czynnik funkcji podcałkowej) jest tu równy 2 (wykładnikowi funkcji) plus 1. Odwołując się do reguły dla funkcji potęgowej (reguły I) widzimy, że w takim przypadku stały czynnik (n + 1) i ułamek 1l(n + 1) skracają się, co daje w konsekwencji x n+l + c. W ogólnym przypadku, jeśli funkcją podcałkową jest (n + l) x n, to nie trzeba wyłączać stałej n + 1, a potem całkować x n\ zamiast tego można od razu napisać odpowiedź xn+1 + c.
Przykład 12. Znaleźć ¡2 x(x2 + l)d r. Odpowiedź można znaleźć, mnożąc najpierw funkcję podcałkową: \ J*2x(x2+ l)d :c = J*(2x3 +2jc)dx = — + x 2 + c, ale zróbmy to za pomocą reguły podstawienia. Niech u = x 2 + 1; wtedy du/dx = 2x, czyli dx-du!2jc. Podstawienie dw/Zr zamiast dx daje: i*2x(x2-f- l)d x = i*2jcu ~ = f«dM = ^ - + c = - ( x 4 + 2x2 + l) + cx = - x 4 + x 2 + c, J j 2 xJ 2 1 2 2
Przykład 11. Znaleźć jj^ e * - x 2 + - dx
(x * 0). Przykład ten ilustruje w istocie gdzie c = - + c1.T e samą odpowiedź można otrzymać, podstawiając duldx zamiast 2x (a nie
wszystkie reguły: du/2x zamiast ćx).
J 5ex - —^ + - \ ć x = 5 j e xć x - j x 2ćx + 3 j - ć x =
= {5ex + c 1) -
+ c2 + (3 ln |jc| + c3) = 5ex + - + 3 ln |*| + c.
Przykład 13. Znaleźć ¡6 x2(x3 + 2)"djc. Ponieważ wymnożenie funkcji podcałkowej jest tu trudne, więc zastosujemy regułę podstawienia. Niech u - x 3 + 2; wtedy dulćx = 3x2, a zatem: [z reguł IV i V] f & c V + 2 )"d x = i ( 2 ^ ) u " d x = f 2 > d t t = — « 100 + c = — J J \ ó x) J ,1 0 0 50
Prawidłowość wyniku można sprawdzić przez różniczkowanie. Wprowadzimy teraz dwie następne reguły, których celem jest uproszczenie, jeśli to możliwe, procesu całkowania dzięki zamianie pierwotnej zmiennej całkowania. Reguły te będą przydatne wtedy, gdy proces całkowania jest łatwiejszy dla nowej zmiennej niż dla starej. Reguła VI (reguła podstawiania) Całka funkcji fiu ) {du!dx) względem zmiennej x jest to całka/(w) względem zmiennej u:
J /(w )^ d x = J/(w)dK = F(u) + c, gdzie operacja Jdx została zastąpiona przez operację Jdw. Reguła ta stanowi odpowiednik wzoru na pochodną funkcji złożonej i może być udowodniona za pomocą tego wzoru. Dla danej funkcji F(k), gdzie u = u(x), wzór na pochodną funkcji złożonej wskazuje, że: du
du
du
(x3+2)loo+ c.
Ptzykład 14. Znaleźć J s e 2x+3cb:. Niech u = 2x + 3: wtedy du/dx = 2, czyli dx = du!2. Zatem: j s e 2x+3dx = J*8e“ — = 4 ^ e ud u ^ 4e“ + c = 4 e 2r+3 + c. Reguła ta jest pomocna zawsze wtedy, gdy — w wyniku dobrania odpowiedniej funk cji /(« ) — ' możemy wyrazić funkcję podcałkową (funkcję x) jako iloczyn fiu ) (funkcji zmiennej u) i duldx (pochodnej wybranej przez nas funkcji u). Ostatnie dwa przykłady pokazują, że regułę tę można stosować również wtedy, gdy oryginalną funkcję podcałkową można zapisać w postaci iloczynu stałej przez f( u ) (du/dx). Nie narusza to możliwości stosowania reguły, gdyż stały czynnik można wyłączyć przed znak całki, co pozostawia funkcję podcałkową w postaci f(u ) {du!dx), wymaganej w regule podstawienia. Gdy jednak rezultatem podstawienia jest zmienna pomnożona przez f(u ) (dułdx), np. x, wówczas wyłączanie czynnika nie jest dozwolone i reguła ta na nic się nie przyda. W istocie, nie istnieje ogólny wzór wyrażający całkę iloczynu dwu funkcji w terminach oddzielnych całek tych dwu funkcji i nie istnieje ogólny wzór wyrażający całkę ilorazu dwu funkcji w zależności od ich oddzielnych całek. Dlatego właśnie całkowanie jest trudniejsze od różniczkowania i wprzypa-
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY 4 45
444 ANALIZA DYNAMICZNA
dku bardziej skomplikowanych funkcji podcałkowych wygodniej jest znaleźć odpowiedź w gotowych tablicach całek niż obliczać je samodzielnie.
Ćwiczenie 13.2 1. Obliczyć następujące całki: (a) J 16jc~3d r
Reguła VII (całkowanie przez części)
(b)
Całka v względem u jest równa iloczynowi uv minus całka u względem v:
( jc
* 0);
(d) J2e_2rdx;
¡9xsdx;
(e) f - ^ - c L c ; *1xr + 1 . (f) \{2ax+ b)(ax1 + bx)7dx.
(c) ¡(x5 -3 x )d x \
jvdu = u v - judv.
Istota tej reguły polega na zastąpieniu operacji ¡du przez operację Jdv. Uzasadnienie tego wyniku jest całkiem proste. Przede wszystkim reguła dla różniczki iloczynu daje: « d(wv) = vdu + udv.
Jeśli całkujemy obie strony równości (tzn. scałkujemy każdą różniczkę), to otrzymujemy nowe równanie:
2. Obliczyć: (a) J o e 'd x ;
(d) |3 e _(2l+7)dr;
1 4 ( b ) J 3e* + - dx V f *
(x > 0 );
o
>
( 0 J 5e<+ ? àx V
Jd(uv) = \vdu + \udv
(e) ¡4xe**+2dx;
X
(f) ¡xex2+9dx.
(x 0);
>
Obliczyć:
lub: uv = Jvdu + \udv.
[nie jest potrzebna stała po lewej stronie (dlaczego?)]
3dx w j—
(x * 0 );
(c)J
X
Odejmując Judv od obu stron, otrzymujemy żądany wynik.
o» j
• ćx —
(x*2);;
x» + 3 d' 1
(d) _
Przykład 15. Znaleźć \x (x + l ) 1/2cLt. W przeciwieństwie do przykładów 12 i 13, nie można w obecnym przypadku zastosować podstawienia takiego, jak w regule VI (dlaczego?). Możemy jednak potraktować podaną całkę w postaci \vdu i zastosować regułę VU. W tym 2 celu przyjmiemy v = jc, z czego wynika dv = dr oraz u = - (x + 1)3/2, więc du = (x+ \) mdx.
4. Obliczyć:
Możemy zatem całkę zapisać w postaci:
5. Na podstawie reguł IV i V, dla danych n stałych k- (dla / = 1, 2, ..., ń) i n funkcji f t(x), pokazać, że:
j x (x + 1)1/2dr = jv d u = uv - Judv = = ^ C* + 1)3/Ź* =
|
(*
+
V )m X
(a) J(jc + 3) (.x + l ) 1/2djc;
(b) Jjclnjcdjc
( jc
>
0 ).
f Ż ^ ( x ) d x = E fc ,f/(x )d t. •'/= 1 1=1 J + l)3^
= -
5( x +
1 )5 /2 +
13.3. CAŁKI OZNACZONE I
Przykład 16. Znaleźć JlnjccLc ( jc > 0). Nié można tu zastosować reguły logarytmicznej,
gdyż reguła ta dotyczy funkcji podcałkowej 1/jc, a nie lnję. Nie można też zastosować reguły VI. Jeśli jednak przyjmiemy v = lnx, skąd wynika dv = (l/x)dx, oraz przyjmiemy u=x, tak iż du = dr, to możemy wykonać całkowanie w następujący sposób: Jlftjcdjc = Jvdw = wv - Jwdv ==jclnję - Jdjc = jęhuc - X + ć = jc(ln jc - 1) + c. Przykład 17. Znaleźć jx e xdx. W tym przypadku przyjmiemy po prostu y = x i u = ext tak że dv = dx i du = e xćx. Stosując regułę VII, otrzymujemy: jxexdx = Jvdw = uv - ¡udy = exx -* ¡exdx = exx - ex + c = ex(x - 1) + c. Wyniki te, podobnie jak poprzednie, możną sprawdzić za pomocą różniczkowania.
Znaczenie całek oznaczonych Wszystkie całki przytoczone w poprzednim podrozdziale były nieoznaczone: każda z nich była pewną funkcją zmiennej x , więc nie miała określonej wartości liczbowej. Jeśli teraz dla danej całki nieoznaczonej funkcji ciągłej / ( jc) : ¡f(x)dx = F(x) + c wybierzemy dwie wartości x należące do dziedziny funkcji, powiedzmy a i b (a < b), i podstawimy je kolejno do prawej strony oraz obliczymy różnicę: [F(b) + c] - [F(a) + c] = F(b) - F(a)t
446
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY
ANALIZA DYNAMICZNA
to otrzymamy konkretną liczbę, bez zmiennej x i dowolnej stałej. Liczba ta jest zwana całką ' oznaczoną funkcji/ ( jc) od a do b. Symbol a nazywamy dolną granicą całkowania, a symbol b — górną granicą całkowania. Aby pokazać, jakie są granice całkowania, piszemy znak całki w postaci J. Obliczanie całki .
-
447
15 J u 2d« = ł « 3||5= ł( 1 5 3- 1 3) = 1124^. Możemy najpierw przejść od w do pierwotnego wyrażenia zawierającego x, a potem zastosować pierwotne granice 1 i 2, i otrzymać taką samą odpowiedź:
a
oznaczonej można wyrazić symbolicznie: (13.6)
] f( x ) d x = F (x ) l = F (b )-F (a ),
gdzie symbol ]* zapisywany też jako fa lub [...]* oznacza, że zamiast x występującego w funkcji pierwotnej należy podstawiać kolejno b i a> aby otrzymać F(b) i F{a), a następnie obliczyć ich różnicę, co zapisano po prawej stronie wzoru (13.6). Pierwszym krokiem będzie jednak znalezienie całki nieoznaczonej. Możemy przy tym pominąć stałą c, która i tak zniknie przy obliczaniu różnicy. Przykład 1. Obliczyć j 3 x 2ćx. Ponieważ całka nieoznaczona jest równa x 3 + c, więc i ' " ■. ':r i oznaczona ma wartość: j s x 2d x = x 3\^= 5 3 - l 3 = 125 - 1 = 124. 1 ^ Przykład 2. Obliczyć J kexóx. Granice całkowania są tu oznaczone symbolami i w rezul tacie wynik całkowania również jest wyrażony przy użyciu tych symboli:
Przykład 3. Obliczyć
l
---+ 2x 1+x
dx
( jc
n
* -1). Całka nieoznaczona jest równa
ln |l + x \+ x 2 + c, otrzymujemy więc odpowiedz: 4 /
J — oV
Każda całka oznaczona ma określoną wartość. Wartość tę można interpretować geometrycznie jako pewne pole pod daną krzywą. Narys. 13.1 przedstawiono wykres ciągłej funkcji y =/(*). Pole obszaru A (zacienionego) ograniczonego krzywą i osią*, zawartego pomiędzy punktami a i b należącymi do dziedziny funkcji, możemy obliczyć w następujący sposób. Najpierw dzielimy przedział (a, b) na n podprzedziałów (niekoniecznierównych). Narys. 13.1(a) zaznaczono cztery podprzedziały, czyli n = 4: pierwszym jest (xv *2), a ostatnim (jc4, x5). Ponieważ każdy z nich odpowiada pewnemu przyrostowi zmiennej jc, więc możemy je oznaczyć A j c 15 . . . , A j c 4. Na każdym podprzedziale budujemy prostokąt o wysokości równej maksymalnej wartości funkcji w tym podprzedziale (dla naszej funkcji jest to za każdym razem wartość funkcji w lewym końcu przedziału). Pierwszy prostokąt ma w yso k o ść/^^ i szerokość Ajc1?czyli ogólnie i-ty prostokąt ma wysokość /(x,-) i szerokość Ax,. Całkowite pole A* prostokątów jest równe sumie: A* = S /(x,)A xf X=1
\ kexdx = kex \b = k(eb- e a). fi
Całka oznaczona jako pole pod krzywą
Nie jest to oczywiście pole obszaru pod krzywą, które chcemy zmierzyć, tylko jego bardzo niedokładne przybliżenie.
r:>
\
+ 2x djc = [ln !l+ jc |+ jc 2]^ = 0 n 5 + 1 6 ) - 0 n l + 0 ) = ln5 + 16. .
[In 1 = 0]
J
Ważne jest, aby zdać sobie sprawę, że obie granice całkowania a i b są wartościami zmiennej x. Gdybyśmy chcieli zastosować technikę podstawienia zmiennych (reguły VI i VII) i wprowadzili zmienną u, to musielibyśmy uważać, aby nie przyjmować a i b jako granic całkowania dla u. Zilustrujemy to następującym przykładem. Przykład 4. Obliczyć J (2x3 - l)2(6x2)d.r. Niech u = 2jc3 - 1; wtedy du/ćbc = 6jc2, czyli du = 6x2dx. Zauważmy teraz, że jeśli x = 1, to u = 1, ale jeśli x = 2, to u = 15. Innymi słowy, granice całkowania dla zmiennej u powinny być równe 1 (dolna) i 15 (górna). Przepisanie danej całki dla u da nam wobec tego nie j u 2du> lecz:
(n = 4, dla wykresu z rys. 13.1 (a)).
Rysunek 13.1(a)
448
ANALIZA DYNAMICZNA
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY
449
Oznacza to, że:
t f(x)d x = lim y /(*i)A */ = pole A. J « -* < »
a
i-l
Wspomniana całka oznaczona (zwana całką Riemanna) jest więc związana z polem oraz br z sumą, gdyż jest ciągłym odpowiednikiem dyskretnego pojęcia XJa i=i
y = f(x )
Ńa rys. 13.1 staramy się przybliżyć pole A, zmniejszając systematycznie zawyżone oszacowanie A* za pomocą coraz drobniejszego podziału (a, b). Otrzymana granica sumy pól prostokątów jest nazywana całką górną (mg. upper integral) i stanowi ograniczenie od góry. Moglibyśmy przybliżać pole A od dołu, gdybyśmy budowali prostokąty wpisane w krzywą, a nie rozciągające się poza nią (por. ćwiczenie 13.3-3). Całkowite pole A** takiego zestawu prostokątów byłoby zaniżonym przybliżeniem A, ale przy coraz drobniejszym podziale (a, b) ponownie otrzymalibyśmy lim A**= A. Granica takiej sumy pól prostokątów jest nazywana
(=a)
W Rysunek 13.1(b)
dolną całką (ang. lower integral). Całka Riemanna J f(x )d x jest zdefiniowana wtedy i tylko a
Różnica między A* i prawdziwym polem A jest równa sumie pól niezakreskowanych części prostokątów; stanowi ona zawyżenie oceny A przez A*. Gdyby można było zmniejszyć wielkość niezakreskowanych części i sprawić, aby dążyła ona do zera, wtedy przybliżona wartość A* dążyłaby do prawdziwej wartości A. Osiągniemy to, stosując coraz drobniejszy podział przedziału (a, b), tak aby n rosło i A xi malało. Wtedy prostokąty staną się bardziej wydłużone (i coraz liczniejsze), a różnica między polem prostokątów a polem pod krzywą będzie się zmniejszać, co można zobaczyć na diagramie 13.1(b). Po przejściu do granicy otrzymujemy: n
(13.7)
lim X /fe)A x . = lim A* = pole A, n —>°° f = 1
/i-» ~
wtedy, gdy całka dolna i całka górna są sobie równe; mówimy wtedy, że funkcja f(x) jest całkowalna w sensie Riemanna (ang. Riemann integrable). Istnieją twierdzenia wyjaśniające, przy jakich warunkach funkcja/C*) jest całkowalna. Zgodnie z podstawowym twierdzeniem rachunku różniczkowego funkcja jest całkowalna w przedziale (a, b), jeśli jest ciągła w tym przedziale. Zatem dopóki zajmujemy się funkcjami ciągłymi, dopóty nie musimy się martwić. Występuje tu również inny problem, na który warto zwrócić uwagę. Otóż obszar A na rys. 13.1 leży całkowicie pod obniżającą się częścią krzywej y - f( x ) . Można jednak utożsamić pojęcie całki oznaczonej i pola również dla wznoszących się fragmentów krzywej. W istocie mogą wystąpić jednocześnie oba rodzaje nachylenia i wówczas istnieje możliwość obliczenia
\
pod warunkiem, że ta granica istnieje (w naszym przypadku rzeczywiście istnieje). Równanie to stanowi formalną definipję pola pod krzywą. n
np. I f(x )d x jako pola obszaru na rys. 13.1 zawartego między krzywą i odcinkiem osi Ob. O v » Zauważmy, że jeśli obliczymy pole B na rys. 13.2 za pomocą całki oznaczonej I f(x)d x,
Wyrażenie zawierające sumę w (13.7), czyli X /(*/)A jc,. przypomina nieco wyrażenie dla całki oznaczonejj j f( x ) d x . W rzeczywistości to drugie jest oparte na pierwszym. Gdy y = /(x )
przyrost A xi jest nieskończenie mały, wówczas można go zastąpić symbolem dxt Ponadto można opuścić indeks i, gdyż każdy z nieskończenie małych przyrostów można oznaczyć tym samym symbolem dx. Możemy wobec tego przepisać f(x^)Axi w postaci f(x)d x. A co n
będzie ze znakiem sumy? Oznaczenie X reprezentuje sumę skończonej liczby składników. *■=i Gdy obliczymy granicę tej sumy przy n —>°o, to oznaczenie otrzymanej granicy będzie dość
t
skomplikowane. Potrzebny jest zatem prostszy symbol. Jest nim J ; wydłużony symbol a
S oznacza tu sumę, a litery a i b (tak jak l i ń) służą do określenia dolnej i górnej granicy tej sumy. Całka oznaczona jest zatem skróconym symbolem określającym granicę (13.7).
Rysunek 13.2 29 — Podstawy...
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY 451
450 ANALIZA DYNAMICZNA
to otrzymamy odpowiedz ujemną, ponieważ wysokość każdego prostokąta zawartego w tym obszarze wyraża się liczbą ujemną. Mamy tu pojęcie ujemnego pola, tzn. pola powierzchni leżącej pod osią j c i powyżej wykresu danej funkcji. Jeśli potrzebna jest nam wartość liczbowa, a nie algebraiczna takiej powierzchni, powinniśmy posłużyć się wartością bezwzględną
w następujący sposób: j f ( x ) d x = j f ( x ) d x 4- j f ( x ) d x + J f(x)d x
( a < b < c < d ).
W równaniu tym wpisano tylko trzy całki, ale wzór pozostanie prawdziwy po dxma natomiast wartość dodatnią, mimo rozszerzeniu go iż do n całek. Własność tę nazywamy niekiedy własnością addytywności. Wzór ten oznacza, że pole (pod krzywą) leżące nad przedziałem (a, b) na osi j c może być leży po stronie ujemnej wartości j c . Jest tak, ponieważ każdy prostokąt budowany od c do d ma otrzymane jako suma pól nad podprzedziałami ze zbioru {(a, b), (b, c), (c, d)}. Zwróćmy dodatnią wysokość oraz dodatnią szerokość.,W ynika. stąd wniosek, że zamiana granic uwagę na to, że ponieważ mamy tu przedziały domknięte, więc punkty brzegowe b i c wy całkowania odwróci kierunek ruchu, a przez to zmieni znaki A*,- i całki oznaczonej. stępują w dwu przedziałach. Czy nie jest to podwójne liczenie? Rzeczywiście tak jest, ale na szczęście nie powoduje to żadnej szkody, gdyż na mocy własności U pole nad pojedynczym W odniesieniu do pola B widzimy, że całka oznaczona J f( x ) d x (od b do a) jest liczbą punktem jest równe zeru, tak więc podwójne liczenie punktu nie wpływa na wynik obliczeń. ■ b Ale uwaga — podwójne obliczanie pól leżących nad przedziałem nie jest dozwolone! przeciwną do pola B , będzie zatem mierzyć wartość liczbową tego pola. Wspomniano wcześniej, że wszystkie funkcje ciągłe są całkowalne w sensie Riemanna. Teraz, korzystając z własności m , można znaleźć również całki oznaczone (pola) dla pewnych funkcji nieciągłych. Rozważmy funkcję schodkową przedstawioną na iys. 13.3(a). Mimo Niektóre własności całek oznaczonych nieciągłości w punkcie b przedziału (a, c), możemy znaleźć pole zakreskowanego obszaru na podstawie sumy: Dotychczasowe rozważania pozwalają na sformułowanie niżej wymienionych własności odpowiedniej całki oznaczonej. Pole C = J / ( x )
całek oznaczonych:
r c(* } f( x ) d x + j_f(x)d x;
,
W łasności to samo odnosi się do krzywej na diagramie (b). Zamiana granic całkowania zmienia znak całki oznaczonej: a
yi
b
J /(jt)d * = - J /( * ) d x , b
a
co można udowodnić w następujący sposób: j/( x ) d x = F(a) - F(b) = ~[F(b) - F(a)] = - \ f ( x ) d x . b
a
0
a
b
0
Własność I I . (a)
Całka oznaczona ma wartość zero, gdy granice całkowania są sobie równe: Rysunek 13.3 j/( x ) d x = a
F(a) - F(a)= 0.
Przy interpretacji geometrycznej oznacza to, że pole (pod krzywą) nad każdym pojedynczym punkiem dziedziny jest równe zero. Tak właśnie powinno być, ponieważ nad punktem na osi j c możemy narysować jedynie (jednowymiarowy) odcinek, a nie (dwu wymiarowe) pole. Własność III
Własność IV b j - f ( x ) d x = -J /(x ) cbc.
Własność V b
J
k f(x )d x = k j f( x ) d x .
Całka oznaczona może być zapisana jako suma skończonej liczby całek oznaczonych
a
b (b)
452
ANALIZA DYNAMICZNA
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY
453
Własność VI (c) j3 y[xó x;
(f)
¡[f(x ) + g(x)]dx = jf ( x ) d x + jg ( x ) d x . a
a
iczyć następujące całki:
a
J e _2*dr, 1
Własność VII (całkowanie przez części) Dla danych funkcji u{x) i v(;t): x -b
fvdM = uvf x-a
T
x= b
,
-
(c) J (e 2x + e*)óx; 2 6f ( 1
1
+x lii* 5 (d)i\x+ r+ c\ y
fi x=a
Ostatnie cztery własności, przeniesione z całek nieoznaczonych, nie wymagają dalszych wyjaśnień.
Inne spojrzenie na całkę nieoznaczoną Wprowadziliśmy całkę oznaczoną, dopisując dwie granice całkowania do całki nieoznaczo nej. Teraz — gdy znamy już sens całki oznaczonej — zobaczmy, jak można przejść od całki oznaczonej do nieoznaczonej. Przypuśćmy, że zamiast ustalania górnej granicy całkowania jako b, przyjmiemy, że jest ona zmienną oznaczoną po prostu jako x. Całka przyjmie wtedy postać: ] f( x ) d x = F (x ) -F ( a ),
3. Na rys. 13.1(a) przyjmijmy najmniejszą wartość funkcji osiąganą w każdym podprzedziale jako wysokość prostokąta, tzn. przyjmijmy f( x 2) zamiast/O^) jako wysokość pierwszego prostokąta, przy czym A xx wciąż pozostanie jego szerokością i podobnie dla pozostałych prostokątów. a. Zapisać w postaci sumy całkowitą powierzchnię A** nowych prostokątów. b. Czy A** jest zawyżoną, czy zaniżoną oceną pola A? c. Czy A** będzie przybliżać się, czy oddalać od A, jeśli przyjmiemy drobniejszy po dział (ia, b)l Wskazówka: narysować wykres. d. Czy w granicy przy liczbie przedziałów n dążącej do °o, przybliżona wartość A** będzie dążyć do prawdziwej wartości A, podobnie jak przybliżona wartość A*? e. Co na podstawie powyższych wyników można wywnioskować o całkowaniu w sensie Riemanna dla funkcji przedstawionej na rysunku? 4. Mówimy, że całka oznaczona jf ( x ) ć x reprezentuje pole pod krzywą. Czy ta krzywa jest
a
a
a ponieważ jest teraz funkcją jc, więc oznacza zmienne pole pod krzywą/(*). Drugi wyraz po prawej stronie jest stały, a zatem całka ta musi być elementem rodziny funkcji pierwotnych dla /(*), które oznaczaliśmy wcześniej jako F(x) + c. Jeśli przyjmiemy c = - F(a), to powyższa
wykresem funkcji podcałkowej f(x), czy funkcji pierwotnej F (x)l Jeśli sporządzimy wy kres funkcji F(x), to jak zaznaczymy na nim powyższą całkę oznaczoną: jako pole, odci nek, czy jako punkt? 5. Sprawdzić, że stała c może być również wyrażona jako całka oznaczona:
całka staje się dokładnie całką nieoznaczoną jf( x ) ć x . Z tego punktu widzenia symbol j możemy traktować jako oznaczający to samo, co J , a pamiętając, że w ostatnim symbolu dolna granica całkowania jest związana ze stałą całkowania równaniem c = -F(a).
Kc (a)csj^cbc; o
cr ( b ) c = Jldt. o
13.4. CAŁKI NIEWŁAŚCIWE Ćwiczenie 13.3 1.
.
O pewnych całkach mówi się, że są „nięwłaściwe’\ Omówimy pokrótce dwa ich rodzaje.
Obliczyć następujące całki:
Nieskończone granicę całkowania (a)
(d) j ( x * - 6 x 2)dx; 2 1
12 1 + 6)dx;
(b) o
(e) j(cu? + bx + c)ćx; -i
i
Gdy mamy całki oznaczone postaci:
4 5 4 ANALIZA DYNAMICZNA
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY 455
dla których jedna z granic całkowania jest nieskończona, wówczas nazywamy je całkami niewłaściwymi (improper integrals). W tych przypadkach nie można obliczyć całek jako:
F ( b) -F( - co),
F(oo)-F(a)
ponieważ ©o nie jest liczbą, zatem nie można jej podstawić zamiast x do funkcji F(x). Musi my zamiast tego ponownie odwołać się do pojęcia granicy. Pierwsza podana wyżej całka niewłaściwa może być zdefiniowana jako granica innej (właściwej) całki, której górna granica całkowania dąży do tzn.: b
(13.8)
-
a
b
b w
a
Gdy granica ta istnieje, wtedy mówimy, że całka niewłaściwa jest zbieżna, a przejście graniczne daje wartość całki. Jeśli granica ta nie istnieje, to mówimy, że całka jest rozbieżna i w istocie nie ma sensu. Na tej samej zasadzie możemy zdefiniować: (13.8')
1
jf(x)ds lira J/to c L t. Rysunek 13.4 Przykład 2. Obliczyć
f&c — . Podobnie jak poprzednio znajdujemy najpierw:
i x
b
\f( x )ć x = lim \f(x )d x t
J
a
—oo
a
— o« J
= ln£-lnl=ln6.
jr-
z takim samym kryterium zbieżności i rozbieżności, fd* Przykład 1. Obliczyć —^ . Zauważmy najpierw, że: 4x -1
,=T +1* zatem zgodnie z (13.8) szukana całka jest równa:
Gdy przyjmiemy, że b -> ©©, wówczas na mocy (10.16') mamy ln b -+ całka niewłaściwa jest rozbieżna.
Rysunek 13.4(b) przedstawia wykres funkcji - i pole figury odpowiadające danej całce. Jeśli przesuniemy prawy bok w nieskończoność, to otrzymamy tym razem nieskończone pole powierzchni, mimo iż kształt wykresu niezmiennie przypomina wykres na rys. 13.4(a). Co się dzieje, gdy obie granice całkowania są nieskończone? Bezpośrednie rozszerzenie (13.8) i (13.8') sugerowałoby definicję: oo
fe-B m Jx b->°°J X
-1 b~*ee
-+ 1
=
1.
Ta całka niewłaściwa jest zbieżna i ma wartość 1. Ponieważ pisanie za każdym razem oznaczenia granicy jest kłopotliwe, niektórzy wolą więc opuścić oznaczenie „lim,, i po prostu stosować zapis:
J ? ““
=
0 +1
=
1.
Nawet jeśli zapiszemy całkę niewłaściwą w tej postaci, to musimy pamiętać o pojęciu granicy. Graficznie całka niewłaściwa ma również związek z pojęciem pola. Ponieważ jed nak górna granica całkowania może w tym przypadku przyjmować coraz większe war tości, więc granica po prawej stronie musi się przesunąć w nieskończoność w prawo, jak pokazano na rys. 13.4(a). Pole to możemy jednak traktować jako mające określoną (graniczną) wartość 1.
Zatem podana
(13.8")
b
J/(*)dx = lim J/W dx.
Mówimy, że całka niewłaściwa (13.8") jest zbieżna wtedy i tylko wtedy, gdy istnieje rozważana granica.
Nieskończona funkcja podcałkowa Jeśli funkcja podcałkowa przyjmuje nieskończoną wartość w pewnym miejscu w przedziale (a, b), to nawet wtedy, gdy granice całkowania są skończone, całka może być niewłaściwa. Aby obliczyć taką całkę, musimy ponownie skorzystać z granicy. i Przykład 3. Obliczyć
-d x . Całka ta jest niewłaściwa, ponieważ — jak pokazano na ox rys. 13.4(b) — funkcja podcałkowa jest nieskończona w dolnej granicy całkowania ( lłx —>©© przy x —>0+). Musimy więc najpierw obliczyć całkę:
456 ANALIZA DYNAMICZNA
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY 4 5 7
Ćwiczenie 13.4 f —djc = ln jc I = l n l - \ n a = -ln a Ja X
( d l a a > 0),
\a
1. Sprawdzić, czy któraś z całek oznaczonych podanych w ćwiczeniach 13.3-1 i 13.3-2 jest niewłaściwa. Jeśli tak, to sprawdzić, jaki to rodzaj całki niewłaściwej.
a potem obliczyć jej granicę przy a -> 0+: i 11 \- d x = lim - d * = lim (-Ina)Jx <*->o+Ja x «-»o+
2. Która z następujących całek jest niewłaściwa i dlaczego: ~ 1i 5
(a) Je~"dr; r Ponieważ granica ta nie istnieje (przy a —>0+; ln a —» —©°), więc dana całka jest rozbieżna.
o 3. 3
9
Przykład 4. Obliczyć J x~m dr. Gdy x -» 0+, wówczas funkcja podcałkowa 1/a/x dąży do o . . . . . nieskończoności, czyli całka jest niewłaściwa. Ponownie znajdujemy najpierw: r
Granica tego wyrażenia przy a —>0+jest równa 6 —0 = 6. Zatem dana całka jest zbieżna (i ma wartość 6). Podobna sytuacja występuje wtedy, gdy funkcja podcałkowa jest nieskończona w górnej granicy całkowania. Mamy jednak całkiem inny problem, gdy nieskończona wartość funkcji podcałkowej występuje w przedziale otwartym (a, 6), a nie w punktach a lub b. W takim przypadku należy wykorzystać addytywność całek oznaczonych i rozłożyć najpierw całkę na sumę całek. Przypuśćmy, że f(x ) —> przy gdzie p jest punktem przedziału (
Całka po lewej stronie jest traktowana jako zbieżna wtedy i tylko wtedy, gdy każda całka po prawej stronie ma granicę. i Przykład 5. Obliczyć 13 ćx. Funkcja podcałkowa dąży do nieskończoności, gdy * dąży -i . do zera, zatem musimy zapisać daną całkę w postaci sumy: 0
1
jx ~ 3ćx = j x ~ 3dx + j x ~ 3dx - 1 - 1 0
(= / + /2).
Całka l x jest rozbieżna, ponieważ:
-1
(d) J e ndt;
2
(f) Jó d c . -3
3. Obliczyć wszystkie niewłaściwe całki z poprzedniego zadania.
.-i
5. a. Narysować wykres funkcji y = ce~r dla nieujemnych i ( c > 0) i zakreskować obszar pod krzywą. b. Zapisać wzór matematyczny wyrażający pole tego obszaru i powiedzieć, czy jest to pole skończone.
13.5.
PEW NE
EKONOMICZNE ZASTOSOWANIA CAŁEK
= lim
Od funkcji krańcowej do funkcji całkowitej Dla danej funkcji całkowitej (np. funkcji kosztu całkowitego) w rezultacie różniczkowania otrzymujemy funkcję krańcową (np. funkcję kosztu krańcowego). Ponieważ całkowanie jest operacją przeciwną do różniczkowania, więc powinno nam umożliwić uzyskanie funkcji całkowitej dla danej funkcji krańcowej. Przykład 1. Znaleźć funkcję kosztu całkowitego, jeśli koszt krańcowy (MC) dla pewnej firmy jest następującą funkcją produktu: C \Q ) = 2e0,2G i jeśli koszt stały jest równy CF - 90. Całkując C \Q ) względem Q otrzymujemy: (13.9)
* l i m Lx 3dc = l i m >-*0 J-
(b) J x 4dx;
4 4
W analizie ekonomicznej całki mają różne zastosowania. W tym podrozdziale pokażemy kilka prostych przykładów, a w następnym zastosowanie całek do modeli wzrostu.
b
p
J /W dx = J f ( x ) d x + J /W dx.
1
0 0
(e) J"—— ; ir 1 - 2
4. Obliczyć całkę /2 z przykładu 5 i pokazać, że jest również niewłaściwa.
9 x ' I/2dx = 2xm i a
b
(c) / c _2/3dbc; oo
'
1 1 ' 2b2 + 2 J
- możemy zatem natychmiast stwierdzić» bez obliczania całki /2, że dana całka jest rozbieżna.
J2 e 0'2ed 2 = 2 — e0-22 + c = 10e°-2e + c.
0,2
Funkcja (13.9) mogłaby być przyjęta jako szukana funkcja C (g), ale jest nieokreślona, ponieważ występuje w niej dowolna stała c. Na szczęście informacja, że CF= 90 może być wykorzystana do określenia wartości stałej. Gdy Q = 0, wówczas koszt całkowity C składa się jedynie z CF. Zatem podstawiając Q = 0 do równania (13.9), powinniśmy otrzymać wartość
458
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY
ANALIZA DYNAMICZNA
90; tzn. 10e° + c = 90. Wynika stąd, że c = 90 - 10 = 80, a zatem całkowita funkcja kosztu jest równa: C (0 = lO e°* 2G+ 8O. W przeciwieństwie do funkcji (13.2), w której stała dowolna miała taką samą wartość jak początkowa zmienna H(0), teraz mamy c = 80, ale C(0) = CF = 90, a więc różne wartości. Na ogół nie należy zakładać, że stała dowolna c będzie zawsze równa początkowej wartości funkcji całkowitej. Przykład 2. Znaleźć funkcję oszczędności 5(7), jeśli krańcowa skłonność do oszczędzania (MPS) jest następującą funkcją dochodu S'(Y) = 0,3 - 0,1 Y~m i jeśli zagregowane oszczędno ści są równe zeru, gdy dochód 7 jest równy 81. Ponieważ MPS jest pochodną 5, więc zagadnienie wymaga całkowania 5'(7): S(Y) = J(0 ,3 - 0,1 r ,/2)d y = 0 ,3 7 -0 ,2
Y m + c.
Konkretną wartość stałej c można wyznaczyć na podstawie faktu, że 5 = 0, gdy 7 = 8 1 . Chociaż nie jest to — ściśle rzecz biorąc — warunek początkowy (nie dotyczy 7 = 0), ale wykorzystanie tej informacji w powyższej całce pozwala wyznaczyć wartość c. Ponieważ: 0 = 0,3 • 81 - 0,2 • 9 + c => c = -22,5, więc szukaną funkcją oszczędności jest: 5(7) = 0 , 3 7 - 0,271/2- 22,5. Pokazaną w dwu powyższych przykładach metodą można bezpośrednio poszukiwać funkcji całkowitych (takich jak całkowity przychód, całkowita konsumpcja) na podstawie danych funkcji krańcowych. Przypomnijmy, że w zagadnieniach tego typu prawdziwość odpowiedzi (całki) można sprawdzić za pomocą różniczkowania.
459
Pierwsze z powyższych równań, będące tożsamością, pokazuje, że inwestycje netto i wzrost kapitału śą synonimami. Ponieważ I(t) jest pochodną K(t), więc K(t) jest całką, czyli funkcją pierwotną /(/), co pokazuje drugie równanie. Przekształcenie funkcji podcałkowej w ostatnim równaniu można również łatwo zrozumieć. Zastąpienie /(i) przez dK/dt wynika z definicji, a następne przekształcenie jest wynikiem skrócenia dwu jednakowych różniczek, tj. na mocy reguły podstawienia. Czasami w modelu oprócz inwestycji netto występują również inwestycje brutto. Oznaczając inwestycje brutto symbolem Ig, a inwestycje netto symbolem /, możemy ich związek wyrazić równaniem: I= I+ 8K , gdzie S oznacza stopę deprecjacji kapitału, a ÓK — stopę reinwestycji. Przykład 3. Przypuśćmy, że strumień inwestycji netto jest opisany równaniem I(t) = 3tm i że początkowy zasób kapitału w chwili t = 0 jest K(0). Jaka jest ścieżka czasowa kapitału K2 Całkując /(i) względem t otrzymujemy: K(t) = J/(f)d
t = J 3tmdt = 2t3n + c.
Podstawiając / = Odo wyrażenia po lewej i po prawej stronie, znajdujemy K(0) = c. Zatem ścieżka czasowa dla K jest następująca: (13.10)
K(t) - 2tm + K(0).
Proszę zwrócić uwagę na podstawowe podobieństwo wyników (13.10) i (13.2"). Pojęcie całki oznaczonej pojawia się wtedy, gdy chcemy znaleźć wielkość kapitału wytworzonego w pewnym okresie (a nie ścieżkę czasową kapitału K). Ponieważ
fi m b = K(t), więc możemy zapisać całkę oznaczoną: b
Inwestycje a tworzenie kapitału Tworzenie kapitału polega na powiększaniu danego zasobu funduszy. Jeśli proces ten traktujemy jako ciągły w czasie, możemy wyrazić zasób kapitału jako funkcję czasu K{t) i zastosować pochodną dK/dt na oznaczenie stopy tworzenia kapitału2. Ale stopa tworzenia kapitału w momencie t jest równa stopie strumienia inwestycji netto w chwili i, oznaczo nego I(t). Zatem zasób kapitału K i inwestycje netto są związane następującymi dwoma równaniami:
=
=
dl = /dŁ
2 Pochodna zmiennej względem czasu często jest oznaczana za pomocą kropki nad zmienną, np. K s dK/dt. W analizie dynamicznej, gdzie pojawia się mnóstwo pochodnych względem czasu, ten bardziej
f
I(t)dt = K(t)
- K(b) - K(a)
wyrażającą całkowitą akumulację kapitału w okresie (ay b). Oczywiście całka ta reprezentuje pole pod krzywą I(t). Należy jednak zauważyć, że na wykresie funkcji K(t) ta całka oznaczona jest równa obszarowi pomiędzy dwiema pionowymi odległościami K(b) i K{a) (por. ćwiczenie 13.3-4). Aby pełniej zrozumieć różnicę między K(t) i /(/), podkreślmy, że kapitał K jest pojęciem typu „zasób” , a inwestycje / są pojęciem typu „strumień” . Zgodnie z tym K(t) mówi, jaka jest wielkość K istniejącego w każdym momencie, a /(i) daje informacje o stopie inwestycji netto w ciągu roku (lub w ciągu pewnego okresu), występującej w pewnym momencie. Zatem, aby obliczyć wielkość dokonanych inwestycji netto (akumulacji kapitału), musimy najpierw określić długość okresu. Można to również zobaczyć, gdy tożsamość dK/dt = /(/) zapiszemy jako d K = I(t)dt] teraz widać wyraźnie, że d/f, czyli wzrost K, zależy nie tylko od /(/), czyli
zwięzły symbol może znacznie uprościć notację. Jednak kropkę, która jest tak małym znaczkiem, można łatwo zgubić lub przesunąć; zatem trzeba być bardzo starannym, gdy używa się tego symbolu.
460
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY
ANALIZA DYNAMICZNA
stopy przepływu, lecz również od di, czyli czasu, który minął. Właśnie ta konieczność sprecyzowania okresu w wyrażeniu /(i) d i powoduje pojawienie się całki oznaczonej oraz to, że wyrażenie jest równe obszarowi pod krzywą /(i). Przykład 4. Jeśli inwestycje netto są stałym strumieniem /(i) = 1000 (dolarów rocznie), to jakie będą całkowite inwestycje netto (tworzenie kapitału) w ciągu roku od i = 0 do 1? Oczywiście odpowiedzią jest 1000 $, co można obliczyć formalnie w następujący sposób: 1 . 1 ,, . \ o.
J/(i)di =JlOOOdi= lOOOi = 1000.
~
o o , 0 Czytelnik sprawdzi, że taką samą odpowiedź otrzymamy, jeśli weźmiemy pod uwagę rok od t = 1 do t = 2. Przykład 5. Jeśli I(t) = 3tm (1000 $ rocznie) — zmienny strumień, to jaki zasób kapitału zostanie zgromadzony w okresie (1,4), czyli w ciągu drugiego, trzeciego i czwartego roku? Odpowiedzią jest całka oznaczona: 4
J:3i1/2di = 2pn
= 16 - 2 = 14.
= m
= K(t) - K(0).
Rysunek 13.5 ilustruje przypadek, gdy wykres ten jest równy (0, t0). Z innego punktu widzenia powyższe równanie daje następujące wyrażenie dla ścieżki czasowej K(t): K(t)=
Wartość bieżąca strumienia gotówki Nasze poprzednie rozważania dotyczące dyskontowania i bieżącej wartości, ograniczone do przypadku pojedynczej przyszłej wartości V, pozwalają na wyprowadzenie następują cych wzorów dla dyskontowania: A = V(1 + fy*
[przypadek dyskretny]
A = Ve"rt.
[przypadek ciągły]
Przypuśćmy teraz, że mamy strumień przyszłych wartości — szereg przychodów uzyskiwanych lub wydatków ponoszonych w różnych momentach. Jak obliczyć bieżącą wartość całego strumienia gotówki? W przypadku dyskretnym, gdy zakładamy, że wystąpią trzy wartości przyszłych przychodów Rt (t = 1 , 2, 3) uzyskiwanych na końcu i-tego roku oraz zakładamy, że roczna stopa procentowa jest równa /, obecne wartości R t będą odpowiednio równe: R ^ l + iT 1;R2{1 + ¡ r 2;
R3(l + i y \
skąd wynika, że łączna bieżąca wartość II jest równa sumie: 3
Na podstawie powyższych przykładów wiemy już, że wielkość akumulacji kapitału w okresie (0, i) dla dowolnej stopy inwestycji /(/) możemy wyrazić za pomocą całki: i
Si m
461
0K ( ) + J/(f)di.
Zasób kapitału K w momencie t jest równy sumie kapitału i całkowitej akumulacji kapitału, jaka nastąpiła do tej pory.
( i 3 . l i)
n = l R / i + /r.
Wzór ten różni się od wzoru dla pojedynczej wartości tylko tym, że V zastąpiono Rt i wprowadzono znak sumy. Pojęcie sumy można z łatwością uogólnić na przypadek ciągłego strumienia gotówki, ale w tym przypadku symbol Z trzeba oczywiście zastąpić znakiem całki oznaczonej. Rozważmy ciągły strumień przychodów o stopie R(t) dolarów rocznie. Oznacza to, że dla t = tx stopa strumienia jest równa R(^) dolarów rocznie, ale w innym momencie t = t2 stopa będzie równa R(t2) dolarów rocznie, gdzie t jest traktowane jako ciągła zmienna. Jeśli w dowolnym punkcie t rozważymy nieskończenie mały okres di, to wielkośćprzychodów uzyskanych w okresie (i, t + di) można zapisać jako R(t)dt (por. poprzednie rozważania dotyczące dfif=/(f)df). Przy ciągłym dyskontowaniu ze stopą r rocznie bieżąca wartość tych przycho dów będzie równa Rtyer^dt. Skoro zagadnienie polega na znalezieniu łącznej wartości bieżącej dla strumienia z trzech lat, więc odpowiedź znajdziemy posługując się następującą całką oznaczoną: € 3
(13.110
n = Jj?(r)e“"di. 0
Wyrażenie to, które jest ciągłą wersją sumy z (13.11), różni się od wzoru dla pojedynczej wartości tym, że V zastąpiono przez R(t) i dopisano znak całki oznaczonej3.
Rysunek 13.5
3 Należy podkreślić, że chociaż górny indeks sumowania i górna granica całkowania są sobie równe i wynoszą 3, to dolny indeks sumy (= 1) różni się od dolnej granicy całkowania (= 0). Wynika to z założenia, że pierwszy przychód dla dyskretnego strumienia otrzymywany jest nie wcześniej niż dla t - 1 (na końcu pierwszego roku), a strumień przychodów w przypadku ciągłym zaczyna się natychmiast po t - 0.
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY 463
462 ANALIZA DYNAMICZNA
Przykład 6. Jaka jest bieżąca wartość ciągłego strumienia przychodów trwających przez y lat ze stałą stopą D dolarów rocznie, przy rocznej stopie dyskontowej r ? Zgodnie z (13.110 mamy: (1 3 .1 2 )
n = j D e " nd i = D Je-"di =
[ y e"rt] o =
c~n
*=o
-D D = —r (e-* - 1 ) = -r ( 1 - e ^ ) ,
reprezentuje stopę zmian wartości sprzedaży V, jeśli sprzedaż odłożymy o rok, a dwa składniki po prawej oznaczają wywołany opóźnieniem sprzedaży wzrost kosztu utraty odsetek (interest cost) i kosztu magazynowania (przychód i koszty są obliczone dla chwili t). Zatem pomysł przyrównania do siebie obu stron równania jest dla nas czymś w rodzaju „starego wina w nowej butelce” , gdyż jest to ten sam co zawsze warunek MC = MR w nowym przebraniu!
a zatem II zależy od Z), r i y. Jeśli Z) = 3000 $, r = 0,06 i y = 2, to mamy: 2AAA
Wartość bieżąca wiecznego strumienia
n = — - ( 1 - e“0,12) = 50 000(1 - 0,8869) « 5655 $. 0,06
Wartość II jest oczywiście zawsze dodatnia, co wynika z tego, że D i r oraz (1 - e '77) są dodatnie. (Liczba e podniesiona do dowolnej ujemnej potęgi zawsze będzie dawać dodatni ułamek, co można zobaczyć na rys. 10.3(a)). Przykład 7. W zadaniu dotyczącym magazynowania wina zaprezentowanym w podrozdz. 10.6 zakładaliśmy, że koszty magazynowania są zerowe. To uproszczone założenie było konieczne z powodu naszej niewiedzy co do metody obliczania bieżącej wartości strumienia kosztów. Teraz możemy uwzględnić koszty składowania. Załóżmy, że koszt zakupu skrzynki wina, równy C, został poniesiony w bieżącej chwili. Wartość sprzedaży wina, zmieniająca się w czasie, może być oznaczona ogólnym symbo lem V(t)\ jej wartość bieżąca jest równa V(f)e-ri. Wartość sprzedaży stanowi przyszłą war tość (można dokonać tylko jednej transakcji dla tej jednej skrzynki wina), natomiast koszt przechowywania jest strumieniem. Zakładamy, że ten koszt jest stałym strumieniem o stopie s dolarów rocznie. Całkowita bieżąca wartość kosztów przechowywania poniesio nych w ciągu i lat jest równa: /
i-se rtd/ = - ( l - e n)y
[por. (13.12)]
a zatem wartość bieżąca netto— ta wartość, którą kupiec chce zmaksymalizować — może być wyrażona jako: N it) = V(t)e~n - ^ (1 - e-") - C = [v(i) +
=
V '(t)z ~ n -r [v ( i)
+
~ ] e_rr
[pochodna iloczynu]
i będzie równa zeru wtedy i tylko wtedy, gdy: V'(t) = rV(t) + s. ;
11 =
0 co jest całką niewłaściwą. Przykład 8. Znaleźć bieżącą wartość wiecznego strumienia dochodów o stałej rocznej stopie równej D, jeśli ciągła stopa dyskontowa jest równa r. Ponieważ przy obliczaniu całki niewłaściwej musimy po prostu znaleźć granicę całki właściwej, więc pomocny będzie wynik (13.12). Dokładniej, możemy napisać: U = If De~ndt = lim fIDe~rtd /= i i mD- ( l - e"") = -D. J
y— }ca J
y—>oo y
Y
Zwróćmy uwagę, że parametr y (liczba lat) nie pojawia się w końcowej odpowiedzi. Tak właśnie powinno być, gdyż mamy tu nieskończony strumień. Czytelnik może również zauważyć, że nasz wynik (wartość bieżąca = stopa przychodu: stopa dyskontowa) odpowiada dokładnie znanemu wzorowi dla tzw. kapitalizacji obligacji wieczystej.
Ćwiczenie 13.5
e n- - - C
i jest funkcją celu zależną od jednej zmiennej decyzyjnej t. Aby zmaksymalizować N(t), trzeba wybrać taką wartość t, aby N '(t) = 0. Pierwsza pochodna jest równa:
N\t)
Gdyby strumień gotówki miał trwać wiecznie — sytuacja, której przykładami mogą być renta wieczysta (peipetual bond) lub przychody z niezniszczalnego zasobu kapitału takiego, jak ziemia — bieżąca wartość strumienia byłaby równa:
■
1. Dla każdej z następujących funkcji przychodu krańcowego: (a)
K{Q ) = 28Q - e°’3G;
(b) K{Q) = 10(1 + Q)~2
znaleźć całkowitą funkcję przychodu R(Q). Jakie można przyjąć warunki początkowe, aby określić wartość stałej całkowania? 2. a. Znaleźć funkcję importu Af(7), jeśli dana jest krańcowa skłonność do importu M '(Y) = 0,1 i jeśli wiadomo, że M = 20 dla 7 = 0 . b. Znaleźć funkcję konsumpcji C(7), jeśli dana jest krańcowa skłonność do konsumpcji C{Y) = 0,8 + 0,1 Y~m i jeśli wiadomo, że C = 7 dla 7 = 100.
V,.5)
To ostatnie równanie jest wobec tego koniecznym warunkiem optymalizacji dla wyboru momentu sprzedaży t. Ekonomiczna interpretacja tego warunku przemawia do naszej wyobraźni: V'(t)
3. Zakładamy, że stopa inwestycji opisana jest funkcją I(t) = 12tm i że K(0) = 25. a. Znaleźć ścieżkę czasową dla zasobu kapitału K. b. Znaleźć wielkość akumulacji kapitału dla okresów (0, 1)i (1, 3).
464 ANALIZA DYNAMICZNA
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY 465
4. Dany jest ciągły strumień dochodów o stałej stopie 1000 $ rocznie. a. Jaka jest bieżąca wartość II, jeśli strumień dochodów trwa przez dwa lata, a ciągła stopa dyskontowa jest równa 0,05 rocznie? b. Jaka będzie wartość bieżąca II, jeśli strumień dochodów skończy się dokładnie po 3 latach, a stopa dyskontowa jest równa 0,04?
gdzie a:oznacza możliwości produkcyjne, czyli strumień potencjalnej produkcji w ciągu roku, a p oznacza proporcję możliwości produkcyjnych i kapitału. Wynika stąd, że gdy zasób kapitału jest równy K(t), wówczas gospodarka może osiągnąć roczną produkcję lub dochód równy K= p K dolarom. Zauważmy, że ze wzoru k = pK (funkcja produkcji) wynika, że d k = p d K oraz:
5. Jaka jest wartość bieżąca nieskończonego strumienia wpływów: (a) w wysokości 1450 $ rocznie, przy stopie dyskontowej r = 5%\ (b) w wysokości 2460 $ rocznie, przy stopie dyskontowej r = 8%?
(i3i4>
13.6. MODEL WZROSTU DOMARA W zagadnieniach dotyczących wzrostu populacji (13.1) i (13.2) oraz w zagadnieniu akumulacji kapitału (13.10) wspólnym celem był opis ścieżki wzrostu na podstawie danego schematu zmian zmiennej. W klasycznym modelu wzrostu profesora Domara4 idea polega na określeniu rodzaju ścieżki czasowej, jaka musi wystąpić, jeśli ma być spełniony warunek równowagi dla gospodarki.
Struktura Podstawowe przesłanki modelu Domara są następujące: 1. Każda zmiana rocznej stopy strumienia inwestycji I{t) będzie miała podwójny skutek: wpłynie na popyt zagregowany oraz na zdolności produkcyjne gospodarki. 2. Efekt popytowy zmiany 7(f) powstaje za pośrednictwem procesu mnożnikowego, który — jak się zakłada — działa natychmiast. Zatem wzrost I(t) spowoduje zwiększenie rocznej stopy strumienia dochodów Y(t) o pewną część przyrostu I(t). Mnożnik jest równy k = 1Is, gdzie s oznacza daną (stałą) krańcową skłonność do oszczędzania. Przy założeniu, że 7(0 jest jedynym (parametrycznym) strumieniem wydatków wpływającym na stopę strumienia dochodów, możemy wtedy napisać, że: (13.13)
d7 d 7 1 - = dt d is
3. Wpływ inwestycji na zdolności produkcyjne (ang. capacity effect of investment) należy mierzyć przy użyciu zmiany stopy potencjalnej produkcji, jaką gospodarka jest w stanie wytworzyć. Zakładając, że proporcja wydajności i kapitału jest stała, możemy napisać: K ~ =P
dA:
dK
W modelu Domara położenie równowagi jest zdefiniowane jako sytuacja, w której możliwości produkcyjne są w pełni wykorzystane. Osiągnięcie równowagi jest zatem równoważne spełnieniu wymagania, aby zagregowany popyt był dokładnie równy potencjal nej produkcji rocznej, tzn. Y= k . Jeśli „wystartujemy” od położenia równowagi, wymaganie to sprowadzi się do zrównoważenia odpowiednich zmian możliwości produkcyjnych i zagregowanego popytu, tzn.:
(13.15)
2 - ii. dt
dt
Jaki rodzaj ścieżki czasowej dla inwestycji I(t) może spełniać ten warunek równowagi w każdym momencie?
Znajdowanie rozwiązania Aby odpowiedzieć na zadane w ostatnim zdaniu pytanie, podstawiamy najpierw (13.13) i (13.14) do warunku równowagi (13.15). Otrzymujemy następujące równanie różniczkowe: (13.16)
czyli
Ponieważ (13.16) opisuje określony schemat zmian 7, więc na tej podstawie możemy znaleźć ścieżkę inwestycji zapewniającą równowagę. W tym prostym przypadku rozwiązanie można otrzymać bezpośrednio, całkując wzglę dem t obie strony ^drugiego równania z (13.16). Ponieważ obie strony równania są równe położeniu równowagi, więc ich całki też muszą być równe, a zatem: f 1 d7 J /d í
f J P íd í'
Po lewej stronie, na podstawie reguły podstawienia i reguły logaiytmów, otrzymujemy: (= stała),
4 Evsey D. Domar, Capital Expansion, Rate of Growth, and Employment, „Econometrica” 1946, April, s. 137-147; reprint w: E.P. Domar, Essays in the Theory of Economic Growth, Oxford University Press, Fair Lawn, N.J. 1957, s. 70-82.
df j = ln|7| + c1
(7*0),
po prawej stronie natomiast (ponieważ p s jest stałą) mamy: j p s d t = p st + c2. 30 — Podstawy...
46 6 ANALIZA DYNAMICZNA
DYNAMIKA EKONOMICZNA I RACHUNEK CAŁKOWY 467
Ponieważ lewa i prawa strona są sobie równe, więc po zsumowaniu stałych otrzymujemy: (13.17)
]n\I\ = p st + c.
Teraz na podstawie ln |/|, dzięki temu, że eMx = x, możemy znaleźć |/|. Gdy obie strony (13.17) wykorzystamy jako wykładnik e, wówczas otrzymamy: ebi\I\ _ ęipsf+c) czyli: \I\ = epstec= Aepsł,
gdzie
A = ec.
Jeśli przyjmiemy, że inwestycje, są dodatnie, to |/| = 7 i powyższy wynik przyjmuje postać I(t) ~AePst, gdzie A jest dowolne. Aby pozbyć się stałej dowolnej, do równania /(/) = A epst podstawiamy / = 0 i otrzymujemy 7(0) = A e°- A . Po tym wyznaczeniu wartości stałej możemy wyrazić rozwiązanie — czyli szukaną ścieżkę inwestycji — jako: (13.18)
/(i) = l(0)epst, s
gdzie 7(0) oznacza początkową stopę inwestycji5. Wynik ten ma niepokojący sens ekonomiczny. Aby utrzymać równowagę między możliwościami produkcyjnymi a popytem, stopa strumienia inwestycji musi mieć dokładnie wzrost wykładniczy o stopie równej ps, wzdłuż ścieżki pokazanej na rys. 13.6. Oczywiście wymagana stopa wzrostu będzie tym większa, im większe będą proporcja możliwości produkcyjnych do kapitału oraz krańcowa stopa wzrostu. Ale — w każdym razie — gdy znane są wartości p i s, wymagana ścieżka wzrostu inwestycji jest wytyczona bardzo sztywno.
Rysunek 13.6
Ostrze noża Należy teraz zapytać, co się stanie, gdy prawdziwa stopa wzrostu inwestycji — nazwijmy ją r — różni się od wymaganej stopy ps.
5 Rozwiązanie (13.18) pozostanie prawdziwe nawet wtedy, gdy przyjmiemy, że w równaniu |/| =Aopst inwestycje są ujemne. Por. ćwiczenie 13.6-3.
Podejście Domara polega na określeniu współczynnika użytkowania (coefficient of utilization): u — lim
[u - 1 oznacza pełne wykorzystanie zdolności produkcyjnych]
i pokazaniu, że u = r/ps, tak iż u = 1, gdy r = ps. Innymi słowy, jeśli występuje jakaś rozbieżność między prawdziwą stopą a stopą wymaganą ( r ï ps), to na końcu (przy będziemy mieć albo niedobór zdolności produkcyjnych (m> 1), albo nadwyżkę zdolności produkcyjnych (u< 1), w zależności od tego, czy r jest większe, czy mniejsze od ps. Możemy pokazać, że wniosek dotyczący niedoborów i nadwyżek możliwości produkcyj nych tak naprawdę obowiązuje w każdym momencie t, a nie tylko dla t —» ©<>. Jeśli bowiem dana jest stopa wzrostu r, to: /(i) = /(0)ert
i
— = r/(0)e". dt
\ '
Wobec tego na mocy (13.13) i (13.14) otrzymujemy: dY
1 d7
r
dt
s dt
s
dt
- p 7 (i) = p 7 ( 0 )e rt.
Proporcja tych dwu pochodnych: dY/dt
r
dK/dt
ps
określa wielkości względne efektu kreacji popytu i efektu kreacji możliwości produkcyjnych przez inwestycje, dla każdego momentu i, przy prawdziwej stopie wzrostu r. Jeśli (prawdziwa) stopa r przekracza ps (stopę wymaganą), io dY/dt > dK/dt i efekt dochodowy będzie przewyższał efekt dla możliwości produkcyjnych, co spowoduje niedobór tych możliwości. Jeśli, przeciwnie, r < p s, to popyt zagregowany będzie niewystarczający, a zatem wystąpi nadwyżka mocy produkcyjnych. Ciekawe w tym wniosku jest to, że jeśli inwestycje faktycznie rosną szybciej niż jest to wymagane (r > p s)* to końcowym rezultatem będzie niedobór, a nie nadwyżka możliwości produkcyjnych. Jest równie zaskakujące, że jeśli rzeczywisty wzrost inwestycji nie nadąża za wymaganym wzrostem (r < ps), to napotkamy nadwyżkę możliwości produkcyjnych, a nie ich niedobór. Rzeczywiście, ze względu na tak paradoksalne wyniki, jeśli pozwolimy przedsię biorcom dostosowywać rzeczywistą stopę wzrostu r (którą do tej pory traktowaliśmy jako ustaloną) do możliwości produkcyjnych, to najpewniej dokonają oni „niewłaściwych” dostosowań. Na przykład dla występującego r> p s niedobór możliwości produkcyjnych będzie stanowił motywację dla jeszcze wyższej stopy inwestowania. Ale to oznaczałoby wzrost r, zamiast redukcji, która w tych okolicznościach jest potrzebna. W rezultacie rozbieżność między dwiema stopami wzrostu zamiast zmaleć, jeszcze bardziej się zwiększy. Rozwiązanie polega na tym, że dla danych stałych parametrycznych p i s jedynym sposobem uniknięcia zarówno niedoborów, jak i nadwyżek mocy produkcyjnych, jest pokierowanie strumienia inwestycyjnego — zawsze niezmiernie uważnie — wzdłuż ścieżki
468 ANALIZA DYNAMICZNA
równowagi ze stopą wzrostu r= ps. Jak pokazaliśmy, jakiekolwiek odchylenie od takiej ścieżki czasowej ustawionej „na ostrzu noża” uniemożliwia spełnienie normy pełnego wykorzystania zdolności produkcyjnych, zawartej przez Domara w tym modelu. Nie jest to prawdopodobnie nazbyt zachęcająca perspektywa. Na szczęście dzięki modyfikacji pewnych założeń modelu Domara możliwe są bardziej elastyczne wyniki, co zobaczymy w modelu wzrostu podanym przez profesora Solowa, który omówimy w następnym rozdziale.
Ćwiczenie 13.6 1. Ile czynników produkcji uwzględniono w jawny sposób w modelu Domara? Co z tego wynika dla proporcji kapitału i pracy w procesie produkcji.
14. CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU
2. W podrozdz. 10.2 dowiedzieliśmy się, że stała r w funkcji wykładniczej Ąen reprezentuje stopę wzrostu funkcji. Zastosować to do (13.16) i bez całkowania wyprowadzić (13.18). 3. Pokazać, że nawet wtedy, gdy w równaniu |/|= A e p5i przyjmiemy ujemną wielkość inwestycji, przy określaniu wartości stałej A otrzymamy w końcu rozwiązanie (13.18). 4. Pokazać, że wynik podany w (13.18) można również otrzymać w rezultacie obliczenia — i porównania — całek oznaczonych obu stron (13.16): ld I l d t ~ pS względem zmiennej t, z granicami całkowania t = 0 i t = t. Trzeba przy tym pamiętać, że gdy zmienną całkowania t zastępujemy zmienną /, wówczas granice całkowania / = 0 i t = t należy zastąpić odpowiednio przez 1=1(0) i / = /(/).
W modelu wzrostu Domara (podrozdz. 13.6) występowały proste równania różniczkowe, które rozwiązywaliśmy za pomocą bezpośredniego całkowania. Dla bardziej skomplikowanych równań różniczkowych istnieją różne ustalone metody rozwiązywania. Ale i w tych przypadkach podstawą jest technika rachunku całkowego. Z tego względu rozwiązanie równania różniczkowego jest często nazywane całką tego równania. W tym rozdziale omówimy tylko równania różniczkowe pierwszego rzędu. Rząd równania oznacza najwyższy rząd pochodnych (lub różniczek) występujących w równaniu różniczkowym. Równanie różniczkowe pierwszego rzędu może zatem zawierać tylko pierwszą pochodną, np, dy/di.
14.1. LINIOWE RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU O STAŁYCH WSPÓŁCZYNNIKACH I STAŁYM WYRAZIE WOLNYM i Pierwsza pochodna dy/d/ jest jedyną pochodną, jaka może występować w równaniu różniczkowym pierwszego rzędu, ale może się pojawić w różnych potęgach: dy/d/, (dy/d/)2lub (dy/d/)3. Najwyższy stopień potęgi pochodnej w danym równaniu nazywamy stopniem równania różniczkowego. Gdy pochodna dy/d/ występuje tylko w pierwszej potędze, tak samo jak dla zmiennej y, i nie pojawia się iloczyn postaci y (dy/d/), wtedy mówimy, że równanie jest liniowe. Liniowe równanie różniczkowe pierwszego rzędu będzie miało zatem ogólną postać*:
1 Zwróćmy uwagę, że pochodna dy/d/ w (14.1) ma współczynnik równy jedności. Nie oznacza to, że nigdy nie może mieć innego współczynnika. Jeśli jednak pojawi się współczynnik różny od 1, to zawsze możemy podzielić równanie przez ten współczynnik i w ten sposób „znormalizować” je. Z tego względu postać (14.1) może być traktowana jako zapis ogólny.
4 70 ANALIZA DYNAMICZNA
(14.1)
/
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 471
Przypadek niejednorodny
^ + u(t)y = w(t), at
gdzie u i w są dwiema funkcjami t, podobnie jak y. W przeciwieństwie do dy/dt i y nie nakła damy żadnych ograniczeń na zmienną niezależną t. Zatem funkcje u i w mogą reprezento wać takie wyrażenia, jak i 2, e* i jeszcze bardziej skomplikowane funkcje i; w i w mogą być również stałe. Ten ostatni fakt prowadzi do dalszej klasyfikacji. Jeżeli funkcja u (współczynnik przy zmiennej zależnej y) jest stałą i funkcja w jest stałym składnikiem, to (14.1) sprowadza się do szczególnego rodzaju liniowego równania różniczkowego pierwszego rzędu o stałym współczynniku i stałym wyrazie wolnym. W tym podrozdziale zajmiemy się wyłącznie tym prostym typem równania różniczkowego.
Przypadek jednorodny Jeśli u i ir są stałe i jeśli w jest stale równe zeru, to (14.1) przyjmuje postać: (14.2)
dy —+
= 0,
•
gdzie a jest pewną stałą. Takie równanie różniczkowe, ze względu na zerowy wyraz wolny, nazywamy równaniem jednorodnym (por. jednorodny układ równań). Dokładniej, równanie to jest jednorodne, gdyż każdy jego składnik jest wyrażeniem stopnia pierwszego względem y i dy/dt; w szczególności stała 0 — w przeciwieństwie do wszystkich innych stałych — może być traktowana jako wyrażenie pierwszego stopnia względem y, ponieważ Oy = 0. Równanie (14.2) można również zapisać jako: (14.20
y dt
- T = ~ a-
Czytelnik zapewne zauważył, że równanie różniczkowe (13.16), występujące w modelu Domara, miało dokładnie taką postać. Wobec tego przez analogię możemy natychmiast napisać następujące rozwiązania (14.2) lub (14.20: (14.3)
y(t)= Ae~ai,
(14.30
y(t) = y (0)e~".
[rozwiązanie ogólne]
Jeśli w (14.2) zamiast zera mamy stałą niezerową, to otrzymujemy niejednorodne liniowe równanie różniczkowa: dy ~ + ay = b. dt
(14.4)
Rozwiązanie tego równania stanowi sumę dwu składników. Pierwszym jest funkcja uzupełniająca (complementary function) oznaczona symbolem yc, a drugim całka szczególna (particular integral) oznaczona symbolem yp. Pokażemy, że każdy z nich ma ważną interpretację ekonomiczną. Przedstawimy tu jedynie metodę rozwiązania, a jej uzasadnienie wyjaśnimy później. Chociaż naszym celem jest rozwiązanie równania niejednorodnego (14.4), często będziemy się jednak odwoływać do jego wersji jednorodnej podanej w (14.2). Dla ułatwienia będziemy je nazywać zredukowanym równaniem dla (14.4). Równanie niejednorodne (14.4) można wobec tego nazwać równaniem całkowitym. Okazuje się, że funkcja uzupełniająca yc jest ogólnym rozwiązaniem równania zredukowanego, podczas gdy całka szczególna ypjest po prostu dowolnym szczególnym rozwiązaniem równania całkowitego. Omawiając przypadek jednorodny, otrzymaliśmy już rozwiązanie równania zredukowa nego; możemy zatem napisać: yc = Ae-*.
[z (14.3)]
Co można powiedzieć o całce szczególnej? Ponieważ jest ona dowolnym szczególnym rozwiązaniem równania pełnego, możemy najpierw wypróbować najprostszy możliwy rodzaj rozwiązania, mianowicie y równe stałej (y = k). Jeśli y jest stałe, to dy/dt = 0 i (14.4) przyj muje postać a y = b , z rozwiązaniem y = b/a. Zatem stała będzie dobrym rozwiązaniem tylko wtedy, gdy a& 0. Mamy w tym przypadku: y
= ~
y
a
(a* 0).
Suma funkcji dopełniającej i całki szczególnej stanowi ogólne rozwiązanie całkowitego równania (14.4):
[rozwiązanie szczególne]
W (14.3) występuje dowolna stała A: jest to zatem rozwiązanie ogólne. Gdy zamiast A podstawimy jakąkolwiek konkretną wartość, to otrzymujemy rozwiązanie szczególne (14.2). Istnieje nieskończenie wiele rozwiązań szczególnych, po jednym dla każdej możliwej wartoś ci A, w tym dla wartości y (0). Ta ostatnia wartość ma jednak specjalne znaczenie: y(0) jest jedyną wartością, dla której otrzymujemy rozwiązanie spełniające warunek początkowy. Ponieważ jest to wynik określenia wartości stałej dowolnej, więc (14.30 będziemy nazywali dokładnie określonym (konkretnym) rozwiązaniem (definite solution) równania różniczkowego (14.2) lub (14.20. Należy dostrzec dwa fakty dotyczące rozwiązania równania różniczkowego: (1) roz wiązanie nie jest wartością numeryczną, ale funkcją y(t) — pewną ścieżką czasową, jeśli t oznacza czas, i (2) w rozwiązaniu y(t) nie występuje wyrażenie zawierające pochodne lub różniczki, zatem po podstawieniu konkretnej wartości t można bezpośrednio obliczyć odpowiednią wartość y.
(14.5)
y (t) = yc 4 y - AoT* + - . a
[rozwiązanie ogólne, gdy a * 0]
Jest to rozwiązanie ogólne, gdyż występuje tu dowolna stała A. Możemy oczywiście wyznaczyć wartość tej stałej za pomocą warunku początkowego. Powiedzmy, że y przyj muje wartość y(0) dla t - 0. Wtedy podstawiając i = 0 do (14.5) otrzymujemy: b y(0) = A + a
i
b A = y (0 ) — , a
a zatem (14.5) możemy przepisać w postaci:
(14.50
>’(0 = [y (0 )--le " * i + - . L
a-l
a
[rozwiązanie określone, gdy a ^ 0]
4 7 2 ANALIZA DYNAMICZNA
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 473
Należy podkreślić, że wykorzystanie warunku początkowego do określenia wartości stałej dowolnej jest — i powinno być — ostatnim krokiem po znalezieniu całkowitego rozwiązania równania. Ponieważ wartości y c i yp zależą od wartości y(0), więc muszą być uwzględnione przy określaniu wartości stałej A. Przykład 1. Rozwiązać równanie dy/d/ + 2y = 6, przy warunku początkowym y(0) = 10. Mamy t u a = 2 i h = 6, zatem na mocy (14.50 rozwiązanie jest równe: y(/) = (10-3)e“2#+ 3 = 7e“2i + 3. Przykład 2. Rozwiązać równanie dy/d/ + 4y = 0 przy warunku początkowym y(0) = 1. Ponieważ a = 4 i b = 0, więc otrzymujemy: y(/) = (1 - 0)e~4i + 0 = e~4i.
= - a[ y ( ° ) ~ ] e -
Gdy to wyrażenie dla dy/d/ i wyrażenie dla y(/) podane w (14.5') podstawimy do lewej strony równania różniczkowego (14.4) i okaże się, że strona ta będzie równa stałej b występującej po prawej stronie równania, wówczas rozwiązanie jest prawdziwe. Wykonując to podstawienie, otrzymujemy:
a zatem nasze rozwiązanie jest prawdziwe, jeśli spełnia również warunek początkowy. Aby to sprawdzić, podstawiamy / = 0 do rozwiązania (14.5'). Ponieważ otrzymujemy tożsamość:
y(/) = h/ + c,
yc = AeT* = Ae° = A.
[A = stała]
Jeśli chodzi o całkę szczególną, to fakt, że stałe rozwiązanie y = k nie jest tu odpowiednie sugeruje, że należy wypróbować rozwiązanie różne od stałej. Rozważmy najprostszy możliwy typ takiego rozwiązania, mianowicie y = kt. Jeśli y = kt, to dy/d/ - k i równanie całkowite (14.6) sprowadzi się do k = b, więc możemy napisać: yp = bt
y(/) = yc + yp = A + bt,
[rozwiązanie ogólne, gdy a = 0]
które jest identyczne z wynikiem (14.7) i gdzie A i c są po prostu innymi oznaczeniami tej samej dowolnej stałej. Zwróćmy jednak uwagę na to, że teraz yc jest stałe, a yp jest funkcją czasu — jest to sytuacja całkowicie przeciwna niż w (14.5). Określając wartość stałej dowolnej, otrzymujemy rozwiązanie określone: y(/) = y(0) + bt.
y ( 0 ) = f " y ( 0 ) - - l+ - = y ( 0 ) , L aJ a więc warunek początkowy jest rzeczywiście spełniony. Radzimy Czytelnikowi, aby jako końcowy etap rozwiązania równania różniczkowego sprawdzał prawidłowość odpowiedzi poprzez upewnienie się, że: (1) pochodna ścieżki czasowej y(/) jest zgodna z podanym równaniem różniczkowym i (2) określone rozwiąza nie spełnia warunek początkowy. «
Ćwiczenie 14.1
(a = 0).
Nasze nowe próbne rozwiązanie naprawdę działa. Rozwiązaniem ogólnym dla (14.6) jest wobec tego:
(14.7")
Jest prawdą, że wszystkie rozwiązania równań różniczkowych można sprawdzić za pomocą różniczkowania. Wypróbujemy to dla rozwiązania (14.50; otrzymamy pochodną:
r * + - \ = b,
gdzie c jest dowolną stałą. Dwa składniki w (14.7) można również potraktować jako funkcję uzupełniającą i całkę szczególną danego równania różniczkowego. Ponieważ a = 0, więc funkcja uzupełniająca może być wyrażona po prostu jako:
(14.7')
Weryfikacja rozwiązania
dy -£ = b. dz
Można łatwo znaleźć jego rozwiązanie ogólne metodą bezpośredniego całkowania: (14.7)
y(0 = 5 + 2/.
|
Tę samą odpowiedź mogliśmy otrzymać z (14.30, czyli ze wzoru dla przypadku jednorodnego. Równanie jednorodne (14.2) jest po prostu szczególnym przypadkiem równania niejednorodnego (14.4) dla b - 0. W rezultacie wzór (14.30 jest szczególnym przypadkiem (14.50 przy warunku b = 0. Co się stanie, gdy a = 0, tzn. gdy rozwiązanie (14.50 nie jest zdefiniowane? W tym przypadku równanie różniczkowe ma szczególnie prostą postać: (14.6)
Przykład 3. Rozwiązać równanie dy/d/= 2 przy warunku początkowym y(0) = 5. Na mocy (14.7") rozwiązaniem jest:
[rozwiązanie określone, gdy a = 0]
1. Znaleźć yc, yp, rozwiązanie ogólne i rozwiązanie określone, jeśli wiadomo, że: (a) J + 4y = 12; a/ ( b ) § - 2 y = 0; a/
at >(0) = 9;
{y0) = 2;
(d) 2 ^ + 4y = 6; at
(c) J + lOy = 15; y(0) = 0; y(D) = 1 ^ 2
2. Sprawdzić odpowiedzi do poprzedniego zadania. 3. Znaleźć rozwiązanie dla każdego z podanych przykładów, korzystając z podanych w tekście wzorów:
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 475
474 ANALIZA DYNAMICZNA
(a) ^ + y = 4; dt (b) ^ = 23; di
y(0) = 0;
y(0) = 1;
(c) ^ - 5 y = 0; at 4.
(d)
u/
+ 3y = 2;
(e) § J - 7 y = 7; ox
y(0) = 6;
Ścieżka czasowa
y(0) = 4;
Aby odpowiedzieć na to pytanie, musimy przede wszystkim znaleźć ścieżkę czasową P(t). Ale to z kolei wymaga, aby określić strukturę zmian cen. Ogólnie rzecz biorąc, ceny są wyznaczone przez relatywną moc oddziaływania sił popytu i podaży na rynku. Załóżmy dla uproszczenia, że stopa zmian cen (względem czasu) w każdym momencie jest zawsze wprost proporcjonalna do nadwyżki popytu (Qd - Qs) występującej w tym momencie. Taka struktura zmian może być wyrażona symbolicznie jako:
y(0) = 7;
(f) 3 - ^ + 6y = 5; ui
y(0) = 0.
Sprawdzić odpowiedzi do poprzedniego zadania. (14-10)
14.2. DYNAMIKA CEN RYNKOWYCH W modelu (makro) wzrostu Domara zastosowano jednorodne liniowe równania różniczkowe pierwszego rzędu. Aby podać przykład nieliniowego równania, przedstawimy dynamiczny model rynku (mikro).
dP idi rriO Ł -a )
O*>0),
gdzie j reprezentuje (ustalony) współczynnik dostosowania (adjustment coefficient). Dla takiej struktury zmian możemy otrzymać dP/dt = 0 wtedy i tylko wtedy, gdy Qd = Qs. W związ ku z tym zwróćmy uwagę na dwa znaczenia terminu cena równowagi: znaczenie między okresowe (P jest stała w czasie) i znaczenie związane z „oczyszczeniem” rynku (cena równowagi to taka cena, która powoduje zrównanie Qd z Qs). W rozważanym modelu oba znaczenia są takie same, ale nie musi to być prawdą dla wszystkich modeli. Na mocy funkcji popytu i podaży (14.8) możemy dokładniej wyrazić (14.10) w postaci: dP - = j ( a - p P + y - SP) = j(a + y ) - j ( p + S)P,
Struktura czyli: Załóżmy, że dla pewnego dobra funkcje popytu i podaży mają następującą postać: . (14.10') Q o= cc- P p Qs = - y + S P
( « ./* > 0). ( y ,S > 0),
■ P=
CC ~ł- y
P+ 8
'
■
.j-f
[= pewnej stałej dodatniej] 'M
Jeśli zdarzy się, że początkowa cena P(0) jest dokładnie równa P, to rynek będzie oczywiście w położeniu równowagi i nie będzie potrzebna analiza dynamiczna. W bardziej interesującym przypadku P (0 ) * P , jeśli P jest osiągalne, to tylko po odpowiednim pro cesie dostosowania, podczas którego zmienią się nie tylko cena, lecz również Qd i Qs jako funkcje P. Wobec tego wszystkie zmienne wyrażające ceny i ilości mogą być traktowane jako funkcje czasu. Nasze pytanie dotyczące dynamiki brzmi tak: jeśli jest dość czasu na to, aby dokonał się proces dostosowania, to czy ceny zostaną sprowadzone do cen równowagi P , tzn. czy ścieżka czasowa Pif) dąży do P przy / —»<*>? , ■
•
S )P = j(a + y).
Ponieważ jest to dokładnie postać równania różniczkowego (14.4) i ponieważ współczyn nik przy P jest różny od zera, więc możemy zastosować wzór (14.50 i zapisać rozwiązanie — ścieżkę czasową — jako:
zatem zgodnie z (3.4) cena równowagi będzie rów na2: (14.9)
dP
... *V-' 2 Zastąpiliśmy symbole (a, b, c, d) z (3.4) symbolami (a , p, y; ó), aby uniknąć możliwych nieporozumień związanych z występowaniem a i b jako parametrów równania różniczkowego (14.4), które teraz zastosujemy do modelu rynku. V M;.
( » .i«
'
= [/,( 0 ) - P ] e - fa+ P .
(z (14.9);
£)]
Dynamiczna stabilność równowagi Postawione wcześniej pytanie, czy P(t) —>P przy / —>©o, sprowadza się w końcu do pytania, czy pierwszy składnik po prawej stronie (14.11) będzie dążył do zera przy / —»«>. Ponieważ P (0) i P są stałe, więc kluczowym czynnikiem jest wyrażenie wykładnicze cTh. Ponieważ k > 0, więc wyrażenie to dąży do zera przy t —>°o. W rezultacie, przy założeniach przyjętych w naszym modelu, ścieżka czasowa będzie rzeczywiście „prowadzić” cenę w kierunku położenia równowagi. W tego rodzaju sytuacji, gdy ścieżka czasowa rozważanej zmiennej P(t) jest zbieżna do poziomu P — interpretowanego tu w roli międzyokresowego (a nie czyszczącego rynek) położenia równowagi — mówimy, że położenie równowagi jest dynamicznie stabilne.
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 477
476 ANALIZA DYNAMICZNA
Pojęcie dynamicznej stabilności jest bardzo ważne. Zbadajmy je dokładniej poprzez szczegółową analizę (14.11). Rozwiązanie (14.11), zależne od względnej wielkości P(0) i P , obejmuje trzy możliwe przypadki. Po pierwsze, gdy P(0) = P, wówczas wynika stąd, że P(0 = P. W tym przypadku ścieżka czasowa dla ceny ma wykres na rys. 14.1 w postaci poziomej linii prostej. Jak wcześniej wspomniano, osiągnięcie położenia równowagi jest wtedy faktem dokonanym. Po drugie, może się zdarzyć, że P (0 )> P . W tym przypadku pierwszy składnik po prawej stronie (14.11) jest dodatni, ale będzie się zmniejszał w miarę tego, jak wzrost t obniża wartość e“**. Zatem ścieżka czasowa będzie się przybliżać do po ziomu równowagi od góry, co zilustrowano za pomocą górnej krzywej na rys. 14.1. Po trzecie, w przypadku przeciwnym, gdy P(0) < P, ścieżka będzie się przybliżać do poziomu równowagi od dołu, co pokazano za pomocą dolnej krzywej na tym samym rysunku. Ogólnie, aby wystąpiła dynamiczna stabilność, odchylenie ścieżki czasowej od położenia równowagi musi albo być tożsamościowo równe zeru (jak w przypadku 1), albo stale zmniejszać się w miarę upływu czasu (jak w przypadkach 2 i 3).
Odpowiedź na to pytanie jest zawarta w rozwiązaniu (14.11): Jeśli przyjmiemy P(0) ^ P, to zauważymy, że pierwszy składnik w (14.11) (yc) będzie dążyć do zera przy wtedy i tylko wtedy, gdy k > 0, tzn. wtedy i tylko wtedy, gdy:
j(P+8)>0. Tę ostatnią nierówność możemy przyjąć jako wymagane ograniczenie dotyczące parametrów j (współczynnika dostosowania dla ceny), fi (liczby przeciwnej do nachylenia krzywej popytu, której wykres sporządzono dla Q na osi pionowej) i 8 (nachylenia krzywej podaży, której wykres sporządzono w taki sam sposób). W przypadku gdy dostosowanie ceny ma typ „normalny” , dlay > 0, tak iż nadwyżka popytu powoduje zwiększenie, a nie zmniejszenie ceny, ograniczenie to przyjmuje postać {/3+ 8 ) > 0 lub równoważnie:
8>-p. Aby uzyskać w tym przypadku dynamiczną stabilność, nachylenie krzywej podaży musi przekraczać nachylenie krzywej popytu. Gdy podaż i popyt mają normalne nachylenia (~fi> 0, 8> 0), tak jak w (14,8), warunek ten jest oczywiście spełniony. Ale nawet jeśli jedna z krzywych ma „przewrotne” nachylenie, warunek wciąż może być spełniony. Na przykład jest spełniony dla 8 - 1 i ~ p - 1/2 (przy dodatnim nachyleniu popytu); tę sytuację pokazano na rys. 14.2, gdzie cena równowagi P jest — jak zwykle — wyznaczo na przez punkt przecięcia dwu krzywych.
Rysunek 14.1 Porównując (14.11) z (14.5') widzimy, że składnik P, odpowiednik b/a, jest całką szczególną yp, podczas gdy składnik wykładniczy jest (dokładnie określoną) funkcją uzupełniającą yc. Otrzymujemy zatem ekonomiczną interpretację yć i yp\ całka szczególna yp reprezentuje międzyokresowy poziom równowagi odpowiedniej zmiennej, a funkcja uzupeł niająca yc jest odchyleniem od równowagi. Dynamiczna stabilność wymaga, aby funkcja uzupełniająca asymptotycznie znikała, gdy t dąży do nieskończoności. W tym modelu całka szczególna jest stałą, więc mamy stacjonarne położenie równowagi w sensie międzyokresowym, reprezentowane przez P. Jeśli całka szczególna nie jest stała, tak jak w (14.70, to możemy ją interpretować jako zmieniające się położenie równowagi (moving equilibrium).
Alternatywne zastosowanie modelu Powyżej zanalizowaliśmy dynamiczną stabilność równowagi (zbieżność ścieżki czasowej), gdy znane były znaki parametrów, Alternatywne pytanie brzmi: jakie szczególne ograniczenia należy nałożyć na parametry, aby zapewnić dynamiczną stabilność?
Rysunek 14.2
Jeśli pierwotna cena wypada w punkcie P v to Qd (odległość P XG) będzie większa niż Qs (odległość P XF) i nadwyżkowy popyt (FG) spowoduje wzrost ceny. Jeśli natomiast początkowa cena ma wartość P2, to wystąpi ujemna nadwyżka popytu MN, która spowoduje spadek ceny. Wobec tego, niezależnie od punktu startu, dostosowanie ceny będzie w tym przypadku zawsze skierowane w stronę położenia równowagi, co pokazano za pomocą dwu
478 ANALIZA DYNAMICZNA
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 479
strzałek na rysunku. Musimy jednak podkreślić, że strzałki wskazują jedynie kierunki zmian, a nie ich wielkości. Rysunek 14.2 jest więc statyczny, a nie dynamiczny; stanowi on jedynie ilustrację i nie może zastąpić analizy dynamicznej przedstawionej powyżej.
14.3. ZMIENNY WSPÓŁCZYNNIK I ZMIENNY WYRAZ WOLNY W ogólniejszym przypadku liniowego równania różniczkowego pierwszego rzędu:
Ćwiczenie 14,2
(14.12)
1. Gdyby popyt i podaż na rys. 14.2 miały nachylenie ujemne, to która krzywa musiałaby być bardziej stroma, aby zapewnić dynamiczną stabilność? Czy odpowiedź jest zgodna z kryterium S > - f i l 2. Pokazać, że (14.10') można przepisać w postaci dP/dt + k ( P - P ) = 0. Jeśli oznaczymy P - P = A (co oznacza odchylenie), tak iż dA/d/ = dP/dt. to równanie różniczkowe będzie można zapisać w postaci: dA - ~ + kA = 0. dt Znaleźć ścieżkę czasową A(/) i omówić warunki dynamicznej stabilności. 3. Dynamiczny model rynku omówiony w tym podrozdziale ma strukturę bardzo podobną do modelu statycznego z podrozdz. 3.2. Jaka szczególna nowa cecha powoduje przekształ cenie modelu statycznego w dynamiczny? 'K
4. Niech popyt i podaż będą równe: dP Qd = a - p P + (7-— ; dt
Qs = - y + S P
( a ,p , y , S > 0 ) .
*
a. Znaleźć ścieżkę czasową P(t) (rozwiązanie ogólne) przy założeniu, że stopa zmian ceny w czasie jest wprost proporcjonalna do nadwyżkowego popytu. b. Jaka jest międzyokresowa cena równowagi? Jaka jest cena równowagi czyszcząca rynek? c. Jaki warunek nałożony na a zapewni dynamiczną stabilność? 5. Niech popyt i podaż będą równe; dP Qd = a - p P - n — \ QS = 8P
di
..
i,f7, <5> 0).
,-g:v
a. Zakładając, że rynek jest czyszczony w każdym momencie, znaleźć ścieżkę czasową P(t) (rozwiązanie ogólne). b. Czy dla tego rynku istnieje cena wyznaczająca dynamicznie stabilne międzyokresowe położenie równowagi? ^ ; c. Założenie, że Qd= Q s dla każdego i, przyjęte w obecnym modelu, jest identyczne z założeniem dla statycznego modelu rynku analizowanego w podrozdz. 3.2. A jednak mamy tu do czynienia z modelem dynamicznym. Jak to się stało?
2/- + u{t)y = w(t)
u(t) i w(t) reprezentują odpowiednio zmienny współczynnik i zmienny wyraz wolny. Jak w tym przypadku znajdujemy ścieżkę czasową?
Przypadek jednorodny Dla przypadku jednorodnego, gdy w(t) = 0, otrzymanie rozwiązania nie sprawia większych kłopotów. Ponieważ równanie różniczkowe ma postać: (14.13)
^ + «(f)y = 0 dt
lub
ł ^ = -M(i), y dt
więc całkując obie strony względem t, otrzymujemy: f 1 dy fdy lewa strona = I - — dt= — = ln y 4- c (przy założeniu y > 0), J y dt J y prawa strona = j - u(t)dt = - ju ( t ) d t . W ostatnim równaniu nie mpżna kontynuować całkowania, ponieważ funkcji u(t) nie nadano konkretnej postaci; musimy się zatem zadowolić takim ogólnym wyrażeniem całkowym. Gdy przyrównamy obie strony, otrzymamy następujący wynik: lny = - c -Jw (/)d /. Można zatem znaleźć ścieżkę czasową, obliczając antylogarytm lny: (14.14)
(a ,
dt
y(i) = elny = e-ce-i“(‘)d'= A e - Ju(')d',
x
gdzie A = e-*. Jest to ogólne rozwiązanie równania różniczkowego (14.13). Aby podkreślić, że współczynnik u(t) jest zmienny, wpisywaliśmy dotychczas argu ment t. Od tej pory — dla uproszczenia — będziemy pomijać argument i skrócimy u (/) do u. W porównaniu z ogólnym rozwiązaniem (14.3) dla przypadku stałych współczynników jedyną modyfikacją w (14.14) jest zastąpienie wyrażenia e-0' przez bardziej skomplikowane wyrażenie e~^ud/. Uzasadnienie tej zmiany może być bardziej zrozumiałe, jeżeli będziemy interpretować wykładnik at w e"^ jako całkę: Jad / = at (plus stała, która może być włączona do składnika A, ponieważ e podniesione do stałej potęgi jest również stałe), W świede tego dwa ogólne rozwiązania okazują się być podobne. W obu przypadkach bierzemy bowiem współczynnik stojący przy y w równaniu różniczkowym — stałą a w pierwszym przypadku i zmienne wyrażenie u w drugim — i całkujemy względem /, a następnie liczbę przeciwną do otrzymanej całki traktujemy jako wykładnik e. Gdy mamy już rozwiązanie ogólne, łatwo otrzymamy konkretne rozwiązanie przy użyciu odpowiedniego warunku początkowego.
4 8 0 ANALIZA DYNAMICZNA
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 481
dy • /Przykład 1. Znaleźć ogólne rozwiązanie równania — + 3 /^ = 0. Mamy tu u = 3t2
metodę zastosowania wzoru (14.15) bez stałych k i e oraz sprawdził, że rozwiązanie będzie takie samo. dy Przykład 3. Rozwiązać równanie — + Aty —4/. Tym razem pominiemy stałe całkowania.
i ju d t - j s f d t = t3 + c, a więc możemy zapisać równanie w postaci: y(t) = Ae“
gdzie B = Ae~°.
Ponieważ:
Zauważmy, że gdybyśmy pominęli stałą całkowania c, nie utracilibyśmy żadnej informacji, gdyż otrzymalibyśmy wtedy y(/)=A e~/3, co jest w istocie tym samym roz wiązaniem, gdyż A i B są dowolnymi stałymi. Innymi słowy, wyrażenie e~°, które jest jedy nym miejscem, gdzie pojawia się stała c, zawszę może być włączone do stałej A.
w= 4r,
Jwd/ = 2/2,
w = 4/;
[pomijamy stałą]
więc ogólne rozwiązanie, na podstawie (14.15), ma postać: y (i) = e-2*2| a +j 4 /e 2i2di = e“2'2(A + e2/2) = Ae~2'2+ 1.
Przypadek niejednorodny Dla przypadku niejednorodnego, gdy w(t) * 0, uzyskanie rozwiązania nie jest tak łatwe. Spróbujemy je znaleźć za pośrednictwem zupełnego równania różniczkowego, które omówi my w następnym podrozdziale. Teraz podamy gotowy wynik: dla danego równania różniczkowego (14.12) rozwiązaniem ogólnym jest: (14.15)
Y(i) = e-,“d,^A + Jw eJ“d’df ,
gdzie A jest dowolną stałą, której można nadać ustaloną wartość, jeśli dysponujemy odpowiednim warunkiem początkowym. Jest interesujące, że to rozwiązanie ogólne, podobnie jak rozwiązanie w przypadku, gdy
Jak można się było spodziewać, pominięcie stałych znakomicie uprościło procedurę. , m. dy Równanie różniczkowe +uy = w zapisane w (14.12) jest ogólniejsze niż równanie dt dy różniczkowe ~ ^+ay = b podane w (14.4), ponieważ u i w — w przeciwieństwie do a i b — nie muszą być stałe. Zgodnie z tym wzór (14.15) jest również bardziej ogólny od wzoru (14.5). W istocie, gdy przyjmiemy u - a i w = b, wówczas (14.15) powinno zredukować się do (14.5). Jest tak rzeczywiście. Jeżeli bowiem mamy: u-a\
J iudt = t2+ k
|a
y(i) =
Jwd/ = at
[pomijamy stałą]
j
t~a + Jiie^di =
= e-‘“ |A + ^ e a'j =
dy Przykład 2. Znaleźć ogólne rozwiązanie równania — + 2 ty = t. Mamy tutaj: dt w = t;
i
w =b
to (14.15) przyjmuje postać:
współczynnik i wyraz wolny są stałe, również składa się z dwu składników. Jeden z nich (e"^Mdi) jest rozwiązaniem ogólnym równania zredukowanego (jednorodnego) otrzymanego wcześniej w (14.14), a zatem ma naturę funkcji uzupełniającej.
u = 2t\
[pomijamy stałą]
[pomijamy stałą]
b =A e-“ + - , a
(k dowolne).
Na podstawie (14.15) otrzymujemy:
co jest identyczne z (14.5).
y (t) = e '(/2+*) A + ^ t e f2+kdt = e~t2e~k IA + ekj t e (2dt = / v / \ 1 = Ae ke *2+ e~{ 2 e*2+ c =
Ćwiczenie 14.3
€
[e“V = l ]
= (Ae~*+ c) e-'2+ ^ = Re-'2 + - , gdzie B=Ae~k+c jest dowolne. Rozwiązanie to można sprawdzić za pomocą różniczko wania. Jest interesujące, że w tym przykładzie ponownie moglibyśmy pominąć stałe całkowania k oraz c, bez zmiany końcowego wyniku. Jest tak, ponieważ k i c mogą być włączone do dowolnej stałej B w końcowym rozwiązaniu. Zalecamy, aby Czytelnik wypróbował prostszą
Rozwiązać następujące liniowe równania różniczkowe pierwszego rzędu; jeśli podany jest warunek początkowy, to określić wartość stałej dowolnej: dy 1. -£ + 5 ^ = 1 5 . dt dy 2. — + 2 ty —0. di dy
3- ^+2/y = f; 3 1 — Podstawy...
3
y(0)=
y
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 483
4 82 ANALIZA DYNAMICZNA
4. ^ + / 2y = 5í2; at
i N = dF/dt. Z twierdzenia Younga, które mówi, że d2F/dtdy = d2F/dydty wynika, że (14.17) jest zupełne wtedy i tylko wtedy, gdy:
y(0) = 6.
5. 2 ^ + 1 2 y + 2 e ' = 0; df
y(0) = ^ . /
< -* >
, dy 6 .s + , - , .
* -? •
To ostatnie równanie umożliwia w prosty sposób sprawdzenie zupełności równania różniczkowego. Dla (14.16), gdzie M - 2 y t i N = y 2J mamy dM/dt - 2 y - dNldy; spraw dziliśmy zatem, że podane równanie jest zupełne. Zwróćmy uwagę, że na wyrażenia M i A nie nałożono żadnych ograniczeń dotyczących sposobu występowania zmiennej y. Zatem zupełne równanie różniczkowe może równie dobrze być równaniem nieliniowym (względem y). Niemniej jednak zawsze będzie równaniem pierwszego rzędu i pierwszego stopnia. Równanie różniczkowe, jeśli jest zupełne, mówi po prostu, że:
14.4. ZUPEŁNE RÓWNANIA RÓŻNICZKOWE Omówimy teraz pojęcie zupełnego równania różniczkowego i wykorzystamy związaną z nim metodę rozwiązania do wyprowadzenia wzoru (14.15) podanego powyżej dla równania różniczkowego (14.12). Chociaż naszym bezpośrednim celem jest zastosowanie go do rozwiązania liniowego równania różniczkowego, to jednak równanie różniczkowe zupełne samo może być albo liniowe, albo nieliniowe."
zatem jest jasne, że jego rozwiązanie ogólne powinno mieć postać:
Zupełne równania różniczkowe
Rozwiązywanie zupełnego równania różniczkowego oznacza wobec tego, że szukamy funkcji pierwotnej F (y , t) i przyrównujemy ją do dowolnej stałej. Opiszemy metodę takiego postępowania dla równania M dy+Ndt = 0.
d F (y ,/) = 0,
F ( y ,t) = c.
Dana jest funkcja dwu zmiennych F (y, /); jej różniczka zupełna jest równa: dF
Metoda rozwiązania
dF
d F i y,t) = - d y + - d ,
Równanie otrzymane w wyniku przyrównania tej różniczki do zera:
Ponieważ M -d F Id y , więc funkcja F musi zawierać całkę M względem zmiennej y; zatem możemy zapisać wstępny wynik — jeszcze w postaci nieokreślonej — jako:
dF , dF J „ —- d y + — d/ = 0 dy dt
(14.19)
jest nazywane zupełnym równaniem różniczkowym, ponieważ jego lewa strona jest dokładnie równa różniczce funkcji F (y, t). Na przykład dla funkcji: F (y , t) = y 2t+ k
\k — stała]
różniczka zupełna jest równa: dF = 2ytdy+ y2dt, więc równanie różniczkowe: (14.16)
dy y2 ly td y + y2di = 0,czyli— + - — = 0
jest zupełne. W ogólnym przypadku równanie różniczkowe: (14.17)
M d y + N d /= 0
jest zupełne wtedy i tylko wtedy, gdy istnieje funkcja F (y, i) taka, że M —dF/dy
F (y , t) = j
Tutaj Af, pochodna cząstkowa, ma być całkowana3jedynie względem y, tzn. że t ma być traktowana jako stała podczas procesu całkowania, podobnie jak podczas obliczania dla funkcji F (y , t) pochodnej cząstkowej równej M -d F Id y . Ponieważ podczas obliczania pochodnej cząstkowej F (y , i) względem y zniknęły wszystkie składniki, które zawierały tylko zmienną t i pewne stałe (ale te, które nie zawierały y), więc teraz — w procesie całkowania — powinniśmy wprowadzić takie składniki. Wyjaśnia to pojawienie się w (14.19) ogólnego wyrażenia 'F (/), które, chociaż nie jest stałą całkowania, odgrywa jednak podobną rolę. Dość łatwo można znaleźć jMdy; jak jednak określić dokładną postać składnika 'P (/)? Sztuczka polega na wykorzystaniu faktu, że N = dF/dt. Ale procedurę tę najlepiej wyjaśnić za pomocą konkretnych przykładów.
3 Niektórzy autorzy stosują tu oznaczenie J(...) 3y, aby podkreślić, że całkowanie dokonywane jest tylko względem y. Będziemy wciąż używać symbolu J(...) dy, gdyż sądzimy, że możliwość nieporozumie nia jest niewielka.
4 8 4 ANALIZA DYNAMICZNA
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 485
Przykład 1. Rozwiązać równanie różniczkowe: 2ytdt+ y2dt = 0.
i przyrównując to wyrażenie do N = y+ 3 tz, znajdujemy: z (14.16)
W tym równaniu mamy: M = 2yt
i
¥ ' (t) = 3t2. KROK HI. Całkujemy otrzymany wynik:
N = y 2.
KROK I. Na podstawie (14.19) możemy najpierw napisać wstępny wynik:
F(y,t) = j 2 y t d t + ' ¥ Q) = f t + ' ¥ (t ) ;
¥ (i) = J*3r2di = t3.
[możemy pominąć stałe]
KROK IV. Łączymy wyniki otrzymane w krokach I i DI, otrzymując cały wzór na funkcję
F(y , t): F ( y ,t) = y t+ y 2+ t\
zauważmy, że pominęliśmy stałą całkowania, ponieważ można ją automatycznie włączyć do wyrażenia ¥ (i). KROK H. Jeśli obliczymy pochodną cząstkową powyższego wyrażenia względem i, to otrzymamy:
c)F dF ale ponieważ N = -r^, więc możemy porównać N = y 2 z — = y2+ ¥ '( t) , skąd wynika, że: ot ot ¥ '( 0 = 0.
y t+ y2+ t3 = c. Czytelnik powinien sprawdzić, że przyrównując do zera różniczkę zupełną tego rozwiązania, rzeczywiście otrzymamy podane równanie różniczkowe. Ta czteroetapowa procedura może być zastosowana do rozwiązania dowolnego zupeł nego równania różniczkowego. Co ciekawe, można ją stosować nawet wtedy, gdy dane równanie nie je st zupełne. Aby się o tym przekonać, musimy najpierw wprowadzić pojęcie czynnika całkującego.
•
KROK Ul. Całkowanie ostatniego wyniku daje: 'F (/) = J V '(i) d/ = Jo d f = Ar i mamy teraz konkretną postać ¥ (0- W tym przypadku ¥ (0 jest po prostu stałą; w ogólnym przypadku może być pewną funkcją t różną od stałej. KROK IV. Połączenie wyników kroków I i HI daje:
Rozwiązaniem zupełnego równania różniczkowego powinno być zatem F (y, 0 = c- Ale ponieważ stała k może być włączona do c, możemy więc rozwiązanie zapisać po prostu jako: lub
Równanie różniczkowe, które nie jest zupełne, można niekiedy przekształcić w równanie zupełne, mnożąc każdy składnik równania przez pewien wspólny czynnik. Taki czynnik nazywamy czynnikiem całkującym (integrating factor). Przykład 3. Równanie różniczkowe;
nie jest zupełne, ponieważ nie spełnia (14.18): 3M
3
x „
dN
d
y(t) = c r m ,
gdzie c jest dowolne. Przykład 2. Rozwiązać równanie (t + 2 y )d y + (y +3t2)d t = 0. Sprawdźmy najpierw, czy jest to zupełne równanie różniczkowe. Przyjmując M = t+ 2y i N = y+ 3 t2i znajdujemy, że dM/dt = 1 = dN/dy. Zatem równanie spełnia warunek zupełności. Aby znaleźć jego roz wiązanie, postępujemy zgodnie Z procedurą opisaną w przykładzie 1. KROK I. Stosujemy (14.19) i zapisujemy: F ( y , t) =
Czynnik całkujący
2tdy+ ydt= Q
F (y, t) = y 2t+ k.
y 2t —c
skąd wynika, że rozwiązaniem danego równania różniczkowego jest:
j ( t + 2 y ) d y + x¥ ( f ) = y t + y 2+ y¥(t). [stałą włączyliśmy do 'P (/)]
KROK II. Różniczkując ten wynik względem t, otrzymujemy:
Jeśli jednak każdy składnik pomnożymy przez y, to otrzymamy równanie (14.16), które jest zupełne, co sprawdziliśmy. Zatem y jest czynnikiem całkującym dla równania różnicz kowego występującego w tym przykładzie. Gdy dla pewnego niezupełnego równania różniczkowego można znaleźć czynnik całkujący, wtedy można otrzymać odpowiednie równanie zupełne i zastosować czteroetapową procedurę rozwiązywania.
Rozwiązanie liniowego równania różniczkowego pierwszego rzędu Ogólne równanie różniczkowe pierwszego rzędu: dy
,
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU
486 ANALIZA DYNAMICZNA
które zgodnie ze schematem (14.17) można zapisać jako:
KROK III. Bezpośrednie całkowanie daje teraz:
(14.20)
»F(f) =- J W
dy + (w y-w )d/ = 0,
ma czynnik całkujący:
“d'd/.
!
487
,
Ponieważ funkcjom u = u(t) i w —w(t) nie nadano konkretnej postaci, więc nic więcej nie można zrobić z tą całką i musimy się zadowolić tym dość ogólnym wyrażeniem dla 'F (i).
eJ«dr_exp J«d/ Czynnik całkujący, którego postać nie jest intuicyjnie oczywista, może być wy prowadzony w następujący sposób. Niech I będzie (na razie nie znanym) czynnikiem całkującym. Mnożenie (14.20) przez I powinno przekształcić je w zupełne równanie różniczkowe: (14.20')
I d y + I(u y - w ) dt = 0. M N Test zupełności mówi, że dMłdt = dN/dy. Jeśli przyjrzymy się wyrażeniom dla M i N, to zauważymy, że ponieważ M zawiera jedynie I oraz w i w są funkcjami samego /, więc test zupełności sprowadzi się do bardzo prostego warunku, jeśli tylko I jest również funkcją samego t. Test przyjmuje bowiem wtedy postać: dl — -lu dt
lub
dl/dt —-— = u. I
[por. (14.13) (14.14)]
Można jednak łatwo sprawdzić, że jeśli stała A jest równa 1, to test zupełności będzie dla /(/) spełniony. Możemy zatem stosować prostszą postać czynnika całkującego ę)udt. Podstawienie tego czynnika całkującego do (14.200 daje zupełne równanie różniczkowe: (14.20")
które można następnie rozwiązać przy użyciu czteroetapowej procedury. KROK I. Najpierw korzystamy z (14.19), otrzymując: (y,0 = J V “d,dy + T (i) = yeludl + *¥ F
(t).
Wynik całkowania ma tak prostą postać, ponieważ funkcja podcałkowa jest niezależna od zmiennej y. KROK II. Następnie różniczkujemy powyższy wynik względem /, aby otrzymać:
djF=yuefudr+ '¥ '( /), dt a ponieważ możemy to przyrównać do N = e ^ udt(uy - w), więc: ¥ '( /) = - w e K
a zatem ogólne rozwiązanie zupełnego równania różniczkowego (14.20") — i równoważ nego, chociaż niezupełnego liniowego równania różniczkowego pierwszego rzędu (14.20) — jest równe: y Q!udt - jw e l udtdt = c. Po przekształceniu i zastąpieniu symbolu c dla dowolnej stałej przez A, można to zapisać jako:
[pochodna funkcji złożonej]
y(i) = e - ^ A + J w e K l f
co jest dokładnie wynikiem podanym wcześniej w (14.15).
Ćwiczenie 14.4 1. Sprawdzić, że każde z następujących równań różniczkowych jest zupełne i rozwiązać je za pomocą czteroetapowej procedury: (a) (b) (c) _ W
ę}udtd y + c^udt(uy - w) d/ = 0,
(t) do wyników otrzymanych w pierwszym
F(y> t)= y e ludł- J w e ^ did/,
(14.21)
Postać / = / ( / ) może zatem rzeczywiście być przydatna, pod warunkiem, że ma stopę równą u lub, dokładniej, u(t). Wobec tego /(/) powinno przyjąć postać: 7 ( l) = A e K
KROK IV. Podstawiając to wyrażenie dla kroku, widzimy, że:
2yt3dy + 3y2t2dt = 0; \ 3y2tdy + (y 3 + 2t)dt = 0\ / ( I + 2y)dy+ y ( l+ y ) d i = 0; dy 2y4t+ 3t2 n =Q (wskazówka: najpierw przekształcić do postaci (14.17)).
2. Czy następujące równania różniczkowe są zupełne? Jeśli nie, wypróbować i, y i y2 jako możliwe czynniki całkujące: (a) 2 (i3+ l) d y + 3yf2di = 0; (b) 4y3idy+(2y4+ 3 0 d r = 0. 3. Przy użyciu czteroetapowej procedury zastosowanej do ogólnego zupełnego równania różniczkowego Mdy+Ndt = 0, wyprowadzić następujący wzór dla ogólnego rozwiązania zupełnego równania różniczkowego: J*Mdy + J Nd/—J*
JjUdy ^ dt = c.
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 489
488 ANALIZA DYNAMICZNA
14.5. NIELINIOWE RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU I PIERWSZEGO STOPNIA
Przykład L Rozwiązać równanie 3y2d y -/d / = 0. Najpierw przepiszemy równanie w postaci: 3y2dy = id/.
W linioiyym równaniu różniczkowym ograniczamy do pierwszego stopnia nie tylko pochodną dy/dr, lecz również zmienną zależną y i nie pozwalamy, aby pojawił się iloczyn y (dy/d/). Gdy y pojawia się w stopniu wyższym niż jeden, wówczas równanie staje się nieliniowe nawet wtedy, jeśli zawiera pochodną dy/d/ w pierwszej potędze. Ogólniej, równanie postaci: ,
(14.22)
Całkując obie strony (które są różniczkami) i przyrównując wyniki, otrzymujemy: J*3y2dy = Jzdz,
~2 % = Hy,t),
d/
y3+Ci = ^z2+ c2,
a zatem ogólne rozwiązanie może być zapisane jako: r \ 3 1 2
/ ( y ,/ ) d y + g ( y ,/ ) d / = 0
lub: (14.220
czyli
gdzie nie nałożono ograniczeń na potęgi y i /, stanowi nieliniowe równanie różniczkowe pierwszego rzędu i pierwszego stopnia. Pewne rodzaje takich równań można rozwiązać dość łatwo za pomocą mniej łub bardziej rutynowych procedur. Omówimy krótko trzy przypadki.
Zupełne równania różniczkowe Pierwszy, to znany już przypadek zupełnego równania różniczkowego. Jak wcześniej wskazano, zmienna y może pojawić się w równaniu zupełnym w wyższej potędze, jak w (14.16) — 2y/dy+y2d/ = 0 — co Czytelnik powinien porównać z (14.22). Wprawdzie skrócenie wspólnego czynnika y z obu składników po lewej stronie zredukuje równanie do postaci liniowej, ale w ten sposób stracimy własność zupełności. Równanie tó, jako zupełne, musi być traktowane jako nieliniowe. Ponieważ omówiliśmy już metodę rozwiązania zupełnych równań różniczkowych, nie są potrzebne dalsze komentarze.
CZyh
=
2+c
Należy zwrócić uwagę na to, że całkowanie każdego składnika jest dokonane względem innej zmiennej; właśnie dlatego równania o zmiennych rozdzielonych są dość łatwe w rozwiązywaniu. Przykład 2. Rozwiązać równanie 2/dy+yd/ = 0. Na pierwszy rzut oka wydaje się, że równanie to nie należy do rozważanego typu, gdyż nie pasuje do postaci ogólnej (14.23). Dokładniej, współczynniki przy dy i dz wydają się zawierać „błędne” zmienne, Ale proste przekształcenie — podzielenie przez 2yz (^ 0) — sprowadzi równanie do postaci o zmiennych rozdzielonych: 1 1 - d y + — d/ = 0. y 2Z Na podstawie naszych doświadczeń z przykładu 1 możemy otrzymać rozwiązanie (bez przenoszenia składnika na prawą stronę) w następujący sposób4:
J V >jyJ l d,= c,
2 t
więc:
Zmienne rozdzielone
l n y + - l n / = c,
Równanie różniczkowe (14.22):
y tm = Qc ~ k , ■_
czyli
y (Z) = kt~m,
-
inoże mieć pożyteczną własność, że funkcja / zależy tylko od zmiennej y, a funkcja g zależy tylko od zmiennej z, tak iż równanie sprowadza się do specjalnej postaci: (14.23)
ln (y /ł/2) = c,
a zatem rozwiązaniem jest:
/ ( y , Z )d y + g (y ,/)d / = 0 V
czyli
gdzie k oznacza dowolną stałą, podobnie jak symbole A i c używane wcześniej. Moglibyśmy również równanie z przykładu 2 przekształcić najpierw w zupełne równanie różniczkowe (za pomocą czynnika całkującego y) i w takiej postaci je rozwiązać. Roz-
/(y )d y + g (z ) d/ = 0.
W takim przypadku mówimy, że jest to równanie o zmiennych rozdzielonych, ponieważ składniki zawierające y — połączone w / (y) mogą być matematycznie oddzielone od składników' zależnych od /, które są zebrane w g(Z). Aby rozwiązać ten szczególny rodzaj równania, potrzebne są jedynie proste techniki całkowania.
4 W równaniu otrzymanym w wyniku całkowania powinniśmy tak naprawdę napisać ln|y| 1 i -ln[/|. Jeśli jednak można założyć, że y i / są dodatnie, tak jak to jest w większości zastosowań ekonomicznych, to otrzymamy wynik podany w tekście.
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 491
490 ANALIZA DYNAMICZNA
wiązanie, podane już w przykładzie 1 w podrozdz. 14.4, musi być oczywiście takie samo, jak rozwiązanie otrzymane w wyniku rozdzielenia zmiennych. Chodzi tu o to, że często istnieje więcej niż jedna metoda rozwiązywania danego równania różniczkowego, a zatem można wybrać tę, którą wygodniej zastosować. W innych przypadkach może się zdarzyć, że nie można rozwiązać równania pewną metodą, ale po wykonaniu pewnych przekształceń staje się to możliwe.
zalecamy Czytelnikowi — ■jako ćwiczenie -— prześledzenie kroków prowadzących do tego rozwiązania. Ponieważ interesuje nas przede wszystkim rozwiązanie y (/), a nie z(/), musimy wykonać odwrotne przekształcenie, korzystając z równania z= y~ l, czyli y = z~l. Obliczając zatem odwrotność z ( 0 Votrzymujemy poszukiwane rozwiązanie: y (0 = -
1
A e x p í- 12 + 3 U
Równania sprowadzalne do postaci liniowej
jest to rozwiązanie ogólne, gdyż występuje w nim dowolna stała A. Jeśli równanie różniczkowe dy/dr = h(y, t) ma specyficzna postać nieliniową: (14.24)
Przykład 4. Rozwiązać równanie dy/dr+ (l/i) y = y3. Mamy tu m = 3 (czyli z - y-2), R = l ł t i T - 1, a zatem równanie może być zlinearyzowane do postaci:
^ + /? y = 7>ra,
dt
gdzie R i T są dwiema funkcjami t, a m jest dowolną liczbą różną od 0 i 1 (a có będzie, jeśli m = 0 lub m = 1?), to równanie — zwane równaniem Bemoulliego — można sprowadzić do liniowego równania różniczkowego i w tej postaci rozwiązać. Procedura sprowadzania jest dość prosta. Najpierw dzielimy (14.24) przez y m i otrzymujemy:
d z + z + 2j dt = 0. Jak Czytelnik może sprawdzić, stosując (14.21), rozwiązaniem tego równania różnicz kowego jest: z(t) = A t2+2t.
dy . y 'm~ + R y l~m = T. dt
Następnie za pomocą odwrotnego przekształcenia y = z m otrzymujemy ogólne roz wiązalne względem pierwotnej zmiennej:
Jeśli przyjmiemy następujące oznaczenia:
y (i) = (At2+ 2 t ) m . dt
dy dr
dr
Jako ćwiczenie Czytelnik sprawdzi prawdziwość rozwiązań tych ostatnich dwu przy kładów za pomocą różniczkowania.
to poprzednie równanie można zapisać jako: Id z — +Rz = T. 1 ~ m dr
Ćwiczenie 14.5
Mnożąc obie strony przez (1 -n i) dr i porządkując, możemy równanie zapisać w postaci:
1. Dla każdego z następujących przykładów określić: (1) czy zmienne są rozdzielone i (2) czy równanie jest liniowe lub czy może być zlinearyzowane:
(14.240
d z + [ ( l - m ) / f e - ( l - / w ) r ] d r = 0.
Widać, że jest to liniowe równanie różniczkowe pierwszego rzędu, postaci (14.20), w której y zastąpiono zmienną z. Możemy oczywiście zastosować wzór (14.21) do znalezienia rozwiązania z(t). Ostatnim krokiem będzie powrót od z do y za pomocą odwrotnego podstawienia. Przykład 3. Rozwiązać równanie dy/dr+ty = 3ty2. Jest to równanie Bemoulliego z w = 2 (co daje z = y1~m= y-1), R = t i T = 3 r. Zatem na mocy(14.24') możemy napisać zlinearyzowane równanie różniczkowe jako: d z+ (-tz+ 3 t)d t = 0. Stosując wzór (14.21), otrzymujemy rozwiązanie: z(r)= A e x p
fl
+3;
(a) 2idy+2ydr = 0; y 2i (b) — d y + di = 0; y+ t y +t
(c) — = — di y dy (d) ^ = 3y2i. dt
2. Rozwiązać (a) i (b) z ćwiczenia 14.5-1 metodą rozdzielenia zmiennych, przyjmując, że y i t są dodatnie. Sprawdzić odpowiedzi za pomocą różniczkowania. 3. Rozwiązać (c) z ćwiczenia 14.5-1 jako równanie o zmiennych rozdzielonych oraz jako równanie Bemoulliego. 4. Rozwiązać (d) z ćwiczenia 14.5-1 jako równanie o zmiennych rozdzielonych oraz jako równanie Bemoulliego. 5. Sprawdzić prawdziwość pośredniego rozwiązania z ( t ) - A t2+ 2t z przykładu 4 pokazu jąc, że jego pochodna dz/dr zgadza się ze zlinearyzowanym równaniem różniczkowym.
492 ANALIZA DYNAMICZNA
14.6. JAKOŚCIOWE PODEJŚCIE GRAFICZNE różniczkowe, równania o zmiennych rozdzielonych i równania Bemoulliego) zostały rozwiązane pod względem ilościowym, tzn. w każdym przypadku znajdowaliśmy ścieżkę czasową y (i), która dla każdej wartości t określała odpowiednią konkretną wartość zmiennej y. Może się niekiedy zdarzyć, że nie będziemy w stanie znaleźć ilościowego rozwiązania dla danego równania różniczkowego. W takich przypadkach może być jednak możliwe określenie jakościowych własności ścieżki czasowej — przede wszystkim, czy y (/) jest zbieżne — na podstawie bezpośredniej obserwacji samego równania różniczkowego lub analizy jego wykresu. Ponadto, jeżeli naszym głównym lub jedynym obiektem zainteresowań jest ilościowy aspekt ścieżki czasowej, to nawet gdy dostępne są rozwiązania ilościowe, możemy również wykorzystać techniki analizy jakościowej.
Diagram fazowy
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 493
rozumowania, każdy punkt poniżej osi poziomej musi być związany z ruchem zmien nej y w lewą stronę, ponieważ ujemna wartość dy/d/ oznacza, że y zmniejsza się w czasie. Tendencje te, dotyczące kierunków, wyjaśniają, dlaczego strzałki na przykładowych liniach fazowych przedstawionych na rys. 14.3 zostały narysowane właśnie w taki sposób. Powyżej osi poziomej wszystkie strzałki są skierowane w prawo — na północny wschód, południowy wschód lub po prostu na wschód, w zależności od przypadku. Pod osią y jest odwrotnie. Ponadto wyniki te nie zależą od znaku y; nawet jeśli linia fazowa A (lub jakakolwiek inna) zostanie przesunięta na lewo od osi pionowej, nie wpłynie to na kierunek strzałek. 2. Poziom równowagi y — w międzyokresowym rozumieniu tego terminu — jeśli istnieje, to może wystąpić tylko na osi poziomej, gdzie dy/d/ = 0 (y jest stacjonarne w czasie). Aby zatem znaleźć położenie równowagi, konieczne jest jedynie rozważenie przecięcia5 linii fazowej z osią y. Aby przetestować dynamiczną stabilność równowagi, powinniśmy również sprawdzić, czy niezależnie od początkowego położenia y linia fazowa będzie zawsze kierować tę zmienną w kierunku położenia równowagi na wspomnianym przecięciu.
Typy ścieżek czasowych
Dla równania różniczkowego pierwszego rzędu w postaci ogólnej: dy
i “ /
równaniem różniczkowym (autonomous differential equation). Gdy znana jest linia fazowa, jej kształt daje ważne informacje jakościowe dotyczące ścieżki czasowej y(f). Kluczem do nich są następujące dwie uwagi ogólne: 1. Wszędzie powyżej osi poziomej (gdzie dy/d/ > 0) y musi wzrastać wraz z upływem czasu, a względem osi y musi przesuwać się od lewej do prawej. Na mocy analogicznego
Na podstawie powyższych uwag ogólnych możemy zaobserwować trzy różne typy ścieżek czasowych dla przykładowych linii fazowych przedstawionych na rys. 14.3. Linia fazowa A ma punkt równowagi yfl, ale powyżej oraz poniżej tego punktu strzałki stale odsuwają się od położenia równowagi. Zatem, mimo iż można osiągnąć równowagę, jeśli j( 0 ) = ya, bardziej typowy przypadek y ( 0 ) * y a spowoduje, że y będzie stale rosło (jeśli y (0) > ya) lub stale malało (jeśli y (0) < ya). Ponadto w tym przypadku odchylenie y od ya będzie rosło coraz szybciej, bó jeśli poruszamy się wzdłuż strzałek na linii fazowej, to odchodzimy coraz dalej od osi y i tym samym napotykamy coraz to większe wartości dy/d/. Ścieżka czasowa y (/) wynikająca z linii fazowej A może być zatem przedstawiona przez krzywe na rys. 14.4(a), gdzie pokazano wykres zależności y od / (a nie dy/d/ od y). Położenie równowagi ya jest dynamicznie niestabilne. W przeciwieństwie do tego linia fazowa B daje stabilne położenie równowagi w punk-
Rysunek 14.4
5 Jednak nie wszystkie przecięcia reprezentują położenie równowagi. Zobaczymy to, gdy przeanali zujemy linię fazową C na rys. 14.3.
4 9 4 ANALIZA DYNAMICZNA
c z a s c i ą g ł y , r ó w n a n i a r ó ż n i c z k o w e p ie r w s z e g o r z ę d u
cie yb- Jeśli y (0) = yb, to równowaga występuje natychmiast. Ale ważną cechą linii fazowej B jest to, że nawet wtedy, gdy y (0) 5*yb, ruch wzdłuż linii fazowej będzie kierował y w stronę poziomu yb. Ścieżka czasowa y (7) odpowiadająca temu typowi linii fazowej powinna zatem mieć postać pokazaną na rys. 14.4(b), co przypomina dynamiczny model rynku. Powyższe rozważania sugerują, że w ogólnym przypadku nachylenie linii fazowej w jej punkcie przecięcia z osią y jest właśnie czynnikiem określającym dynamiczną stabilność położenia równowagi lub zbieżność ścieżki czasowej. Skończone nachylenie dodatnie, tak jak w punkcie ya, powoduje dynamiczną niestabilność, a skończone nachylenie ujemne, tak jak w punkcie yb, implikuje dynamiczną stabilność. To uogólnienie może nam pomóc w wyprowadzeniu wniosków jakościowych dotyczą cych danych równań różniczkowych nawet bez sporządzania wykresów ich linii fazowych. Weźmy np. liniowe równanie różniczkowe (14.4): dy ~ + a y = b, di
czyli
495
Zauważmy, że gdy tylko y (t) dochodzi do górnej granicy yć lub dolnej granicy yc, mamy dy/di = 0 (lokalne ekstrema); ale wartości te na pewno nie stanowią wartości równowagi dla y. W odniesieniu do rys. 14.3 oznacza to, że nie wszystkie punkty przecięcia linii fazowej z osią y są położeniami równowagi. Reasumując, przy badaniu dynamicznej stabilności położenia równowagi (lub zbieżności ścieżki czasowej) istnieje alternatywa: albo zbadać samą ścieżkę czasową, albo po prostu wyciągnąć wnioski na podstawie przebiegu jej linii fazowej. To ostatnie podejście zilustru jemy, stosując je do modelu wzrostu Solowa.
Ćwiczenie 14.6 1. Sporządzić wykres linii fazowej dla każdego z następujących równań i omówić jej implikacje jakościowe:
dy — = —ay+b. di
Ponieważ linia fazowa będzie, oczywiście, miała stałe nachylenie - a , o którym tutaj zakładamy, że jest niezerowe, możemy więc natychmiast (bez wykreślania prostej) wywnio skować, że:
c « ! - * - 112. Dla każdego z następujących równań sporządzić wykres linii fazowej i zinterpretować:
jest zbieżne do położenia równowagi, jest rozbieżne i oddala się od położenia równowagi. Jak można się było spodziewać, wniosek ten zgadza się doskonale z tym, j aki wysnuliśmy na podstawie ilościowego rozwiązania równania: y (t) =
b
y( 0)—
a
e -"+ -. a
[z (14.5')]
Dowiedzieliśmy się, że przy starcie z punktu różnego od położenia równowagi zbież ność y(f) zależy od tego, czy e~^—>0 przy t-> °°. A to może się zdarzyć wtedy i tylko wtedy, gdy a > 0; jeśli a < 0, to e_ai —» 00 przy i y (/) nie może być zbieżne. Zatem nasz wniosek jest taki sam niezależnie od tego, czy otrzymano go metodą ilościową, czy jakościową. Pozostaje do omówienia linia fazowa C, która jest zamkniętą pętlą położoną po obu stronach osi poziomej i która nie może być wykresem funkcji, lecz jedynie relacji6 między dy/di i y. Pojawia się w tym przypadku interesujący nowy element, a mianowicie możliwość okresowych wahań ścieżki czasowej. Ze sposobu, w jaki narysowano linię fazową C, wynika, że y waha się pomiędzy dwiema wartościami yc i yć- Aby mogły powstać wahania okresowe, pętla musi oczywiście przecinać oś poziomą w taki sposób, aby dy/di mogło być na zmianę dodatnie lub ujemne. Ponadto w dwóch punktach przecięcia yc i yć linia fazowa musi mieć nieskończone nachylenie, w przeciwnym razie przecięcie będzie przypominało albo ya, albo yb, a żadne z nich nie pozwala na wystąpienie ciągłego strumienia strzałek. Typ ścieżki czasowej y (t) odpowiadającej takiej zapętlonej linii fazowej pokazano na rys. 14.4(c).
6 Może być otrzymana z równania różniczkowego drugiego stopnia (dy/di)2= /(y).
(a) ^ = ( y + l ) 2- 1 6 dr
(y s* 0 ),
dy 1 (b )- = - > - /
(y > 0 ).
3. Dane jest dy/d/ = ( y - 3 ) ( y - 5 ) = y 2-8 y + 1 5 . a. Wywnioskować, że są możliwe dwa położenia równowagi dla y: jedno przy y = 3 i drugie przy y = 5. d ^dy^ b. Znaleźć znaki — — I dla y = 3 i dla y = 5. Jakie wnioski można wysnuć na ich dy podstawie?
14.7. MODEL WZROSTU SOLOWA Model wzrostu profesora Solowa7 ma na celu m.in. pokazanie, że ścieżka wzrostu „na ostrzu noża” w modelu Domara jest przede wszystkim wynikiem przyjętych tam szczególnych założeń o funkcji produkcji i że w innych okolicznościach może nie być konieczności tak delikatnego balansowania.
7 Robert M. Solow, A Contribution to the Theory of Economic Growth, „Quarterly Journal of Economics’’ 1956, February, s. 65-94.
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 497
49 6 ANALIZA DYNAMICZNA
Struktura
Ponieważ jednak k = K/L i K = kL , możemy więc otrzymać inne wyrażenie dla K, różniczkując ostatnią tożsamość:
W modelu Domara produkcja (output) jest w jawny sposób sformułowana jako funkcja jedynie kapitału: K - p K (zdolność produkcyjna lub produkcja potencjalna są stałą wielokrot nością zasobu kapitału). Niewystępowanie nakładu pracy w funkcji produkcji prowadzi do wniosku, że praca jest zawsze powiązana z kapitałem w ustalonej proporcji, więc dopuszczalne jest uwzględnienie w jawny sposób tylko jednego z tych dwu czynników produkcji. Solow, przeciwnie, dąży do analizy przypadku, gdy kapitał i praca mogą być połączone w zmiennych proporcjach. Zatem jego funkcja produkcji ma postać:
(14.29)
Q = f ( K t L)
Q =L f
=L ę(k\
K gdzie k = - .
Ze względu na założenie dotyczące znaków f K i f KK, nowo wprowadzona funkcja ę (która notabene ma jeden argument k) musi mieć dodatnią pierwszą pochodną i ujemną drugą pochodną. Aby to sprawdzić, przypomnijmy najpierw z (12.49), że: /^ M P P * = ę /(A :), zatem f K> 0 oznacza automatycznie, że (p'(k) > 0. Ponadto, ponieważ: [ » b . (12.48)]
Gdy (14.29) przyrównamy do (14.28) i wyeliminujemy wspólny czynnik L, otrzymamy wynik: (14.30)
k = sę (k )-X Ł
Graficzna analiza jakościowa Ponieważ równanie (14.30) jest sformułowane w postaci zawierającej ogólne funkcje, nie możemy więc na jego podstawie otrzymać konkretnego rozwiązania ilościowego. Niemniej jednak możemy analizować je jakościowo. W tym celu powinniśmy sporządzić wykres linii fazowej, z k na osi pionowej i k na osi poziomej. Ponieważ (14.30) zawiera po prawej stronie dwa składniki, więc najpierw narysujemy je jako dwie oddzielne krzywe. Składnik Xk, który jest liniową funkcją k, będzie miał oczywi ście wykres (por. rys. 14.5(a)) w postaci linii prostej przechodzącej przez początek układu współrzędnych o nachyleniu równym A, a składnik sę{k) — wykres w postaci krzywej rosnącej w coraz wolniejszym stopniu, tak jak ę (k ), ponieważ sę {k) jest po prostu sta łym ułamkiem ę{k). Jeśli uważamy, że ATjest niezbędnym czynnikiem produkcji, musimy rozpocząć wykreślanie krzywej s (p{k) od początku układu współrzędnych; jeśli bowiem K= 0, a zatem = 0, to również Q musi być równe zero, podobnie jak (p{k) i s(p(k). Sposób, w jaki rysujemy krzywą, odzwierciedla również milczące założenie, że istnieje zbiór wartości
więc założenie f KK < 0 prowadzi bezpośrednio do wyniku (p”(k) < 0. Zatem funkcja (p— która zgodnie z (12.46) daje APPL dla każdej proporcji kapitału i pracy — rośnie wraz ze wzros tem k i to coraz szybciej. Skoro Q zależy od K i L, trzeba zatem teraz wskazać, w jaki spo sób zmienne te są określone. Założenia Solowa są następujące: (14.26)
K
(14.27)
|
= dt
= sQ,
dLłdt
=A
[stała część Q jest inwestowana]
(A > 0). '■
[siła robocza rośnie wykładniczo]
Symbol s reprezentuje (stałą) krańcową skłonność do oszczędzania, a A— (stałą) stopę wzrostu siły roboczej. Zauważmy, że natura tych założeń jest dynamiczna: mówią one nie o tym, jak określone są wartości K i L, ale ó tym, jak są określone ich stopy zmian. Równania (14.25), (14.26) i (14.27) stanowią całkowity model. Przystępując do rozwiązania, zapiszemy je najpierw w zwarty sposób w postaci pojedynczego równania względem jednej zmiennej. Podstawiając (14.25) do (14.26), otrzymujemy: (14.28)
K = sL
[pochodna iloczynu] [z (14.27)]
Równanie to — różniczkowe względem zmiennej k, o dwu parametrach s i A — jest podstawowym równaniem modelu wzrostu Solowa.
(K, L > 0),
gdzie Q jest produktem (po odliczeniu deprecjacji), K oznacza kapitał, a L pracę — wszystkie w sensie makroekonomicznym. Zakłada się, że f K i /z, są dodatnie (dodatnie produkty krańcowe), a f KK oraz f LL są ujemne (malejące przychody dla każdego czynnika). Przyjmuje się ponadto, że funkcja produkcji / jest liniowo jednorodna (stałe przychody skali). W rezultacie można napisać: (14.25)
k = L i+ k L = = Lk+kXL.
Rysunek 14.5 32 — Podstawy...
498 ANALIZA DYNAMICZNA
CZAS CIĄGŁY. RÓWNANIA RÓŻNICZKOWE PIERWSZEGO RZĘDU 499
k, dla których sę {k) przekracza Xk, tak iż dwie krzywe przecinają się dla pewnej dodatniej wartości k, mianowicie k. Wartość k dla każdej wartości k możemy zmierzyć jako pionową odległość między dwiema krzywymi. Jeśli dla każdej wartości k zaznaczymy na wykresie odpowiadającą jej wartość k, tak jak na rys. 14.5(b), to otrzymamy szukaną linię fazową. Zauważmy, że ponieważ dwie krzywe na diagramie (a) przecinają się w punkcie, gdzie proporcja kapitału i pracy jest równa k, więc linia fazowa na diagramie (b) musi przecinać oś w punkcie E Oznacza to, że E jest (międzyokresowym) położeniem równowagi dla proporcji kapitału i pracy. Ponieważ linia fazowa ma w punkcie k ujemne nachylenie, więc możemy od razu stwierdzić, że to położenie równowagi jest stabilne: dla każdej (dodatniej) początkowej wartości k dynamiczny ruch w modelu musi prowadzić do położenia równowagi E Jest ważne, że gdy zostanie już osiągnięty ten poziom równowagi — a zatem proporcja kapitału i pracy jest (z definicji) stała — kapitał musi wzrastać w tym samym stopniu co praca, z taką samą stopą wzrostu X. To z kolei implikuje, że inwestycje netto muszą rosnąć ze stopą wzrostu równą X (por. ćwiczenie 14.7-2). Jednak słowo „muszą’’ jest tu użyte nie w znaczeniu wymagania, ale w tym sensie, że wartości są automatycznie określone. Zatem model Solowa pokazuje, że jeśli dana jest stopa wzrostu siły roboczej X, sama gospodarka, bez delikatnego balansowania a la Domar, może osiągnąć w końcu stan wzrostu zrównoważonego (a state of steady growth), w którym stopa wzrostu inwestycji, podobnie jak K i L, będzie równa71. Ponadto, aby było spełnione (14.25), Q musi mieć taką samą stopę wzrostu, ponieważ ę(k ) jest stałe, gdy proporcja kapitału i pracy pozostaje na tym samym poziomie E Taka sytuacja, w której wszystkie rozważane zmienne mają identyczną stopę wzrostu, jest nazywana stanem wzrostu zrównoważonego (a steady state) — jest to uogólnienie pojęcia stanu stacjonarnego (stationary state), w którym wszystkie rozważane zmienne pozostają stałe, tzn. wszystkie mają zerową stopę wzrostu. Zauważmy, że w powyższej analizie zakładaliśmy, że funkcja produkcji jest stała w czasie. Jeśli dopuszczamy możliwość rozwoju technologii, musimy odpowiednio zmodyfi kować funkcję produkcji. Na przykład można ją zapisać w postaci: Q = T (t) f( K ,L )
rdT ' — >° di
gdzie T — pewna zmiana technologii, jest rosnącą funkcją czasu. Z powodu obecności rosnącego czynnika T(t) te same ustalone wielkości K i L będą dawały większą produkcję w przyszłości niż w chwili obecnej. W takim przypadku krzywa stp(k) na rys. 14.5 będzie podlegała okresowym przesunięciom ku górze, powodującym, że będzie przecinała półprostą Xk w coraz wyższych punktach i że wartości k będą coraz większe. Przy rozwoju techno logii jest zatem możliwe, że dla kolejnych stanów wzrostu zrównoważonego wyposażenie kapitałowe przypadające na każdego pracownika w gospodarce będzie coraz większe, co spowoduje jednoczesny wzrost wydajności.
Zapiszmy funkcję produkcji w postaci: Q = K aL 1~a = L
Z
tak iż ę{k) = k a. Wtedy (14.30) przyjmuje postać: i = ska- X k ,
czyli
k+ X k = ska9
co jest równaniem Bemoulliego względem zmiennej k (por. (14.24)) dla R = X; T = s i m = a. Przyjmując z = k l~a, otrzymujemy jego wersję zlinearyzowaną: d z+ [(1 - a ) X z - (1 - a )s]d t = 0, czyli: dz + ( l - a ) X z = ( l- c x ) s . dt Jest to liniowe równanie różniczkowe o stałym współczynniku a i stałym wyrazie wolnym b. Zatem na mocy wzoru (14.50 otrzymujemy: z(t) = m
- i
Podstawienie z = k l a daje ostateczne rozwiązanie: k l~a = k(0)l - a- -
a-( l - a ) X t
gdzie k(0) jest początkową wartością ilorazu kapitału i pracy k. Rozwiązanie to określa ścieżkę czasową dla k. Skoro (1 —cc) i X są dodatnie, to przy t —>oo wyrażenie wykładnicze będzie dążyć do zera: k1 a >—,
czyli
przy t-p>ooy
a zatem proporcja kapitału i pracy będzie dążyć do stałej wartości równowagi. Ta war tość równowagi, czyli wartość dla stanu wzrostu zrównoważonego (sX)1/^ ~ a\ jest propor cjonalna do skłonności do oszczędzania s i odwrotnie proporcjonalna do stopy wzrostu siły roboczej X.
Ćwiczenie 14.7
Przykład ilościowy
1. Podzielić (14.30) przez k i zinterpretować otrzymane równanie w odniesieniu do stóp wzrostu k , K \L .
Powyższa analiza była jakościowa, ponieważ w modelu występowała ogólna funkcja (p(k). Ale jeśli np. przyjmiemy, że funkcja produkcji jest liniowo jednorodną funkcją Cobba-Douglasa, to możemy również znaleźć rozwiązanie ilościowe.
2. Pokazać, że jeśli stopa wzrostu kapitału jest równa X (czyli muszą również mieć stopę wzrostu X.
to inwestycje netto
3. Jeśli funkcją produkcji w modelu Solowa jest Q = T (t)f(K , L), przy czym funkcja / jest
500 ANALIZA DYNAMICZNA
liniowo jednorodna, T(t) ma stopę wzrostu p, a L ma stopę wzrostu A, to jaka będzie stopa wzrostu Q dla stanu wzrostu zrównoważonego? 4. Pierwotne zmienne dla nakładów w modelu Solowa to K i L, ale podstawowe równanie (14.30) dotyczy proporcji kapitału i pracy k. Jakie założenie lub założenia modelu umożliwiają taką zamianę? Wyjaśnij to. - —5. Narysować diagram fazowy dla każdego z następujących równań i omówić jakościowe aspekty ścieżki czasowej y(i): (a) y = 3 - y - l n y ; (b) y = ey- (y + 2 ) .
15. RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW
W poprzednim rozdziale omówiliśmy metody rozwiązywania równania różniczkowego pierwszego rzędu, czyli takiego, w którym nie występowała pochodna (lub różniczka) rzędu wyższego niż 1, Niekiedy jednak model obejmuje drugą pochodną lub pochodne wyższych rzędów. Może być np. podana funkcja opisująca „stopę zmian stopy zmian” dochodu 7;
di2 na podstawie której mamy znaleźć ścieżkę czasową dla 7. W tym przypadku dana funkcja określa równanie różniczkowe drugiego rzędu i zadanie znalezienia ścieżki czasowej polega na rozwiązaniu tego równania. W rozdziale tym zajmiemy się metodami rozwiązywania oraz zastosowaniami ekonomicznymi takich właśnie równań wyższych rzędów, ale ograniczymy się tylko do równań liniowych. Prostym rodzajem liniowego równania różniczkowego rzędu n jest równanie postaci: d"y (15-1)
dn_1y ■ ^ + a^
dy + - + a^
+ a’'y = b ’
czyli w innym zapisie: (15.10
y(n)(t) + aiy * - \ t ) + ... + an_xy \ t) + n„y = b.
Równanie to ma rząd n, gdyż n-ta pochodna (pierwszy składnik po lewej stronie) jest pochodną najwyższego rzędu występującą w tym równaniu. Równanie jest liniowe, ponieważ wszystkie pochodne i zmienna zależna y pojawiają się w pierwszej potędze i nie występują tu żadne iloczyny y i którejkolwiek z pochodnych. Ponadto równanie to ma stałe współczynniki a i stały wyraz wolny b. W całym rozdziale będziemy zakładać, że współczynniki są stałe, natomiast stały wyraz wolny jest tylko pierwszym przybliżeniem; później, w podrozdz. 15.5 przyjmiemy, że jest on zmienną.
502 ANALIZA DYNAMICZNA
15.1. LINIOWE RÓWNANIA RÓŻNICZKOWE DRUGIEGO RZĘDU O STAŁYCH WSPÓŁCZYNNIKACH I STAŁYM WYRAZIE WOLNYM Ze względów dydaktycznych omówimy najpierw metodę rozwiązania dla przypadku równania różniczkowego drugiego rzędu {n = 2). Ma ono wtedy prostą postać: (15.2)
y"(t) + a ly /(t) + a2y = b,
gdzie al9 a2 i b są stałe. Jeśli wyraz wolny b jest tożsamościowo równy zeru, otrzymujemy równanie jednorodne, ale jeśli b jest niezerową stałą, równanie jest niejednorodne. Będziemy kontynuować rozważania przy założeniu, że (15.2) jest niejednorodne; w trakcie roz wiązywania niejednorodnej wersji (15.2) rozwiązanie równania jednorodnego pojawi się automatycznie jako produkt uboczny. W związku z tym przypominamy stwierdzenie wprowadzone w podrozdz. 14.1, które ma tu zastosowanie. Jeśli yc jest funkcją uzupełniającą, czyli ogólnym rozwiązaniem (zawierają cym stałe dowolne) równania zredukowanego ędpowiadającego (15.2), i jeśli yp jest całką szczególną (tzn. dowolnym szczególnym rozwiązaniem nie zawierającym stałych dowolnych) całkowitego równania (15.2), to y(t) = yc + yp będzie ogólnym rozwiązaniem całkowitego równania. Jak wyjaśniono wcześniej, składowa yp daje wartość y stanowiącą wartość dla równowagi w sensie międzyokresowym, podczas gdy składowa yc określa, dla każdego momentu, odchylenie ścieżki czasowej y(t) od równowagi.
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 503
w A co się stanie, gdy a2 będzie równe zeru, tak iż wzór bla2 nie będzie określony? W tym przypadku musimy wypróbować pewne rozwiązanie różne ód stałej, ponieważ stała nie jest odpowiednia. Wybieramy najprostszą możliwość: y = kt. Ponieważ a2 = 0, więc równanie różniczkowe przyjmuje teraz postać: y"(t) + a iy '(t) = b; skoro jednak y = kt, to y'(t) = k, a y"{t) = 0 i równanie sprowadza się do alk = b. Określa to wartość k jako b/a{, otrzymujemy w ten sposób całkę szczególną: (15.30
b yp = - t
(a2 = 0: a x & 0).
Ponieważ yp jest w tym przypadku funkcją czasu różną od stałej, więc będziemy je traktować jako ruchome położenie równowagi. Przykład 2. Znaleźć yp dla równania y"(t) + y'(t) = -10. Mamy tu ¿^ = 0, a t = l i b = -1 0 . Na mocy (15.30 możemy zatem napisać: yp = -10t. Jeśli zdarzy się, że również a x = 0, to rozwiązanie postaci y = kt również nie będzie odpowiednie, gdyż nie będzie określony iloraz bt/av Musimy wtedy wypróbować roz wiązanie postaci y = k t2. Dla a x = a2- 0 równanie różniczkowe sprowadza się do szczególnie prostej postaci: y"(t) = b
Całka szczególna W przypadku stałych współczynników i stałego wyrazu wolnego znalezienie całki szczególnej nie przedstawia większych trudności. Ponieważ całka szczególna może być dowolnym rozwiązaniem (15.2), tzn. dowolną wartością y spełniającą to niejednorodne równanie, więc zawsze możemy wypróbować najprostsze możliwe rozwiązanie, a mianowicie y = stałej. Wówczas:
i jeśli y = k t2, skąd wynika y / (t) = 2kt i y"(t) = 2k, to równanie różniczkowe można zapisać jako 2k = b. Mamy zatem k = b!2, a całka szczególna jest równa: (15.3")
y 2Ą t 2
(aj
= a 2 = 0).
x .
Równowaga reprezentowana przez tę całkę" szczególną jest ponownie ruchomym położeniem równowagi.
y \ t) = y"(t) = 0, więc w rezultacie równanie (15.2) przyjmuje postać a^y - b i jego rozwiązaniem jest y - bła2. Zatem szukana całka szczególna jest następująca: (15.3)
>■„=* a2
Przykład 3. Znaleźć yp dla równania y"{t) = -1 0 . Ponieważ współczynniki wynoszą al - a 2- Q i b - -1Q, więc można zastosować wzór (15.3//)- Szukaną odpowiedzią jest
(a2* 0).
Ponieważ w trakcie znajdowania yp uwzględniono warunek y \ f ) = 0, więc uzasadnienie traktowania tej wartości jako międzyokresowego położenia równowagi staje się oczywiste. Przykład 1. Znaleźć całkę szczególną dla równania: y"(t) + y \ t ) - 2y = -10. Występują tu współczynniki a2~ - 2 i b - -10. Zatem całka szczególna jest równa y, = -1 0/(-2 ) = 5.
Funkcja uzupełniająca Funkcja uzupełniająca dla równania (15.2) jest zdefiniowana jako ogólne rozwiązanie odpowiadającego mu równania zredukowanego (jednorodnego): (15.4)
y"(t) + a1y '(t) + a2y = 0;
dlatego właśnie stwierdziliśmy, że rozwiązanie zadania jednorodnego będzie zawsze produktem ubocznym procesu rozwiązywania całkowitego równania. Chociaż dotychczas nie zajmowaliśmy się takimi równaniami, nasze doświadczenia
504 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 505
z funkcjami uzupełniającymi dla równań różniczkowych pierwszego rzędu powinny nam podsunąć pożyteczną wskazówkę. Na podstawie rozwiązań (14.3), (14.30, (14.5) i (14.50 widać, że funkcja wykładnicza A t* odgrywa bardzo ważną rolę wśród funkcji uzupełniających dla równań różniczkowych pierwszego rzędu o stałych współczynnikach. Spróbujmy zatem skorzystać z rozwiązania y = Ae* również dla równania drugiego rzędu. Jeśli przyjmiemy próbne rozwiązanie y = Aert, musimy również zaakceptować: y'(i) = rAe*
i
_y"(f) = r 2Aert
jako pochodne y. Na podstawie tych wyrażeń dla y, y'(t) i y"(0 możemy przekształcić równanie różniczkowe (15.4) do postaci: (15.40
A cn(r2 + axr + a2) = 0.
Jeśli wybierzemy takie wartości A i r , które spełniają (15.40, to próbne rozwiązanie y = Ae* powinno działać. Oznacza to, że musimy przyjąć A = 0 lub postarać się, żeby r spełniało równanie: (15.4'0
r2 + axr + a2- 0 .
Ponieważ wartość (dowolnej) stałej A ma być wyznaczona na podstawie warunków początkowych zadania, nie możemy tak po prostu przyjąć, że A = 0. Musimy zatem koniecznie znaleźć wartości r spełniające (15.4'0. Równanie (15.4") jest znane jako równanie charakterystyczne (characteristic equation) lub pomocnicze (auxiliary) dla równania jednorodnego (15.4) lub dla całkowitego równania (15.2). Ponieważ jest to równanie kwadratowe względem r, ma więc dwa pierwiastki (rozwiązania), zwane tu pierwiastkami charakterystycznymi, określone następującym wzo rem 1: (15.5)
-a , ± - 4 a7 rx, r2 = — V -------
Dwa pierwiastki są związane w prosty, ale interesujący sposób, ułatwiający sprawdzanie obliczeń: ich suma jest zawsze równa - a lt a ich iloczyn jest zawsze równy a2. Dowód tego stwierdzenia jest bezpośredni: (15.6)
-a , + - 4
riV 2
4
\ ~ 4a2 _ - 2 a x _ 9
4a2 ” 4 “ ^2*
Wartości tych dwu pierwiastków są to jedyne wartości, jakie możemy nadać parametrowi r w rozwiązaniu y = A en. Oznacza to, że otrzymujemy dwa rozwiązania, a mianowicie:
1 Zauważmy, że równanie kwadratowe (15.4") jest w postaci znormalizowanej, tzn. współczynnik przy r2jest równy 1. Aby móc stosować wzór (15.5) do znajdowania pierwiastków charakterystycznych równania różniczkowego, musimy się najpierw upewnić, czy równanie charakterystyczne rzeczywiście jest znormalizowane.
y1= A 1e r,/
i
y2 = A2e r2V
gdzie Ax i A2 są dwiema dowolnymi stałymi, a rx i r2 są pierwiastkami charakterystycznymi obliczonymi według wzoru (15.5). Ponieważ jednak chcemy mieć jedno (a nie dwa) rozwiązanie ogólne, możemy albo wybrać y\ lub y2 przypadkowo, albo połączyć je w pewien sposób. Pierwsza możliwość jest prostsza, ale nie do przyjęcia. We wzorze dla y x i dla y2 występuje jedna stała dowolna, natomiast wyrażenie kwalifikujące się jako rozwiązanie ogólne równania różniczkowego drugiego rzędu musi zawierać dwie stałe dowolne. Wymaganie to wynika z faktu, że przy przejściu od funkcji y (t) do jej drugiej pochodnej y"(t) „tracimy” dwie stałe przy dwu kolejnych różniczkowaniach; wobec tego, aby powrócić od równania różniczkowego drugiego rzędu do funkcji pierwotnej y(i), musimy wprowadzić dwie stałe. Pozostaje nam zatem możliwość druga polegająca na połączeniu y x i y2 tak, aby uwzględnić obie stałe A : i A2. Okazuje się, że możemy przyjąć ich sumę yx+ y2 jako ogólne rozwiązanie (15.4). Pokażemy, że jeśli y x i y2 spełniają (15.4), to ich suma Ji + również będzie spełniać to równanie. Jeśli y x i y2 są rzeczywiście rozwiąza niami (15.4), to podstawiając je kolejno do (15.4), otrzymujemy następujące dwie pra wdziwe równości: y"(t) + a jK t) + a2y 1= 0, y"(t) + a ly'l(t) + a2y2 = 0. Dodajemy je stronami i otrzymujemy równość: [y;X/) + y ^ (0 ] + ^ [y ;( r )+ y ;( 0 ] + a 2(yi + y2) = 0,
a zatem suma (yx+ y2) również spełnia równanie (15.4), podobnie jak y x i y2. Wobec tego ogólne rozwiązanie równania jednorodnego (15.4), czyli funkcja uzupełniająca dla cał kowitego równania (15.2), może być ogólnie zapisana jako yc = yi + y 2. Dokładniejsza analiza wzoru na pierwiastki charakterystyczne (15.5) pokazuje jednak, że jeśli chodzi o wartości rx i r2, to mogą wystąpić trzy przypadki, a niektóre z nich wymagają zmodyfikowania wzoru y c = y 1+ y 2. Przypadek 1 (dWa różne pierw iastki rzeczywiste). Gdy a 2 > 4a2, wówczas pierwiastek kwadratowy w (15.5) jest liczbą rzeczywistą i dwa pierwiastki rx i r2będą miały różne wartości rzeczywiste (ponieważ pierwiastek kwadratowy dodajemy do - a x, aby otrzymać rx, ale odejmujemy go od - a v aby otrzymać r2). W tym przypadku możemy rzeczywiście napisać: (15.7)
yc = y1+ y2 = A1e rć + A2e r2i
( h * r 2).
Ponieważ dwa pierwiastki są różne, więc dwa wyrażenia wykładnicze muszą być liniowo niezależne (żadne z nich nie jest wielokrotnością drugiego); w rezultacie A x i A2 będą zawsze osobnymi wielkościami i stanowić będą wymagane dwie stałe. Przykład 4 . Rozwiązać równanie różniczkowe: y"(t) + y '( t ) - 2 y = -10.
RÓWNANIA. RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 507
506 ANALIZA DYNAMICZNA
W przykładzie 1 znaleźliśmy już całkę szczególną tego równania yp = 5. Teraz znajdziemy funkcję uzupełniającą. Ponieważ współczynnikami równania są a x = 1 i a2 = —2, więc pierwiastki charakterystyczne, określone wzorem (15.5), są równe: -i± v r+ 8 r » r 2=
-i ±3 =—
^-
=
1 ,-2
' (sprawdzenie: rx + r2 = - l = - a x; rxr2 = - 2 = a2). Ponieważ pierwiastki są różnymi liczbami rzeczywistymi, więc funkcja uzupełniająca jest równa yc = A:e' + A2e_2r. Ogólne rozwiązanie można zapisać w postaci: y (t)= y c +yp = A le’ + A2e-2‘ +
(15.8)
5.
'*
yc = A1e rt + A2e rt= (A 1+A 2)e'i =A 3ert, w którym pozostaje tylko jedna stała. Nie wystarcza to do odtworzenia funkcji pierwotnej na podstawie równania różniczkowego drugiego rzędu. Jedyna rada to znalezienie innego możliwego składnika dla sumy — składnika spełniającego (15.4), ale liniowo niezależnego od składnika A 3e n. Wyrażeniem spełniającym te warunki jest A 4te n. Ponieważ zmienna t występuje tu jako czynnik, więc składnik ten jest oczywiście liniowo niezależny od A 3e rt; umożliwi nam więc wprowadzenie nowej stałej A4. Ale czy A4te n spełnia (15.4)? Na podstawie wzoru na pochodną iloczynu pierwsza i druga pochodna funkcji y = A4/e ri są równe:
.
y'(i) = (rt+ 1)A4e rt
Do określenia wartości stałych dowolnych A xi A2 potrzebne są dwa warunki początkowe. Niech tymi warunkami będą y(0) = 12 i y'(0) = -2 , tzn. dla i = 0, y(t) i y'(t) przyjmują odpowiednio wartości 12 i -2 . Podstawiamy t = 0 do (15.8) i otrzymujemy: y(0) = Aj + A2 + 5. Różniczkując (15.8) względem t i podstawiając t = 0 do wzoru na pochodną, mamy: y'(t) = A xe* - 2A2e~2t
i
y '(0 )= A l - 2 A 2.
Aby te dwa warunki początkowe były spełnione, musimy przyjąć y(0) = 12 i y '(0) = -2 ; otrzymujemy zatem następujący układ dwu równań:
i
y '\t) = (Pt + 2r)A4e n.
Podstawiając wyrażenia dla y, y' i y" do lewej strony wzoru (15.4), otrzymujemy: [(r2t + 2r) + ax(rt + 1) + a2f]A4e /i. Ponieważ w obecnym kontekście a 2 = 4a2 i r = -a J 2 , więc ostatnie wyrażenie jest tożsamościowo równe zeru, a zatem jest zawsze równe prawej stronie (15.4); dowodzi to, że A4t t n rzeczywiście stanowi rozwiązanie. Funkcja uzupełniająca dla przypadku podwójnego pierwiastka może być zatem zapisana w postaci: (15.9)
A x+ A2 = 7,
yc= A 3e rt + A4te rt.
Przykład 5. Rozwiązać równanie różniczkowe:
A x - 2A2 = - 2 z rozwiązaniami A x = 4 i A 2 = 3. Zatem określone rozwiązanie równania różniczkowego jest równe: (15.8')
y(t) = 4e‘+3e~2t + 5.
y*(f) + 6y'(t) + 9y = 27. Współczynniki są tu równe ax = 6 i a2 - 9; ponieważ a 2- 4 a 2, więc będziemy mieć podwójne pierwiastki. Zgodnie ze wzorem (15.5) mamy r - - a xS2 - -3 . Zatem zgodnie z wynikiem (15.9) funkcja uzupełniająca może być zapisana jako:
Podobnie jak poprzednio, sprawdzamy rozwiązanie za pomocą różniczkowania. Pierwsza i druga pochodna (15.8') wynoszą: y'(t) = 4e' - 6e~2i
i
y"(r) = 4ct +\2eT2t.
Po podstawieniu ich wraz z (15.80 do danego równania różniczkowego otrzymujemy tożsamość -1 0 = -10, a zatem rozwiązanie jest prawidłowe. Jak Czytelnik sprawdzi z łatwością, (15.8') spełnia również oba warunki początkowe. ,v P rzypadek 2 (podwójny pierwiastek rzeczywisty). Gdy równanie różniczkowe ma współczynniki takie, że a 2 = 4a2, wówczas pierwiastek kwadratowy w (15.5) wyzerowuje się i dwa pierwiastki charakterystyczne przyjmują jednakową wartość:
yc = A3ę-3r + A4fe-3'.
\ x
Teraz można już z łatwością podać ogólne rozwiązanie danego równania różniczkowego. Jeśli wypróbujemy stałe rozwiązanie dla całki szczególnej, otrzymamy yp - 3. Wynika stąd, że ogólne rozwiązanie całkowitego równania jest równe: y(t) = yc + yp =A e_3' +AĄter3>+3. Za pomocą dwu warunków początkowych można określić wartości dwu zmiennych dowolnych. Załóżmy, że warunki początkowe są takie: y (0) = 5 i y'(0) = -5 . Podsta wiając t = 0 do powyższego równania, powinniśmy otrzymać y (0) = 5, tzn.: y(0) = A3 + 3 = 5,
r(= r, = r j = - j ; nazywamy je pierwiastkami wielokrotnymi (w tym przypadku podwójnymi). Jeśli spróbujemy zapisać funkcję uzupełniającą jako yc = y x + y2, to suma w tym przypadku sprowadzi się do pojedynczego wyrażenia:
skąd wynika, że A3 = 2. Następnie różniczkując ogólne rozwiązanie i podstawiając t = 0 i A3 = 2, możemy otrzymać y'(0) = -5 . Oznacza to: oraz:
y*(t) = -3A3e3' - 3A4te_3r + A4e_3r / ,(0) = - 6 + A4 = - 5 .
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 509
508 ANALIZA DYNAMICZNA
Wynika stąd, że A 4 = 1. Określone rozwiązanie danego równania możemy ostatecznie v zapisać jako: y(0 = 2e~3' + i e '3' + 3. Przypadek 3 (pierw iastki zespolone). Jeśli chodzi o względną wielkość współczyn ników ax i a2, pozostaje jeszcze jedna możliwość, a mianowicie a \ < 4a2. Gdy zdarzy się taka ewentualność/wówczas wzór (15.5) będzie zawierał pierwiastek kwadratowy pewnej liczby ujemnej, którego nie możemy dokładniej rozważać, zanim nie zapoznamy się z po jęciem liczb urojonych i zespolonych. Na razie poprzestaniemy na odnotowaniu tej możliwości, a jej dokładne omówienie pozostawimy na później. Podane wyżej trzy przypadki mogą być zilustrowane za pomocą trzech krzywych (por. rys. 15.1). Każda z tych krzywych reprezentuje inną wersję funkcji kwadratowej f( r ) = r2 + axr + a2. Jak dowiedzieliśmy się wcześniej, jeśli przyrównamy taką funkcję do zera, to otrzymamy równanie kwadratowe f{r) ~ 0 i znalezienie rozwiązań tego równania oznacza znalezienie miejsc zerowych funkcji kwadratowej. Graficznie wyraża się to tym, że pierwiastki równania znajdują się na osi poziomej, g d zie/(r) = 0.
Dynamiczna stabilność równowagi Dla przypadków 1 i 2 warunek dynamicznej stabilności równowagi ponownie zależy od znaków pierwiastków charakterystycznych. Dla przypadku 1 funkcja uzupełniająca (15.7) składa się z dwu wyrażeń wykładniczych A1e'v i A2er27 Współczynniki Ax i A2 są dowolnymi stałymi; ich wartości zależą od warunków początkowych zadania. Możemy zatem być pewni, że położenie równowagi będzie dynamicz nie stabilne (yc —>0 przy i -> °°) niezależnie od tego, jakie są warunki początkowe, jeśli tylko oba pierwiastki r x i r2 są ujemne. Podkreślamy tu słowo: oba, gdyż warunek dla dynamicznej stabilności nie pozwala na to, aby choć jeden z pierwiastków był dodatni lub równy zeru. Jeśli np. rx = 2 i r2 = - 5, to mogłoby się na pierwszy rzut oka wydawać, że drugi pierwiastek, większy co do wartości bezwzględnej, mógłby przeważyć pierwszy. W rzeczywistości jednak to dodatni pierwiastek będzie ostatecznie dominował, gdyż wraz ze wzrostem t wyrażenie e2r będzie nieskończenie wzrastać, ale e“5i będzie stopniowo znikało. Dla przypadku 2, z podwójnym pierwiastkiem, funkcja (15.9) zawiera nie tylko znajome wyrażenie e*, lecz również wyrażenie iloczynowe te*. Dla pierwszego z tych wyrażeń na to, aby dążyło ono do zera niezależnie od warunków początkowych jest konieczne i dostateczne, aby r < 0 . Ale czy to zapewni również znikanie te*? Okazuje się, że wyraże nie te* (lub ogólniej tkQn) ma ten sam ogólny typ ścieżki czasowej, jak e* (r ź 0). Zatem warunek r < 0 jest rzeczywiście konieczny i dostateczny, aby cała funkcja uzupełniająca dążyła do zera przy t —» ©o, co daje dynamicznie stabilne międzyokresowe położenie równowagi.
Ćwiczenie 15.1 1. Znaleźć całkę szczególną dla każdego równania: (a) y " (t)- 2 y '(t) + 5y = 2; (b) y " ( 0 + / ( 0 = 7; (c) y"(t) + 3y = 9; (d) y"(t) + 2 y \t) - y = -4 ; (e) y"(t) = 12.
Rysunek 15.1
Położenie najniższego wykresu na rys. 15.1 jest takie, że krzywa ta przecina oś po ziomą dwukrotnie; możemy zatem znaleźć dwa różne pierwiastki r x i r2, które spełniają równanie k w adratow e/(r) = 0 i mają oczywiście wartości rzeczywiste. Zątem najniżej położona krzywa ilustruje przypadek 1. Środkowa krzywa styka się z psią poziomą tylko raz, w punkcie r3. Jest to zatem jedyna wartość r spełniająca rów nanie/(r) = 0. Ilustruje ona zatem przypadek drugi. W końcu krzywa położona najwyżej wcale nie przecina osi poziomej, dlatego równanie f{r) ==0 nie ma pierwiastków rzeczywistych. Mimo to można znaleźć W tym przypadku dwie liczby zespolone, które — jak to pokażemy w następnym podrozdziale — spełniają równanie.
2. Znaleźć funkcję uzupełniającą dla każdego równania: (a) y"(t) + 3y'(t) - 4y = 12; (b) y"(t) + 6y'(t) + 5y = 10; (c) y " ( i) - 2 y '( f) + y = ?>\ (d) y"(t) + 8y'(i) -f 16y = 3. 3. Znaleźć ogólne rozwiązanie każdego równania różniczkowego z poprzedniego zadania, następnie określić rozwiązanie przy użyciu początkowych warunków y(0) = 4 i y'(0) = 2. 4. Czy międzyokresowe położenia równowagi znalezione w poprzednim zadaniu są dynami. cznie stabilne?
5. Sprawdzić, że określone rozwiązanie z przykładu 5 rzeczywiście: (a) spełnia dwa warunki początkowe i (b) ma pochodne (pierwszą i drugą) spełniające dane równanie różniczkowe. 6. Pokazać, że dla t —»
granica /e* jest równa zeru dla r < 0, ale jest nieskończona dla r ^ 0.
5 1 0 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 511
15.2. LICZBY ZESPOLONE I FUNKCJE KOŁOWE Jeśli współczynniki liniowego równania różniczkowego drugiego rzędu y"(t) + a xy'(t) + + ayy = b są takie, że a 2 < 4a2> to wzór określający pierwiastki charakterystyczne (15.5) wymaga wyciągania pierwiastka kwadratowego z liczby ujemnej. Chociaż kwadrat dowolnej dodatniej lub ujemnej liczby rzeczywistej jest zawsze dodatni, a kwadrat zera jest równy zeru, to jednak jedynie nieujemna liczba rzeczywista może dać pierwiastek kwadratowy o wartości rzeczywistej. Jeśli ograniczymy się do zbioru liczb rzeczywistych, to w tym przypadku (przypadek 3) nie otrzymamy pierwiastków charakterystycznych o wartościach rzeczywis tych. Stanowi to zachętę do rozważenia liczb spoza zbioru liczb rzeczywistych.
Liczby urojone i wymierne Pojęciowo możliwe jest zdefiniowanie liczby i = V-1, która podniesiona do kwadratu będzie dawała 1. Ponieważ i jest pierwiastkiem kwadratowym liczby ujemnej, więc oczywiście nie jest liczbą rzeczywistą; nazywamy ją liczbą urojoną (imaginary number). Dysponując taką liczbą, możemy zapisać mnóstwo innych liczb urojonych, np. V~9 = ^¡9^-1 = 3i lub V-2 = = V 2i Rozszerzając jej zastosowanie, możemy skonstruować jeszcze inny rodzaj liczby — zawierający część rzeczywistą i część urojoną — jak np. 8 + i lub 3 + 5/. Liczby te, znane jako liczby zespolone (complex numbers), mogą być ogólnie zapisane w postaci (h+ vi)\ gdzie h i v są dwiema liczbami rzeczywistymi2. Oczywiście dla v = 0 liczba zespolona sprowadza się do liczby rzeczywistej, a dla h = 0 staje się liczbą urojoną. Zatem zbiór wszystkich liczb rzeczywistych (oznaczony 91) stanowi podzbiór zbioru wszystkich liczb zespolonych (oznaczony %). Podobnie, zbiór wszystkich liczb urojonych (oznaczony $>) również stanowi podzbiór %. Oznacza to, że i$ Ponieważ ponadto pojęcia liczb rzeczywistych i urojonych wzajemnie się wykluczają, więc zbiory 91 i $ muszą być rozłączne, tzn. 9 l n $ = 0 . Liczba zespolona (h + vi) może być przedstawiona graficznie na tzw. diagramie Arganda, co pokazano na rys. 15.2. Zaznaczymy h na osi rzeczywistej, a v na osi urojonej; liczba h + v/ może więc być reprezentowana przez punkt (h, v), który oznaczyliśmy symbolem C. Wartości h i v mają oczywiście znaki, więc jeśli h < 0 , to punkt C będzie położony na lewo od początku układu współrzędnych; podobnie ujemne v oznacza położenie pod osią poziomą. a Mając wartości h i v, możemy obliczyć długość odcinka OC za pomocą twierdzenia Pitagorasa, które mówi, że kwadrat długości przeciwprostokątnej trójkąta prostokątnego jest równy sumie kwadratów pozostałych dwu boków. Oznaczając długość OC przez R (od: radius vector — wektor wodzący), otrzymujemy:
R 2=h2 + v i2
(15.10)
R = ^ h 2 + v2,
gdzie zawsze przyjmujemy dodatnie wartości dla pierwiastka kwadratowego. Wartość R nazywamy niekiedy wartością bezwzględną lub modułem liczby zespolonej (h + vi). Zauważ my, że zmiana znaków h i v nie wpłynie na wartość bezwzględną liczby zespolonej. R, podobnie jak h i v, jest więc zawsze rzeczywiste, ale w przeciwieństwie do h i v musi zawsze mieć wartość dodatnią. Zobaczymy, że liczba R odegra ważną rolę w dalszych rozważaniach.
Pierwiastki zespolone Tymczasem wróćmy do wzoru (15.5) i zbadajmy przypadek zespolonych pierwiastków charakterystycznych. Gdy współczynniki równania różniczkowego drugiego rzędu są takie, że a 2 < 4a2, to wyrażenie z pierwiastkiem kwadratowym w (15.5) może być zapisane jako: yfa* - 4 a 2 = V4a2 - a \
= ^4 a2 - a \ /,
a zatem — jeśli przyjmiemy skrócone oznaczenie: —a, h = ~— 2
. i
V4a2 - a2 v = -------------, 2
czyli dwa pierwiastki mogą być oznaczone za pomocą pary sprzężonych liczb zespolonych: rl5 r2- h ± v i .
2 Stosujemy tu oznaczenia h (od: horyzontalny, poziomy) i v (od: wertykalny, pionowy) dla ogólnego zapisu liczby zespolonej, gdyż będziemy teraz zaznaczać h i v odpowiednio na osi poziomej i pionowej dwuwymiarowego diagramu.
Mówimy, że te dwa pierwiastki zespolone są „sprzężone” , ponieważ zawsze występują razem; jeden z nich jest sumą h i vi, a drugi jest różnicą h - v i . Zauważmy, że mają one tę samą wartość bezwzględną R.
512 ANALIZA DYNAMICZNA RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 513
Przykład 1. Znaleźć pierwiastki równania charakterystycznego r 2 + r + 4 = 0. Stosując znany wzór, otrzymujemy: -1 ± >/—15 r , . r , = ^ — = ---------
-1 =j ± —
>.
co stanowi parę sprzężonych liczb zespolonych. Podobnie jak poprzednio, nasze rachunki możemy sprawdzić za pomocą (15.6). Jeśli są poprawne, powinno być: rl + r2 = - a l (= -1 ) i rxr2 = a2 (= 4). Ponieważ rzeczywiście otrzymujemy:
fi + r, =
-1
V l5 «
2 + 2
-1
Vl5
2
2
==ł--ł =-l. 2
(15.12)
s in 0 = -, R.
(15.13)
cos
R
0= ^.
Ze względu na ich związek z kołem funkcje te są nazywane funkcjami kołowymi. Ponieważ są one również związane z trójkątem, nazywane są równiq±funkcjami trygonomet rycznymi. Inna (i bardziej fantazyjna) nazwa to funkcje sinusoidalne. Funkcje sinus i cosinus nie są jedynymi funkcjami kołowymi; inną — często spotykaną — jest funkcja tangens zdefiniowana jako: tg 0 =
2
sin0
COS0
(h * 0);
będziemy się jednak zajmować przede wszystkim funkcjami sinus i cosinus. r ,r ,=
\ r -1
2 + 2
V l5 i
=(t J-
V l5 i
V = 1 - ^ = 4, 4 4
więc nasze obliczenia są rzeczywiście prawdziwe. A zatem nawet w przypadku zespolonych pierwiastków (przypadek 3) możemy wyrazić uzupełniającą funkcję równania różniczkowego zgodnie z (15.7), tzn.: (15.11)
yc = A1e(/ł+v0? + A2e(/ł_w)i = cht(AxQvit + A 2c vit).
Pojawiła się tu jednak nowa cecha: w wykładnikach dwu wyrażeń w nawiasie pojawia się liczba i. Jak interpretujemy takie urojone funkcje wykładnicze? Aby ułatwić ich interpretację, pomocne będzie przekształcenie tych wyrażeń w równo ważną postać funkcji kołowych. Jak teraz zobaczymy, te ostatnie funkcje obejmują okresowe wahania zmiennych. W konsekwencji funkcja uzupełniająca (15.11), którą można przekształ cić w postać zawieraj ącą funkcje kołowe, może również generować cykliczny rodzaj ścieżki czasowej.
Funkcje kołowe Popatrzmy na przedstawione na rys. 15.3 koło o środku w początku układu współrzędnych i o promieniu długości R . Niech promień obraca się w kierunku przeciwnym do ruchu wskazówek zegara. Startując z położenia OA, stopniowo przesunie się w położenie OP, następnie w OB, OC i OD, a na końcu cyklu wróci do położenia OA. Potem cykl będzie się powtarzał. Gdy promień znajduje się w pewnym ustalonym położeniu — powiedzmy OP — wówczas wskazówka zegara utworzy określony kąt 0 z linią OA i koniec strzałki (P) wyznaczy poziomą odległość v i pionową odległość h. Jeżeli kąt 0 zmienia się podczas obrotów, to v i h też będą się zmieniać, ale R będzie stałe. Proporcje v/R i h/R muszą się zmieniać wraz z 0, a zatem obie proporcje będą funkcjami kąta 0. Dokładniej, v/R i h/R są nazywane odpowiednio sinusem (funkcją) i cosinusem (funkcją) 6:
Zmienną niezależną funkcji kołowej jest kąt 0, a zatem odwzorowanie, jakie tu mamy, przyporządkowuje kątowi proporcję dwu odległości. Kąty zazwyczaj są mierzone w stopniach (np. 30°, 45°, 90°), ale w pracy analitycznej wygodniej jest mierzyć je w radianach. Wynika to z faktu, że gdy 0 jest w ten sposób mierzone, pochodne funkcji kołowych przyjmują wygodniejszą postać — podobnie jak podstawa e daje wygodniejsze pochodne dla funkcji wykładniczych i logarytmicznych. A ile wynosi radian? Aby to wyjaśnić, wróćmy do rys. 15.3, gdzie narysowaliśmy punkt P tak, iż długość łuku AP jest dokładnie równa promieniowi R. Radian (w skrócie: rad) może być wtedy zdefiniowany jako kąt 0 oparty na łuku równym promieniowi, a więc na łuku o długości R . Ponieważ obwód koła ma długość 2 n R (gdzie 33 — Podstawy...
514 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 515
n - 3,14159...), więc cały okrąg musi zawierać kąt równy 271 radianom. Kąt pełny mierzony w stopniach ma 360°, a zatem porównując 360° z 2n radianami, otrzymujemy następujące przeliczenia: Stopnie
360
Radiany
2k
270
180
3k
n
— 2
90
45
k
—
. 2
,,
n 4
0
■■■,
0
.
Własności funkcji sinus i cosinus Gdy dana jest długość R , wówczas wartość sin 0 zależy od sposobu, w jaki wartość v zmienia się wraz ze zmianą wartości kąta 0. W początkowym położeniu OA mamy v = 0. Gdy wskazówka koła porusza się przeciwnie do kierunku ruchu wskazówek zegara, v przyjmuje rosnące wartości dodatnie. Kulminacją jest maksymalna wartość v = R, kiedy to wskazówka pokrywa się z OB, tzn. gdy 0 = nl2 rad (=90°). Dalszy obrót będzie stop niowo zmniejszał v, aż osiągnie ono w7artość zerową, gdy wskazówka będzie w położe niu O C — gdy 0 = /rrad (= 180°). Gdy wskazówka przechodzi do trzeciej ćwiartki, v zaczyna przyjmować ujemne wartości; w położeniu OD mamy v = —R. W czwartej ćwiartce v jest wciąż ujemne, ale wzrasta od wartości - R do wartości v = 0, którą osiąga wtedy, gdy wskazówka powraca do OA, tzn. gdy 0 = 2 k rad (= 360°). Następnie cały cykl powtarza się. Gdy podstawimy do (15.12) te przykładowe wartości v, otrzymamy wyniki podane w wierszu tabl. 15.1 oznaczonym „sin0” . Wykres funkcji sinus jest dokładniej przed stawiony na rys. 15.4(a), na którym wartości sin0 odpowiadają wartościom 0 (wyrażonym w radianach). Wartość cos0 zależy od sposobu, w jaki zmienia się h przy zmianie 0. W początko wym położeniu OA mamy h = R. Następnie h stopniowo maleje; osiąga zero, gdy 0 = /r/2 (położenie OB). W drugiej ćwiartce /z jest ujemne i dla 0 = /r (położenie OC) h = -R . W trze ciej ćwiartce wartość h stopniowo rośnie od - R do zera i gdy 0 = 3 /r/2 (położenie OD) okazuje się, że h = 0. W czwartej ćwiartce h znów jest dodatnie i gdy wskazówka powraca do położenia OA ( 6 - 2/r), wówczas mamy znów h = R . Następnie cały cykl powtarza się. Tablica 15.1 1
3
e
0
-n
n
-IZ
In
sin0 cos0
0
1 0
0 -1
-1 0
0 1
1
2
2
Podstawienie tych wartości h do (15.13) daje wyniki podane w dolnym wierszu tabl. 15.1, ale rys. 15.4(b) daje dokładniejszy obraz funkcji cosinus. Funkcje sin0 i cos0 mają tę samą dziedzinę, mianowicie zbiór wszystkich liczb rzeczywistych (miar w radianach kątów 0). W związku z tym należy podkreślić, że ujemny kąt odpowiada po prostu przeciwnemu kierunkowi obrotów wskazówki; na przykład zgodny z kierunkiem ruchu wskazówek zegara ruch od OA do OD na rys. 15.3 generuje kąt - n ! 2 rad (= —90°). Dwie funkcje mają też wspólny zbiór wartości, mianowicie domknięty przedział
Rysunek 15.4
(-1 , 1). Z tego powodu wykresy sin0 i cos0 są na rys. 15.4 ograniczone do określonego poziomego pasa. Główna cecha wyróżniająca funkcje sinus i cosinus polega na tym, że obie są okresowe; ich wartości powtarzają się dla każdego przedziału 2 k rad (pełnego obrotu), jaki przemierza kąt 0. Mówimy więc, że każda z tych funkcji ma okres równy 2n. Ze względu na tę własność okresowości, spełnione są następujące równania: , sin(0+ 2nn) = sin0;
cos(0+ 2nn) = cos0,
tzn. dodanie (lub odjęcie) dowolnej całkowitej wielokrotności 2n do dowolnego 0 nie zmieni ani wartości sinusa 0, ani wartości cosinusa 0. Wykresy funkcji sinus i cosinus pokazują, że w każdym okresie zakres wahań jest stały, mianowicie ±1. Czasami mówimy, że amplituda wahań jest równa 1. Identyczne okresy i identyczne amplitudy tych funkcji powodują, że gdy przesuniemy krzywą cos0 w prawo o n!2, to dokładnie pokryje się ona z krzywą sin0. W związku z tym mówi się, że te dwie krzywe różnią się tylko fazą, tzn. różnią się tylko położeniem najwyższego punktu każdego okresu. Symbolicznie można to wyrazić przy użyciu równania: c o s 0 = s in ^ 0 + ^ j.
Funkcje sinus i cosinus spełniają pewne tożsamości. Spośród nich najczęściej stosuje się poniższe:
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 517
5 16 ANALIZA DYNAMICZNA
(15.14)
*>(-«) . - S M , cos(-Z) = cosZ;
(15.15)
sin2Z+ cos2Z= 1
(15*16)
[gdzie sin2Z= (sinZ)2 itd.]
sin(Ol ± Z2) = sinZxcosZ2 ± cos01sin02, cos(Zx± Z2) = cosZxcósZ2 ■+■sinZjSinZj.
Para tożsamości (15.14) służy do wyrażenia faktu, że funkcja cosinus jest symetryczna względem osi pionowej (tzn. 6 i - 6 zawsze dają tę samą wartość cosinusa), a funkcja sinus nie jest. Wzór (15.15) pokazuje, że dla każdej wartości $ suma kwadratów jej sinusa i cosinusa jest zawsze równa jedności. Tożsamości (15.16) wyrażają sinusy i cosinusy sum i różnic kątów 6Xi Z2. Tożsamości te okażą się pożyteczne w dalszych rozważaniach. Na koniec słowo o pochodnych. Ponieważ funkcje sinus i cosinus są ciągłe i gładkie, więc są również różniczkowalne. Pochodne d(sinZ)/dZ i d(cosZ)/dZ można otrzymać w wyniku przejścia do granicy AZ—>0 odpowiednio dla dwu ilorazów różniczkowych A(sin0)/A0 i A(cosZ)/AZ. Wyniki — podane tu bez dowodów — są następujące: (15.17)
d — sinZ=cosZ, aa
(15.18)
d — cosZ=-sinZ .
Należy jednak podkreślić, że powyższe wzory określające pochodne są prawdziwe tylko dla Zmierzonego w radianach. Jeśli mierzymy go w stopniach, to np. (15.17) przyjmie postać d(sinZ)/dZ= (;r/180)cosZ. Właśnie w celu pozbycia się w rozważaniach analitycznych czynnika (/r/180) preferowana jest miara w radianach. Przykład 2. Znaleźć nachylenie krzywej sinZ w punkcie Z= k !2. Nachylenie sinusoidy jest dane przez jej pochodną (= cos Z). Zatem dla 6= n!2 nachylenie powinno być równe cos(/r/2) = 0. Można sprawdzić ten wynik na rys. 15.4. Przykład 3. Znaleźć drugą pochodną sin Z. Z (15.17) wiemy, że pierwszą pochodną sinZ jest cos Z, zatem szukana druga pochodna wynosi: d2 d — r sin Z = — cos 6 = -sin Z. dZ2 dZ
pokazać, jak wyrażenie wykładnicze z wykładnikami urojonymi napotkane w (15.11) — może być przekształcone w funkcje kołowe mające równoważne rozwinięcia. Dla funkcji sinus napiszmy ę>(Z) = sin Z; wtedy
ę>'(Z) = cos Z ę>"(Z) = -sin Z ——cos Z ę>(4)(Z) = sin Z
Po podstawieniu do (9.14), w którym x został teraz zastąpiony przez Z, otrzymujemy następujący szereg Maclaurina z resztą:
(n+» ; e.n+, sm0=O+ 0+ O - £ + O+ U + ...+ (M+1)! Wyrażenie , a za tem może przyjmować wartości jedynie z przedziału (-1 , 1), niezależnie od wielkości n. Natomiast (n + 1)! będzie szybko rosło przy «-»«>, i to o wiele szybciej niż Z”+1, gdy rośnie n. Zatem reszta będzie dążyć do zera przy n —><*>, więc możemy zapisać szereg Maclaurina w postaci nieskończonego szeregu: (15.19)
0 3 O5 9 1 s in e = 0 -- +- - - + . . .
Podobnie, gdy napiszemy 'F(0) = cos 6, wówczas 'F(0) = cos0 = 1 i kolejne pochodne będą równe: 'F '^ - s i n f l 'F"(ć>) = -c o s 6 ¥ " '( 0 ) = sin 'P(4)(ć>) = cos Q 'P (5)( 0 ) = - s i n 0
W podrozdz. 9.5 pokazano, że każda funkcja mająca skończone, ciągłe pochodne aż do' potrzebnego rzędu może być rozwinięta w funkcję wielomianową. Ponadto, jeśli reszta Rn w otrzymanym szeregu Taylora (rozwinięcie w dowolnym punkcie r 0) lub szeregu Maclaurina' (rozwinięcie w r 0 = 0) dąży do zera, gdy n dąży do nieskończoności, to wielomian może być zapisany jako szereg nieskończony. Przedstawimy teraz rozwinięcie dla funkcji sinus i cosinus, a następnie postaramy się
( ¥ '( 0 ) = - s in 0 = 0, 4'"(0) = - c o s 0 = - l , ¥ '" (0 ) = sin 0 = 0, y (4)(0) = c o s 0 = 1, 4,(3)(Q) = - s in 0 = 0.
Na podstawie tych pochodnych możemy zapisać następujące rozwinięcie dla cos 6: cosB= 1 + 0
Relacje Eulera
ę>'(0) = cos 0 = 1, ę>"(0) = -sin 0 = 0, ^ ( 0 ) = -c o s 0 = - l , ę>(4)(0) = sin 0 = 0, ę><5>(0) = c o s 0 = 1.
+ 0 + ^ - + .. . + \ 6 n*K 2! 4! (ń + 1)!
Ponieważ slriadnik resztoWy równięż tutąj będzie dążył do zera przy w—> więc funkcję cosinus możną też przedstawić w postaci nieskończonego szeregu w następujący sposób: 02
44
A6
(1 5 .2 0 )
Czytelnik zapewne zauważył, żę dysponując wzorami (15.19) i (15.20) jesteśmy W stanie skonstruować tablice wartości sinusa i cosinusa dla wszystkich możliwych wartości Z
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 519
518 ANALIZA DYNAMICZNA
(w radianach). Ale interesuje nas przede wszystkim znalezienie związku między wyrażeniami wykładniczymi zawierającymi urojone wykładniki a funkcjami kołowymi. W tym celu dokonamy rozwinięcia dwu wyrażeń wykładniczych e'6 i e~,ff. Proszę zauważyć, że są to szczególne przy padki wyrażenia e*, które — jak pokazaliśmy wcześniej w (10.6) — ma rozwinięcie: 1 , 1 , e*= l + * + 2 ! 3 !
4
1 . ! "
(15.22)
Podstawiając x = i0, możemy natychmiast otrzymać: ef0 = 1 + i0+
(i O f
(i O f
(i O f
(i O f
2!
3!
4!
5!
+
e2ei ' + i
2! + 4!
i
h -R c o s0 ,
h ± v i = R cos 0 ± Ri sin 0 = R(cos 0 ± / sin 0).
. . . =
0 _ 3! + 5 ! _ -
v = /?sin 0
to sprzężone liczby zespolone h ± vi mogą być przekształcone w następujący sposób:
Postępując tak, przeszliśmy w rezultacie od współrzędnych kartezjańskich dla liczb zespolonych (h, v) do tzw. współrzędnych biegunowych (polar coordinates) R i 0. Wyrażenie po prawej stronie powyższego wzoru stanowi przykład postaci biegunowej dla pary sprzężonych liczb zespolonych. Następnie za pomocą relacji Eulera można przekształcić postać biegunową w następującą postać wykładniczą'.
_ O2 i O3 O4 i O5 ... —■ = 1 + 10-------- ——h----4 2! 3! 4! 5!
'
W odniesieniu do rys. 15.2 widzimy, że określenie h i v wyznacza natychmiast wiel kość kąta 0 i wartość R. Ponieważ dany kąt 0 i dane R mogą razem w jednoznaczny sposób określić punkt na diagramie Arganda, możemy wykorzystać 0 i R do określenia konkretnej pary liczb zespolonych. Jeśli przepiszemy definicje funkcji sinus i cosinus z (15.12) i (15.13) jako:
'•
Podobnie, podstawiając x = - i 0, otrzymamy następujący wynik: R(cos 0 ± i sin 0) = Re±ld. Mamy w sumie trzy zapisy sprzężonych liczb zespolonych: „ 2!
4!
(15.23)
03 05 3! + 5!
Po podstawieniu (15.19) i (15.20) do powyższych dwu wyników, otrzymujemy następującą parę tożsamości — znanych jako relacje Eulera: (15.21)
e ,0 = cos 0 + / sin 0,
(15.21')
e~w = cos 0 - i sin 0,
które umożliwią nam przekształcenie dowolnej urojonej funkcji wykładniczej w równoważną kombinację funkcji sinus i cosinus i vice versa. Przykład 4. Znaleźć wartość eiK. Najpierw przekształcimy to wyrażenie w wyrażenie trygonometryczne; podstawiając 0 = K do (15.21), otrzymujemy e,7C= cos n + i sin n. Ponie waż c o s /r = - l i sin TT= 0 , więc el7t- - \ . Przykład 5. Pokazać, że e-,7r/2 = - /. Podstawiając 0 = ę-in/i = coS
^
o
tz/2
do (15.210, otrzymujemy:
h ± v i = R( cos 0 ± / sin 0) = Re±id.
Jeśli podane są wartości R i 0, to przejście do h i v jest natychmiastowe: korzystamy z dwu równań (15.22). A co z odwrotnymi przekształceniami? Dla danych wartości h i v nie sprawia trudności znalezienie odpowiadającej im wartości R, która jest równa y h + v2. Ale pewna komplikacja dotyczy 0; szukana wartość 0 (w radianach) spełnia dwa warunki cos 0 = h/R i sin 0 = v/R; ale dla danych wartości h i v wartość 0 nie jest jednoznacznie określona. (Dlaczego?) Na szczęście problem nie jest zbyt poważny, gdyż możemy uniknąć niejednoznaczności, jeśli ograniczymy się do przedziału (0, 2/r). Przykład 6. Znaleźć postać kartezjańską liczby zespolonej 5e3i7C/1. Mamy tu R = 5 i 0 - 3 n l2 , zatem z (15.22) i tabl. 15.1 wnioskujemy, że: , ^ h = 5 cos— = 0 2 ,
i
, . ?>k v = 5 sm — = -5 ; 2
postać kartezjańska jest równa po prostu h + vi = - 5 /.
- /( l) = -/. Przykład 7. Znaleźć postać biegunową i wykładnicządla (1 + -\/3 /). W tym przypadku
Alternatywna reprezentacja liczb zespolonych Do tej pory przedstawialiśmy parę sprzężonych liczb zespolonych w ogólnej postaci h ± v/. Ponieważ h i v odnoszą się do odciętej i rzędnej w układzie współrzędnych kartezjańskich dla diagramu Arganda, więc wyrażenie h ± vi przedstawia postać kartezjańską pary sprzężo nych liczb zespolonych. Jako produkt uboczny rozważań nad funkcjami kołowymi i relacjami Eulera, h ± vi możemy teraz wyrazić na dwa różne sposoby.
mamy h= 1 i v = Æ a zatem R = a/1 + 3 = 2. Tablica 15.1 nie pomoże nam tym razem w wyznaczeniu wartości 0. Skorzystamy zatem z tabl. 15.2, która zawiera niektóre dodatkowe wybrane wartości sin0 i cos0. Szukamy mianowicie takiej wartości 0, dla której cos0= h/R = 1/2 oraz sin0= v!R = ^ / 2 . Wartość 0 = /r/3 spełnia te wymagania. Zatem zgodnie z (15.23) szukanym przekształceniem jest: /
V
1 + V3 / = 2 cos - + /s in - = 2einI3. 3 3 V 7
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 521
520 ANALIZA DYNAMICZNA
(b) co s2 0 = l - 2 s i n 20;
Tablica 15.2
(c) sin(0x+ 02) + sin(0x - Oj) = 2 sin 61cos 02; K 4
K 6 1
sin0
7~ f) 2 Ti
2
ñ2
cos0
i ( t
K 3 1 2 1 2
3n T
7
cos20 ’
1 Ti c 2 J
(e) sin
0
cos 0;
-i T
2
Kończąc omawianie tych zagadnień, zwróćmy jeszcze uwagę na ważne uogólnienie wyniku (15.23). Załóżmy, że mamy n-tą potęgę liczby zespolonej, np. (h + vi)n. Jak zapiszemy jej postać biegunową i wykładniczą? Łatwiej otrzymać postać wykładniczą. Ponieważ h + vi = Rew, więc: (h + vi)n = (Rci0)n = R nQin0. Podobnie możemy napisać: (h - vi)n == (ReTi9) = R nQ~in0. Zwróćmy uwagę, że podniesienie liczby zespolonej do w-tej potęgi spowodowało dwie zmiany: (1) R zastąpiono przez R n i (2) 6 zastąpiono przez n6. Gdy te dwie nowe wartości podstawimy do postaci biegunowej w (15.23), wówczas otrzymujemy: (15.230
(d) l + t g 20 =
( h ± v i)n - R n( c o s n O ± is m n 0 \
to znaczy: [R(cos 0 ± i sin 0)]rt = R n(cos n 0 ± i sin n 0). Wynik ten, znany jako twierdzenie De M oivre’a, oznacza, że aby podnieść liczbę zespoloną do n-tej potęgi, musimy po prostu przekształcić jej współrzędne biegunowe, podnosząc R do n-tej potęgi i mnożąc 0 przez n.
(f) cos
f-
s=sin0.
5. Stosując regułę dla pochodnej funkcji złożonej: (a) napisać wzory na pochodne dla -j^sinf(0 ) i -^ c o s f( 0 ) t gdzie f(6 ) jest funkcją d0 d0 (b) znaleźć pochodne cos03, sin(02 + 30), cose® i sin(l/0). 6. Na podstawie wzorów Eulera wywnioskować, że: (a) e“,jr = - l ; (b) e“ » = l ( l + V 3 i); V2 (c) e''c/4 = — (1 + i); <2 (d) e-3i*f4 = — (1 + 0. 7. Znaleźć postać kartezjańską dla każdej liczby zespolonej: f \ n . n (c) (b) 4e* (a) 2 cos - + i sm 6 6, 8. Znaleźć postać biegunową i postać wykładniczą następujących liczb zespolonych: (a) l +
(b) 4 (V3 + z).
Ćwiczenie 15.2 1* Znaleźć pierwiastki następujących równań kwadratowych: (a) r ? ^ 3r -Ę 9 = 0; (ć)2*2 + jc+ 8 = 0; (b) i* + 2 r + 1 7 = 0; (d)Żjc2 - * + 1 = 0. 2. a. Ile stopni zawiera radian? b. Ile radianów ma jeden stopień? 3* W odniesieniu do rys. 15.3, za pomocą twierdzenia Pitagorasa udowodnić, że: (a) sin20 + cos20 = 1;
(b) sin - = ćos - = -J=?. 4 4 *\f2
4. Za pomocą tożsamości (15.14), (15.15) i (15.16) pokazać, że: (a) sin 2 0 = 2sin 0cos 0;
15.3. ANALIZA PRZYPADKU PIERWIASTKÓW ZESPOLONYCH Teraz, dysponując pojęciem liczb zespolonych i funkcji kołowych, jesteśmy przygotowani do zajęcia się przypadkiem pierwiastków zespolonych (przypadek 3 z podrozdz. 15.1). Czytelnik przypomina sobie, że klasyfikacja trzech przypadków, według postaci pierwiastków charak terystycznych, dotyczyła jedynie uzupełniającej funkcji równania różniczkowego. Zatem możemy skupić uwagę na równaniu zredukowanym: y"(i) + a y ( f ) + a 2y = 0.
[z (15.4)]
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 523
522 ANALIZA DYNAMICZNA
Funkcja uzupełniająca Gdy wartości współczynników a x i a 2 są takie, że a 2 < 4a2, wówczas pierwiastki charakte rystyczne stanowią parę sprzężonych liczb zespolonych: rl9 r2 = h ± vi, gdzie:
• i
h
v = lV 4< J 2 - a 2r
Funkcja uzupełniająca, jak wcześniej napisaliśmy, będzie miała postać: yc = eh‘(Alevl, + A2e"’“).
.
[z (15.11)]
Przekształcimy najpierw wykładnicze urojone wyrażenie w nawiasie w równoważną postać trygonometryczną tak, aby można było interpretować funkcję uzupełniającą jako funkcję kołową. Możemy to zrobić za pomocą wzorów Eulera. Podstawiając 0 - vt do (15.21) i (15.21'), otrzymujemy: e™= cos vt + 1sin vi
i
e"VIi = cos vt - i sin vt;
wynika stąd, że funkcja uzupełniająca w (15.11) może być zapisana jako: (15.24)
yc - oht [A j(cos vt + i sin vi) + A2(cos vt - i sin vt)] = = eht [(A i + A2)cos vt + (Aj —A2) i sin vr].
Ponadto, jeśli przyjmiemy skrócone oznaczenia: A5 = A 1+A 2
i
A6 = (Aj - A2) z,
to (15.24) możemy zapisać w prostszej postaci3: (15.24')
yc = e ht(A5cosvt + A 6sm vt),
gdzie występują nowe stałe dowolne A5 i A6, których wartości zostaną później określone. Jeśli Czytelnik jest skrupulatny, może zapytać, dlaczego w poprzednim rozumowaniu zastąpiliśmy 6 przez v/? Zmienna 0 mierzy kąt, a vt jest wielkością wyrażoną w jednost kach t (w naszym przypadku w jednostkach czasu). Jak jest możliwe przedstawienie 6= vtl Można to wyjaśnić za pomocą okręgu jednostkowego (okręgu o promieniu R = 1) przed stawionego na rys. 15.5. Prawdą jest, że używamy 0na oznaczenie kąta, ale ponieważ ten kąt
jest mierzony w radianach, wartość 0 jest zawsze równa stosunkowi długości łuku AB do promienia R. Gdy R = 1, mamy w szczególności: 0=
łuk AZ?
łuk Ai?
R
1
-
= łukAB.
Innymi słowy, 0 jest nie tylko zmianą kąta wyrażoną w radianach, lecz również długością łuku AB, która jest liczbą, a nie kątem. Jeśli wpływ czasu zaznaczymy na obwodzie okręgu jednostkowego (w kierunku przeciwnym do kierunku ruchu wskazówek zegara), a nie na osi takiej, jak dla szeregów czasowych, nie będzie stanowiło żadnej różnicy, czy potraktujemy upływ czasu jako wzrost miary kąta 0 wyrażonej w radianach, czy jako wydłużenie łuku AZ?. Nawet jeśli R ź 1, to też można przyjąć takie samo rozumowanie, z tą różnicą, że w tym przypadku 0 będzie równe: (łuk AB)/R, tzn. kąt 0 i łuk AB będą stanowić ustaloną proporcję zamiast być równe. Zatem podstawienie 0 = v f jest rzeczywiście uzasadnione.
Przykład rozwiązania Znajdźmy rozwiązanie równania różniczkowego:
3 Fakt, że przy określeniu A6 włączamy do niej jednostkę urojoną, nie jest wcale próbą — mówiąc metaforycznie — „zamiatania śmieci pod dywan” . Ponieważ A6 jest dowolną stałą, więc może przyjmować zarówno wartości urojone, jak i rzeczywiste. Nie jest też prawdą, że A6 musi koniecznie być liczbą urojoną. Rzeczywiście, jeśli A x i A2 są parą sprzężonych liczb zespolonych, np. m ± ni, to A5 i A6 będą rzeczywiste: A 5= A l Ji-A2- { m Jr ni) + (m - ni) = 2m,
y"(f) + 2y'(t) + 17y = 34 z warunkami początkowymi y (0) = 3 i y'(0) = 11. Ponieważ ax = 2, a2 = 17 i b = 34, możemy więc natychmiast znaleźć całkę szczególną: b
34
yP p = a, = T17i
•
[z (15.3)]
Ponadto, ponieważ a 2 = 4 < 4 a 2 = 68, więc pierwiastki charakterystyczne będą stanowić
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 525
524 ANALIZA DYNAMICZNA
parę sprzężonych liczb zespolonych (h ± vi), gdzie: /' = _ 5 a >= " 1
1
v = ^V 4a2- a J = ^V64 = 4-
Zatem na podstawie (15.24') funkcja uzupełniająca jest równa: yc = e~'(A5cos 4 r+ A6sin 4r) i po dodaniu yp do yc rozwiązanie ogólne może być zapisane jako: y(t) = e"'(A5cos4i + A6sin4f) + 2. Aby wyznaczyć wartości stałych As i A6, skorzystamy z dwóch warunków począt kowych. Najpierw podstawiając 1= 0, do rozwiązania ogólnego, otrzymujemy: y(0) = e°(A5 - c o s 0 + A6sin0) + 2 = (A5 + 0) + 2 = A 5 + 2.
[cosO = 1; sin0 = 0]
Na podstawie warunku początkowego y(0) = 3 możemy określić A5 = 1. Następnie (korzystając ze wzoru na pochodną iloczynu i wzorów dla pochodnych (15.17) i (15.18), pamiętając o regule na pochodną funkcji złożonej — por. ćwiczenie 15.2-5) różniczkujemy ogólne rozwiązanie względem t i otrzymujemy najpierw y'(r), a potem y '(0): y'(t) = -e " i(A5cos 4t + A6sin4i) + ew[A5( - 4 sin 4f) + 4A6cos 4/], y '(0 ) =
(A5cos 0 + A6sin 0) + (-4A5sin 0 + 4A6cos 0) = -(A 5 + 0) + (0 + 4Ag) = 4A6 - A5.
Na podstawie drugiego warunku początkowego y'(Q) = 11, a ponieważ A5 = 1, więc widać4, źe A6 = 3. Rozwiązanie określone ma zatem postać: (15.25)
y(r) = e“'(c o s4 f+ 3 sin 4 0 + 2.
Podobnie jak poprzednio, składowa yp(= 2) może być interpretowana jako między okresowe położenie równowagi dla y, podczas gdy składowa yc reprezentuje odchylenie od położenia równowagi. Ze względu na to, że we wzorze dla yc występują funkcje kołowe, można oczekiwać, że ścieżka czasowa dla (15.25) będzie miała strukturę zawierającą wahania. Ale jaka będzie jej konkretna struktura?
Ścieżka czasowa Znamy już ścieżki czasowe zwykłej funkcji sinus i cosinus, pokazane na rys. 15.4., Musimy teraz zbadać ścieżki dla pewnych wariantów i kombinacji funkcji sinus i cosinus, tak abyśmy mogli zinterpretować — w ogólnym przypadku — funkcję uzupełniającą (15.24'): ; yc = e to(A5cos vt + A6sin vt) i w szczególności składową yc dla (15.25). Zbadajmy najpierw składnik A5cos vt. Samo wyrażenie cos vt jest funkcją kołową
4 Rzeczywiście okazało się, że A6 jest liczbą rzeczywistą, mimo iż do jej definicji włączyliśmy liczbę urojoną i.
argumentu vt o okresie 2;r(= 6,2832) i amplitudzie 1. Okres 2n oznacza, że kształt wykresu powtarza się za każdym razem, gdy vt rośnie o 2/r. Gdy samo t traktujemy jako zmienną niezależną, powtórzenie kształtu nastąpi wtedy, gdy zwiększymy t o 2/tfv, więc w odniesie niu do t — tak jak należy czynić w dynamicznej analizie ekonomicznej — będziemy przyjmować, że okres cos vt jest równy 2n!v (amplituda pozostaje jednak na poziomie 1). A teraz, gdy dołączymy do cos vt stały czynnik A5, zakres wahań zmienia się z ±1 w ±A5. Amplituda jest teraz równa A5, chociaż okres nie zmienia się pod wpływem tej stałej. W skrócie, A5cos vt jest funkcją typu cosinus zmiennej t, o okresie 2nlv i amplitudzie A5. Na tej samej zasadzie A6sinvi jest sinusową funkcją zmiennej t, o okresie równym 2/r/v i amplitudzie A6. Ponieważ oba składniki mają ten sam okres, więc suma (A5 cos vt + A6 sin vt) również będzie się charakteryzować cyklem powtarzającym się, gdy t wzrośnie o 2n!v. Dla danych wartości A5 i A6 możemy zawsze znaleźć dwie stałe A i £ takie, źe: A5 = A c o s £
i
A6 = -Asin£,
a więc wspomnianą sumę możemy wyrazić jako: A5c o s vt + A6sin vt = A cos £cos vt - A sin £ sin vt = = A(ćos vt cos £ - sin vt sin £) = = A cos(vi+£).
[z (15.16)]
Jest to zmodyfikowana funkcja argumentu i, z amplitudą A i okresem 2n/v, ponieważ za każdym razem, gdy t rośnie o 2nlv, wówczas (vt + £ ) wzrośnie o 2 k , c o zamknie cykl dla wykresu funkcji cosinus. Gdyby yc składało się tylko z wyrażenia (A5cosvf+ A 6sinv/), w ynikłoby z tego, że ścieżka czasowa dla y byłaby nieskończona, z niekończącymi się wahaniami o stałej amplitudzie wokół wartości równowagi y, reprezentowanej przez yp. Ale trzeba tu roz ważyć również czynnik e fa. Jest on bardzo ważny, ponieważ — jak zobaczymy — zawiera klucz do rozwiązania problemu: czy ścieżka czasowa będzie zbieżna. Jeśli h > 0, to wartość e^ będzie wciąż rosłą w miarę wzrostu t. Spowoduje to zwiększa nie amplitudy (A5cos vf + A6sinv/) i wywoła coraz większe odchylenie od położenia równowagi w każdym następnym cyklu. Jak pokazano na rys. 15.6(a), ścieżka czasowa będzie się charakteryzowała eksplodującymi wahaniami. Jeśli h = 0, to t ht- \ i funkcja uzupeł niająca równa się po prostu A5cosvi + A6sinvi i ma stałą amplitudę. W tym przypadku każdy cykl będzie miał jednakowy schemat odchyleń, jak to pokazano dla ścieżki czasowej na rys. 15.6(b). Jest to ścieżka czasowa o jednakowych wahaniach. W końcu, jeśli h< 0,
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 527
526 ANALIZA DYNAMICZNA
Czytelnik przypomina sobie, że dla przypadków 1 i 2 (podrozdz. 5.1), gdy pierwiastki charakterystyczne były rzeczywiste, warunkiem dynamicznej stabilności równowagi był fakt, aby każdy pierwiastek charakterystyczny był ujemny. W obecnym przypadku (przypadek 3) dla zespolonych pierwiastków warunek jest skromniejszy; wymaga się jedynie, aby część rzeczywista (h) pierwiastków zespolonych (h ± vz) była ujemna. Można jednak połączyć wszystkie te przypadki i zebrać wszystkie trzy, pozornie różne warunki, w jeden warunek o ogólnym zastosowaniu. Wystarczy interpretować dowolny pierwiastek rzeczywisty jako pierwiastek zespolony, którego część urojona jest równa zeru (v = 0). Wtedy warunek „rzeczywista część każdego pierwiastka charakterystycznego ma być ujemna” oczywiście może być stosowany do wszystkich trzech przypadków i stanowi jedyny warunek, jaki jest nam potrzebny.
Ćwiczenie 15.3 Znaleźć yp i y c oraz ogólne, a następnie określone rozwiązania dla każdego z następujących równań: ;
KO) = 3;
K(0) = 7.
2. y"(t) + 4y'(t) + 8y = 2;
K 0) = 2 Í;
O II
1. y"(t) - 4y'(0 + 8y = 0;
3.
KO) = 2;
/(O ) = 2.
KO) = 6;
K (0) = 8 l
K 0) = l; y(0) = 4;
y'(0) = 5.
Rysunek 15.6 (b, c) to składnik &ht będzie stale maleć w miarę wzrostu t i każdy następny cykl będzie miał mniej szą amplitudę niż poprzedni, podobnie jak fale rozchodzące się po powierzchni wody. Przypadek ten jest zilustrowany na diagramie 15.6(c), gdzie ścieżka czasowa charakteryzuje się gasnącymi wahaniami. Rozwiązanie (15.25) dla h = -1 stanowi przykład tego ostatniego przypadku. Tylko w tym właśnie przypadku może powstać zbieżna ścieżka czasowa; w dwu pozostałych ścieżka nie jest zbieżna lub jest rozbieżna5. Na wszystkich trzech diagramach rys. 15.6 przyjęto założenie, że międzyokresowe położenie równowagi jest stacjonarne. Jeśli jest to ruchome położenie równowagi, to trzy rodzaje ścieżek będą wciąż wahać się wokół niego, ale ponieważ ma ono na ogół wykres w postaci krzywej, a nie poziomej prostej, więc wahania mogą przyjąć postać, powiedzmy, cykli koniunkturalnych wokół trendu (secular trend).
Dynamiczna stabilność równowagi Pojęcie zbieżności ścieżki czasowej jest nierozłącznie związane z pojęciem dynamicznej stabilności międzyokresowego położenia równowagi dla tej zmiennej. Dokładniej, położenie równowagi jest dynamicznie stabilne wtedy i tylko wtedy, gdy ścieżka czasowa jest zbieżna. Warunek zbieżności ścieżki czasowej y(t), mianowicie h < 0 (rys. 15.6(c)), jest zatem również warunkiem dynamicznej stabilności położenia równowagi dla y.
5 Będziemy używać dwu terminów: „nie jest zbieżny” i „jest rozbieżny” , chociaż ten ostatni bardziej nadaje się na oznaczenie eksplodującego niż jednostajnego typu braku zbieżności. ii
y"(t) + 3y'(t) + 4y = 12;
4. y"(t) - 2 /( r ) + lOy = 5; 5. y"(t)+ 9y = 3 ; 6. 2 /'( i ) - 1 2 y '( i) + 20y = 40;
,
K(0) = 3.
7. Które z powyższych równań różniczkowych ma ścieżkę czasową z: (a) gasnącymi wahaniami; (b) jednorodnymi wahaniami; (c) eksplodującymi wahaniami?
15 4. M O D E L R Y N K U Z O C Z E K IW A N IA M I C E N O W Y M I
^
We wcześniejszych sformułowaniach dynamicznego modelu rynku Qd i Qs traktowano jako funkcje bieżącej ceny P. Ale niekiedy sprzedający i kupujący mogą uzależniać swoje zachowanie na rynku nie tylko od bieżących cen, lecz również od trendu cenowego występującego w danym okresie. Obserwacje trendu cen mogą bowiem skłaniać ich do sformułowania pewnych oczekiwań dotyczących poziomu cen w przyszłości, a te z kolei mogą wpłynąć na ich decyzje dotyczące popytu i podaży.
3,
Trend cen i oczekiwania cenowe W kontekście czasu ciągłego informację dotyczącą trendu cen można znaleźć przede wszystkim za pomocą dwu pochodnych: dP/dt (czy cena rośnie) i d2P/di2 (czy rośnie coraz
528 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 52 9
szybciej). Aby uwzględnić trend cenowy, włączymy teraz te pochodne do funkcji popytu i podaży jako dodatkowe argumenty: " Qd= b [ P ( t\ p \ t ) , p " m Qs =s[P(t), m n o ] . Jeśli ograniczymy się do liniowych wersji tych funkcji i uprościmy oznaczenia zmiennych niezależnych jako P, P/ i P", to możemy napisać: (15 26)
Q d= < x-pP + mP' + nP" Qs = - Y + S P + uP' + wP"
\ a y p > 0), (/, S> 0),
gdzie parametry a , p , y i S są po prostu przeniesione z poprzednich modeli rynku, ale m, n, u i w są nowe. Cztery nowe parametry, których znaki nie zostały określone, wyrażają oczekiwania cenowe sprzedających i kupujących. Jeśli np. m > 0, to wyższa cena będzie powodowała wzrost Qd. Oznaczałoby to, że kupujący spodziewają się dalszego wzrostu cen, więc wolą zwiększyć zakupy obecnie, gdy ceny są wciąż jeszcze względnie niskie. Przeciwny znak dla m oznacza natomiast oczekiwanie, że nastąpi odwrócenie trendu cenowego, więc kupujący wolą ograniczyć obecnie zakupy i poczekać na niższe ceny. Włączenie parametru n powo duje, że zachowanie kupujących zależy również od tempa wzrostu dP/dt. Zatem nowe parametry m i n powodują pojawienie się elementu spekulacji cenowej w modelu. Parametry u i w mają podobne implikacje po stronie podażowej modelu.
równowagi międzyokresowej. Innymi słowy, dwa sposoby rozumienia równowagi są teraz rozłączne. To właśnie mechanizm dostosowania cen dPIdt = j(Q d - Qs), zawierający pochod ną, powodował, że poprzedni model był dynamiczny. W obecnym modelu, nie zawierającym mechanizmu dostosowawczego, dynamiczna natura modelu wynika ze składników opisują cych oczekiwania mP/ i nP".
Ścieżka czasowa ceny Cena dla międzyokresowego położenia równowagi — całka szczególna Pp (poprzednio oznaczona yp) — może być z łatwością wyznaczona na podstawie (15.3). Jest ona równa: p *
b = a+ r a2 P + S '
Ponieważ jest ona stała (dodatnia), więc reprezentuje równowagę stacjonarną. Jeśli chodzi o funkcję uzupełniającą Pc (poprzednio oznaczoną yc), istnieją trzy możliwe przypadki. Przypadek 1 (różne pierwiastki rzeczywiste)
e r-n Funkcja uzupełniająca jest w tym przypadku równa (na podstawie (15.7)):
Model uproszczony
Pc = A le r', + A 1e r^,
Dla uproszczenia przyjmijmy, że tylko funkcja popytu zawiera oczekiwania cenowe. Dokładniej, przyjmujemy, że w (15.26) m i n są różne od zera, ale u = w = 0. Zakładamy ponadto, że rynek jest oczyszczony w każdym momencie. Możemy wtedy przyrównać funkcje popytu oraz podaży i po normalizacji otrzymać równanie różniczkowe:
gdzie: (15.28)
ri, r2 = ł
W związku z tym ogólne rozwiązanie jest równe: (15.27)
+
‘\
= n
n
n
a+ y P(t) = Pc + Pp = A le r‘'+ A 2e r* + j - ^ .
(15.29)
które przyjmie postać (15.2) po następujących podstawieniach: _ y = P;
m «1 = - ; n
p+ S a+ y a2 = - ------- ; b = ----------. n n
Ponieważ schemat zmian dla P obejmuje oprócz pierwszej pochodnej P' również drugą pochodną P", więc obecny model jest na pewno różny od dynamicznego modelu rynku przedstawionego w podrozdz. 14.2. Zauważmy jednak, że różnice między modelami wynikają również z innych powodów. W podrozdz. 14.2 występował dynamiczny mechanizm dostosowawczy dPJdt = j(Q d - Qs). Ponieważ z tego równania wynikało, że dP/dt = 0 wtedy i tylko wtedy, gdy Qd= Qs, równowagi w sensie międzyokresowym i czyszczącym rynek pokrywały się ze sobą. Obecnie rozważany model uwzględnia natomiast założenie o czysz czeniu rynku w każdym momencie. Zatem każda cena występująca na rynku jest ceną równowagi w sensie czyszczenia rynku, chociaż może się nie kwalifikować jako cena
Przypadek 2 (podwójny pierw iastek rzeczywisty)
W tym przypadku oba pierwiastki charakterystyczne przyjmują jedną i tę samą wartość: m
r zatem na mocy (15.9) ogólne rozwiązanie może być zapisane jako: (15.290 P(t) = 34 — Podstawy...
CT+r A 3e ~ m / 2 n + Ajfe~ P+8
530 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 531
Przypadek 3 (pierwiastki zespolone)
Ogólnym rozwiązaniem, na podstawie (15.29), jest zatem: P(t) = A le6‘ + A2er2‘ + 4.
W tym przypadku pierwiastki charakterystyczne są parą sprzężonych liczb zespolonych:
P(0 = e6' + Q~2t + 4.
rlf r2 = h ± vi,
Ze względu na dodatni pierwiastek rx = 6, międzyokresowe położenie równowagi (Pp = 4) jest dynamicznie niestabilne. Powyższe rozwiązanie otrzymaliśmy na podstawie wzorów (15.28) i (15.29). Alternatyw nie możemy najpierw przyrównać do siebie podane funkcje popytu i podaży w celu otrzymania równania różniczkowego:
gdzie:
a zatem na podstawie (15.24') otrzymujemy ogólne rozwiązanie: (15.29")
Uwzględniając ponadto warunki początkowe, widzimy, że A 1= A 2= 1, a więc roz wiązanie jest równe:
/y + y P(t) = e_mi/2n(A5cos vt + A6sin vt) + - — fi + 6
P " - 4 P '- 1 2 P = -4 8 , a następnie rozwiązać to równanie, jako szczególny przypadek (15.2).
Można stąd wyprowadzić dwa wnioski ogólne. Po pierwsze, jeśli n > 0, to -4 (/? + S)/n musi być ujemne, zatem mniejsze niż (m/n)2. Przypadki 2 i 3 można więc natychmiast odrzucić. Ponadto, jeśli n jest dodatnie (podobnie jak fi i 3), to wyrażenie podpierwiastkowe w (15.28) musi przekraczać (m/n)2, a zatem pierwiastek kwadratowy musi być większy niż |m/n|. Znaki ± we wzorze (15.28) utworzą wtedy jeden dodatni pierwiastek (rfi i jeden ujemny pierwiastek (r2). W konsekwencji międzyokresowa równowaga jest niestabilna, chyba że określona w (15.29) wartość jest równa zeru. Po drugie, jeśli n < 0, to wszystkie trzy przypadki stają się dopuszczalne. W przypad ku 1 możemy być pewni, że oba pierwiastki będą ujemne, jeśli m jest ujemne. (Dlaczego?) Co ciekawe, podwójny pierwiastek dla przypadku 2 jest również ujemny, jeśli m jest ujemne. Ponadto, ponieważ r, część rzeczywista pierwiastków zespolonych w przypadku 3, ma taką samą wartość jak podwójny pierwiastek z przypadku 2, więc ujemne m gwarantuje również, że h jest ujemne. Słowem, dla wszystkich trzech przypadków jest zapewniona dynamiczna stabilność równowagi, gdy oba parametry m i n są ujemne. Przykład L Niech będą dane funkcje popytu i podaży:
Przykład 2. Dane są funkcje popytu i podaży: Qd = 4 0 - 2 P - 2 P '- P " , fi, = - 5 + 3P oraz P(0) = 12 i P'(0) = 1. Znaleźć P(f) przy założeniu, że rynek jest zawsze oczyszczony. Parametry m in są tutaj ujemne. Zgodnie z naszymi poprzednimi ogólnymi rozważaniami równowaga międzyokresowa powinna być zatem dynamicznie stabilna. Aby znaleźć konkretne rozwiązanie, możemy najpierw przyrównać Qd i Qs, otrzymując równanie różniczkowe (po pomnożeniu przez -1): P" + 2P' + 5P = 45. Międzyokresowa równowaga jest wyznaczona przez całkę szczególną:
a równanie charakterystyczne tego równania różniczkowego:
&, = 4 2 - 4 P - 4 P ' + P", r2 + 2r + 5 = 0
a = - 6 + 8P, z warunkami początkowymi P(0) = 6 i P^O) = 4. Zakładając czyszczenie rynku w każdym momencie, znaleźć ścieżkę czasową P(t). W tym przykładzie wartości parametrów są równe: cc =42;
fi = 4;
7 = 6;
3= 8;
m =- 4;
n = 1.
Ponieważ n jest dodatnie, więc z naszych poprzednich rozważań wynika, że może się pojawić tylko przypadek 1 i że dwa (rzeczywiste) pierwiastki rx i r2 będą miały przeciwne znaki. Potwierdza się to po podstawieniu wartości parametrów do (15.28), gdyż:
* ma dwa pierwiastki zespolone: rv r2= l ( - 2 ± V4- 2o) = ^ ( - 2 ± 4i) = -1 ± 2 Oznacza to, że h = -1 i v = 2, więc rozwiązanie ogólne jest równe: P(t) = e~r(A5cos 21+ A6sin 21) + 9. Aby określić wartość stałych dowolnych A5 i A6, podstawiamy do ogólnego rozwiązania t = 0 i otrzymujemy: P(0) = e°(A5cos0 + A6sin 0) + 9 = A5 + 9;
[cos 0 = 1 ; sin 0 = 0]
532 ANALIZA DYNAMICZNA
/
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 533
i
15.5. WSPÓŁZALEŻNOŚĆ INFLACJI I BEZROBOCIA
ponadto po zróżniczkowaniu ogólnego rozwiązania i podstawieniu / = 0 otrzymujemy: F it) = -e"'(A 5cos 2 f + A6sin 2t) + e"'(-2A5sin 21+ 2A6cos 21) [pochodna iloczynu i pochodna funkcji złożonej]
W tym podrozdziale zilustrujemy zastosowanie równania różniczkowego na przykładzie modelu makroekonomicznego dotyczącego problemów inflacji i bezrobocia.
oraz: P'{0) = -e°(A 5cos 0 + A6sin 0) + e°(-2A5sin 0 + 2A6cos 0) = = -(A 5 + 0) + (0 + 2A6) = -A 5 + 2A6.
Zależność PhiUipsa
Na mocy warunków początkowych P(0) = 12 i P'(0) = 1 otrzymujemy zatem A5 = 3 i A6 = 2. W konsekwencji rozwiązanie określone jest równe:
Najpowszechniej stosowanym pojęciem w nowoczesnej analizie problemu inflacji i bez robocia jest zależność PhiUipsa6. Jest to opis, oparty na obserwacjach empirycznych, ujemnej zależności między stopą wzrostu płac a stopą bezrobocia:
P(t) = e“'(3 cos 2t + 2 sin 21) + 9. Ta ścieżka czasowa zawiera oczywiście wahania okresowe; okres jest równy 2 ttIv = n. Oznacza to, że mamy pełny cykl wtedy, gdy t wzrasta o n - 3,14159... Ze względu na czyn nik e-f wahania wygasają. Ścieżka czasowa, która rozpoczyna się od początkowej ceny P(0) = 12, dąży do ceny międzyokresowej równowagi Pp = 9 w sposób cykliczny.
Ćwiczenie 15.4
.
.
1. Zmóżmy, że wszystkie parametry m, n, u i w w (15.26) są różne od zera. a. Zakładając, że rynek jest czyszczony w każdym momencie, zapisać nowe równanie różniczkowe dla modelu. b. Znaleźć międzyokresową cenę równowagi. c. W jakich okolicznościach można wykluczyć wahania okresowe? 2. Załóżmy, że funkcje popytu i podaży są takie, jak w (15.26), ale dla u = w = 0, tak jak w tekście. a. Rynek nie zawsze jest oczyszczony, ale występują dostosowania zgodnie ze wzorem:
^ = j ( Q d- Q s)
U> 0);
zapisać odpowiednie dla tej sytuacji równanie różniczkowe. b. Znaleźć cenę równowagi międzyokresowej i cenę równowagi czyszczącej rynek. c. Sformułować warunek otrzymania ścieżki czasowej z wahaniami. Czy wahania mogą wystąpić, jeśli n > 0? 3. Niech popyt i podaż będą opisane równaniami: Qd = 9 - P + P' + 3 P = -1 + 4P - P ' + 5P" przy P(0) = 4 i P'(0) = 4. a. Znaleźć ścieżkę cen, zakładając, że rynek jest czyszczony w każdym momencie. b. Czy ścieżka czasowa jest zbieżna? Czy zawiera wahania?
(15.30) ' Wy
w = f(U )
(f'( U )< 0),
gdzie w oznacza stopę wzrostu płac W (tzn. w = WiW), a U jest stopą bezrobocia. Relacja odnosi się zatem jedynie do rynku pracy. W późniejszych zastosowaniach przekształcono zależność Phillipsa w funkcję opisującą związek między stopą inflacji (zamiast w) a stopą bezrobocia. Takie przekształcenie może być usprawiedliwione tym, źe zasada pełnych kosztów jest szeroko stosowana, więc dodatnie w, wyrażające rosnący koszt płac, będzie mieć implikacje inflacyjne, a to z kolei powoduje, że stopa inflacji, podobnie jak w, staje się funkcją U. Nacisk inflacyjny dodatniego w może jednak być kompensowany wzrostem wydajności pracy, o której zakłada się, że jest egzogeniczna i którą oznaczamy tu symbolem T. Dokładniej, efekt inflacyjny może się zmaterializować tylko w takim stopniu, w jakim płace rosną szybciej niż wydajność. Oznaczając stopę inflacji — tzn. stopę wzrostu poziomu cen P — literą p ( p = P lP \ możemy zatem napisać: (15.31)
p = w -T .
Łącząc (15.30) z (15.31) i przyjmując liniową wersję funkcji /( i/) , otrzymujemy zmodyfikowaną zależność Phillipsa: (15.32)
p =a -T -p U
{a, p > 0).
Zależność Phillipsa poszerzona o oczekiwania » Ekonomiści uznali, źe lepiej jest stosować wersję zależności Phillipsa poszerzoną o oczekiwa nia (expectations-augmented): (15.300
w = f{U ) + h n
(0 < fc * sl),
gdzie n oznacza wartość oczekiwaną stopy inflacji. Zgodnie z ideą profesora Friedmana7, jeśli trend inflacyjny trwa dość długo, ludzie są skłonni wyrobić sobie pewne oczekiwania
6 A.W. Phillips, The Relationship Between Unemployment and the Rate of Change of Money Wage Rates in the United Kingdom, 1861-1957, „Economica” 1958, November, s. 283-299. 7 Milton Friedman, The Role of Monetary Policy, »American Economic Review” 1968, March, s. 1-17.
5 3 4 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 535
inflacyjne. Zatem w powinno być rosnącą funkcją K. Po uwzględnieniu tej idei w (15.32), otrzymujemy równanie: (15.33)
p = a - T - fiU+hTC
Przypomnijmy sobie równanie (10.25).. Stosując je w drugą stronę, widzimy, że wyrażenie i m - p ) reprezentuje stopę wzrostu pieniądza w ujęciu realnym :
(O c fc ^ l). m ~P
Po wprowadzeniu nowej zmiennej, która ma oznaczać oczekiwaną stopę inflacji, należy sformułować hipotezę dotyczącą powstawania oczekiwań inflacyjnych8. Przyjmujemy tu hipotezę o oczekiwaniach adaptacyjnych (adaptive expectation): \ (15.34)
(0
j1). < . •
M P ~p~ rM~ rP~ r(M//0»
a zatem (15.35) oznacza, że dU/dt jest ujemnie związane ze stopą wzrostu rzeczywistego bilansu pieniądza. Ponieważ zmienna p uczestniczy obecnie w określaniu dUldt, więc model zawiera sprzężenie zwrotne od inflacji do bezrobocia.
.
Zauważmy, że równanie to opisuje nie wielkość k , lecz jej schemat zmian w czasie. Jeśli rzeczywista stopa inflacji p przekroczy stopę oczekiwaną k , to ta druga zostaje podwyższona, ponieważ okazała się zbyt niska (dtódt > 0). Jeśli natomiast p jest mniejsza od n, to K zostaje obniżona. Postać równania (15.34) przypomina mechanizm dostosowawczy dP ldt= j(Q d- Q s) w modelu rynku. Ale tutaj siłą sprawczą wy wołującą dostosowanie jest rozbieżność między rzeczywistą i oczekiwaną stopą inflacji.
Ścieżka czasowa 77 Równania (15.33), (15.34) i (15.35) stanowią zamknięty model względem trzech zmiennych 7t, p i U. Eliminując jednak dwie spośród trzech zmiennych, możemy skondensować model w postaci pojedynczego równania różniczkowego względem jednej zmiennej. Załóżmy, że wybraliśmy /r jako tę zmienną. Możemy wtedy najpierw podstawić (15.33) do (15.34), aby otrzymać: dk
Sprzężenie zwrotne od inflacji do bezrobocia
(15.36)
Równania (15.33) i (15.34) można traktować jako stanowiące zupełny model. Ponieważ są tu trzy zmienne w układzie złożonym z dwu równań, jedna ze zmiennych musi być traktowana jako egzogeniczna. Jeśli n p . p i w uważamy za endogeniczne, to U musi być egzogeniczna. Bardziej zadowalającą alternatywą jest wprowadzenie trzeciego równania objaśniającego zmienną U, co wzbogaciłoby opisy zachowań w modelu. Co ważniejsze, dałoby to nam możliwość uwzględnienia efektu sprzężenia zwrotnego wpływu inflacji na bezrobocie. Równocześnie (15.33) pokazuje, jak U wpływa na p — głównie po stronie podaży gospo darki. Ale p na pewno z kolei wpływa na U. Na przykład stopa inflacji wpływa na decy zje społeczeństwa dotyczące konsumpcji i oszczędzania, a zatem na zagregowany popyt na produkcję krajową, co wpłynie na stopę bezrobocia. Stopa inflacji w znacznej mierze decyduje 0 kształcie polityki fiskalnej i monetarnej państwa, które wywierają różny wpływ na produkcję 1 bezrobocie. Dla uproszczenia uwzględnimy jedynie sprzężenie zwrotne za pośrednictwem polityki monetarnej. Oznaczając nominalny bilans pieniężny przez M i jego stopę wzrostu przez m = M/M, postulujemy, że9:
Gdyby to równanie zawierało dU/dt, a nie U, moglibyśmy je podstawić bezpośrednio (15.35). Ale dla równania (15.35), takiego jakie jest, musimy najpierw utworzyć wyrażenie dUldt, różniczkując (15.36) względem t. Otrzymujemy:
(15.35)
dU —~ = - k ( m - p ) dt
(k> 0).
dt
= j( a -T -fiU )- j( l-h ) 7 r .
d27U
dn
Podstawienie (15.35) do tego równania daje:
^j=jpkm-jpkp-j(\-h ) ^ . \
OS-37')
Pozostała jeszcze do wyeliminowania zmienna p. Aby to osiągnąć, zauważmy, że (15.34) implikuje: (15.38)
P = - - r +'n ' j di
Stosując ten wynik w (15.37') i upraszczając, otrzymujemy w końcu szukane równanie różniczkowe względem jednej zmiennej K\ d?7i
8 Stanowi to przeciwieństwo sytuacji analizowanej w poprzednim podrozdziale, gdy omawialiśmy oczekiwania cenowe bez wprowadzania nowej zmiennej reprezentującej oczekiwaną cenę. W rezultacie założenia dotyczące powstawania oczekiwań były uwzględnione jedynie w sposób niejawny w parame trach m, n, u i w w (15.26). 9 Poprzednio oznaczyliśmy podaż pieniądza symbolem Ms, aby odróżnić ją od popytu na pie niądz Md. Teraz możemy stosować po prostu oznaczenie M, gdyż nie istnieje ryzyko nieporozumienia.
_ dU
(1537)
dn + [ f i k + j ( l - h j \ — + (jp k )7 t= jp k m . at
a2
b
Całką szczególną tego równania jest po prostu: b ftp —— —m, a2
536 ANALIZA DYNAMICZNA RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 537
a zatem wartość oczekiwanej stopy inflacji odpowiadająca równowadze międzyokresowej zależy jedynie od stopy wzrostu nominalnego zasobu pieniądza. Dla funkcji uzupełniającej dwa pierwiastki są równe jak poprzednio: (15.39)
r„ r2 = ^ ( - a ,
- 4 a 2),
.
9 b =jfi b n = -m .
^
gdzie — jak można zauważyć na podstawie (15.37") — ax i a2 są dodatnie. Nie można a priori określić, czy a \ będzie większe czy mniejsze od 4a2. Możliwe są zatem wszystkie trzy przypadki dla pierwiastków charakterystycznych: różne pierwiastki rzeczywiste, podwójny pierwiastek rzeczywisty lub pierwiastki zespolone. Niezależnie od tego, który przypadek wystąpi, położenie równowagi w obecnym modelu będzie dynamicznie stabilne. Można to wyjaśnić w następujący sposób. Załóżmy najpierw, że wystąpi przypadek l , z a j > Ąa2. Wtedy pierwiastek kwadratowy w (15.39) jest liczbą rzeczywistą. Ponieważ a jest dodatnie, więc
9 d2= j p k = - ,
Całka szczególna jest równa bla2 = m. Ponieważ a \ < 4a2, więc pierwiastki charakte rystyczne są zespolone: 3 <
¡99 | ’
lf3 3 V
3
3.
y _ 2 ^ 2 :!:2 'J “' _ 4 ± 4 ,’
3 3 tzn. h = — i v = - . W konsekwencji rozwiązanie ogólne dla oczekiwanej stopy inflacji:
- 4a 2 musi być mniej
sze od ^la^ = av Wynika stąd, że rx jest ujemne, podobnie jak r2, czyli równowaga jest dynamicznie stabilna. A co będzie dla a2x = 4a2 (przypadek 2)? Wtedy pierwiastek kwadratowy jest równy zeru, więc rx = r2 = - a j l < 0. Ujemność podwójnego pierwiastka powtórnie implikuje dynamiczną stabilność. W końcu dla przypadku 3 część rzeczywista pierwiastków zespolonych jest równa h = - a xll. Ponieważ ma ona taką samą wartość jak podwójny pierwiastek z przypadku 2, więc stosuje się tu ten sam wniosek dotyczący dynamicznej stabilności. Chociaż przeanalizowaliśmy jedynie ścieżkę czasową dla K, model może dostarczyć informacji również o pozostałych zmiennych. Aby znaleźć ścieżkę czasową, np. dla zmien nej t/, możemy albo przekształcić model w równanie różniczkowe względem zmiennej U, a nie ;r (porównaj zadanie 15.5-2), albo wyznaczyć ścieżkę U na podstawie znalezionej ścieżki K (zob. przykład 1).
(15.43)
n (i) = e 3i/4^A5cos ^ t + A6sin ^ tj ■+m
określa ścieżkę czasową z wygasającymi wahaniami wokół wartości równowagi m. Możemy stąd również wyprowadzić ścieżki czasowe dla zmiennych p i U. Zgodnie z (15.41) p może być wyrażone w zależności od k i d n ld t równaniem: 4 dn p = - — + 7T. 3 di
Ścieżka
n
w rozwiązaniu ogólnym (15.43) implikuje, że pochodna jest równa:
d7t = —3 e 33t/4\ J AA5cos -3 1 + A6sin , • -3 1Y+ N — di 4 V 4 4 ) ( 3 3 3 3 ^ + e 3i/4l - - A 5s in - i + - A6c o s -iJ . [pochodna iloczynu i pochodna funkcji złożonej]
Przykład 1. Załóżmy, że trzy równania modelu przyjmują konkretną postać:
Korzystając z rozwiązania (15.43) i jego pochodnej, otrzymujemy: (15.40)
p = \ - 3 U + 7U,
(15.41)
d7C 3 = i p - Kx di 4
(15.44)
dU
1
(15'42)
p(i) = e-3i/4^A6c o s ^ i - A 5s in ^ ij+ m .
Podobnie jak oczekiwana stopa inflacji /r, również rzeczywista stopa inflacji ma ścieżkę czasową z wahaniami, zbieżną do wartości równowagi m. Jeśli chodzi o zmienną t/, to (15.40) pokazuje, że można ją wyrazić jako funkcję K i p w następujący sposób:
3 1 Mamy wtedy wartości parametrów /?= 3; h = \; j = ~; &= - , a zatem w odniesieniu do (15.37") otrzymujemy:
Na mocy rozwiązań (15.43) i (15.44) możemy zatem zapisać ścieżkę czasową dla bezrobocia jako: (15.45)U{t) = ^ e -3l/4[(A5 - 4 6) c o s ^ i+ (A5 + A6)sin ~ /] + ~ .
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 539
53 8 ANALIZA DYNAMICZNA
Jest to również ścieżka czasowa z wygasającymi wahaniami, a
lo
jest dynamicznie
stabilną wartością międzyokresowej równowagi dla U. Ponieważ wartości n i p dla międzyokresowej równowagi są równe parametrowi polityki monetarnej m, więc wartość m — stopa wzrostu nominalnego zasobu pieniądza — wyznacza oś, wokół której wahają się ścieżki czasowe n i p . Jeśli wystąpi zmiana m, nowe wartości równowagi n i p zastąpią stare wartości równowagi. Te wartości, jakie zmienne n i p przyj mują w momencie zmiany polityki monetarnej, staną się początkowymi wartościami, z których wystartują nowe ścieżki n i p. Przeciwnie, wartość U dla międzyokresowej równowagi nie zależy od m . Zgodnie z (15.45) U dąży do stałej ~ niezależnie od stopy wzrostu nominalnego zasobu pieniądza, 18 a zatem niezależnie od stopy inflacji dla równowagi. Ta stała wartość równowagi U jest nazywana naturalną stopą bezrobocia. Fakt, że naturalna stopa bezrobocia jest zgodna z dowolną wartością równowagi dla stopy inflacji, może być zilustrowany na płaszczyźnie Up za pomocą pionowej linii prostej równoległej do osip. Ta linia prosta wyznaczająca wzajemną zależność U i p jest nazywana długookresową krzywą Phillipsa. Pionowy kształt tej krzywej zależy jednak od szczególnej wartości parametru przyjętej w tym przykładzie. Gdy zmieni się wartość tego parametru, jak w ćwiczeniu 15.5-4, długookresowa krzywa Phillipsa może nie być już pionowa.
a. b. c. d.
Znaleźć p(t), n(t) i U(t). Czy ścieżki czasowe wciąż zawierają wahania? Czy wciąż są zbieżne? Jakie są p i U, czyli wartości /? i U dla międzyokresowej równowagi? Czy wciąż jest prawdą, że U nie jest funkcyjnie związana z p? Jeśli teraz połączymy te dwie wartości równowagi długookresowej krzywą Phillipsa, czy wciąż możemy otrzymać krzywą pionową? Jakie założenie w przykładzie 1 jest zatem kluczowe dla otrzymania pionowej długookresowej krzywej Phillipsa?
15.6. RÓWNANIA RÓŻNICZKOWE ZE ZMIENNYM WYRAZEM WOLNYM W rozważanym powyżej równaniu różniczkowym: y"(t) + a ly'(t) + a2y = b wyraz wolny b po prawej stronie jest stały. Co się stanie, jeśli zamiast b będziemy mieli zmienny składnik, tzn. pewną funkcję t taką, jak bt2, ebt lub ¿sin i? Odpowiedź jest następująca: musimy zmodyfikować naszą całkę szczególną yp. Na szczęście funkcja uzupełniająca nie zmienia się wskutek obecności zmiennego wyrazu wolnego, ponieważ yc dotyczy jedynie równania zredukowanego, którego prawa strona jest ponownie równa zeru.
Ćwiczenie 15.5 Metoda współczynników nieoznaczonych 1. W modelu inflacji i bezrobocia pozostawić (15.33) i (15.34), ale usunąć (15.35) i założyć zamiast tego, że t/je s t egzogeniczne. a. Jaki rodzaj równania różniczkowego otrzymamy teraz? b. Ile pierwiastków charakterystycznych można otrzymać? Czy jest teraz możliwe ustalenie wahań okresowych w funkcji uzupełniającej? 2. W naszych rozważaniach kondensujemy model inflacji i bezrobocia w postaci równania różniczkowego względem zmiennej n. Pokazać, że model może być również skonden sowany w postaci równania różniczkowego drugiego rzędu względem zmiennej U z takimi samymi współczynnikami ax i a2, jak w (15.37"), ale z innym wyrazem wolnym b =k j[ a -T -(l-h )m ] . 3. Zastąpimy hipotezę oczekiwań adaptacyjnych (15.34) przez tzw. hipotezę „doskonałych przewidywań*’ (perfect foresight) n = p , ale pozostawiamy (15.33) i (15.35). a. Wyprowadzić równanie różniczkowe względem zmiennej p. b. Wyprowadzić równanie różniczkowe względem zmiennej U. c. Jaka jest podstawowa różnica między tymi równaniami a tym, które otrzymaliśmy przy założeniu hipotezy oczekiwań adaptacyjnych? d. Jaka zmiana w warunkach nałożonych na parametry jest teraz niezbędna, aby uczynić nowe równanie różniczkowe sensownym? : 4. W przypadku 1 pozostawić (15.41) i (15.42), ale zastąpić (15.40) przez: 1 1
Omówimy teraz metodę znaj do wania ypf znaną j ako metoda współczynników nieoznaczonych, którą można stosować do równań różniczkowych o stałych współczynnikach i zmiennym wyrazie wolnym, jeśli zmienny wyraz wolny i jego kolejne współrzędne zawierają w sumie jedynie skończoną liczbę różnych typów wyrażeń (poza stałymi). Przedstawimy to na konkretnych przykładach. >s Przykład 1. Znaleźć całkę szczególną dla: (15.46)
y"(t) + 5y'(t) + 3y = 6t2- t - \ .
Z definicji, całka szczególna jest to wartość y spełniająca dane równanie, tzn. war- • tość y, która po podstawieniu do równania spowoduje przekształcenie go w tożsamość, niezależnie od wartości t. Ponieważ lewa strona zawiera funkcję y(t) i pochodne y'(t) i y"{t) — podczas gdy prawa strona zawiera wielokrotności wyrażeń i2, t i stałą — mo żemy zapytać, jaka ogólna postać funkcji y(t), wraz z jej pierwszą i drugą pochodną, da nam trzy typy wyrażeń i 2, i i stałą? Oczywistą odpowiedzią jest funkcja B xt2 + B2t + B3 (gdzie współczynniki Bt muszą być jeszcze wyznaczone), gdyż jeśli zapiszemy całkę szczególną jako: y(t) = B 1t2 + B2t + B3, to możemy otrzymać: (15.47)
y'(f) = 2Bl t + B 2
i
y"(t) = 2B1
54 0 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 541
i te trzy równania rzeczywiście składają się ż podanych typów wyrażeń. Podstawiając je do (15.46) i sumując składniki podobne, otrzymujemy: lewa strona = (3B J t2 + (lOBj + 3B2)t + (2BX+ 5B2 + 3# 3). Gdy przyrównamy to, wyraz po wyrazie, do prawej strony* wówczas możemy wyznaczyć następujące wartości współczynników B : 3BX= 6 10B1+ 3B2 = -1 + 5B2 + 35j = —1
* i = 2, B2 = -7 , R3=T0,
a zatem szukana całka szczególna może być zapisana jako: yp = 2t2 - l t + 10. Metoda ta może działać tylko wtedy, gdy liczba typów wyrażeń jest skończona (por. ćwiczenie 15.6-1). W ogólnym przypadku, gdy jest spełniony ten warunek wstępny, można przyjąć, że całka szczególna ma postać kombinacji liniowej wszystkich typów różnych wyrażeń zawartych w tym zmiennym wyrazie wolnym oraz w jego pochodnych. Trzeba koniecznie włączyć do całki szczególnej stałą, jeśli pierwotny zmienny wyraz wolny lub którakolwiek z jego kolejnych pochodnych zawierają stały składnik. Przykład 2. Znajdźmy teraz ogólną postać całki szczególnej odpowiedniej dla zmiennego wyrazu wolnego b sin t. Powtarzane różniczkowania dają w tym przypadku kolejne pochodne b cos t ; - b sin t; - b cos i, b sin t itd., obejmujące tylko dwa różne typy wyrażeń. Możemy wobec tego wypróbować całkę szczególną postaci B xsin t + B2cost.
(mianowicie -8e~4r; 32e~4r; -1 2 8 e '4f itd.) przyjmują również tę samą postać. Jeśli wy próbujemy rozwiązanie: y(t) = Be~4t
i podstawimy do (15.48), to otrzymamy nieodpowiedni wynik: (15.49)
lewa strona
W niektórych przypadkach pojawiają się pewne komplikacje przy stosowaniu metody współczynników nieoznaczonych. Gdy współczynnik przy y w danym równaniu różnicz kowym jest równy zeru, tak jak dla;
(16 - 12 - 4)Ber4t = 0,
który oczywiście nie jest równy wyrażeniu po prawej stronie 2e"4f. Jest tak dlatego, ponieważ wykładnik funkcji wykładniczej w zmiennym wyrazie wolnym jest tu równy jednemu z pierwiastków równania charakterystycznego dla (15.48): r2 + 3 r - 4 = 0
(pierwiastki rv r2 = 1, -4 ).
Równanie charakterystyczne, przypomnijmy, otrzymane jest w procesie różniczkowa nia10, ale wyrażenie (16 - 12 - 4) w (15.49) otrzymano w wyniku tego samego procesu. Nie jest zatem zaskakujące, że 1 6 - 1 2 - 4 jest po prostu szczególną wersją r 2 + 3 r - 4 dla r równego - 4 . Ponieważ tak się zdarzyło, że - 4 jest pierwiastkiem charakterystycznym, więc wyrażenie kwadratowe: r2 + 3r - 4 = 16 - 12 - 4 musi koniecznie być tożsamościowo równe zeru. Aby poradzić sobie z tą sytuacją, wypróbujemy rozwiązanie: y(t) = BteT4t o pochodnych: y \ t) = (1 - 4t)BeT4t
Pewna modyfikacja
[z y \ t) = - 4 B e '4t; y"(t) = 16Be~4t]
i
y"(t) = ( -S + l6t)Be-4t.
Podstawiając je do (15.48), otrzymujemy teraz: lewa strona = -5 B e r4t. Gdy przyrównamy je do prawej strony, wyznaczymy wartość współczynnika B = -2 /5 . W rezultacie szukana całka szczególna dla (15.48) przyjmuje postać:
y'Xt) + 5 / ( 0 = 6i2 f - 1 , wówcząs poprzednio stosowaną próbna postać dla ypi a mianowicie B xt2 + B2t + B3i nię ‘ będzię już działać. Dzieje się tak, ponieważ składni^ y(t) nię występuje W równaniu i tylko pochodne y \ t) i y"(i) - - j a k pokazano w (15.47) ^ zostaną podstawione dó lewej strony, więc nię pojawi się składnik B xt \ który mógłby zostać przyrównany do składnika Ó/2 po prąwej stronie, Wyjściem z tego rodzaju trudności jest zastosowanie próbnego rozwiązania t(B xt2 + B2t + B^). Jeśli i to iiie pOmóże, wypróbujemy t2(Bxt2 + B2t + B3) i tak dalej. Oczywiście ta sama sztuczka może być zastosowana wobec innej trudności, co pokażemy w następnym przykładzie. Przykład 3. Znajeź
Ćwiczenie 15.6 1. Pokazać, że metody współczynników nieoznaczonych nie można zastosować do równania różniczkowego y"(i) + a y \t) + by = r l. 2. Znaleźć całkę szczególną każdego z następujących równań metodą współczynników nieoznaczonych:
(a) y"(0+2y'(i) +y=i; (b) y"(i) +4 / ( r ) + y = 2 i2;
f ( t ) + 3 y * (ó -4 y = 2e-^
Tutaj zmienny Wyraz wolny fna postać ę"4*, ale tyszystkię kolejne jego pocliodnę
10 Por. rozważania w tekście prowadzące do (15.4").
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 543
5 42 ANALIZA DYNAMICZNA
(c) y"{t) + y'(t) + 2y = e'; (d) y"(t) + y'(t) + 3y = sini.
Wielomian ten ma oczywiście n pierwiastków i każdy z nich powinien być uwzględniony w ogólnym rozwiązaniu (15.51). Zatem nasza funkcja uzupełniająca powinna w ogólnym przypadku łnieć postać: yc = A lQrit + A 2erf + ... 4-Aner"i |= X Ą eVj-
15.7. LINIOWE RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW Wprowadzone wyżej metody rozwiązań możemy z łatwością rozszerzyć na przypadek liniowego równania różniczkowego n-tego stopnia. Jeśli współczynniki i wyraz wolny są stałe, to takie równanie może być zapisane jako: (15.50)
Jednak — tak jak poprzednio — w sytuacji gdy nie wszystkie pierwiastki są rzeczywiste i różne, trzeba dokonać pewnych modyfikacji. Po pierwsze, załóżmy, że są tam wielokrotne pierwiastki, np• rx = r2 = rv Wtedy, aby uniknąć „zsumowania” , musimy zapisać pierwsze trzy składniki rozwiązania jako: A1erii+ A 2ie rii + A3f2e rii.
y (n\ t ) + a 1y in- 1X t) + ...+ a n_ly'(t) + any = b.
Gdy mamy ponadto r4 = rv wówczas czwarty składnik musi być zastąpiony przez A4i3e ri* itd. Po drugie, załóżmy, że mamy dwa pierwiastki zespolone, np.:
Znajdowanie rozwiązania W przypadku stałych współczynników i stałego wyrazu wolnego obecność pochodnych wyższego rzędu nie wpływa w istotny sposób na metodę znajdowania całki szczególnej. Jeśli wypróbujemy najprostszy możliwy typ rozwiązania, y = k, to zobaczymy, że wszystkie pochodne od y'(t) do y(n\t) będą równe zeru, a zatem (15.50) zredukuje się do ank = b i możemy napisać:
r5, r6 = h ± v i , wtedy piąty i szósty składniki w powyższym rozwiązaniu mogą być połączone w następujące wyrażenie: e**(A5cosv/ + A6sinvO.
yP = k = -
(an* 0).
[por (15.3)]
W przypadku an = 0 musimy wypróbować rozwiązanie postaci y = kt. Wtedy, ponieważ y \t) = k, ale wszystkie wyższe pochodne będą znikać, (15.50) sprowadzi się do an_1k = b. skąd wynika całka szczególna: yP= kt = — a n-
t
(a„ = 0; a„ _ !^0 ).
[por. (15.3')]
1
Gdy zdarzy się, że an = an_l = 0, wówczas ostatnie rozwiązanie również zawodzi. Zamiast tego trzeba wypróbować rozwiązanie postaci y = kt2. Dalsze dostosowania tej procedury są oczywiste. Jeśli chodzi o funkcję uzupełniającą, to włączenie do równania różniczkowego pochodnych wyższych rzędów powoduje podwyższenie stopnia równania charakterystycz nego. Taka funkcja uzupełniająca jest zdefiniowana jako ogólne rozwiązanie równania zredukowanego: (15.51)
[por. (15.9)]
[por. (15.240]
Na tej samej zasadzie, jeśli znajdziemy dwie różne paiy pierwiastków zespolonych, to musimy mieć dwa takie wyrażenia trygonometryczne (z różnymi wartościami h i v i różnymi dwiema stałymi dowolnymi dla każdej pary)11. Jeśli zdarzy się, że wystąpią dwie pary powtarzających się pierwiastków zespolonych, to powinniśmy użyć e** jako mnożnika dla pierwszej pary, ale ietó — dla drugiej. Ponadto, chociaż h i v mają jednakowe wartości dla wielokrotnych pierwiastków zespolonych, jednak dla każdej pary trzeba wybrać inne stałe dowolne. Gdy znaleziono już yp i yc, z łatwością można otrzymać ogólne rozwiązanie dla (15.50). Tak jak poprzednio jest ono po prostu sumą funkcji uzupełniającej i całki szczególnej: y(t) = yc +yp. W tym rozwiązaniu ogólnym występuje w sumie n stałych dowolnych. Aby zatem określić to rozwiązanie, potrzeba n warunków początkowych. Przykład 1. Znaleźć ogólne rozwiązanie równania: y \ i ) 4- 6y'"(t) + 14y"(i) 4- I6y'(t) + 8y = 24. Całka szczególna tego równania czwartego stopnia jest następująca:
/ n\t) + aiy ^ \ t ) + ... + an_iy \t) + 0„y = 0.
Wypróbowując y = A t rk& 0) jako rozwiązanie i korzystając z tego, że y ^ O -rA e* ; y"{t) = r 2Aert, ..., y{n\t) = rM ert, możemy (15.51) przepisać jako: AQrt(rJl + a xrn~l + ... +an_xr + aj) = 0. Równanie to jest spełnione przez dowolną wartość r, która spełnia następujące równanie charakterystyczne (wielomian n-tego stopnia): (15.51)
vn 4- apr11 1 4-... 4- an_ ^r + an = 0.
_
11 Ponieważ pierwiastki zespolone zawsze występują w parach sprzężonych, więc możemy być pewni, że będziemy mieć przynajmniej jeden pierwiastek rzeczywisty, gdy równanie różniczkowe ma rząd nieparzysty, tzn. gdy n jest liczbą nieparzystą.
RÓWNANIA RÓŻNICZKOWE WYŻSZYCH RZĘDÓW 545
544 ANALIZA DYNAMICZNA
a jego równanie charakterystyczne, na mocy (15.517), wynosi: r4 + 6 r3+ 1 4 r 2 + 1 6 r + 8 = 0, co można przedstawić w postaci iloczynu czynników: (r + 2) (r + 2) (r2 + 2r + 2) = 0. Dla pierwszych dwu wyrażeń w nawiasach otrzymujemy podwójny pierwiastek rx = r2 = -2 , ale ostatnie (kwadratowe) wyrażenie ma parę pierwiastków zespolonych, r3, r 4 = - l ± i , z h = - l i v = 1. Zgodnie z tym funkcja uzupełniająca jest równa: yc = Aje-2*+ A2/e“2i + er(A3co s/ + A4sin t) i rozwiązanie ogólne ma postać: y (0 = Aje"2*+ A2tG~2t + e“'(A3cos t + A4sin 0 + 3. Można oczywiście określić wartości czterech stałych dowolnych Ax, A2, A3i A4, jeśli dane są cztery warunki początkowe. Zwróćmy uwagę, że wszystkie pierwiastki charakterystyczne w tym przykładzie są albo rzeczywiste i ujemne, albo zespolone o ujemnej części rzeczywistej. Ścieżka czasowa musi być zatem zbieżna i międzyokresowe położenie równowagi jest dynamicznie stabilne.
Zbieżność i twierdzenie Routha Rozwiązanie równania charakterystycznego wyższego rzędu nie zawsze jest łatwym zada niem. Dlatego też byłoby niezmiernie pomocne, gdybyśmy znaleźli sposób pozwalający stwierdzić, czy ścieżka czasowa jest zbieżna czy rozbieżna, bez konieczności znajdowania pierwiastków charakterystycznych. Na szczęście istnieje taka metoda, która umożliwia jakościową (chociaż nie graficzną) analizę równania różniczkowego. Metodę tę zawarto w twierdzeniu Routha12, które mówi, że: Części rzeczywiste wszystkich pierwiastków równania wielomianowego n-tego stopnia: cięfn + axrn~l + ... + an_xr + an = 0 są ujemne wtedy i tylko wtedy, gdy pierwsze n wyznaczniki z następującego ciągu:
di
a i
a3
a0 Oj
9
a3
ao a 2 0 a\
03
05
07
02
04
06
a 5 a 4 t
a3
0
01
03
05
0
00
02
0 4
są dodatnie.
12 Omówienie tego twierdzenia i szkic dowodu można znaleźć w pracy Paula A. Samuelsona, Foundations of Economic Analysis. Harvard University Press, 1947, s. 429-435 i w podanych tam źródłach.
Przy stosowaniu tego twierdzenia należy pamiętać, że |a x\ = av Ponadto należy przyjąć am= 0 dla wszystkich m > n. Na przykład, jeśli dane jest równanie wielomianowe trzeciego stopnia (n = 3), musimy zbadać znaki pierwszych trzech spośród powyższych wyznaczników; w tym celu musimy przyjąć a4 = as = 0. Związek tego twierdzenia z problemem zbieżności stanie się oczywisty, gdy przypo mnimy sobie, że aby ścieżka czasowa y(t) była zbieżna niezależnie od tego, jakie są warunki początkowe, wszystkie pierwiastki charakterystyczne równania różniczkowego muszą mieć ujemne części rzeczywiste. Ponieważ równanie charakterystyczne (15.51') jest równaniem wielomianowym n-tego stopnia, z a0= 1, więc twierdzenie Routha może być bezpośrednio stosowane przy badaniu zbieżności. Zauważmy, że współczynniki równania charakterystycz nego (15.51') są identyczne ze współczynnikami danego równania różniczkowego (15.51), więc można podstawić do podanego powyżej ciągu wyznaczników, używanych do testowania, współczynniki równania różniczkowego, pod warunkiem, że zawsze a0= 1. Ponieważ podany w twierdzeniu warunek jest sformułowany przy użyciu zwrotu „wtedy i tylko wtedy” , więc oczywiście stanowi warunek konieczny i dostateczny. Przykład 2. Za pomocą twierdzenia Routha sprawdzić, czy równanie różniczkowe podane w przykładzie 1 ma zbieżną ścieżkę czasową. To równanie jest równaniem czwartego rzędu, więc n = 4. Współczynniki są równe aQ= 1; ax = 6; 02 = 14; a3 = 16; a4 = 8; a5 = a6 = a7 = 0. Podstawiamy te wartości do pierwszych czterech wyznaczników. Wyznaczniki są równe odpowiednio 6; 68; 800 i 6400. Ponieważ wszystkie są dodatnie, więc ścieżka czasowa jest zbieżna.
Ćwiczenie 15.7 1. Znaleźć całkę szczególną dla każdego z następujących równań: (a) y'"{t) + 2y"{t) + y'(t) + 2y = 8; (b) y'"(t) + y"(t) + 3 y\t) = 1; (c) 3y"'(t) + 9y"(t) = l; (d) y(4)(0 + y"(0 = 4. 2. Znaleźć yp i yc (a więc również rozwiązanie ogólne) dla: (a) y " \t) - 2y"(t)f- y'(t) + 2y = 4 (wskazówka: r3 - I r 2 - r + 2 = (r - 1) (r + 1) (r - 2)); (b) y '"(0 + 7y"(0 + 1 5 / ( 0 + 9y = 0 (wskazówka: r3 + I r 2 + 15r + 9 = (r + 1) (r2 + 6r + 9)); ( c ) / " ( 0 + 6y"(0 + 10y'(0 + 8y = 8 (wskazówka: r3 + ór2 + lOr + 8 = (r + 4) (r2 + 2r + 2)). 3. Na podstawie znaków pierwiastków charakterystycznych otrzymanych w poprzednim zadaniu przeanalizować dynamiczną stabilność równowagi. Następnie sprawdzić od powiedź przy użyciu twierdzenia Routha. 4. Stwierdzić, czy następujące równania różniczkowe będą dawały zbieżne ścieżki czasowe, bez obliczania ich pierwiastków charakterystycznych: (a) / " ( 0 - 10y"(0 + 2 7 /( 0 - 18^ = 3; 35 — Podstawy...
546
ANALIZA DYNAMICZNA
(b) y"'(t) + 11 / '0 ) + 3 4 / « + 24y = 5; (c) / " ( O + 4y"(t) + 5 /(1 )-- 2y = -2 . 5.
Na podstawie twierdzenia Routha wywnioskować, że dla liniowego równania różnicz kowego drugiego rzędu: /'(D + a y i O + ^ y - b ścieżka rozwiązania będzie zbieżna niezależnie od warunków początkowych wtedy i tylko wtedy, gdy oba współczynniki a x i są dodatnie.
16. CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU
W przypadku czasu ciągłego schemat zmian zmiennej y był wyrażony za pomocą jej pochodnych y'(i), y "(0 itd. Dotyczyły one nieskończenie małych przyrostów czasu. Jeśli natomiast czas jest traktowany jako zmienna dyskretna, czyli zmienna t może przyjmować tylko całkowite wartości, to pojęcie pochodnej oczywiście nie będzie już odpowiednie. W takim przypadku schemat zmian zmiennej y musi być opisany przez tzw. różnice» a nie pochodne lub różniczki zmiennej y(t). Technika równań różniczkowych ustępuje miejsca równaniom różnicowym. Gdy zajmujemy się czasem dyskretnym, wówczas wartość zmiennej y będzie się zmieniać tylko wtedy, gdy całkowita Wartość zmiennej t zostaje zastąpiona inną całkowitą wartością tej zmiennej, np. t = 1 przez t = 2. Zakłada się, że w tzw. międzyczasie nic się nie dzieje z y. W tej sytuacji wygodniej jest interpretować wartości t jako odnoszące się do okresów, a nie do momentów, przy czym t = 1 oznacza pierwszy okres, t = 2 drugi okres itd. Możemy po prostu uznać, że y ma jedną, stałą wartość w każdym okresie. Ze względu na tę interpretację wersja dynamiki ekonomicznej w czasie dyskretnym jest często nazywana analizą okresową. Należy tu jednak podkreślić, że słowo „okres” nie jest tu używane w sensie kalendarzowym, ale w znaczeniu analitycznym. Okres może obejmować pewną część czasu kalendarzowego w jednym modelu i zupełnie inną część w drugim modelu. Nawet w jednym i w tym samym modelu każdy kolejny okres nie musi koniecznie oznaczać takiego samego czasu kalendarzowego. W sensie analitycznym okres to po prostu czas, jaki upływa, zanim nastąpi zmiana wartości y.
16.1. CZAS DYSKRETNY, PRZYROSTY I RÓWNANIA RÓŻNICOWE Przejście od czasu ciągłego do dyskretnego nie wpływa na podstawową naturę analizy dynamicznej, chociaż wymaga zmiany sformułowania. Problem dynamiczny polega na znajdowaniu ścieżki czasowej na podstawie pewnej danej struktury zmian pewnej zmień-
548 ANALIZA DYNAMICZNA
nej y w czasie. Ale struktura zmian dla czasu dyskretnego powinna być opisana za pomocą ilorazu różnicowego Ay! At, który jest odpowiednikiem pochodnej dy/d/ występującej w przypadku czasu ciągłego. Przypomnijmy jednak, że / może teraz przyjmować tylko wartości całkowite, zatem gdy porównujemy wartości y w dwu kolejnych okresach, musimy mieć A t - 1. Z tego powodu iloraz różnicowy A yIA / może być uproszczony i zastąpiony wyrażeniem Ay; nazywamy je pierwszym przyrostem y (first difference of y). Symbol A , oznaczający różnicę (przyrost), może być interpretowany jako polecenie obliczenia pierwszej różnicy y. Jest wobec tego operatorem stanowiącym odpowiednik symbolu operatora d /d /. Wyrażenie Ay może oczywiście przyjmować różne wartości w zależności od tego, dla których kolejnych okresów obliczamy przyrosty. Aby uniknąć niejednoznaczności, dodajemy do y indeks oznaczający czas i definiujemy pierwsze różnice bardziej dokładnie w następujący sposób: (16.1)
4 y ,= y ,+i - y „
gdzie yt oznacza wartość y w okresie /, a yi+i jest jej wartością w okresie następującym bezpośrednio po okresie /. Przy tych oznaczeniach możemy opisać schemat zmian y rów naniami typu: (16.2)
dy, = - 0 ,ly „
zwanymi równaniami różnicowymi. Zwróćmy uwagę na podobieństwo między dwoma ostatnimi równaniami a równaniami różniczkowymi d y /d /= 2 i d y /d / = —0,ly. . Chociaż równania różnicowe biorą swą nazwę od wyrażeń różnicowych, takich jak Ayt, istnieją inne równoważne formy zapisu tych równań nie zawierające wyrażeń A i wygodniej sze w użyciu. Na mocy (16.1) możemy (16.2) przepisać jako: (16.2')
y,+i - y , = 2
lub: (16.2")
y,+i = y, + 2.
Dla (16.3) odpowiednie równoważne równania to: (16.30
Równania różnicowe, podobnie jak różniczkowe, mogą być liniowe lub nieliniowe, jednorodne lub niejednorodne, pierwszego lub drugiego rzędu (lub wyższych rzędów). Weźmy np. (16.2'). Równanie to można zaklasyfikować jako: (1) równanie liniowe, gdyż żadne wyrażenie y (dla któregokolwiek okresu) nie jest podniesione do drugiej lub wyższej potęgi ani pomnożone przez składnik yt odpowiadający innemu okresowi, (2) równanie niejedno rodne, gdyż prawa strona (nie zawierająca składników y) jest niezerowa i (3) równanie pierwszego rzędu, gdyż występuje tu jedynie pierwsza różnica Ayt obejmująca opóźnienie tylko o jeden okres (w przeciwieństwie do niego równanie różnicowe drugiego rzędu, które będzie omówione w rozdz. 17, dotyczy opóźnienia o dwa okresy, więc zawiera trzy składniki ^ + 2» y*+i oraz yt). W istocie można powiedzieć, że równanie (16.2') ma stałe współczynniki i stały wyraz wolny (równy 2). Będziemy rozważać jedynie przypadek stałych współczynników. Przyj mujemy milczące założenie, że współczynniki są stałe. W tym rozdziale przyjmiemy też założenie, że wyraz wolny jest stały, chociaż w rozdz. 17 omówimy pewną metodę postępowania w przypadku zmiennego wyrazu wolnego. Czytelnik sprawdzi, że równanie (16.30 też jest równaniem liniowym pierwszego rzędu, ale — w przeciwieństwie do (16.20 — jest jednorodne.
Ayt = 2
lub: (16.3)
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 549
y,+i- 0 ,9 y , = 0
16.2. ROZWIĄZYWANIE RÓWNANIA RÓŻNICOWEGO PIERWSZEGO RZĘDU Przy rozwiązywaniu równania różniczkowego naszym celem było znalezienie ścieżki czasowej y(t). Jak wiemy, taka ścieżka czasowa była funkcją czasu nie zawierającą żadnych wyrażeń z pochodnymi (lub różniczkami) i całkowicie zgodną z danym równaniem różniczkowym i jego warunkami początkowymi. Ścieżka czasowa, której szukamy dla równania różnicowego, ma podobną naturę. Ponownie powinna to być funkcja zmien nej / — wzór określający wartość y dla każdego okresu — która jest zgodna z danym równaniem różnicowym i jego warunkami początkowymi. Prócz tego nie może zawierać żadnych wyrażeń różnicowych, takich jak Ayt (lub wyrażeń postaci yt+x - y t). Rozwiązywanie równania różniczkowego jest w ostateczności kwestią całkowania. A jak rozwiązujemy równanie różnicowe?
lub: (16.3")
y,+i = 0,9y,.
Wersje (16.2") i (16.3'0 będą użyteczne wtedy, gdy będziemy później obliczać war tości y na podstawie znanej wartości, jaką y przyjmowała w poprzednim okresie. W dalszych rozważaniach będziemy stosować przede wszystkim wersje (16.20 i (16.30Należy podkreślić, że wybór indeksu czasu w równaniu różnicowym jest do pewnego stopnia arbitralny. Na przykład (16.20» bez zmiany znaczenia równania, można zapisać jako y ,-y ,_ i = 2, gdzie (/ - 1) odnosi się do okresu bezpośrednio poprzedzającego okres o nume rze /. Możemy je również wyrazić jako yi+2 - yt+1 = 2. Zamiast symboli z indeksami, można stosować zapis y(/), y(/ + 1 ) i y ( / - l ) . Aby nie używać tego samego oznaczenia y(/) dla przypadku czasu ciągłego i dyskretnego, przy omawianiu analizy okresowej będziemy używać indeksów.
Metocia iteracyjna Przed określeniem ogólnej metody działania, wyjaśnijmy najpierw sposób liczenia „na piechotę” , czy metodą iterącyjną, która Wyjaśnią istotę rozwiązania. W tym rozdziale zajmujemy się jedynie przypadkiem równania pierwszego rzędu, zatem . równanie różnicowe opisuje sposób, Wjaki y zmienią się tylko dla dwu kolejnych okresów. Gdy określony jest schemat zmian, np. (16.2''), i gdy daną jest wartość początkowa yo* wówczas wyznaczenie yi t równania nie stanowi problemu. Podobnie, gdy znajdziemy y u możemy natychmiast otrzymać y 2 itd. w wyniku kolejnyęh powtórzeń (iteracji) schematu zmian opisanego równaniem różnicowym. Wyniki iteracji pozwolą nam ustalić ścieżkę czasową.
550 ANALIZA DYNAMICZNA
Przykład 1. Znaleźć rozwiązanie równania różnicowego (16.2), zakładając, że wartość początkowa jest równa yo = 15. Przy iteracyjnej procedurze wygodniej jest korzystać z alternatywnej postaci równania różnicowego (16.2"), mianowicie yt+1= yt + 2, dla y0 = 15. Z tego równania możemy krok po kroku wywnioskować, że: y i= y 0 + 2,
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 551
Przykład 3. Rozwiązać jednorodne równanie różnicowe: myt+i - n y t = 0. Po znormalizowaniu i przeniesieniu na prawą stronę równanie to można zapisać jako: ^n yi+i = — | yt\
m1
y2 = y i + 2 = (yo + 2) + 2 = y0 + 2 • 2, y3 = y2 +
2 = (y0 + 2 • 2) + 2 = y0 + 3 • 2,
i ogólnie dla dowolnego okresu t: (16.4)
y, = y0 + / - 2 = 15 + 2i.
To ostatnie równanie wyznacza wartość y dla dowolnego okresu (w tym również dla początkowego okresu i = 0), stanowi zatem rozrwiązanie (16.2). Proces iteracyjny jest toporny — przypomina nieco rozwiązywanie prostego równania różniczkowego przez bezpośrednie całkowanie — ale jasno pokazuje, w jaki sposób generowana jest ścieżka czasowa. Ogólniej, wartość yt będzie w określony sposób zależała od wartości y w bezpośrednio poprzedzającym okresie yt~i, a zatem początkowa wartość yo będzie prowadziła kolejno do y x, y2 itd. według ustanowionego schematu zmian. Przykład 2. Rozwiązać równanie różnicowe (16.3). Tym razem wartość początkowa będzie nieokreślona, oznaczona po prostu symbolem yo. Ponownie wygodniej jest stosować wersję alternatywną (16.3"), mianowicie y/+i = 0,9y,. Metodą iteracyjną otrzymujemy: yi = 0,9yo,
zapis ten przypomina (16.3") z przykładu 2, z wyjątkiem zastąpienia 0,9 przez nim . Zatem, przez analogię, rozwiązaniem powinno być: i n \Vt yoy»= — m s t Zwróćmy uwagę na wyrażenie — . Poprzez ten czynnik rozmaite wartości t będą m prowadziły do odpowiadających im wartości y. Odpowiada on zatem wyrażeniu eri wy stępującemu w rozwiązaniach równań różniczkowych. Jeśli zapiszemy to wyrażenie ogól niej w postaci b* (b od słowa podstawa, ang. base) i dodamy ogólniejszy stały czyn nik A (zamiast y0), to zobaczymy, że rozwiązanie ogólnego jednorodnego równania różnicowego z przykładu 3 przyjmie postać: yt = Ab*. Jak się przekonamy, wyrażenie Ab* odegra tak samo ważną rolę w równaniach różnicowych, jak wyrażenie A en odgrywało w rozwiązaniach równań różniczkowych1. Chociaż oba są wyrażeniemi wykładniczymi, to jednak pierwsze ma podstawę b, a drugie podstawę e. Wydaje się rozsądne, że podobnie jak ścieżka y(t) dla czasu ciągłego zależy w wielkim stopniu od wartości r, tak ścieżka yt dla czasu dyskretnego zależy przede wszystkim od wartości b.
y2 = 0,9yi = 0,9 • 0,9y0 = 0,92yo, ya = 0,9y2 = 0,9 • 0,92y0 = 0,93yo,
co można podsumować w rozwiązaniu: (16.5)
y, = (0,9)'yo.
Przykładowi temu możemy nadać pewien sens ekonomiczny. W prostej analizie mnożnikowej pojedynczy wydatek inwestycyjny w okresie 0 będzie wymagać kolejnych wydatków, co z kolei przyniesie zmienne wielkości przyrostu dochodu w następnych latach. Używając y na oznaczenie wzrostu dochodu, mamy: yo = wielkość inwestycji w okresie 0, ale następne przyrosty dochodu będą zależne od krańcowej skłonności do konsumpcji (MPC). Jeśli MPC = 0,9 i jeśli dochód z każdego okresu jest konsumowany jedynie w następnym okresie, to 90% yo zostanie skonsumowane w okresie 1, co daje przyrost dochodu w okre sie 1 równy yi = 0,9y0. Podobnie rozumując, możemy znaleźć y2 = 0,9yi itd. Widzimy, że są to , podane powyżej wyniki procedury iteracyjnej. Innymi słowy, mnożnikowy proces generowa nia dochodu może być opisany równaniem różnicowym takim, jak (16.3"), a rozwiązanie takie, jak (16.5), pokaże, jaka będzie wielkość wzrostu dochodu w każdym okresie t.
Metoda ogólna Czytelnik zapewne jest pod wrażeniem rozmaitych podobieństw między równaniami różniczkowymi i różnicowymi. Jak można było przewidywać, ogólna metoda rozwiązania, którą teraz wyjaśnimy, będzie analogiczna do metody dla równań różniczkowych. Załóżmy, że szukamy rozwiązania równania różnicowego pierwszego rzędu: (16.6)
yt+i + ayt = c,
gdzie a i c są dwiema stałymi. Ogólne rozwiązanie będzie stanowiło sumę dwu składowych: całki szczególnej2 yp, która jest dowolnym rozwiązaniem zupełnego niejednorodnego
1 Czytelnik może się temu przeciwstawić, wskazując na to, że rozwiązanie (16.4) w przy kładzie 1 nie zawiera składnika postaci Ab‘. Ale jest tak tylko dlatego, że w przykładzie 1 mamy b - n h n - 1/1 = 1, więc składnik Ab1redukuje się do stałej. 2 Zapożyczamy tę nazwę z równań różniczkowych, chociaż nie występuje tu żadna całka. Niektórzy autorzy nazywają ją rozwiązaniem szczególnym.
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 553
5 5 2 ANALIZA DYNAMICZNA
równania (16.6), oraz funkcji uzupełniającej yc, która jest ogólnym rozwiązaniem równania zredukowanego dla (16.6): (16.7)
y,+i + ay,= 0.
Składowa yp ponownie reprezentuje poziom międzyokresowej równowagi dla y, a składowa yc — odchylenia od ścieżki czasowej dla tego położenia równowagi. Suma yc i yp stanowi rozwiązanie ogólne, ponieważ zawiera stałą dowolną. Podobnie jak poprzednio, aby dokładnie określić rozwiązanie, niezbędny jest warunek początkowy. Zajmijmy się najpierw funkcją uzupełniającą. Nasze doświadczenia z przykładem 3 sugerują, że możemy wypróbować rozwiązanie postaci yt =Ab* (gdzie Ab* & 0, gdyż w przeciwnym przypadku yt byłoby po prostu linią prostą leżącą na osi t)\ w tym przy padku mamy również yt+i = A tf+1. Jeśli występują takie wartości yt i yt+1, to równanie jednorodne przyjmie postać:
zatem yp (=kt) - ct. Ta postać całki szczególnej jest funkcją t różną od stałej; przedstawia zatem ruchomą równowagę (moving equilibrium). Dodając yp do yc, możemy zapisać ogóhie rozwiązanie w jednej z dwu następujących postaci: (16.8)
Q yt = A ( - a )*+ - — —, +a
(16.9)
yt = A(-a)* + c t= A + ct.
c y0= A + —- — 1 fa
co po skróceniu niezerowego wspólnego czynnika daje: czyli
i
A = y0~ -
c 1 +a
W konsekwencji, określoną wersją (16.8) jest:
b = -a .
r
Oznacza to, że aby działało takie próbne rozwiązanie, musimy przyjąć b ——a\ zatem funkcja uzupełniająca może być zapisana jako:
(16.8')
> ,= v
c~ \
1+a
c (~a)* + ------ —. *+ a y
[rozwiązanie określone, przypadek a ź -1 ]
Podstawiając t = 0 do (16.9), otrzymamy natomiast y 0 = A, więc określoną wersją (16.9)
yc(=Ab*)=A(-a)*.
jest:
Poszukamy teraz całki szczególnej odnoszącej się do całkowitego równania (16.6). Nie pomoże nam w tym przykład 3, gdyż dotyczy tylko równania jednorodnego. Zauważmy jednak, że jako yp możemy wybrać dowolne rozwiązanie (16.6); zatem gdyby mogło zadziałać próbne rozwiązanie najprostszej postaci yt = k (stałe), nie napotkalibyśmy żadnej poważniej szej trudności. Jeśli teraz yt = k, to y będzie utrzymywało w czasie tę samą stałą wartość i musi być również yt+i = k. Podstawienie tych wartości do (16.6) daje: k + ak = c ,
[rozwiązanie ogólne, przypadek a = -1 ]
Żadne z nich nie jest całkowicie określone, ponieważ zawiera ogólną stałą A. Aby usunąć tę stałą, uciekamy się do warunku początkowego yt - y0 dla t = 0. Podstawiając t = 0do (16.8), otrzymujemy:
Ab*+1 + aAb* = 0,
b + a = 0,
[rozwiązanie ogólne, przypadek a * 1]
c k - -------- . 1+ a
Ponieważ wartość k spełnia równanie, więc całkę szczególną można zapisać jako:
(16.9')
yt = yo + ct.
[rozwiązanie określone, przypadek a = -1 ]
Gdy ten ostatni wynik zastosujemy do przykładu 1, wówczas otrzymamy rozwiązanie dokładnie takie samo, jak rozwiązanie iteracyjne (16.4). Czytelnik może sprawdzić prawdziwość każdego z tych rozwiązań w następujących dwu etapach. Po pierwsze, podstawiając t = 0 do (16.80 sprawdzamy, że to ostatnie rozwiązanie sprowadza się do tożsamości y0 = yo, co oznacza, że spełniony jest warunek początkowy. Po drugie, podstawiając wzór (16.8') dla y t i podobny wzór dla yr+i — otrzymany przez zastąpie nie t przez t + 1 we wzorze (16.8') — do (16.6), zobaczymy, że równanie to sprowadza się do tożsamości c = c,f co oznacza, że ścieżka czasowa jest zgodna z danym równaniem różniczkowym. Sprawdzenie prawdziwości rozwiązania (16.9') jest analogiczne.
1+a ą ponieważ jest to stała, Więc mamy w tym przypadku stacjonarne położenie równowagi, ę Jeśli żdarzy się, że — tak jak w przykładzie 1 — a = ^ l , to całka szczególną —-— 1+ a nie jest określona i trzeba szukać innego rozwiązania równania niejednorodnego, W tym przypadku stosujemy poznaną sztuczkę wypróbowywanią rozwiązania postaci yt = kt. Wynika stąd oczywiście, że yt+\ = k(t + 1), Podstawiając te wartości do (16.6), otrzymujemy: k(t+ i) + a k t - c
i
k = --------i+ l+ o t
= c,
[gdyż a ==-1 ]
Przykład 4. Rozwiązać równanie pierwszego rzędu: yi+i - 5 y , = l
7^ *= 4
Postępując zgodnie z procedurą zastosowaną do otrzymania (16.8'), możemy znaleźć yc, wypróbowując rozwiązanie y t = Ab* (skąd wynika yt+i =Ab*+1). Podstawiając te wartości do wersji jednorodnej yt+1 - 5y, = 0 i skracając wspólny czynnik Ab*, otrzymamy b = 5. Zatem: yc= A 5 '.
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 555
554 ANALIZA DYNAMICZNA
Aby znaleźć ypt wypróbujemy rozwiązanie y, = A:, skąd wynika yt+1 = k. Podstawiając te dwie wartości do całkowitego równania różnicowego, otrzymujemy k ———, a zatem:
(a) y,+i + 3y, = 4
(y0 = 4);
(b) 2yr+l- y t = 6
(y0 = 7);
(c) y*+i = 0,2yf + 4
(y0 = 4).
1 ^ = -4’ skąd wynika, że ogólne rozwiązanie jest równe:
16.3. DYNAMICZNA STABILNOŚĆ RÓWNOWAGI
yt= yc+ yP= A 5 t - j . 7 Podstawiając t = 0 i korzystając z warunku początkowego y0 = —, otrzymujemy A = 2. Możemy w końcu zapisać rozwiązanie określone jako:
Znaczenie b 7
(16.6)
dla ¿z = -5 , c = l i y0 = — i ponieważ (16.80 określa rozwiązanie dla równania 4 różnicowego tego typu, moglibyśmy otrzymać nasze rozwiązanie, podstawiając te konkretne wartości parametrów do (16.80- Otrzymalibyśmy:
1 -5
co zgadza się w pełni z poprzednią odpowiedzią. Zauważmy, że składnik yt+1 w (16.6) ma współczynnik równy jedności. Gdyby‘dane równanie różnicowe miało przy yt+\ współczynnik różny od jedności, należałoby je unormować przed zastosowaniem wzoru (16.80 określającego rozwiązanie.
Ćwiczenie 16.2___________ _________ 1. Przekształcić następujące równania różnicowe do postaci (16.2"): (a) Ayt = 7; (b) Ay, = 0,3y,; (c) Ayt = 2yt - 9 . 2. Rozwiązać następujące równania różnicowe za pomocą iteracji: (a) yi+i = y ,+ l (yo=10); (b) yt+i = ccyt (yo = P)\; (c) yt+i = a y t - p (yt = yo dla i = 0).
Pytanie o dynamiczną stabilność równowagi jest pytaniem o to, czy funkcja uzupełniająca będzie dążyć do zera przy t —>°°. Musimy przede wszystkim przeanalizować ścieżkę wyrażenia A bf przy t nieskończenie rosnącym. Oczywiście wartość b (podstawy wyrażenia wykładniczego) ma tu kluczowe znaczenie. Rozważmy najpierw znaczenie samej tej podstawy, pomijając współczynnik A (zakładając, że A = 1). Dla celów analizy zakres możliwych wartości b ( - 00, + 00) możemy podzielić na siedem rozłącznych części (zakresów) określonych w pierwszej kolumnie tabl. 16.1, uporząd kowanych według malejących wartości b. Zakresy te są również zaznaczone na osi piono wej b na rys. 16.1, z punktami +1, 0 i -1 jako punktami demarkacyjnymi. W istocie te trzy punkty same stanowią zakresy n , IV i VI. Zakresy DI i V odpowiadają natomiast zbiorowi wszystkich dodatnich ułamków i wszystkich ujemnych ułamków. Pozostałe dwa zakresy I i VH to te, w których wartość bezwzględna Z? przekracza jedność. Tablica 16.1. Klasyfikacja wartości b
Zakres
Wartości b‘ w różnych okresach
Wartość b
I n
b> 1
m
0<Ż><1
Wartość b‘
(I*!>1)
np. 2‘
u
Ponieważ równanie różnicowe podane w tym przykładzie jest szczególnym przypadkiem
11
» = 2 . 5 '- i
yt =
W przypadku czasu ciągłego dynamiczna stabilność równowagi zależy od składnika Aeri funkcji uzupełniającej. W analizie okresowej podobną rolę odgrywa składnik A b1 funkcji uzupełniającej. Ponieważ jego interpretacja jest nieco bardziej skomplikowana niż Aeri, spróbujemy ją wyjaśnić.
dfci< i)
1‘ np.
V t 2
t= 0
t- 1
t =2
t =3
f= 4
1 1
2 1
4 1
8 1
16 1
1
1
1
1
~2
4
8
16
0
0
0
0
0
1
1 “.2"
1 ~4
1
1
~~8
ló
1
-1
1
-1
1
-2
4
-8
1 16
1
\ / IV
3. Przepisać równania z poprzedniego przykładu w postaci (16.6) i rozwiązać je stosując wzory (16.80 lub (16.90, w zależności od tego, który z nich jest odpowiedni. Czy odpowiedzi zgadzają się z otrzymanymi metodą iteracyjną?
V
4. Dla każdego z następujących równań różnicowych zastosować procedurę pokazaną przy wyprowadzeniu (16.80 1 (16.90 do znalezienia yc, yp i rozwiązania określonego:
vn
VI
b =Q -K b < 0 b =- 1 b< -1
(1*1=0) (I*I< 1) (1*1=1)
(l*l> 1)
0' np.
' 1'y
< 2J (- D ' n p .(-2 )’
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 557
55 6 ANALIZA DYNAMICZNA
Wartość b
Zakres
Wykres b*
+1«
będzie zatem poziomą linią prostą. Następnie w zakresie HI b* jest dodatnim ułamkiem podniesionym do całkowitej potęgi. Gdy wykładnik potęgi wzrasta, wówczas b* musi się zmniejszać, chociaż wciąż pozostaje dodatnie. Następny przypadek, dla b = 0 w zakresie IV, jest całkiem podobny do przypadku b = 1, ale mamy tu b* = 0, a nie b* = 1, więc wykres będzie się pokrywał z osią poziomą. Jednakże ten przykład nas nie interesuje, ponieważ przyjmujemy założenie, że Ab* & 0, skąd wynika b & 0. Gdy przechodzimy do zakresów ujemnych, pojawia się interesujące nowe zjawisko: wartość b* będzie przyjmować na przemian dodatnie i ujemne wartości dla kolejnych okre sów. Ten fakt jest wyraźnie widoczny w ostatnich trzech wierszach tabl. 16.1 i na trzech wykresach rys. 16.1. W zakresie V, gdzie b jest ujemnym ułamkiem, przemienna ścieżka czasowa coraz bardziej przybliża się do osi poziomej (por. zakres III dodatnich ułamków). W przeciwieństwie do tego, dla b = - 1 (zakres VI) otrzymujemy kolejne zmiany z - 1 na + 1. W końcu dla b < - 1 (zakres VII) przemienna ścieżka czasowa będzie się coraz bardziej oddalać od osi poziomej. Ciekawe jest to, że podczas gdy zjawisko wahań dla ścieżki czasowej nie może wystąpić dla pojedynczego składnika Aer* (przypadek zespolonych pierwiastków dla równania różniczkowego drugiego rzędu wymaga pary pierwiastków zespolonych), to wahania mogą być generowane przez pojedynczy składnik b* (lub Ab*). Zauważmy jednak, że charakter wahań jest nieco inny; w przeciwieństwie do schematu dla funkcji kołowych, funkcje pokazane na rys. 16.1 nie są gładkie. Z tego powodu będziemy używać terminu oscylacje na oznaczenie nowego, niegładkiego typu wahań (wielu autorów używa zamiennie terminów: wahania (fluktuacje) i oscylacje). Istota powyższych rozważań może być wyrażona następującym ogólnym stwierdzeniem: ścieżka czasowa b* (b * 0) będzie: nieoscylującal oscylująca
-1 <
. , jesh
J
rozbieżna
1
zbieżna
J
. jeśli
\b > 0 , [ b < 0, f \b\ > 1,
'
[|f c |< l.
Zwróćmy uwagę na to, że zbieżność wyrażenia e rt zależy od znaku r, a zbieżność wyrażenia b* zależy od wartości bezwzględnej b.
•VII*
Rola stałej A
•
Do tej pory celowo pomijaliśmy stałą A. Ale jej znaczenia nie można przemilczeć. Po pierwsze, Rysunek 16.1
W każdym zakresie wyrażenie wykładnicze bł generuje inny typ ścieżki czasowej. Przykłady podano w tabl. 16.1 i zilustrowano na rys. 16.1. W regionie I (gdzie b > 1) b* musi wzrastać coraz szybciej w miarę wzrostu t. Ogólna konfiguracja ścieżki czasowej będzie zatem przyjmować kształt górnego wykresu na rys. 16.1. Wykres ten ma postać funkcji schodkowej, a nie gładkiej krzywej; jest tak, ponieważ zajmujemy się analizą okresową. W zakresie II (b = 1) b* musi być stale równe jedności dla wszystkich wartości t. Jej wykres
wielkość A może służyć do „rozsadzenia’ ’ (gdy np. A = 3) lub zredukowania jeśli np. A = — V / wielkości b*y tzn. może wywołać efekt skali bez zmiany podstawowego kształtu ścieżki czasowej. Znak A wpływa natomiast istotnie na kształt ścieżki, bo jeśli b* pomnożymy przez A = -1 , to każdy wykres na rys. 16.1. zostanie zastąpiony przez wykres położony symetrycznie względem osi poziomej. Zatem ujemna A może wywołać efekt odbicia i efekt skali.
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 559
558 ANALIZA DYNAMICZNA
Zbieżność do równowagi
(a)
Powyższe rozważania przedstawiały interpretację wyrażenia A b ł w funkcji uzupełniającej, która —jak sobie przypominamy — reprezentuje odchylenia od pewnego międzyokresowego położenia równowagi. Jeśli do wyrażenia A b1dodamy pewien składnik, np. yp = 5, to ścieżka czasowa musi przesunąć się do góry o 5 jednostek. Nie wpłynie to na zbieżność lub rozbieżność ścieżki czasowej, ale zmieni poziom, względem którego ta zbieżność lub rozbieżność jest mierzona. Na rys. 16.1 przedstawiono zbieżność (lub jej brak) wyrażenia A b ł do zera. Gdy uwzględnimy yp, wówczas problem przekształci się w zagadnienie dotyczące zbieżności ścieżki czasowej y - y c + yP do położenia równowagi yp. W związku z tym wyjaśnimy jeszcze szczególny przypadek b = 1 (region H). Ścieżka czasowa:
y, = 3 '+ l;
t (b) yt = 2 i 1 ' ; 3 V y
(c) y, = 5
(d) * = - 3
10 V 4 v y
+ 3;
+ 2.
2. Jaka jest natura ścieżek czasowych otrzymanych dla każdego z równań różnicowych w Ćwiczeniu 16.2-4? 3. Znaleźć rozwiązania dla następujących równań i określić, czy ścieżki czasowe są oscylujące i zbieżne: (a)
y t+i - ~ y t = 6
(y0= l ) ;
(b) y,+1 + 2y, = 9
(yo
= 4);
(c) y t+i + — yt = 5
(yo = 2 ) ;
(d) y ,+ i-y , = 3
(yo
yt = A V + yp = A + y p sprawia wrażenie zbieżności, gdyż mnożnik l r = '1 nie powoduje efektu eksplozji. Zauważmy jednak, że yt przyjmuje teraz wartość A + yp, a nie wartość równowagi yp\ w istocie nigdy nie może osiągnąć yp (chyba że A = 0). Jako przykład sytuacji tego typu możemy przytoczyć ścieżkę czasową (16.9), w której występuje ruchome położenie równowagi yp = ct. Ta ścieżka czasowa musi być uważana za rozbieżną nie z powodu pojawienia się t w całce szczególnej, ale dlatego, że przy A różnym od zera będzie występował stały odstęp od ruchomego położenia równowagi. Przy zastrzeżeniu warunku zbieżności ścieżki czasowej yt do równowagi yp musimy zatem wykluczyć przypadek b = 1. W sumie rozwiązanie: yt=Ab* + y 0 jest ścieżką zbieżną wtedy i tylko wtedy, gdy \b \ < 1. Przykład 1. Jaki rodzaj ścieżki czasowej jest reprezentowany przez yt = 2
+ 9?
4 4 Ponieważ b = - — < 0, więc ścieżka czasowa oscyluje. Ale ponieważ |6| = y < l , więc oscylacje są gasnące i ścieżka czasowa dąży do poziomu równowagi równego 9.
t Czytelnik powinien dokładać starań, aby nie mylić 2 one bowiem zupełnie inne konfiguracje ścieżek czasowych.
V
5
)
z - 2 i 4 l ; reprezentują 5 v y
Przykład 2. Jak można scharakteryzować ścieżkę czasową y = 3 • 2 r + 4? Ponieważ 6 = 2 > 0 , więc nie występują oscylacje. Ale ponieważ |6| = 2 > 1, więc ścieżka czasowa będzie rozbieżna względem poziomu równowagi równego 4.
= 5).
16.4. MODEL PAJĘCZYNY Aby zilustrować zastosowanie równań różnicowych pierwszego rzędu w analizie ekonomicz nej, przytoczymy dwa warianty modelu rynku dla jednego dobra. Pierwszy wariant, znany jako model pajęczyny (cobweb model), różni się od naszych wcześniejszych modeli rynku tym, że Q jest traktowana jako funkcja nie bieżącej ceny, ale ceny z poprzedniego okresu.
Model Rozważmy sytuację, gdy producent musi podjąć decyzję dotyczącą poziomu produkcji na jeden okres przed sprzedażą. Sytuacja taka ma miejsce w produkcji rolniczej, gdzie siewy poprzedzają zbiory i sprzedaż o pewien dosyć długi okres. Załóżmy, że decyzja dotycząca wielkości produkcji jest podejmowana w okresie t na podstawie występującej wtedy ceny Pt. Ponieważ produkcja będzie gotowa do sprzedaży dopiero w okresie i+ 1 , więc będzie wpływać nie na QSJ, ale na Qs>t+i- Mamy teraz funkcję opóźnionej podaży (lagged supply)3: Q s,t + i
= S(Pt)
lub równoważnie — w wyniku cofnięcia indeksu czasowego o jeden okres: Qst = S(Pt_0.
Ćwiczenie 16.3 1. Omówić naturę następujących ścieżek czasowych:
3 Przyjmujemy tu milczące założenie, że cała produkcja z danego okresu będzie wystawiona na sprzedaż i żadna jej część nie zostanie zmagazynowana. Takie założenie jest odpowiednie dla szybko psujących się produktów albo dla sytuacji, w której nie jest możliwe gromadzenie zapasów. Model uzwględniający magazynowanie będziemy rozważać w następnym podrozdziale.
560 ANALIZA DYNAMICZNA
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 561
Gdy taka funkcja podaży współdziała z funkcją popytu postaci: Qdt = D(Pt), wynikają z tego interesujące dynamiczne struktuiy cen. Przyjmując liniowe wersje tej (opóźnionej) funkcji podaży i (nieopóźnionej) funkcji popytu i zakładając, że w każdym momencie cena rynkowa jest zawsze ustalona na po ziomie oczyszczającym rynek, otrzymujemy model rynku złożony z następujących trzech równań: Qdt = QSt > (16.10)
( a , p > 0 ),
Q d t- o c - p P t
Qst = - y + SPt . 1
( y , 8 > 0).
Podstawiając dwa ostatnie równania do pierwszego, można model sprowadzić do pojedynczego równania różnicowego pierwszego rzędu: p p t + 8 P t-i = a + y .
P,+ l+ -£./», = ^ ± i P P
po podstawieniach: y = P;
8 a =~; p
(16.12')
P f = (P0 - P )
r £
P
a +y c =-
p
będzie wtedy repliką równania (16.6). Ponieważ parametry ¿> i p są dodatnie, więc a ^ - 1 . Możemy zatem zastosować wzór (16.8') i otrzymać ścieżkę czasową:
>
jednostajne
jeśli
gasnące
S=/ J , <
gdzie termin „jednostajne oscylacje” dotyczy ścieżki typu takiego, jak w zakresie IV. Aby sobie wyjaśnić zjawisko pajęczyny, obejrzyjmy model (16.10) na rys. 16.2. Drugie równanie (16.10) ma wykres w postaci opadającej liniowej krzywej popytu, o nachyleniu równym, co do modułu, /ł. Podobnie dla trzeciego równania otrzymujemy wykres liniowej krzywej popytu o nachyleniu równym 8 , jeśli założymy, że tym razem na osi Q zaznaczono odroczoną wielkość podaży. Przypadek gdy 8 > p ( S jest bardziej strome niż D) i przypadek 8 < P (Sjest mniej strome niż D) przedstawiono odpowiednio na diagramach (a) i (b). W obu przypadkach punkt przecięcia D i S wyznacza cenę P międzyokresowej równowagi.
_ _ ^ ]V a + r gdzie P0 reprezentuje początkową cenę.
Pajęczyny Istotne są trzy fakty dotyczące badanej ścieżki czasowej. Po pierwsze, wyrażenie (a + y)/(J3+ 8 ), stanowiące całkę szczególną równania różnicowego, może być uważane za cenę równowagi międzyokresowej4: P = a + Y
P+ 8'
(a) 4 Jeśli chodzi o równowagę w sensie oczyszczenia rynku, to każda cena osiągana w kolejnych okresach jest taką ceną równowagi, gdyż założyliśmy, że Qdt = Qst dla każdego t.
-P .
Prowadzi to nas do następnej kwestii, mianowicie wyrażenia P q- P- Ponieważ wartość tej różnicy odpowiada stałej A w wyrażeniu A b \ więc od jej znaku zależy odpowiedź na pytanie, czy ścieżka czasowa będzie się zaczynać powyżej czy poniżej położenia równowagi (efekt odbicia), a od jej wielkości bezwzględnej zależy, jaka będzie odległość początku ścieżki czasowej od położenia równowagi (efekt skali). Po trzecie, występuje tu wyrażenic (-81 P ) odpowiadające wielkości b w Ab*. Ze specyfikacji modelu (/?, 8 > 0) możemy wywnioskować, że ścieżka oscyluje. Właśnie ten fakt powoduje powstanie zjawiska pajęczyny. W naszym modelu mogą oczywiście pojawiać się trzy możliwe odmiany schematu oscylacji. Zgodnie z tabl. 16.1 lub rys. 16.1, oscylacje będą: eksplodujące
Aby rozwiązać to równanie, normalizujemy je i przesuwamy indeksy o jeden okres do przodu (zastępujemy t przez t + 1 itd.). Wynik: (16.11)
Ponieważ wyrażenie to jest stałe, więc stanowi stacjonarne położenie równowagi. Gdy podstawimy P do naszego równania, będziemy mogli wyrazić ścieżkę czasową Pt w innej postaci:
Rysunek 16.2 36 — Podstawy...
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 5 6 3
5 6 2 ANALIZA DYNAMICZNA
Gdy 8 > p , tak jak na diagramie (a), wówczas interakcja popytu i podaży wywoła eksplodujące oscylacje. Omówimy tę ewentualność. Dla danej ceny początkowej P0 (zakładamy tu, że jest ona większa niż P) poruszamy się zgodnie ze strzałką i znajdujemy na krzywej S wielkość podaży w następnym okresie (okresie 1) równą Q i. Aby oczyścić rynek, wielkość popytu w okresie 1 musi być również równa <2i >co jest możliwe jedynie wtedy, gdy cena jest ustalona na poziomie Pi (co pokazuje strzałka skierowana w dół). Teraz za pośrednictwem krzywej S cena Pi powoduje, że wielkość podaży w okresie 2 będzie rów na Q2 i aby w tym okresie oczyścić rynek, cena — zgodnie z krzywą popytu — musi zostać ustalona na poziomie P2. Powtarzając to rozumowanie, możemy prześledzić ceny i ilości w kolejnych okresach, poruszając się zgodnie ze strzałkami na diagramie i „rozpinając” w ten sposób „pajęczynę’’ wokół krzywych popytu i podaży. Jeżeli porównamy poziomy cen P 0, P i, P i, t o zobaczymy, że w tym przypadku oprócz oscylacyjnego schematu zmian występuje również tendencja do powiększania różnic między ceną a P w miarę upływu czasu. Gdy pajęczyna jest „tkana” od środka na zewnątrz, ścieżka czasowa jest rozbieżna, a oscylacje eksplodują. Przeciwnie jest w przypadku diagramu (b), gdzie S e p ; tu powstanie dośrodkowa pajęczyna. Startując z P0 i poruszając się zgodnie ze strzałkami, będziemy się coraz bardziej przybliżać do punktu przecięcia krzywych popytu i podaży, gdzie jest P. Ta ścieżka czasowa jest również oscylująca, ale tym razem zbieżna. Nie pokazaliśmy na rysunku trzeciej możliwości, mianowicie dla S = p . Sposób analizy graficznej jest dokładnie taki sam, jak w pozostałych dwu przypadkach. Pozostawiamy sporządzenie rysunku Czytelnikowi jako ćwiczenie. Powyższe rozważania dotyczyły jedynie ścieżki czasowej dla ceny P (tzn. Pt ), ale gdy już znaleźliśmy Pt, możemy otrzymać ścieżkę czasową dla Q. Drugie równanie w (16.10) wyraża związek między Q a Pt, więc jeśli podstawimy do równania popytu wielkość (16.12) lub (16.12'), to otrzymamy ścieżkę czasową dla Qdt. Ponieważ Qdt musi być w każdym okresie równe Qst (ze względu na oczyszczenie rynku), więc możemy mówić o tej ścieżce czasowej jako o Qt, a nie Qdt. Na rys. 16.2 widać jasno uzasadnienie takiego podstawienia. Każdy punkt na krzywej D wiąże P, z wartością Qt w tym samym okresie, zatem funkcja popytu może służyć do odwzorowania ścieżki czasowej cen w ścieżkę czasową ilości. Czytelnik powinien zwrócić uwagę na to, że technika graficzna taka, jak na rys. 16.2, może być stosowana nawet wtedy, gdy krzywe D i S są nieliniowe.
Ćwiczenie 16.4
2. Narysować diagram podobny do rys. 16.2, aby pokazać, że w przypadku gdy S = p , cena będzie oscylowała jednostajnie, nie wygasając i nie eksplodując. 3. Dla podanych funkcji popytu i podaży w modelach pajęczyny znaleźć cenę równowagi międzyokresowej i sprawdzić, czy ta równowaga jest stabilna: f i * = 1 8 - 3 Pt,
Qst = - 2 +. Pt- i ; Qst= 6 P , - ! - 5 .
4. W modelu (16.10) pozostawić bez zmian warunek Qdt = Qst i funkcję popytu, ale zas tąpić funkcję podaży przez: Q s t= -r + # P ? , gdzie P* oznacza oczekiwaną cenę dla okresu t. Zakładamy ponadto, że sprzedający mają „adaptacyjny” typ oczekiwań cenowych5: P ; = P U + 77(Pt-i ~ P U )
(0 < 77 ^ 1),
gdzie 77 oznacza współczynnik dostosowania oczekiwań (expectation-adjustment coef ficient). a. Podać ekonomiczną interpretację powyższego równania. Jakie są podobieństwa, a jakie różnice między nim a równaniem oczekiwań adaptacyjnych (15.34)? b. Co się stanie, jeśli 77przyjmie swą maksymalną wartość? Czy można traktować model pajęczyny jako szczególny przypadek rozpatrywanego obecnie modelu? c. Pokazać, że nowy model może być przedstawiony w postaci równania różnicowego: Pt+1-
T?(a + r) ti - „n - n8 j p,=P
(wskazówka: rozwiązać równanie funkcji podaży względem P *, a potem wykorzystać informację, że Qst = Qdt - c c - p p t). d. Znaleźć ścieżkę czasową dla ceny. Czy ścieżka ta musi być koniecznie oscylująca? Czy może być oscylująca? W jakich okolicznościach? e. Pokazać, że ścieżka czasowa P,, jeśli jest oscylująca, będzie zbieżna tylko wtedy, gdy 1 - 2/77 < - S i p . Czy w porównaniu z rozwiązaniem pajęczyny (16.12) lub (16.12') nowy model ma szerszy, czy węższy zakres wartości —S / p powodujących stabilność? 5. Model pajęczyny, podobnie jak dynamiczne módęle rynkowe, jest w istocie oparty na statycznym modelu rynku przedstawionym w podrozdz. 3.2. Jakie założenie ekonomiczne jest w obecnym przypadku czynnikiem dynamizującym? Wyjaśnić.
16.5. MODEL RYNKU Z ZAPASAMI
1. Na podstawie (16.10) znaleźć ścieżkę czasową dla Q i przeanalizować warunki jej zbieżności.
(a )
(b) Qdt = 22 - 3 P „ (c) Qdt = 1 9 - 6Pti
& , = - 3 + 4 P , _ i;
W poprzednim modelu zakładaliśmy, że cena jest tak ustalona, aby sprzedać w całości produkt dla każdego okresu. Implikacją tego założenia jest albo nietrwałość produktów i wynikająca stąd niemożność ich składowania, albo przyjęta zasada niegromadzenia zapasów. A teraz skonstruujemy model, w którym sprzedawcy przechowują zapasy dobra.
5 Zob. Marc Nerlove, Adaptive Expectations and Cobweb Phenomena, „Quarterly Journal of Economics” 1958, May, s. 227-240.
564 ANALIZA DYNAMICZNA
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 565
Model Przyjmijmy następujące założenia: 1. Zarówno wielkość popytu Qdti jak i wielkość bieżącej produkcji Qst są nieodroczonymi liniowymi funkcjami ceny Pt. 2. Dostosowanie ceny następuje nie wskutek oczyszczenia rynku w każdym okresie, ale w wyniku procesu ustalania ceny przez sprzedających: na początku każdego okresu sprzedający ustalają cenę dla tego okresu po uwzględnieniu wielkości zapasów. Jeśli ceny w poprzednim okresie spowodowały nagromadzenie się zapasów, cena na okres bieżący jest wyznaczona na niższym poziomie, a jeśli zapasy w poprzednim okresie zmniejszyły się, bieżąca cena jest wyższa od poprzedniej. 3. Dostosowanie cen z okresu na okres jest odwrotnie proporcjonalne do zaobser wowanej zmiany zapasów (zasobu). Przy tych założeniach możemy zapisać następujące równanie:
(16.13)
Qdt= a - p p t
( a , p > 0),
Qst = - r + 8 P t
( y ,8 > 0),
P ,+1= P , - o - ( & , - 2 * )
( a > 0),
gdzie
w drugiej kolumnie tablicy może być przekształcony w równoważny opis wartości <7, pokazany w trzeciej kolumnie. Na przykład dla zakresu Ul opis b jest taki: 0 < b < 1; zatem możemy napisać: 0 < 1- < j (P + 8 ) < 1, —1 < - cr ( p + 8 ) < 0,
[odejmujemy 1 od wszystkich trzech części]
—-— > <7 > 0. [dzielimy przez -(/? +8)] p+ 8 Ostatnia nierówność stanowi szukany opis <7dla zakresu HI. Dla innych zakresów takie przekształcenia mogą być dokonane w analogiczny sposób. Ponieważ na podstawie rys. 16.1 wiemy już, jaki typ ścieżki czasowej odpowiada każdemu z zakresów, więc opis cr pozwala na określenie na podstawie podanych wartości cr, P i 8 ogólnej natury ścieżki czasowej Pt, co streszczono w ostatniej kolumnie tabl. 16.2. Przykład 1. Jeśli w naszym modelu sprzedający zawsze zwiększają (zmniejszają) cenę o 10 procent wielkości spadku (wzrostu) zapasów i jeśli krzywa popytu ma nachylenie -1 , a krzywa podaży nachylenie 15 (oba nachylenia są mierzone względem osi cen), to jaki będzie typ ścieżki czasowej Ptl Mamy tu (7 = 0,1; >3 = 1 i 5 = 1 5 . Ponieważ l/(/? + 5) = — i 2 /( /? + 5 ) = —, więc 16
o
(
i Y wartość (7 = “ leży między tymi wartościami; jest to zatem przypadek zakresu V. Ścieżka \ J czasowa będzie miała wygasające oscylacje.
Graficzne podsumowanie wyników Ścieżka czasowa Po podstawieniu pierwszych dwu równań do trzeciego, model nasz można zapisać w postaci pojedynczego równania różnicowego: (16.14)
Pt+ i - [ l - c r ( p + 8)]P t =<7(a + y),
a rozwiązanie tego równania dane jest wzorem (16.8'):
(,615)
^ = (Po - P ) [ l ~ c r 0 3 + 8)]f + P.
Jest zatem oczywiste, że dynamiczna stabilność modelu będzie zależała od wyrażenia 1 - ct(P + 5); dla wygody oznaczmy to wyrażenie symbolem b. Gdy odwołamy się do tabl. 16.1, wówczas zauważymy, że przy analizowaniu wyrażenia wykładniczego b* można określić siedem rozłącznych zakresów wartości b. Ponieważ nasza specyfikacja modelu (er, p , 8 > 0) wyklucza dwa pierwsze zakresy, pozostaje więc tylko pięć możliwości, wymienionych w tabl. 16.2. Dla każdego z tych zakresów opis wartości b podany
Dane zawarte w tabl. 16.2, obejmujące pięć różnych możliwych przypadków opisu (7, mogą być łatwiejsze do ogarnięcia, jeśli przedstawimy je na wykresie. Ponieważ opis <7obejmuje w istocie porównanie względnych wartości parametrów cr i p + 8, narysujemy wy kres <7 względem p + 5, jak na rys. 16.3. Zauważmy, że wystarczy nam dodatnia ćwiartka, gdyż ze specyfikacji modelu wynika, że a i p + 8 są dodatnie. Zakresy IV i VI (tabl. 16.2) są opisane odpowiednio równaniami <7=1 ł( p + 8 ) i a - H ( P + 8). Ponieważ wykres każdego z nich jest hiperbolą prostokątną, więc te dwa zakresy są przedstawione graficznie przez dwie hiperbole na rys. 16.3. Gdy mamy już dwie hiperbole, pozostałe trzy zakresy natychmiast „lądują” na swoich miejscach. Na przykład zakres III jest po prostu zbiorem punktów położonych poniżej dolnej hiperboli, gdzie mamy (7 mniejsze od I I ( p + 8 ) . Podobnie zakres V jest reprezentowany przez zbiór punktów leżących pomiędzy dwiema hiperbolami, podczas gdy wszystkie punkty powyżej górnej hiperboli należą do zakresu VII. 1 3 Przykład 2. Jeśli G - y ; p - l i 8 = — , to czy model (16.13) będzie określał zbieżną ścieżkę czasową Pt l Podane wartości parametrów odpowiadają punktowi A na rys. 16.3. Ponieważ punkt ten należy do regionu V, ścieżka czasowa jest więć zbieżna, chociaż oscyluje.
566 ANALIZA DYNAMICZNA
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 567
Ćwiczenie 16.5 1. Dlaczego przy rozwiązywaniu (16.14) używamy wzoru (16.8'), a nie (16.90? 2. Na podstawie danych tabl. 16.2 sprawdzić prawidłowość przejścia od opisu b do opisu <7 dla zakresów od TV do VII. 3. Gdyby model (16.13) miał następującą postać liczbową: Qdt = 2 l - 2 P ty Q st —— 3 + 6Pt, F * t + i —P t ~ 0,3 ( Q s t —Q d t ) » jaka byłaby wówczas ścieżka czasowa Pt i czy byłaby ona zbieżna? [Obszar IV]
4. Załóżmy, że w modelu (16.13) podaż w każdym okresie jest ustalona na stałym poziomie, powiedzmy Q ^ - k , zamiast być funkcją ceny. Przeanalizować zachowanie cen w czasie. Jaki warunek należy nałożyć na k, aby rozwiązanie było ekonomicznie sensowne? P+5
Rysunek 16.3
16.6. NIELINIOWE RÓWNANIA RÓŻNICOWE — JAKOŚCIOWE PODEJŚCIE GRAFICZNE
Tablica 16.2 Typy ścieżki czasowej Zakres
Wartość b s 1 - o(p+ 6)
Wartość a
m
0
0 < (J<
IV
b =0
<7 =
V
-1 < b < 0
VI
b= -1
vn
b < -1
Natura ścieżki czasowej Pt
1
p+s 1 p+s
1
2 2
2
nieoscylująca i zbieżna
Do tej pory w naszych modelach używaliśmy liniowych równań różnicowych, ale fakty życia ekonomicznego nie zawsze muszą się dopasowywać do wygody liniowości. Na szczęście, jeżeli w przypadku modeli równań różnicowych pierwszego rzędu wystąpi nieliniowość, to istnieje łatwa metoda analizy, która może być stosowana przy dość ogólnych założeniach. Metoda ta, z natury graficzna, bardzo przypomina metody jakościowej analizy równań różniczkowych pierwszego rzędu przedstawione w podrozdz. 14.6.
pozostająca w równowadze* z gasnącymi oscylacjami
Diagram fazowy
z jednostajnymi oscylacjami
Nieliniowe równania różnicowe, w których pojawiają się jedynie zmienne yt+i i y t, takie jak: » ;y<+i+:y3<= 5 lub >>,+, + s in y ,- ln y , = 3,
z eksplodującymi oscylacjami
mogą być — jako kategoria — reprezentowane przez równanie: * To, że cena w tym przypadku pozostaje w równowadze, można zobaczyć bezpośrednio na podstawie (16.14.). Dla o - 11(0+ 8) współczynnik P, jest równy zeru i (16.14) sprowadza się do P1+] =
Czytelnik zapewne zauważył, że w dwu przedstawionych modelach nasze wnioski analityczne były formułowane w postaci zbioru możliwych przypadków: trzech typów oscylujących ścieżek dla pajęczyny i pięciu typów ścieżek czasowych w modelu zapasów. To bogactwo wyników analitycznych jest rezultatem parametrycznego sformułowania modelu. To, że wynik nie może być sformułowany w postaci pojedynczej, jednoznacznej odpowiedzi, jest oczywiście zaletą, a nie słabością.
(16.16)
y,+i= /(* )>
w którym / może być funkcją o dowolnym stopniu złożoności, ale funkcją tylko zmien nej t. Gdy sporządzimy wykres dla dwu zmiennych yi+J i yt w układzie kartezjańskim współrzędnych na płaszczyźnie, wówczas otrzymamy diagram fazow y, a krzywa od powiadająca / będzie linią fazową. Na ich podstawie można przeanalizować ścieżkę czasową zmiennej za pomocą procedury iteracyjnej. Terminy— diagram fazowy i linia fazowa— są tu używane przez analogię do przypadku równania różniczkowego. Zwróćmy jednak uwagę na pewną różnicę w konstrukcji diagramu.
568 ANALIZA DYNAMICZNA
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 569
yi = /l( 7 o ) ,
możemy więc — startując z punktu y0 — narysować linię pionową, przecinającą linię fazową w punkcie A , i odczytać jego wysokość na osi pionowej jako wartość y x. Następnie chcemy odwzorować y\ w y2 zgodnie z równaniem: ?2 = /i(y i). W tym celu musimy najpierw zaznaczyć yx na osi poziomej — podobnie jak y0 przy pierwszym odwżorowaniu. To przeniesienie yx z osi pionowej na poziomą najłatwiej jest wykonać za pomocą prostej wykreślonej pod kątem 45°, która ma nachylenie równe -t-1 i jest miejscem geometrycznym punktów z jednakową odciętą i rzędną, takich jak (2,2) lub (5,5). Aby zatem przenieść y xz osi pionowej, możemy po prostu narysować odcinek poziomy w prawo aż do przecięcia z linią 45° w punkcie B, następnie skręcić w dół do przecięcia z osią poziomą i wyznaczyć punkt yx. Powtarzając tę procedurę, możemy odwzorować y x w y2 poprzez punkt C na linii fazowej, a potem użyć prostej 45° do przeniesienia y2 na oś poziomą itd. Teraz, gdy zasada iteracji jest jasna, zwróćmy uwagę, że żądane iteracje można wykonać, poruszając się po prostu wzdłuż strzałek od y0 do A (na linii fazowej), do B (na linii 45°), do C (na linii fazowej) itd. — zawsze przechodząc na zmianę od jednej linii do drugiej; nie trzeba już odwoływać się do osi.
Typy ścieżek czasowych Omówione właśnie iteracje graficzne odnoszą się również do pozostałych trzech diagramów na rys. 16.4. Te cztery diagramy stanowią ilustrację czterech podstawowych typów linii fazowych, z których każda generuje inny rodzaj ścieżki fazowej. Pierwsze dwie linie fazowe, f x i / 2, mają dodatnie nachylenia. Nachylenie pierwsze jest mniejsze, a drugie większe od jedności: 0 < /i( y ,) < l
i
fiiy d > l;
X * pozostałe dwie linie fazowe mają ujemne nachylenie; dokładniej mamy: Rysunek 16.4
W przypadku równań różniczkowych rysowaliśmy dy fd t jako funkcję y, jak na rys. 14.3; aby więc uzyskać całkowitą analogię w obecnym przypadku, powinniśmy mieć A yt na osi pionowej i yt na osi poziomej. Nie jest to możliwe, ale o wiele wygodniej jest umieścić na osi pionowej yt+l, tak jak na rys. 16.4. Zwróćmy uwagę na obecność linii prostej narysowanej pod kątem 45° na każdym diagramie na rys. 16.4; prosta ta okaże się bardzo pomocna przy przeprowadzeniu analizy graficznej. Zilustrujmy odpowiednią procedurę za pomocą rys. 16.4(a), gdzie wykreśliliśmy linię fazową (oznaczoną / i ) reprezentującą konkretne równanie różnicowe yt+i = fi(yt). Jeśli dana jest wartość początkowa y0 (zaznaczona na osi poziomej), to w niżej opisany sposób możemy prześledzić wszystkie następne wartości y. Po pierwsze, ponieważ linia fazowa f od wzorowuje wartość początkową y0 w yi zgodnie z równaniem:
-1 < / 3'(y ,)< 0
i
/ 4'( y , ) < - l .
Na każdym diagramie rys. 16.4 wartość y odpowiadająca międzyokresowej równowadze (mianowicie y ) występuje na przecięciu linii fazowej i prostej 45°. Punkt przecięcia oznaczyliśmy symbolem E. Ponieważ punkt E na linii fazowej leży jednocześnie na prostej 45°, więc odpowiada przyporządkowaniu wartości yt takiej samej wartości y,+i, a ponieważ yt+x = yt, więc y musi z definicji być w równowadze międzyokresowej. Naszym głównym zadaniem jest zbadanie, czy dla danej wartości początkowej y0 ^ y schemat zmian określony przez linię fazową prowadzić nas będzie stale w kierunku y (zbieżny) czy w kierunku przeciwnym (rozbieżny). Dla linii fazowej f i procedura iteracyjna prowadzi od y0 do y stabilną ścieżką, bez oscylacji. Czytelnik może sprawdzić, że jeśli y0leży na prawo od y, to również wystąpi stabilny ruch w kierunku y, chociaż będzie skierowany w lewo. Te ścieżki czasoWe są zbieżne do położenia równowagi i ich ogólny kształt będzie takiego samego typu, jak pokazany w zakresie Ul na rys. 16.1.
CZAS DYSKRETNY. RÓWNANIA RÓŻNICOWE PIERWSZEGO RZĘDU 571
570 ANALIZA DYNAMICZNA
Dla danej linii fazowej / 2, której nachylenie jest większe niż jeden, otrzymujemy rozbieżną ścieżkę czasową. Od wartości początkowej y0 większej niż y strzałki prowadzą nas coraz dalej od położenia równowagi do coraz wyższych wartości y. Jak można sprawdzić, początkowa wartość mniejsza niż y prowadzi do podobnego stałego ruchu rozbieżnego, chociaż w przeciwnym kierunku. Gdy linia fazowa ma nachylenie ujemne, tak jak / 3 i / 4, stały ruch powoduje oscylację i pojawia się zjawisko przestrzelenia (overshooting) położenia równowagi. Na diagramie (c) y0 prowadzi do y x, które jest większe niż y, następnie do y2, które jest mniejsze niż y itd. Zbieżność ścieżki czasowej będzie w tym przypadku zależała od tego, czy nachylenie linii fazowej jest, co do modułu, mniejsze od 1. Jest tak w przypadku linii fazowej / 3, gdzie wielkość różnicy zmniejsza się w kolejnych okresach. Dla linii fazowej / 4, której nachylenie, co do modułu, przekracza 1, dominuje przeciwna tendencja i powstaje rozbieżna ścieżka czasowa. Oscylujące ścieżki czasowe generowane przez linie fazow e/3 i / 4 przypominają pajęczy nę z rys. 16.2. Ale na rys. 16.4(c) lub (d) pajęczyna jest rozpięta między linią fazową (która zawiera odroczenie) i prostą 45°, a nie między krzywą popytu i krzywą podaży (odroczonej). Występująca tu prosta 45° jest narzędziem służącym do przeniesienia wartości y, a na rys. 16.2 krzywa D (która odgrywa rolę podobną do prostej 45°) stanowi integralną część modelu. Dokładniej, gdy na krzywej podaży określono wartość Qst-> rysujemy strzałkę dotykającą krzywej D, aby wyznaczyć cenę, która „oczyści rynek” , zgodnie z regułami gry w modelu pajęczyny. W konsekwencji istnieje podstawowa różnica oznaczeń osi: na rys. 16.2 mamy dwie całkiem różne zmienne P i Q, a na rys. 16.4 osie reprezentują wartości tej samej zmien nej y w dwu kolejnych okresach. Jeśli przeanalizujemy wykres równania różnicowego (16.11) opisującego model pajęczyny, a nie oddzielnych równań podaży i popytu w (16.10), to otrzymamy wykres linii fazowej, taki jak na rys. 16.4. Innymi słowy, istnieją dwa sposoby analizy graficznej modelu pajęczyny prowadzące do jednakowego wyniku. Podstawowa reguła, jaką możną sformułować na podstawie powyższych rozważań, jest taka, że znak nachylenia linii fazowej pokazuje, czy wystąpią oscylacje, natomiast od wartości bezwzględnej nachylenia zależy zbieżność. Jeśli linia fazowa zawiera fragmenty o nachyleniu dodatnim i o nachyleniu ujemnym i jeśli wartość bezwzględną jej nachylenia jest w niektórych punktach mniejsza, a w innych większa niż 1, to ścieżka czasowa będzie oczywiście bardziej skomplikowana. Jednak nawet w tym przypadku można również przeprowadzić analizę graficzną. Oczywiście najpierw musi być zadana wartość początkowa. W takich bardziej skomplikowanych przypadkach różne wartości początkowe mogą powodować powstanie ścieżek czasowych o zupełnie różnej postaci (zob. ćwiczenia 16.6-2 i 16.6-3).
Jest to zapis postaci Pt+X = f(P t), dla f \ P t) = -8 1 p < 0. Wykres tej liniowej linii fazowej — pokazany na rys. 16.5 — sporządzono przy założeniu, że nachylenie jest, co do modułu, większe niż 1, co prowadzi do eksplodujących oscylacji. Pif+iA
Rysunek 16.5 A teraz załóżmy, że wprowadzono prawne ograniczenie cen: pułap cenowy P. Można to przedstawić na rys. 16.5 jako poziomą linię prostą, ponieważ obecnie, niezależnie od war tości Pt, cena Pt+1 nie może przekroczyć poziomu P. Powoduje to, że nie obowiązuje już część linii fazowej leżącej powyżej P, czyli patrząc na to inaczej, zginamy w dół górną część linii fazowej do poziomu P, otrzymując w ten sposób łamaną linię fazową6. Ze względu na załamania, nowa (pogrubiona) linia fazowa nie tylkp jest nieliniowa, lecz również nie jest już gładka. Podobnie jak dla funkcji schodkowej, potrzebne jest teraz więcej niż jedno równanie, aby opisać łamaną: P (16.17')
Pt+1 = %
(dla P
Rynek z pułapem ceny Przytoczymy teraz ekonomiczny przykład nieliniowego równania różnicowego. Wszystkie cztery linie fazowe na rys. 16.4 były gładkie; tym razem pokażemy linię fazową, która nie jest gładka. Jako punkt wyjścia przyjmiemy liniowe równanie różnicowe (16.11) z modelu pajęczyny i przepisujemy je w postaci:
(dla Pt ^ k), P
gdzie k oznacza wartość Pt w punkcie załamania. Przy założeniu, że początkowa cena jest równa Po, prześledźmy iteracyjnie ścieżkę czasową. W pierwszym etapie iteracji, dotyczącym obniżającej się części krzywej fazowej, występuje tendencja do eksplodujących oscylacji. Jednak po upływie kilku okresów strzałki zaczynają trafiać na pułap cenowy i od tej pory ścieżka cenowa przekształca się w cykliczny 6 Ściśle rzecz biorąc, powinniśmy również „zagiąć” tę część linii fazowej, która leży na prawo od punktu P na osi poziomej. Ale nic złego się nie stanie, jeśli pozostawimy ją w takiej postaci, jaką ma obecnie po wygięciu górnej części, gdyż przeniesienie wartości Pl+i na oś poziomą automatycznie powoduje przeniesienie górnego ograniczenia.
572 ANALIZA DYNAMICZNA
ruch pomiędzy P i ceną minimalną P. Zatem w wyniku istnienia pułapu cenowego wew nętrzna tendencja modelu do eksplodowania zostaje zahamowana i zamiast wzrastających oscylacji pojawiają się jednostajne oscylacje. Istotne w tym wyniku jest to, że podczas gdy dla liniowej linii fazowej jednostajnie oscylująca ścieżka może się pojawić wtedy i wtylko wtedy, gdy nachylenie linii fazowej jest równe -1 , ta teraz — po wprowadzeniu nieliniowości — można otrzymać ten sam wynik analityczny nawet wtedy, gdy linia fazowa ma nachylenie różne od -1 . Fakt ten ma dość ważne implikacje ekonomiczne. Jeśli obserwujemy mniej lub bardziej jednorodne oscylacje rzeczywistej ścieżki czasowej dla pewnej zmiennej i próbujemy je wyjaśnić za pomocą modelu liniowego, zmuszeni jesteśmy do przyjęcia dość szczególnego założenia, że nachylenie linii fazowej jest równe dokładnie -1 . Ale gdy wprowadzimy nieliniowość, czy to w wersji gładkiej, czy też nie, wówczas możemy dokonać wyboru spośród mnóstwa bardziej rozsądnych założeń, z których każde może w równym stopniu odpowiadać za pojawienie się zaobserwowanej cechy jednostajnych oscylacji.
17. RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW
Ćwiczenie 16.6 1. W modelach równań różnicowych zmienna t może przyjmować jedynie całkowite war tości. Czy to oznacza, że na diagramach fazowych z rys. 16.4 zmienne yt i y[+i muszą być uważane za zmienne dyskretne? 2. Jako linię fazową weźmy lewą połowę krzywej w kształcie odwróconej litery U i załóżmy, że przecina ona prostą 45° w dwu punktach L (lewym) i P (prawym). a. Czy jest to przypadek wielu położeń równowagi? b. Jeśli wartość początkowa y0 leży na lewo od L, to jaki rodzaj ścieżki czasowej otrzymamy? c. Co będzie, jeśli wartość początkowa leży pomiędzy L i P ? d. Co będzie, jeśli wartość początkowa leży na prawo od P I e. Co można wywnioskować o dynamicznej stabilności równowagi odpowiednio wLiwP? 3. Jako linię fazową zastosujemy krzywą w kształcie odwróconej litery U. Załóżmy, że jej wznosząca się część przecina prostą 45° w punkcie L, a jej opadającą część przecina pro stą 45° w punkcie P, Odpowiedź na te same pytania, co w poprzednim zadaniu (uwaga: odpowiedź będzie zależała od sposobu, w jaki narysujemy krzywą; proszę wypróbować różne możliwości). 4. Na rys* 16.5 odrzucić pułap Cenowy i ustalić zamiast tego cenę minimalną Pm. a. Jak zmieni się linia fazowa? b. Czy będzie ona łamaną? Czy będzie nieliniową? c. Czy również pojawią się jednostajne oscylacje cen? 5. W odniesieniu do (16.17') i rys* 16.5 pokazać, że stała k ińo?e być zapisana jako: L -a+ r
Pn
Modele ekonomiczne rozważane w poprzednim rozdziale zawierały równania różnicowe wyrażające związki między Pt i Pt- 1. Ponieważ wartość P w jednym okresie może jednoznacznie określać wartość P w następnym okresie, więc ścieżka czasowa dla P będzie całkowicie zdeterminowana przez podaną wartość początkową P0. Może się jednak zdarzyć, że wartość pewnej zmiennej ekonomicznej w okresie t (np. yt) zależy nie tylko od y,_i, lecz również od y,_2. Taka sytuacja prowadzi do pojawienia się równania różnicowego drugiego rzędu. Mówiąc dokładniej, równanie różnicowe drugiego rzędu jest to równanie zawierające wyrażenie A 2yti zwane drugą różnicą y, (second difference of y,), ale nie zawierające różnic rzędów wyższych niż 2. Symbol *42, odpowiednik dla czasu dyskretnego symbolu d2/d t2, jest instrukcją obliczania drugiej różnicy w następujący sposób1: A 2yt = A (Ayt) = A (y,+1 - yt) = = (y*+2 y t+i)
(y*+i
\
yt) ~
[z (16.1)] [znów z (16.1)]
= y,+2- 2 y , +i + y,. Druga różnica y) może być zatem przekształcona w sumę wyrażeń zawierającą odrocze nie o dwa okresy. Ponieważ wyrażenia A2yt i Ayt są niezbyt wygodne w użyciu, zdefiniu jemy po prostu równanie różnicowe drugiego rzędu jako takie, które zawiera zmienną z odroczeniem o dwa okresy. Podobnie równanie różnicowe trzeciego rzędu dotyczy odro czeń o trzy okresy itd.
1 To znaczy, że najpierw przesuwamy indeksy w wyrażeniu (y,+i - yf) o jeden okres do przodu, aby otrzymać nowe wyrażenie (y,+2 - yf+i), od którego następnie odejmujemy pierwotne wyrażenie. Ponieważ otrzymana różnica może być zapisana jako Ayt+1 - Ayt, możemy więc wyprowadzić następującą regułę:
A (y,+i -y ,) = Ayt+i - Ay,; przypomina to regułę stosowaną dla pochodnej sumy lub różnicy funkcji.
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW 575
574 ANALIZA DYNAMICZNA
Skoncentrujemy się teraz na metodzie rozwiązywania równań różnicowych drugiego rzędu, odkładając uogólnienia dla równań wyższych rzędów do dalszych podrozdziałów. W tym rozdziale zajmiemy się jedynie liniowymi równaniami różnicowymi o stałych współczynnikach. Omówimy jednak oba warianty: ze stałym i zmiennym wyrazem wolnym.
oraz: : $i;
k = -------
c
c
(1 + cii + a2) t + a x + 2
[a, + a9 = -1 ]
= -— ------. #i + 2
Całkę szczególną możemy więc zapisać jako:
17.1. LINIOWE RÓWNANIA RÓŻNICOWE DRUGIEGO RZĘDU 0 STAŁYCH WSPÓŁCZYNNIKACH 1STAŁYM WYRAZIE WOLNYM
1
(17.2')
yp (—kt) = — — C - t
(przypadek, gdy a 1+ a2 = - l ; a i^ -2 ).
Przykład 2. Znaleźć całkę szczególną dla y,+2 + yt+x - 2yt = 12. Tutaj ax = 1; a2 = - 2 ; c = 12. Oczywiście nie możemy zastosować wzoru (17.2), lecz tylko (17.2'). Zatem:
Prosty rodzaj równania różnicowego drugiego rzędu przyjmuje postać:
12 (17.1)
yt +2 + alyt+l + a2yt = c.
* “ 7+2
Równanie to jest liniowe, niejednorodne, ma stałe współczynniki (au a2) i stały wyraz wolny c.
ta całka szczególna reprezentuje równowagę ruchomą. Jeśli «i + 02 = - 1 i jednocześnie 01 = - 2 (czyli jeśli 01 = - 2 i 02 = 1), to możemy przyjąć próbne rozwiązanie postaci yt = kt2, skąd wynika yt+i = k(t+ l ) 2 itd. Można sprawdzić, że w tym przypadku całka szczególna przyjmuje postać:
Całka szczególna (17.2") Podobnie jak poprzednio, możemy oczekiwać, że rozwiązanie (17.1) będzie miało dwie składowe: całkę szczególną yp reprezentującą poziom międzyokresowej równowagi dla y oraz funkcję uzupełniającą yc określającą, dla każdego okresu, odchylenie od położenia równowagi. Całka szczególna zdefiniowana jest jako dowolne rozwiązanie całkowitego równania i niekiedy można ją znaleźć wypróbowując po prostu rozwiązanie postaci yt = k. Podstawiając tę stałą wartość y do (17.1), otrzymujemy: k + axk + a2k = c
i
c k = ----------------, \ + a x + a2
(17.2)
c yp(=£) = \+ a \ + a2
(przypadek, gdy
Przykład 1. Znaleźć całkę szczególną równania y/+2- 3y,+i + 4y,= 6. Mamy tu ax = - 3 ; a2 = 4 i c = 6. Ponieważ ax + a2 & - 1 , więc z (17.2) można otrzymać następującą całkę szczególną:
(przypadek, gdy ai = - 2 ; a2= l)-
Ponieważ jednak wzór ten dotyczy tylko pojedynczego przypadku równania różnicowego yt+2 - 2yt +i + yt = c, jego przydatność jest raczej ograniczona.
Funkcja uzupełniająca Aby znaleźć funkcję uzupełniającą, musimy skupić się na równaniu zredukowanym: (17.3)
a zatem dla 1 + ax + a2 & 0 całka szczególna równa się:
yp = k t2 = ~ t 2
y t+2 + a iyt+i + a2yt = 0.
Nasze doświadczenie z równaniami różnicowymi pierwszego rzędu nauczyło nas, że w rozwiązaniu ogólnym takiego równania ważną rolę odgrywa wyrażenie Ab*. Wypróbujemy zatem rozwiązanie postaci yt = Ab*i skąd wynika oczywiście, że yt+i=Ab*+1 i tak dalej. Naszym zadaniem będzie teraz określenie wartości A i b. Po podstawieniu próbnego rozwiązania do (17.3) równanie przyjmuje postać: Ab*+2 + axA bt+1 + a2Ab* = 0, czyli po skróceniu niezerowego wspólnego czynnika Ab* otrzymamy: (17.3')
W przypadku gdy ax + a2 = - 1 , wówczas próbne rozwiązanie yt = k jest nie do przy jęcia i możemy zamiast niego wypróbować yt = kt. Podstawiając tę ostatnią wartość do (17.1) i pamiętając, że mamy teraz yt+x = k(t+ 1) oraz y t+2 = k(t + 2), znajdujemy: k(t + 2) + axk(t + 1 ) + a2kt = c
b 2 + axb + a2 = 0.
To równanie kwadratowe — równanie charakterystyczne dla (17.3) lub (17.1), które jest porównywalne z (15.4") — ma dwa pierwiastki charakterystyczne: (17.4)
Ł l. - * i ± V<*i - 4 0 2 b x, b2 = -----------------------
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW 577
576 ANALIZA DYNAMICZNA
każdy z nich jest do przyjęcia w rozwiązaniu A b {. Ściśle rzecz biorąc, oba pierwiastki bx i b2 powinny wystąpić w ogólnym rozwiązaniu jednorodnego równania różnicowego (17.3), ponieważ — tak jak w przypadku równań różniczkowych — •rozwiązanie to musi składać się z dwu liniowo niezależnych części, z których każda ma własną stałą dowolną występującą jako czynnik. Jeśli chodzi o pierwiastki charakterystyczne, to mogą zaistnieć trzy sytuacje w zależności od pierwiastka kwadratowego występującego w (17.4). Bardzo przypominają one analizę równań różniczkowych drugiego rzędu (por. podrozdz. 15.1). Przypadek 1 (różne pierw iastki rzeczywiste). Gdy a j> 4 a 2, wówczas pierwiastek kwadratowy w (17.4) jest liczbą rzeczywistą, a bx i b2 są rzeczywiste i różne. W tym przy padku b{ oraz b2 są liniowo niezależne i funkcję uzupełniającą można zapisać po prostu w postaci kombinacji liniowej tych wyrażeń, tzn.: (17.5)
To nam jednak nie wystarczy, gdyż brakuje jednej stałej. Aby uzupełnić brakujący składnik, który — jak pamiętamy — powinien być liniowo niezależny od składnika A 3b \ zastosujemy znów starą sztuczkę polegającą na mnożeniu b { przez zmienną t. Nowa składo wa przyjmie zatem postać A ątb *. Powinno być oczywiste, że jest liniowo niezależna od A 3b \ gdyż nie da się otrzymać wyrażenia A4tbxprzez dołączenie stałego współczynnika do A3b*. To, że A 4tbĄ rzeczywiście stanowi rozwiązanie jednorodnego równania (17.3), podobnie jak A 3b \ można łatwo sprawdzić, podstawiając yt = A4tb* (i y t+\ = A4(i + 1) b t+l itd.) do (17.3) 2 i zauważając, że równanie to sprowadzi się do tożsamości 0 = 0. Funkcja uzupełniająca dla przypadku podwójnego pierwiastka charakterystycznego ma zatem postać: (17.6)
yc = A3h' + A4ib',
co Czytelnik powinien porównać z (15.9).
yc = A 1b{+ A 2b}; Przykład 4. Znaleźć funkcję uzupełniającą dla yt+2 + 6yt+x + 9yt = 4. Ponieważ współ czynniki są równe ax = 6 i a2 = 9, więc pierwiastki charakterystyczne wynoszą bx - b 2- - 3 . Mamy zatem:
proszę porównać to z (15.7). Przykład 3. Znaleźć rozwiązanie yt+2 + yt+i - 2yt =12. Równanie to ma współczynniki ax = 1 i a2 = -2 ; pierwiastki charakterystyczne znalezione za pomocą wzoru (17.4) są rów ne bx = 1 oraz b2 = - 2 . Funkcja uzupełniająca jest zatem następująca:
yc = A3(-3 )' + A4i(-3 )'. Jeśli pójdziemy o krok dalej, znajdziemy yp = — i będziemy mogli zapisać ogólne
yc = A i l t + A 2( - 2 y = A i + A2(-2 y . Ponieważ w przykładzie 2 znaleźliśmy już całkę szczególną tego równania różnicowego, a mianowicie yp - 4 t y więc możemy podać rozwiązanie ogólne: y t= y c +yP= A l + A
2( - 2 ) f + 4
yo = Ai + A 2
(= 4 na mocy pierwszego warunku początkowego),
yi = Ai - 2A2 + 4
(= 5 na mocy drugiego warunku początkowego),
a zatem wartości stałych dowolnych mogą być określone jako A x = 3 i A 2 = 1. Rozwiązanie określone możemy wobec tego zapisać w postaci: y, = 3 + (-2 )' + 4 L
Przypadek 2 (podwójne pierw iastki rzeczywiste). Gdy aj = 4a2t wówczas pierwiastek kwadratowy w (17.4) jest równy zeru i występuje podwójny pierwiastek charakterystyczny: b(= bl = b 2) = ~ ^ . Jeśli teraz funkcję uzupełniającą wyrazimy w postaci (17.5), to dwie składowe połączą się w pojedyncze wyrażenie: (A i
y ,= A 3(-3 )' + A4f(-3 )' + ^ .
/.
Występują w nim dwie stałe dowolne A x i A 2, których wartości mamy wyznaczyć. Do tego potrzebne są jednak dwa warunki początkowe. Załóżmy, że dane jest y0 = 4 i y x = 5. Podstawiamy kolejno do rozwiązania / = 0 oraz / = 1, otrzymując:
A xb[ + A 2b2 =
rozwiązanie podanego równania różnicowego:
+ A 2W =A3bł.
Jeśli dane są dwa warunki początkowe, to można wyznaczyć określone wartości stałych Ai i A4. Przypadek 3 (pierw iastki zespolone). Gdy a j < 4 a2y wówczas pierwiastki charakterys tyczne są sprzężonymi liczbami zespolonymi. Dokładniej, mają one postać: b i ,b 2 = h ± v i, gdzie: (17.7)
, cii 4=-^ -
. i
V4 a2- a \ v, S ^ z A .
Funkcja uzupełniająca ma wtedy postać: yc = AiM + A 2b 2 = A i(h + vi)‘ + A 2(h - vi)1, którą bardzo trudno zinterpretować. Ale na szczęście dzięki twierdzeniu podanemu w (15.230 można z łatwością przekształcić ją do postaci trygonometrycznej, którą umiemy inter pretować.
2 Należy pamiętać, że w tym przypadku a j- 4 a 2 i b = -a J 2 . 37 — Podstawy...
578 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW 579
Zgodnie ze wspomnianym twierdzeniem możemy zapisać:
można więc wnioskować, korzystając z danych tabl. 15.1, że: n 0 =■ 2’
(h ± vi)* = R*(cosOt ± i sinOt),
gdzie wartość R (zawsze dodatnia) jest równa (por. (15.10)): (17.8)
=
^
^
1
wobec tego funkcja uzupełniająca jest równa: W K t+ A. 6 sm • — 71 t A5cos— yc =
= v « ;,
a 0 jest miarą w radianach talciego kąta z przedziału (0 , 2 7t), który spełnia warunki: (17.9)
cos&= — = — j==*
2
i
sin0= — = '\j 1 R \ 4a2
=
[(Ai + A2) c o s
gdzie przyjęliśmy skrótowe oznaczenia: i
yt =
2
v
A6 = (A i-A 2)/.
K ‘fA * i+ A A6sm ■ — - t + 4. A5c o s —-
l
2
2 A
= V16=4,
Funkcja uzupełniająca (17.10) różni się od swej odpowiedniczki dla równań różnicz kowych (15.24') pod dwoma ważnymi względami. Po pierwsze, stosowane poprzednio cos vt i sin vt zastąpiono wyrażeniami cos Ot i sin Ot. Po drugie, czynnik R* (potęga o podstawie R) zastąpiła wyrażenie wykładnicze o podstawie naturalnej z ht. W skrócie, współrzędne kartezjańskie (h i v) pierwiastków zespolonych zamieniliśmy na ich współrzędne biegunowe (R i 0). Wartości R i 0 można dla danych h i v wyznaczyć ze wzorów (17.8) i (17.9). Możliwe jest również obliczenie R i 0 bezpośrednio na podstawie wartości parametrów a x i a2 za po mocą (17.8) i (17.9), pod warunkiem, że najpierw upewnimy się, czy a j < 4a2 i pierwiastki są rzeczywiście zespolone. Przykład 5. Znaleźć ogólne rozwiązanie dla yi+2 +
J
Przykład 6. Znaleźć ogólne rozwiązanie dla yt+2 - 4yt+i + 16yr = 0. Całkę szczegól ną yp = 0 można znaleźć dość łatwo. Oznacza to, że rozwiązanie ogólne yt (= yc + yp) będzie identyczne z yc. Zauważmy, że współczynniki 0 i = - 4 i 02=16 prowadzą do pierwiastków zespolonych. Możemy zatem podstawić wartości a x i a2 bezpośrednio do wzorów (17.8) oraz (17.9) i obliczyć:
+ (Ai - A2) i sin 6t] =
= R'(A5cos Ot + A6 sin 0i)>
A5 =Ai+A 2
2
Aby znaleźć yp, do całkowitego równania podstawiamy y t - k . Wynika stąd, że k = 4, a zatem yp = 4, więc ogólne rozwiązanie można zapisać jako:
Funkcja uzupełniająca może być zatem przekształcona w następujący sposób: yc = A1/?#(cos0i + i sin 0 i)+ ^ 2^ (c o s 0 i - i sin0r) =
2
v
(17.11) (17.10)
~~ '
=
5. Stanowi to ilustrację
^
4
1
2 -4
2
C O S 0 = —— 7 = —
1
i 1 ~ r
16 416 "
y j
~
czyli, korzystając z danych tabl. 15.2, mamy:
-
i
Wynika stąd, że funkcja uzupełniająca — która stanowi w tym przypadku również rozwiązanie ogólne — jest równa: x
(17.12)
K K y c (= yt) = 4 t As cos — t + A^ sin — t
przypadku pierwiastków zespolonych. Jeżeli a j < 4a2ł to wartości współczynników są równe 0i = 0
i
1
a2 = — . Za pomocą wzoru (17.7) obliczamy część rzeczywistą i urojoną pierwiastków
, 1 h = 0 i v = — . Ze wzoru (17.8) wynika, że:
Ponieważ wartość 0 spełnia dwa równania: h
cos 0= — = 0 R
i
v
sin0= — = 1, R
Zbieżność ścieżki czasowej Podobnie jak w przypadku równań różnicowych pierwszego rzędu, zbieżność ścieżki czaso wej yt zależy jedynie od tego, czy yc dąży do zera przy t —> To, czego dowiedzieliśmy się za pomocą rys. 16.1 o różnych wariantach dla wyrażenia b r, ma tu również zastosowanie, chociaż w obecnym kontekście musimy rozważać dwa, a nie jeden, pierwiastki charakterys tyczne. Rozważmy najpierw przypadek, gdy występują dwa różne pierwiastki rzeczywiste bxź b 2. Jeśli |fri|> l i Ib21> 1, to obie składowe funkcji uzupełniającej (17.5) — A xb[ i A 2b2 — będą eksplodujące, zatem yc musi być rozbieżne. W przeciwnym przypadku, gdy [bx| < 1 i | b21< 1, oba składniki yc będą dążyć do zera przy nieskończenie rosnącym t , więc yc również będzie dążyć do zera. A co będzie, gdy \b x\ > 1, ale \b2\ < 1? W tym pośrednim
580 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW 581
przypadku jest jasne, że składnik A 2b^ „wygasa” , podczas gdy drugi składnik oddala się od zera. Wynika stąd, że składnik A xb[ musi w końcu zdominować sytuację i spowodować, że ścieżka będzie rozbieżna. Pierwiastek o większej wartości bezwzględnej nazwijmy pierwiastkiem dominującym (dominant root). Wydaje się wtedy, że to pierwiastek dominujący b\ nadaje ton rozwojowi ścieżki czasowej, przynajmniej jeśli chodzi o jej ostateczną zbieżność lub rozbieżność. Tak rzeczywiście jest. Możemy zatem stwierdzić, że ścieżka czasowa będzie zbieżna — nie zależnie od tego, jakie mogą być warunki początkowe — wtedy i tylko wtedy, gdy pierwias tek dominujący jest co do modułu mniejszy od 1. Czytelnik może sprawdzić, że stwierdzenie to jest prawdziwe wtedy, gdy oba pierwiastki są co do modułu większe lub oba są mniejsze niż 1 (przypadek omówiony powyżej) i gdy jeden pierwiastek ma wartość bezwzględną równą dokładnie 1 (przypadek nie omówiony). Chociaż ostateczna zbieżność zależy tylko od pierwiastka dominującego, to jednak pierwiastek nie dominujący również wywiera określony wpływ na ścieżkę czasową, przynajmniej w początkowych okresach. Zatem dokładny kształty zależy od obu pierwiastków. Przechodząc do przypadku pierwiastków wielokrotnych widzimy, że funkcja uzupeł niająca składa się ze składowych A 3bł i A4tb \ jak pokazano w (17.6). Pierwszy z nich jest nam już znany, ale drugi, zawierający mnożnik i, wymaga słowa wyjaśnienia. Jeśli [b\ | > 1, to wyrażenie będzie eksplodować, a mnożnik t wzmocni ten efekt jeszcze bardziej. Jeśli natomiast | bx| < 1, to część bx (dążąca do zera przy wzroście t) oraz czynnik t będą miały tendencje przeciwne, tzn. wzrost t będzie przeciwstawiał się zmianom b1. Która z tych tendencji okaże się silniejsza? Otóż tendencja do tłumienia czynnika bl będzie zawsze przeważać nad tendencją do eksplozji czynnika t. Dlatego też podstawowym warunkiem zbieżności w przypadku pierwiastków wielokrotnych pozostaje wymaganie, aby pierwiastek był co do modułu mniejszy niż 1. Przykład 7. Przeanalizować zbieżność rozwiązań podanych wyżej w przykładach 3 i 4.
Dla przykładu 3 rozwiązaniem jest: y, = 3 + (-2)' + 4f 0 pierwiastkach równych odpowiednio 1 i -2 (3 • 1*= 3) i z ruchomym położeniem równo wagi 41. Dominującym pierwiastkiem jest -2, więc ścieżka czasowa jest rozbieżna. Dla przykładu 4, gdzie rozwiązaniem jest: yt = A3(-3)* + A 4t(-3 Y + —
4
1 gdzie [¿>| = 3, również mamy rozbieżność. Rozważmy teraz przypadek pierwiastków zespolonych. Na podstawie ogólnej postaci funkcji uzupełniającej podanej w (17.10): yc = R* (A5c o s 0 t + A 6 sin Ot)
widać, że wyrażenie w nawiasach — podobnie jak w (15.24') — będzie powodowało powstanie okresowych wahań. Ponieważ jednak zmienna t może w obecnym przypadku przyjmować tylko wartości całkowite 0 , 1, 2 , ..., więc wybierzemy i wykorzystamy tylko część punktów wykresu funkcji kołowej. Wartość y osiągana w każdym z tych punktów będzie
zawsze obowiązywała dla całego okresu dopóty, dopóki nie osiągniemy następnego interesującego nas punktu. Jak pokazano na rys. 17.1, otrzymana ścieżka nie wykazuje ani zwykłych oscylacji (nie przyjmuje w kolejnych okresach na przemian wartości powyżej i poniżej yp), ani zwykłych wahań (nie jest gładka); jest to raczej rodzaj schodkowych fluktuacji. Jeśli chodzi o zbieżność, to decydującym czynnikiem jest wyrażenie R \ które — podobnie jak wyrażenie e hł w (15.24') — będzie dyktować, czy schodkowe fluktuacje mają być wzmocnione czy hamowane w miarę wzrostu t. W obecnym przypadku fluktuacje mogą stopniowo zwężać swój zakres wtedy i tylko wtedy, gdy R < 1. Ponieważ R jest z definicji wartością bezwzględną sprzężonych pierwiastków zespolonych h ± v i, więc warunek zbieżności mówi ponownie, że pierwiastki charakterystyczne muszą być co do wartości bezwzględnej mniejsze niż 1.
Rysunek 17.1
Reasumując: dla wszystkich trzech przypadków dotyczących pierwiastków charakterys tycznych ścieżka czasowa będzie zbieżna do (stacjonarnego lub ruchomego) położenia równowagi międzyokresowej— niezależnie od tego, jakie będą warunki początkowe — wtedy i tylko wtedy, gdy wartość bezwzględna każdego pierwiastka jest mniejsza niż 1. Przykład 8, Czy ścieżki czasowe (17.11) i (¡7.12) są zbieżne? W (17.11) mamy
R = —, a zatem ścieżka czasowa będzie zbieżna do stacjonarnego położenia równowa gi (=4). W (17.12) mamy natomiast R = 4, więc ścieżka czasowa nie będzie zbieżna do położenia równowagi (= 0 ).
Ćwiczenie 17.1 1. Zapisać równanie charakterystyczne dla każdego z podanych równań i obliczyć pierwiastki charakterystyczne: 1
1
1
(a) ytf i - y t+l + — yt = 2;
(C) yt+2 + yJfc+i- j y t = 5;
(b) yt+2 - 4yt+l + 4yt = 7;
(d) yt+2 - 2yt+l + 3y, = 4.
% Dla każdego z równań różnicowych z poprzedniego zadania stwierdzić, na podstawie
582
ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW
piewiastków charakterystycznych, czy ścieżka czasowa obejmuje oscylacje czy fluktuacje schodkowe i czy jest eksplodująca.
Yt = Ct + It + Go,
(17.13)
3. Znaleźć całki szczególne równań podanych w ćwiczeniu 17.1-1. Czy reprezentują one stacjonarne, czy ruchome położenie równowagi? 4. Rozwiązać następujące równania różnicowe: ■7 1■ (a) y,+2 + 3y,+1 - —y, = 9 (y0 = 6; yi = 3); 4 (b) y(+2 - 2y,+x + 2 y ,= l (y0 = 3; yi = 4); (c) j'1+2 - y (.n+-ł-y( = 2 4 •
(yo = 4; yi = 7).
583
Ct = r Y t- 1
(0 < y< 1),
It = a (C t - C t- 1)
( a > 0),
gdzie y reprezentuje krańcową skłonność do oszczędzania, a a oznacza akcelerator ( współ czynnik akceleracji). Zauważmy, że jeśli z modelu usuniemy indukowane inwestycje, to pozostanie równanie różnicowe pierwszego rzędu opisujące dynamiczny proces mnóżnikowy (por. przykład 2 z podrozdz. 16.2), natomiast po uwzględnieniu indukowanych inwestycji otrzymujemy równanie różnicowe drugiego rzędu opisujące współzależność mnożnika i akceleratora. Na mocy drugiego równania możemy w następujący sposób wyrazić It w zależności od dochodu:
5. Przeanalizować ścieżki czasowe otrzymane w poprzednim zadaniu.
/,= a ( y Y t-i - yY t_2) = a y ( Y t_x - y,_2). Po podstawieniu tego wyniku oraz równania dla Ct do pierwszego równania układu (17.13) i uporządkowaniu, model sprowadza się do jednego równania:
17.2. MODEL SAMUELSONA WSPÓŁZALEŻNOŚCI MNOŻNIKA I AKCELERATORA W charakterze przykładu zastosowania w ekonomii równań różnicowych drugiego rzędu przytoczymy klasyczny model współzależności profesora Samuelsona, model, którego celem jest zbadanie dynamicznego procesu określania dochodu, gdy działają zarówno zasada akceleracji, jak i mnożnik Keynesa3. Model ten pokazuje między innymi, że prosta współzależność mnożnika i akceleratora jest w stanie endogenicznie wygenerować wahania cykliczne.
Y t - / ( l + a )Y t. x + a y Y t_2 = G0
lub równoważnego mu (po przesunięciu indeksów o dwa okresy do przodu) równania: (17.14)
Yt+2- 7(1 + a ) Yt+i + a y Y t = G 0.
Ponieważ jest to liniowe równanie różnicowe drugiego rzędu o stałych współczynnikach i stałym wyrazie wolnym, można je więc rozwiązać poznaną właśnie metodą.
Rozwiązanie Całkę szczególną otrzymujemy za pomocą wzoru (17.2):
Struktura Załóżmy, że dochód narodowy Yt tworzą trzy główne grupy wydatków: konsumpcja Cu inwestycje It i wydatki rządowe Gt. Konsumpcja jest postrzegana jako funkcja nie dochodu bieżącego, lecz dochodu w poprzednim okresie Yt-\ \ dla uproszczenia zakłada się, że C, jest wprost proporcjonalna do Yt- \. Inwestycje typu „indukowanych” (pobudzanych) są funkcją dominującej tendencji wydatków konsumpcyjnych. Właśnie za pośrednictwem tych in dukowanych inwestycji pojawia się w modelu zasada akceleracji. Dokładniej, przyjmujemy, że It stanowi stałą część wzrostu konsumpcji ACr_i = Ct - Ct-\. Trzecia składowa G, jest natomiast traktowana jako egzogeniczna; w istocie przyjmiemy, że jest stała, i będziemy ją oznaczać symbolem G0. Założenia te mogą być wyrażone następującym układem równań:
Y p
______ Go________ Gq 1 - 7(1 + a ) + a y 1 -y
\
Współczynnik 1/(1 - y) jest to po prostu mnożnik, który wystąpiłby, gdyby nie było indukowanych inwestycji. Zatem G0/(l - y) — iloczyn egzogenicznej wielkości wydatków rządowych oraz mnożnika — powinien określać dochód równowagi w tym sensie, że poziom dochodu spełnia warunek równowagi mówiący, że „dochód narodowy jest równy sumie wydatków” (por. (3.24)). Ponieważ jest to jednocześnie całka szczególna modelu, stanowi więc zarazem poziom dochodu odpowiadający równowadze międzyokresowej. Jeśli chodzi o równowagę międzyokresową, to możliwe są trzy przypadki. Pierwszy z nich (aj > 4a2) w obecnym przypadku jest scharakteryzowany przez: 7 2(1 + a ) 2> 4 a y
lub
7 (l + a ) 2 > 4 a,
lub: 3 Paul A. Saumelson, Interactions between the Multiplier Analysis and the Principle o f Acceleration, „Review of Economic Statistics” 1939, May, s. 75-78; przedrukowane w: Readings in Business Cycle Theory, „American Economic Association” 1944, Richard D. Irwin, Inc., Homewood 111., s. 261-269.
4a
r> ( T W Aby scharakteryzować przypadki 2 i 3, wystarczy zastąpić znak > odpowiednio przez
584 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW 585
= i <. Na rys. 17.2 przedstawiono wykres równania y - 4 a l { \ + a ) 2. Zgodnie z powyż szymi rozważaniami pary ( a , y ) położone dokładnie na tej krzywej odpowiadają punktowi 2 , natomiast pary (cc, y) leżące powyżej tej krzywej (o większych wartościach y) odnoszą się do przypadku 1, a leżące poniżej krzywej — do przypadku 3. Ta potrójna klasyfikacja przedstawiona graficznie na rys. 17.2 jest interesująca, ponieważ jasno przedstawia warunki, przy jakich cykliczne fluktuacje mogą być endogenicznie wygenerowane w wyniku współzależności mnożnika i akceleratora. Ale nie mówi nic o zbieżności lub rozbieżności ścieżki czasowej dla Y. Dla każdego z trzech przypadków musimy zatem rozróżnić możliwość ścieżki wygasającej i eksplodującej. Możemy oczy wiście wybrać łatwiejsze wyjście i po prostu zilustrować każdą z tych możliwości odpowiednimi przykładami liczbowymi. Wybieramy jednak — być może nieco bardziej pracochłonne, ale bardziej obiecujące — zadanie opisania ogólnych warunków występowania zbieżności i rozbieżności.
Zbieżność kontra rozbieżność Równanie różnicowe (17.14) ma równanie charakterystyczne: b2- y ( \ + a )b + a y = 0
o dwu pierwiastkach: , , y (1 + a ) ± V y 2( l + a ) 2 - 4 a y b u b2= — — -— — -• Ponieważ występowanie zbieżności i rozbieżności zależy od wartości b\ i b2 i ponie waż b\ i b2 zależą z kolei od wartości parametrów a i y, więc warunki zbieżności i rozbież ności powinny dać się wyrazić w postaci warunków nałożonych na wartości a i y. Aby to osiągnąć, wykorzystamy fakt, że — z (15,6) — dwa pierwiastki charakterystyczne są zawsze powiązane następującymi zależnościami: (17.15) (17.15')
b x + b2 = y ( l + a ) ,
blb2 = a y.
Na podstawie tych dwóch równań możemy stwierdzić, że: (17.16)
(1 - b x) (1 - b2)= l - ( b x + b2) + bxb2 = = 1 - 7(1 + a ) + a y - 1 - y .
Ze względu na to, że w specyfikacji modelu stwierdzono, iż 0 < y< 1, konieczne jest nałożenie na pierwiastki b\ i h2 następującego warunku:
(17.17)
0 < ( l - ^ ) ( i - 5 2) < l .
Zbadajmy teraz problem zbieżności dla przypadku 1, gdy mamy dwa różne pierwiastki rzeczywiste. Ponieważ z założenia a i y są dodatnie, więc z (17.15') wynika, że bxb2 > 0, có oznacza, że bx i b2 muszą mieć taki sam znak algebraiczny. Ponadto, ponieważ y ( l + a ) >0, więc z (17.15) wynika, że hi i b2 muszą być dodatnie. Zątem w przypadku 1 ścieżka czasowa dla Yt nie może mieć oscylacji.
Chociaż znamy już znaki hi i h2, to jednak dla przypadku 1 istnieje pięć różnych kombinacji wartości bx oraz b2 i z każdej z nich możemy wysnuć inne wnioski dotyczące odpowiednich wartości a i y : (I) 0 < h2 < hi < 1 (E) 0 < b2 < bx — 1 (IE) 0
=» 0 < 7 < 1; = » 7 = 1, => 7 > 1, =* 7 = 1, =» 0< 7 < 1;
ay < 1,
ay > 1.
Możliwość I, gdy bx i h2 są dodatnimi ułamkami, spełnia warunek (17.17) i pasuje do specyfikacji modelu 0 < y < 1. Iloczyn dwu pierwiastków również musi być wtedy dodatnim ułamkiem, więc z (17.15') wynika, że a y < 1. W przeciwieństwie do tego trzy następne możliwości naruszają warunek (17.17) i prowadzą do niedopuszczalnych wartości 7 (por. ćwiczenie 17.2-3). Trzeba je zatem wykluczyć. Ale możliwość V jest do przyjęcia. Gdy hi i h2 są większe niż 1, wówczas (17.17) znów jest spełnione, chociaż tym razem ze wzoru (17.15') wynika a y > 1 (a nie < 1). W rezultacie dla przypadku 1 mamy tylko dwa dopuszczalne podprzypadki. Pierwszy (możliwość I) dotyczy pierwiastków hi i h2 równych dodatnim ułamkom, a zatem powoduje powstanie zbieżnej ścieżki czasowej dla Y. Drugi (możli wość V) dotyczy pierwiastków większych od jedności, a zatem powoduje, że ścieżka czasowa jest rozbieżna. Jeśli jednak chodzi o wartości a i 7 , to zbieżność lub rozbieżność zależą jedynie od tego, czy a y > 1. Wszystkie te informacje są zawarte w górnej części tabl. 17.1, gdzie przypadek zbieżności został oznaczony symbolem IZ, a przypadek rozbieżności symbo lem IR. Analiza przypadku 2, dla wielokrotnych pierwiastków, przebiega podobnie. Pierwiastki są teraz równe h = 7(1 + a) 12 i mają znak dodatni, gdyż a i 7 są dodatnie. Również i w tym przypadku nie występują oscylacje. Istnieją tu tylko trzy podkategorie dla wartości h: (VI) (VE) (VID)
01
1=> 7 < 1 ; =* 7 = 1, => 7 < 1;
ay< 1, a y> 1.
W przypadku możliwości IV h (=hL = h2) jest dodatnim ułamkiem, więc implikacje dotyczące ar i 7 są dokładnie takie same, jak dla możliwości I w przypadku 1. Analogicz nie możliwość VIII dla b (= b x = h2) większego niż 1 prowadzi do takich samych wyników, jak możliwość V. Natomiast możliwość VE jest sprzeczna z (17.17) i dlatego musi być wykluczona. Zatem znów mamy tylko dwa dopuszczalne podprzypadki. Pierwszy (możli wość VI) oznacza pojawienie się zbieżnej ścieżki czasowej, a drugi (możliwość VID) — ścieżki rozbieżnej. Podprzypadki zbieżności i rozbieżności ponownie są związane odpowiednio z a y< 1 i ay > 1. Wyniki te zapisano w środkowej części tabl. 17.1, w której dwa podprzypadki oznaczono symbolami 2Z (zbieżny) i I R (rozbieżny). W końcu w przypadku 3, dla pierwiastków zespolonych, mamy wahania schodkowe, a więc pojawiają się endogeniczne cykle koniunkturalne. Teraz kluczem do zbieżności i rozbieżności jest wartość bezwzględna R = ^[02 (zob. (17.8)), gdzie a2 oznacza współczyn nik stojący przy yt w równaniu różnicowym (17.1). W obecnym modelu mamy R - y [a y , co
586
ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW
587
Tablica 17.1. IZ
Przypadki i podprzypadki w modelu Samuelsona Przypadek 1. Różne pierwiastki rzeczywiste 4a
y > --------- (1 + a )2
IZ:
0 < b2 < bi
IR:
l< b 2
2. Podwójny pierwiastek rzeczy wisty 2Z: 4a (1
Wartości
Podprzypadek
3. Pierwiastki zespolone 4a
y < ------ r
(1 + a )2
Ścieżka czasowa Yt
a y <1
nieoscylująca i bez wahań
ay>
1
2Z 3Z H M
oCL E D ■O O
0
2R: b>
+ «)2
<1
aiy
t& fil
ay< 1
1
ay> 1
3Z:
R< 1
ay< 1
3R:
R^ 1
a y ** 1
Stabilne; bez cykli
L R lilllllli
Niestabilne; bez cykli
Stabilne; bez cykli
2R
Niestabilne; bez cykli
3R PSSSl
Eksplodujące fluktuacje schodkowe
3R V^
Jednostajne fluktuacje schodkowe
Tłumione fluktuacje schodkowe
o y =1 ( 1 + a )2
nieoscylująca i bez wahań
wahania schodkowe
0
1
2
3 a (akcelerator)
powoduje pojawienie się następujących trzech możliwości: (IX) R < 1 (X) R = 1 (XI) R > 1
Rysunek 17.2
a y < l, ay = 1 ay > 1
Chociaż wszystkie one są dopuszczalne (por. ćwiczenie 17.2-4), jednak tylko w przypad ku R < 1 występuje zbieżna ścieżka czasowa. Możliwość tę oznaczyliśmy w związku z tym jako podprzypadek 3Z w tabl. 17.1, a pozostałe dwa przypadki są oznaczone łącznie jako podprzypadek 3R. Z danych tabl. 17.1 możemy zatem wywnioskować, że zbieżna ścieżka czasowa pojawia się wtedy i tylko wtedy, gdy a y < 1.
Podsumowanie graficzne Wynikiem powyższych rozważań jest dość skomplikowana klasyfikacja przypadków i podprzypadków. Pomocny będzie rys. 17.2, który ilustruje schemat klasyfikacji. Zbiór wszystkich dopuszczalnych par (a , y ) jest podzielony na rys. 17.2 na różnie zakreskowane obszary. Ponieważ wartości y= 0 i / = 1 oraz a - 0 są wykluczone, więc zbiór wszystkich dopuszczalnych par jest rodzajem prostokąta bez brzegów. Narysowaliśmy już wykres równania y= 4 a i( l + a ) 2, aby zaznaczyć trzy główne przypadki z tabl. 17.1. Punkty na tej krzywej odpowiadają przypadkowi 2 , punkty leżące na północ od krzywej (reprezen tujące większe wartości y) należą do przypadku 1, a leżące na południe (odpowiadające mniejszym wartościom y ) — do przypadku 3. Aby rozróżnić przypadki, dla których występuje zbieżność oraz rozbieżność, narysowaliśmy — jako drugą linię podziału — wykres a y = 1 (hiperbolę prostokątną). Punkty nad tą hiperbolą prostokątną spełniają nierówność a y > 1,
a punkty pod hiperbolą— nierówność a y < 1. Można teraz z łatwością rozróżnić poszczególne przypadki. Dla przypadku 1 obszar oznaczony kolorem jasnoszarym położony poniżej hiperboli odpowiada podprzypadkowi IZ, a obszar zakreskowany linią ciągłą odpowiada podprzypadkowi IR. Dla przypadku 2, któremu odpowiadają punkty leżące na krzywej y = 4 a ł ( l + a ) 2, podprzypadek 2Z dotyczy tej części krzywej, która wznosi się ku górze, a podprzypadek 2R tej części, która opada. Dla przypadku 3 hiperbola prostokątna oddziela obszar ciemnoszary (podprzypadek 3Z) od obszaru oznaczonego kwadracikami (podprzypadek 3R). Ten ostatni, co należy podkreślić, zawiera również punkty leżące na hiperboli prostokątnej, a to z tego powodu, że w jego opisie występuje nieostra nierówność a y ^ 1. Ponieważ na rys. 17.2 zebrano wszystkie ilościowe wnioski wynikające z modelu, możemy więc dla danej pary uporządkowanej (a , y) zawsze znaleźć metodą graficzną odpowiadający jej przypadek, zaznaczając na diagramie punkt (a , /). Przykład 1. Jeśli akcelerator jest równy 0,8, a krańcowa skłonność do konsumpcji wynosi 0,7, to jaką ścieżkę czasową otrzymamy w wyniku ich wzajemnych wpływów? Para uporządkowana (0,8; 0,7) znajduje się w obszarze zaznaczonym kropkami, jako podprzypa dek 3Z, a zatem ścieżka czasowa ma wygasające schodkowe wahania. Przykład 2. Jakie skutki współzależności wynikają dla wartości a = 2 i / = 0,5? Para uporządkowana (2; 0,5) leży dokładnie na hiperboli prostokątnej i odpowiada przypadkowi 3R. Ścieżka czasowa dla Y ponownie ma wahania schodkowe, ale tym razem nie jest ani zbieżna, ani rozbieżna. Przez analogię do przypadków jednostajnych oscylacji i jednostajnych wahań, przypadek ten można by określić mianem „jednostajnych wahań schodkowych” . Jednakże w tym przypadku jednostajność nie jest taka doskonała, gdyż — podobnie jak
588 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW 589
pokazano na rys. 17.1 — możemy uwzględnić tylko te punkty na wykresie funkcji sinus lub cosinus, które odpowiadają całkowitym wartościom f, ale dla tych wartości t możemy otrzymać dla różnych okresów wahań całkiem różne punkty na krzywej.
nominalnego zasobu pieniądza (lub stopa ekspansji monetarnej) — różni się od pozostałych tym, że jego wartość jest ustalona w ramach polityki monetarnej. Dla analizy okresowej funkcja Phillipsa (15.33) przyjmuje postać: (17.18)
pt= a - T - p u t + hnt
( a ,p > 0 ;
Ćwiczenie 17.2
W równaniu dotyczącym oczekiwań adaptacyjnych pochodną należy zastąpić wyraże niem zawierającym różnicę:
1. Porównując podane wartości a i 7 z rys. 17.2, zobaczyć, do jakich obszarów należą odpowiadające im punkty, i opisać cechy jakościowe ścieżki czasowej: (a) a - 3,5; 7=0,8; (c) a = 0,2; 7=0,9; (b) a = 2; 7 = 0 ,7 ; ( d ) a = l ,5 ; 7 = 0 ,6 .
(17.19)
2. Na podstawie wartości a i Tpodanych w punktach (a) i (c) poprzedniego zadania obliczyć, dla każdego przypadku, liczbowe wartości pierwiastków charakterystycznych i określić naturę ścieżki czasowej. Czy otrzymane wyniki są zgodne z wcześniejszą odpowiedzią?
7Ct+l-7Ut = j( p t - x t)
( 0 < y ^ l) ;
na tej samej zasadzie równanie opisujące politykę monetarną należy zapisać w postaci4: (17.20)
Ut+1- U t = - k ( m - p t+l)
(k> 0).
• Te trzy równania stanowią nową wersję modelu inflacji i bezrobocia.
3. Sprawdzić, że z możliwości n, HI i IV dla przypadku 1 wynikają niedopuszczalne wartości 7 .
Równania różnicowe względem p
4. Pokazać, że dla przypadku 3 nigdy nie zdarzy się, że 7 ^ 1.
Pierwszym etapem analizy nowego modelu jest — jak zwykle — zapisanie go w postaci pojedynczego równania względem jednej zmiennej. Niech tą zmienną będzie p. Zajmujemy się więc równaniem (17.18). Ponieważ równanie to, w przeciwieństwie do dwu pozostałych, nie opisuje przyrostów, więc musimy je odpowiednio przekształcić. Obliczymy różnicę p t, zgodnie z definicją:
17.3. INFLACJA I BEZROBOCIE W CZASIE DYSKRETNYM
Apt=Pt+i~Pt-
Współzależność inflacji i bezrobocia, omówiona wcześniej dla czasu ciągłego, może być również przedstawiona dla czasu dyskretnego. W niniejszym podrozdziale pokażemy, jak można przekształcić wcześniejszy model w model zawierający równania różnicowe. Skorzys tamy tu w zasadzie z tych samych założeń ekonomicznych.
Wymaga to dwu zabiegów. Najpierw przesuwamy indeksy czasowe w (17.18) o jeden okres do przodu, aby otrzymać: (17.18')
p t+l = a - T - p u t+1 + h x t+u
a następnie od (17.180 odejmujemy równanie ( 17 -18): (17.21)
Model
p t+i - p t = - P ( U t+i - Ut) + h(7Ct+i - n t) =
= p k im -pt+ i) + h j(p t - x t) .
Wcześniejsza postać modelu (podrozdz. 15.5) dla czasu ciągłego składała się z trzech równań różniczkowych (15.33)-(15.35): p - c c - T - p U 4- h n ,
[funkcja Phillipsa poszerzona o oczekiwania]
Otrzymane w ten sposób równanie opisuje schemat zmian. Zauważmy, że w drugim wierszu (17.21) uwzględniono informacje dotyczące schematów zmian pozostałych wielkości występujących w modelu. Równanie (17.21) zawiera zatem całą informację o modelu. Z równania tego należy wyeliminować składnik n . Korzystamy w tym celu z faktu, że: (17.22)
ÓL7Z
= j (P -
dU — - - k ( m - p).
[oczekiwania adaptacyjne] [polityka monetarna]
Występują tu trzy zmienne endogeniczne: p (rzeczywista stopa inflacji), ;r (oczekiwana stopa inflacji) i U (stopa bezrobocia). Model zawiera sześć parametrów. Jeden z nich, parametr rn — stopa wzrostu
[z (17.20) i (17.19)]
h x t = p t - ( a - T ) + p u t.
[z (17.18)]
Podstawiając do (17.21) i porządkując, otrzymujemy: (17.23)
(1 + P k)pt+1 - [ 1 - 7 ( 1 - h)]pt + jp U t = Pkm + j ( a - T ) .
4 Przyjęliśmy założenie, że przyrost Ut zależy od ( m - p ł+1), czyli stopy wzrostu pieniądza (w ujęciu realnym) w okresie t+ 1. Inna możliwość polega na tym, aby przyrost U, zależał od stopy wzrostu pieniądza (w ujęciu realnym) w okresie t, czyli od (m - p t) - por. ćwiczenie 17.3-4.
590 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW 591
Teraz z kolei pojawił się składnik Ut. Trzeba go wyeliminować. W tym celu obliczamy różnicę (17.23), w której występuje wyrażenie (Ut+1 - Ut), i korzystamy z (17.20). W wyniku tych wszystkich przekształceń otrzymujemy równanie różnicowe zawierające jedynie p, które po znormalizowaniu przyjmuje postać: _
nmA\
(1 /.2 4 )
l+hj+(l-j)(l+f}k)l - j ( l - A ) _ jfikrn
.
P t +2
~ P t +1 +
----
-¡r------P t — ~
a2
Ścieżka czasowa dla p Wartość p odpowiadająca równowadze międzyokresowej, określona przez całkę szczególną równania (17.24), jest równa: c
jB km
. 1 + a-i + a2
pkj
= m.
[z (17.2)]
Podobnie jak w modelu dla czasu ciągłego, stopa inflacji dla położenia równowagi jest dokładnie równa stopie ekspansji monetarnej. W funkcji uzupełniającej natomiast, w zależności od wartości a j i 4a2>pierwiastki charakterystyczne mogą być rzeczywiste i różne (przypadek 1), rzeczywiste i równe (przypadek 2) lub zespolone (przypadek 3). W naszym modelu: (17.25)
aj = 4 a2 wtedy i tylko wtedy, gdy:
5 6
a ponadto:
b ,b 2 =
1 +p k
a2 =2 l - J‘(1~ A) e (0, 1),
U
(1 + pk) Ut+l- U t = k ( a - T - m) + khn t+x.
Następnie, przygotowując się do podstawienia równania (17.19), obliczamy różnicę (17.28) i otrzymujemy: (17.29)
(1 + pk)U t+2 - (2 + Pk) Ut+X + Ut - kh (n t+2 ~ n t+\).
Po prawej stronie pojawiła się różnica K\ zamiast niej podstawiamy przesuniętą o jeden okres do przodu wersję równania oczekiwań adaptacyjnych, otrzymując: (17.30)
(1 + pk) Ut+2 - (2 + Pk) i /,+1 + Ut = k h j(p t+1 - Kt+X\
a więc równanie uwzględniające całą informację modelu. Musimy jeszcze wyeliminować zmienne p i K, aby otrzymać równanie różnicowe względem U. Z równania (17.20) wynika, że:
bi + b1 = - a i = ^ - + \ - j > 0 , 1 +pk
(por. (17.24)] (17.26')
Analiza
(17.28) , a 4a2- 2 0 ; otrzymujemy
zatem przypadek 1. Ale jeśli h = j = 1,to aj = 4, a 4 a 2 = 4(1 + pk) > 4 i mamy do czynienia z przypadkiem 3. Ponieważ w modelu występuje znacznie więcej parametrów, więc nie da się skonstruować takiego wykresu pomocnego w klasyfikacji, jak na rys. 17.2 dla modelu Samuelsona. Analizę zbieżności przeprowadzamy w ten sam sposób, jak w poprzednim podrozdziale. Przypomnijmy z (15.6), że dwa pierwiastki charakterystyczne bx i b2 muszą spełniać następujące dwa warunki: (17.26)
Samuelsona) nie mogą tu wystąpić możliwości II i IV. Nie może się zdarzyć, aby jeden pierwiastek był większy, a drugi mniejszy niż 1, gdyż wtedy (1 - b i ) ( l - b2) byłoby ujemne. Wykluczona jest więc również możliwość III. Zatem pierwiastki charakterystyczne b x i b2 muszą być albo oba większe niż 1, albo oba mniejsze niż 1. Jeśli bi > 1 i b2 > 1 (możliwość V), to byłby naruszony warunek (17.26'). Jedyną ewentualnością jest możliwość I, gdy b\ i b2 są oba dodatnimi ułamkami, tak iż ścieżka czasowa p jest zbieżna. Analiza przypadku 2 w zasadzie nie jest zbyt odmienna. Rozumując praktycznie w taki sam sposób, można wywnioskować, że podwójny pierwiastek w tym modelu musi być dodatnim ułamkiem. Dopuszczalna jest więc możliwość VI, ale nie VII ani VIII. Ścieżka czasowa dla p jest również nieoscylująca i zbieżna. Dla przypadku 3 zbieżność wymaga, aby R (wartość* bezwzględna pierwiastków zespolonych) było mniejsze od jedności. Z (17.8) wiemy, że R = ^[a^. Ponieważ a2 jest dodatnim ułamkiem (por. (17.26')), więc rzeczywiście R < 1, a zatem ścieżka czasowa dla p w przypadku 3 również jest zbieżna, chociaż tym razem zawiera schodkowe wahania.
Chcąc zanalizować ścieżkę czasową stopy bezrobocia, możemy wystartować od (17.20). Aby wyeliminować z tego równania p, podstawiamy (17.18') i otrzymujemy:
[1 + hj + (1 - j ) (1 + pk)]2 g 4[1 -y (l - h)] (1 + pk). Jeśli na przykład h = — , 7 = y i Pk = 5 , to a j~
Rozważmy przypadek 1, gdy mamy dwa różne rzeczywiste pierwiastki charakterystyczne bi i b2. Ponieważ ich iloczyn bib2 jest dodatni, więc b\ i b2 muszą mieć taki sam znak, a ponieważ ich suma jest dodatnia, więc bi i b2 muszą być dodatnie, skąd wynika możliwość wystąpienia oscylacji. Z (17.27) wynika, że ani Z?i, ani b2nie mogą być równe 1; w przeciwnym razie (1 - Z?i)(l - b2) musiałoby być równe zeru, co byłoby sprzeczne z podaną nierównością. Oznacza to, że (odwołujemy się tu do różnych możliwości (bu b2) występujących w modelu
(17.31)
kpt+l = Ut+l~ U t + km.
Mnożąc (17.22) przez (~kj) i zmieniając indeksy, możemy zapisać: (17.32)
- k jh K t+x = - k j p t+1+ k j ( a - T) ~ P k jU t+i =
= - j( U t+1 - Ut + km ) + k j ( a - T) - p k jU t+x = = - j (1 + Pk) Ut+i + jU t + k j ( a - T - m ) .
[z (17.31)]
5 9 2 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW 593
Wielkości Pt+i i x t+i są tu wyrażone jako funkcje samego U. Podstawiając je do (17.30), otrzymujemy nareszcie szukane równanie różnicowe samego £/: l + h j + ( l - M l + p k ) rr
rr
u,+2~ ,~
7
t i - j ( i - h ) TT
lęj[a-T-(l-h)m] '
T W . +, 1
I+ P k 1 —
“•
Współczynniki d\ i a2 po lewej stronie są identyczne ze współczynnikami równania różnicowego dla p (tzn. (17.24)). W rezultacie wcześniejsza analiza funkcji uzupełniającej dla/? odnosi się również do (17.33). Ponieważ jednak wyraz wolny po prawej stronie (17.33) różni się od wyrazu wolnego dla (17.24), więc całki szczególne dla obu równań są różne. Tak właśnie powinno być, gdyż nie ma powodu, aby stopa bezrobocia dla równowagi między okresowej była taka sama, jak stopa inflacji, chyba że przypadkowo będą miały takie same wartości. '
Ćwiczenie 17.3 1. Wykonać pośrednie obliczenia prowadzące od (17.23) do (17.24). 2. Pokazać, że jeśli zapiszemy rozważany model w postaci pojedynczego równania różnicowego względem /r, to otrzymamy taki sam wynik, jak (17.24) po zastąpie niu p przez n. 3.
Dla modelu rozważanego w tym podrozdziale ścieżki czasowe p i U są zbieżne. Czy mogą pojawić się rozbieżne ścieżki czasowe, jeśli pominiemy założenie, że h ^ 1? Jeśli tak, to które „możliwości” z przypadków 1, 2 i 3 dla rozbieżnych ścieżek będą teraz dopuszczalne?
4. Pozostawiamy bez zmian równania (17.18) i (17.19), ale (17.20) zastąpimy równaniem: Ut+i- U t = - k ( m - p t).
Długookresowa zależność Phillipsa Można łatwo sprawdzić, że stopa bezrobocia dla równowagi międzyokresowej jest równa: U = ^ -[ a -T -(l-h )m ] ;
a. Wyprowadzić nowe równanie różnicowe względem zmiennej p. b. Czy nowe równanie różnicowe prowadzi do nowej wartości p l c. Załóżmy, że j = h = 1. Znaleźć warunki, przy których pierwiastki charakterystyczne będą takie, jak w przypadku 1, 2, i 3. d. Załóżmy, że j = h = l. Opisać ścieżkę czasową dla p (w tym jej zbieżność lub rozbieżność), gdy Pk jest równe 3, 4 lub 5.
ponieważ jednak stopa inflacji w położeniu równowagi równa się p = w, więc związek między U i p możemy wyrazić równaniem: (17.34)
£7= i - [ a _ T - ( l - h ) p l P
-
Równanie to dotyczy tylko wartości stopy bezrobocia i inflacji dla położenia równowagi; mówi się więc, że wyraża ono długookresową zależność Phillipsa. Szczególnemu przypadkowi (17.34), dla h = 1, ekonomiści poświęcili wiele uwagi. Jeśli h = 1, to p znika, gdyż współczynnik stojący przy nim przyjmuje wartość zero. Innymi słowy, U będzie stałą funkcją p. Na standardowym diagramie Phillipsa, ze stopą bezrobocia zaznaczoną na osi poziomej, dla tego wyniku otrzymujemy długookresową krzywą Phillipsa w postaci pionowej linii prostej. Wartość U — nazywana w tym przypadku naturalną stopą bezrobocia — występuje dla każdej' stopy inflacji zapewniającej równowagę. Płynie stąd ważny wniosek dla polityki gospodarczej: na dłuższą metę nie jest możliwe wzajemne zastępowanie (trade-off) dwu plag: inflacji i bezrobocia (co jest możliwe w krótkim okresie). Ale co będzie, gdy h < 1? W tym przypadku współczynnik przy p w (17.34) ma ujemną wartość. Długookresowa krzywa Phillipsa jest malejąca, co oznacza możliwość zastępowania inflacji i bezrobocia. Zatem to, czy długookresowa krzywa Phillipsa jest pionowa, czy też ma ujemne nachylenie, w zasadniczy sposób zależy od wartości parametru h. Parametr ten, zgodnie z zależnością Phillipsa rozszerzoną o oczekiwania, mierzy, do jakiego stopnia oczekiwana stopa inflacji może wpływać na strukturę płac i rzeczywistą stopę inflacji. Problem ten powinien wydawać się znajomy, gdyż podobne rozważania snuliśmy w przykładzie 1 w podrozdz. 15.5, a Czytelnik rozwiązał już zapewne ćwiczenie 15.5-4 dotyczące tych zagadnień. 38 — Podstawy...
17.4. UOGÓLNIENIA DLA ZMIENNEGO WYRAZU WOLNEGO I RÓWNAŃ WYŻSZYCH RZĘDÓW Możemy teraz dokonać uogólnień w dwu kierunkach; dla przypadku zmiennego wyrazu wolnego oraz dla równań różnicowych wyższych rzędów.
Zmienny wyraz wolny postaci c m 1 Gdy stały wyraz c w (17.1) zastąpimy zmiennym wyrazem wolnym — pewną funkcją t — wpłynie to tylko ria całkę szczególną (dlaczego?). Aby znaleźć nową całkę szczególną, możemy powtórnie skorzystać z metody nieoznaczonych współczynników. Dla równań różniczkowych (podrozdz. 15.6) metodę tę można stosować tylko wtedy, gdy zmienny wyraz wolny i jego kolejne pochodne zawierają łącznie, prócz stałych, tylko skończoną liczbę różnych wyrażeń. W odniesieniu do równań różnicowych zastrzeżenie to brzmi: „zmienny wyraz wolny i jego kolejne przyrosty muszą, oprócz stałych, zawierać jedynie skończoną liczbę różnych wyrażeń” . Zilustrujmy tę metodę konkretnymi przykładami, najpierw dla wyrazu wolnego cm \ gdzie c i m są stałe. Przykład 1. Znaleźć całkę szczególną dla: 7í+2 + y í+ i - 3 > , = 7 '.
59 4 ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW 595
Mamy tu c = l i m = 7. Sprawdźmy, czy zmienny wyraz wolny 7' daje skończoną liczbę typów wyrażeń przy obliczaniu przyrostów. Zgodnie z regułą obliczania przyrostów (Ayt = yt+i - y t)> pierwszy przyrost wyrazu wolnego jest równy:
Zauważmy, że mianownik B musi być różny od zera. Jeśli jednak zdarzy się5, że m 2 + axm + a2 = 0, to jako rozwiązanie próbne musimy przyjąć yt = B tm t\ jeśli i to zawiedzie, przyjmujemy yt = B t2m*.
A l 1- 7 i+1 - 7* = (7 —1)7* = 6 • 7',
Zmienny wyraz wolny postaci c t n
podobnie drugi przyrost, A 2! * , można zapisać jako: A (A V ) = A (6 • 70 = 6- 7 '+1 - 6 ♦V = 6 • (7 - l)7 f = 36 • V.
Można sprawdzić, że wszystkie kolejne przyrosty będą pewnymi wielokrotnościami 7'. Ponieważ mamy tu tylko jeden typ wyrażenia, więc możemy wypróbować jako całkę szczególną rozwiązanie postaci yt —B l \ gdzie B jest współczynnikiem nie określonym. Podstawiając próbne rozwiązanie i jego wersje dla okresów t + 1 i f + 2 do danego równania różnicowego, otrzymujemy: B • l t+1 + B • 7 *+1 - 3 • £ • 7' = 7',
czyli
B(72 + 7 - 3 )V = V ,
Rozważmy teraz zmienne wyrazy wolne postaci ctn, gdzie c jest dowolną stałą, a n liczbą naturalną. Przykład 2. Znaleźć całkę szczególną dla: yt+2 + 5yr+i + 2 y, = i2.
Pierwsze przyrosty dla t 2 (szczególnego przypadku ctn dla c = 1 i /i = 2) obliczmy w następujący sposób6:
a zatem: Ai2 = (i+ l) 2 - t 2 = 2 i+ 1, s = _ 1 — = JL 49 + 7 - 3 53
,
i całkę szczególną możemy zapisać jako:
Jest to oczywiście równowaga ruchoma. Czytelnik może sprawdzić poprawność rozwiązania, podstawiając je do równania różnicowego — otrzyma tożsamość 1* = 1*. Otrzymany w przykładzie 1 wynik można łatwo uogólnić, przechodząc od wyrażenia 7' do bardziej ogólnego cm 1. Możemy oczekiwać, że kolejne przyrosty cm *będą miały postać B m \ gdzie B jest pewnym stałym czynnikiem. Możemy więc wypróbować rozwiązanie yt = Bm ł jako całkę szczególną dla równania różnicowego: (17.35)
yt+i + a ^ t ^ + a tf^ c m * .
Dla próbnego rozwiązania yt = B m t i dla yr+ł = B m t+l itd. możemy przepisać równanie (17.35) w postaci: Bmt+2 + axBm t+l + a2Bm t = cm \
czyli: B (m 2 + axm-Y a2)m t = cm*.
A 2tz = A (A tz) = A ( 2 t + l ) = A 2 t + A l = = 2(t+ l ) - 2 r + 0 = 2,
[A stałej = 0]
A 3t2 = A (A2t 2) = A2 = 0.
Ponieważ kolejne przyrosty są równe zeru, mamy łącznie trzy typy wyrażeń: t2 (sam zmienny wyraz wolny), t oraz stałą (otrzymane dla kolejnych przyrostów). Wypróbujmy zatem rozwiązanie: yt = Bo + B xt + B212
jako całkę szczególną, z nie określonymi współczynnikami B0, B i i' B2. Dla tego rozwiązania otrzymujemy: yt+1= Bo + B \(t + 1) + B2(t + 1) 2 = (Bq+ B\ + B2) + (Bi + 2 B ^ t + B2t2, yt+2 = Bo + Bi (t + 2) + B2(t + 2)2 = (Bo + 2Bi + AB^) + (Bi + A B ^t + B2t2.
Podstawiając te wyniki do równania, otrzymamy: (8 B0 + IB i + 9B2) + (8Bi + 14B2)r + 8B2t2 = t2.
Porówiiując obie strony — wyraz po wyrazie — widzimy, że współczynniki muszą spełniać następujący układ równań:
Współczynnik B w próbnym rozwiązaniu powinien zatem być równy: m 2 + axm + a2
i szukana całka szczególna dla (17.35) przyjmie postać: (17.36)
yp = Bm ł = —=---m* (m2 + axm + a2 & 0). m + a xm + a2
5 Analogicznie do sytuacji w przykładzie 3 w podrozdz. 15.6 może się to zdarzyć, gdy stała m jest równa pierwiastkowi charakterystycznemu równania różnicowego. Pierwiastki charakterystyczne rów nania różnicowego to wartości b spełniające równanie b2 + axb + a2 = 0. Jeśli jeden z pierwiastków ma wartość m, to musi być m2 + aim + a2= 0. 6 Należy to porównać z pierwszymi trzema pochodnymi i2:
d „
d2 „
d3
596
ANALIZA DYNAMICZNA
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW 597
8B0 + 7Bi + 9B2 = 0, 8B,+ 14B2 = 0,
-/( '3 ^ 1
8B2 = 1,
13 7 1 muszą być zatem równe B0 = —— ; B x = - — ; 5 2 = —; otrzymujemy zatem całkę szcze256 32 o golną:
i
13 7 1 , 256 32 i + ¥ i V : . ; ’ V'' Nasze doświadczenie zdobyte dzięki rozważaniom dotyczącym wyrazu wolnego t 2 pozwalają uogólnić tę metodę na przypadek c tn. W nowym rozwiązaniu próbnym powinien wystąpić składnik Bntn odpowiadający danemu wyrazowi wolnemu. Ponadto, ponieważ kolejne obliczanie różnic daje różne wyrażenia t n~l, t n~2, ..., t i B0 (stałą), nowe rozwiązanie próbne dla zmiennego wyrazu wolnego c tn może więc być zapisane jako: ~yt = B0 + B lt + B2t2 + ...+ B nt n,
jeśli oczywiście pierwiastki są różnymi liczbami rzeczywistymi. Jeżeli wystąpią wielokrotne pierwiastki rzeczywiste (np. bx = ¿2 = ^3)» to trzy pierwsze składniki w (17.39) trzeba zmodyfikować jako: [por. (17.6)]
A xb{+ A 2tb \+ A 3t 2b[.
Gdy wystąpi para sprzężonych pierwiastków zespolonych — np. czas ostatnie dwa składniki w (17.39) trzeba połączyć w wyrażenie:
i bn — wów
R/(An_iCos Ot+ An sin Ot). Podobne wyrażenie występuje dla każdej pary sprzężonych pierwiastków zespolonych. Jeśli natomiast mamy dwie powtarzające się pary, to jedna z nich musi mieć mnożnik tR* zamiast R*. Po znalezieniu yp i yc otrzymujemy ogólne rozwiązanie równania różnicowego, dodając je do siebie, tzn.: yt= yP+yc-
Ponieważ w rozwiązaniu tym pojawia się łącznie n stałych dowolnych, więc potrzeba
a cała reszta procedury jest doldadnie taka sama. Trzeba dodać, że niekiedy takie rozwiązanie nie sprawdzi się. W takim przypadku — podobnie jak to robiliśmy mnóstwo razy — mnożymy pierwsze rozwiązanie przez dostatecznie wysoką potęgę t. Możemy np. wypróbować: yt = t(B0 + B xt + B 2t2 + ... + B nt n).
n warunków początkowych, aby określić ich wartości. Przykład 3. Znaleźć rozwiązanie ogólne równania różnicowego trzeciego rzędu:
7 1 1 yf+3- —yt+2 + j y t+1+ yt = 9. Podstawiając rozwiązanie yt = k, znajdziemy całkę szczególną yp = 32. Jeśli chodzi o funkcję uzupełniającą, to ponieważ równanie charakterystyczne trzeciego stopnia:
Liniowe równania różnicowe wyższych rzędów
7
1
1
8
8
32
%
Rząd równania różnicowego wskazuje, jaki jest najwyższy rząd różnicy występującej w równaniu; ale oznacza też maksymalną liczbę okresów. Liniowe równanie różnicowe n-tego rzędu (o stałych współczynnikach i stałym wyrazie wolnym) można zapisać w ogólnej postaci jako: (17.37)
b n + aibn~l + ... + an- ib + a n = 0;
będzie ono miało n pierwiastków charakterystycznych bt (/= 1, 2 , ..., n) i wszystkie one muszą zostać uwzględnione w funkcji uzupełniającej, a zatem: (17.39)
b—
1
n
b +-
= 0,
yt+n + aly t+n-i + .. .+ a n- lyt+i + anyt = c.
Metoda znajdowania całki szczególnej dla tego równania nie różni się istotnie od wcześniej przedstawionych metod. Najpierw możemy wypróbować yt = k (przypadek sta cjonarnej równowagi międzyokresowej). Gdyby to zawiodło, wypróbujemy y t = k t 2 itd. Przy poszukiwaniu funkcji uzupełniającej napotkamy natomiast równanie charakterys tyczne, które jest równaniem wielomianowym stopnia n : (17.38)
może być rozłożone na czynniki:
x =
i=l
1
więc pierwiastkami są bx = b2 = —■i b3 = 2
fi V
yc= A — + A 2t
2J
V
t
2
,
V
)
+ A3
f
8
. Możemy zatem zapisać:
1V
l 8J
Zwróćmy uwagę na to, że drugi składnik zawiera czynnik i; jest to spowodowane obecnością podwójnego pierwiastka. Rozwiązanie ogólne danego równania różnicowego to suma yc i yp. W tym przypadku wszystkie trzy pierwiastki charakterystyczne są co do modułu mniejsze niż 1. Możemy zatem wywnioskować, że otrzymane rozwiązanie ma ścieżkę czasową zbieżną do stacjonarnego położenia równowagi równego 32.
RÓWNANIA RÓŻNICOWE WYŻSZYCH RZĘDÓW
598 ANALIZA DYNAMICZNA
Zbieżność i twierdzenie Schura Gdy mamy równanie różnicowe wyższego rzędu, którego nie można łatwo rozwiązać, możemy wówczas zbadać jakościowo odpowiednią ścieżkę czasową, bez obliczania roz wiązania ilościowego. Pamiętamy, że ścieżka czasowa może być zbieżna wtedy i tylko wtedy, gdy każdy pierwiastek równania charakterystycznego jest co do modułu mniejszy niż 1. Z tego powodu można bezpośrednio skorzystać z następującego twierdzenia — znanego jako twierdzenie Schura7:
599
Gdy przetransponujemy blok górny po lewej stronie, otrzymamy blok dolny po prawej stronie. Blok u góry po prawej stronie ma na głównej przekątnej elementy równe a n, pod główną przekątną zera, a nad główną przekątną w każdej kolumnie ku górze — elementy z kolejnymi coraz mniejszymi indeksami. Gdy przetransponujemy elementy tego bloku, otrzymujemy blok po lewej stronie u dołu. Zastosowanie tego twierdzenia jest bezpośrednie. Ponieważ współczynniki równania charakterystycznego są takie same, jak współczynniki po lewej stronie pierwotnego równania różnicowego, możemy więc je bezpośrednio podstawić do wyznaczników. Zwróćmy uwagę, że po normalizacji mamy zawsze a 0~ 1.
Wszystkie pierwiastki równania wielomianowego n-tego stopnia: Przykład 4. Czy ścieżka czasowa dla równania yt+2 + 3y/+ł + 2yt = 12 jest zbieżna? Mamy tu n = 2, a współczynniki są równe a 0 = 1; ax = 3; a2 = 2. Wobec tego:
a 0bn + a ilf " 1+ ... + an-ib + an = 0
a0 i an
>
A2 ~
an ; ao
Clo Cli
0 a0
ax
a2
an a n- 1 0 an
an 0 1 a0 ai a,i~i an j 0 a0
... 0 ... 0
Cln-l an.-2 ••• a0 0 an Cln-l an
oa o
a0 ai
i. . . . . . . . . . . . . .
będą co do modułu mniejsze od jedności wtedy i tylko wtedy, gdy wszystkie niżej zapisane wyznaczniki:
... 0 ... 0 ... an
an an~i 0 an
ax a2
0
an
0
a0 ai 0 a0 0
0
¿1 =
a0 a2
1
2
a2 a i
2
1
= -3 < 0 .
Ponieważ narusza to warunek zbieżności, nie musimy więc już obliczać A2. Łatwo można znaleźć pierwiastki charakterystyczne danego równania różnicowe go, a mianowicie b i = - l , b 2 = - 2 y skąd rzeczywiście wynika, że ścieżka czasowa jest rozbieżna.** Przykład 5. Zbadać zbieżność dla yt+2 + — yt+i - ~ y t = 2 za pomocą twierdzenia 6 6
Schura. Współczynniki są równe Oo= 1; 0 i =
... an- 1
6
a2 = ~ — (dla n = 2). Mamy zatem: 6
an—2 1
a 0 a2
aQ
7 Omówienie twierdzenia i jego historii można znaleźć w pracy Johna S. Chipmana, The Theory of Inter-SectoralMoney Flows andIncome Formation, The John Hopkins Press, Baltimore 1951, s. 119-120.
6
a0
0
ai
a0
t a2
ai
0
a2
ai
0
a 0 ai
a2 0
1
1 1
A2 = a2
„
35
= ~36 >
a 2 a0
są dodatnie (jest ich n).
Zauważmy, że w sformułowaniu twierdzenia występuje zwrot „wtedy i tylko wtedy” , czyli podany w nim warunek jest konieczny i dostateczny. Zatem twierdzenie Schura dla równan różnicowych jest dokładnym odpowiednikiem twierdzenia Routha podanego wcześ niej dla równan różniczkowych. Konstrukcja tych wyznaczników jest oparta na prostej procedurze. Najlepiej ją wyjaśnić po podziale każdego z wyznaczników liniami przerywanymi na cztery bloki. Każdy blok &-tego wyznacznika, czyli Ak , składa się zawsze z wyznacznika stopnia k. Blok u góry po lewej stronie ma na głównej przekątnej elementy równe a 0, zera powyżej głównej przekątnej i elementy o kolejnych rosnących indeksach w każdej kolumnie poniżej głównej przekątnej.
--
ao
~6 1 ~~6
0
1
0
1
1
~6
~6"
1
1
~6
6"
0
1
0
1 " 6" 1
1176 1296
~6 1
a zatem są spełnione warunki (konieczny i dostateczny) zbieżności.
>0,
600 ANALIZA DYNAMICZNA
Ćwiczenie 17.4 1. Zastosować definicję operatora przyrostów A i znaleźć: (a) A t; (b) A 2t; (c) A t3. ' . Porównać wyniki obliczania przyrostów z wynikami różniczkowania. 2. Znaleźć całkę szczególną dla każdego z następujących równań: (a) y t+2 + 2yt+i + y / = 3'; (b) y t+2 ~ 5yi+i - 6yt = 2 • 6 *; (c) 3y,+2 + 9y, = 3 *4'. 3. Znaleźć całki szczególne dla: (a) yi+2 - 2 yf+i + 5yi = i; (b) y,+2 - 2 y,+i + 5yt = 4 + 2 i; (c) y,+2 + 5y,+i + 2y, = 18 + 6 t + 8 i2. 4. Czy można oczekiwać, że dla wyrazu wolnego w postaci m* + tn próbne rozwiązanie powinno być równe Bm* + (B0 + B rt+ ... + Bnt n) l Dlaczego? 5. Znaleźć pierwiastki charakterystyczne i funkcję uzupełniającą dla: 1 1 „ (a) yt+ 3-— yt+2 - y t+ i+ — yt=o-,
5 1 (b) y,+3 -2 y ,+2 + T y,+i - T y,= l. 4 4 6 . Za pomocą twierdzenia Schura sprawdzić zbieżność następujących równań różnicowych:
(a) y,+2 + y y ,+i - y y , = 3; (b) yt+2 - j y t = l7. W przypadku równania różnicowego trzeciego rzędu: yt+3 + a xyt+2 + a 2yt+i + a3y, = c
18. UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH
W dotychczasowych rozważaniach dotyczących dynamiki ekonomicznej ograniczaliśmy się do analizy pojedynczego równania dynamicznego (różniczkowego lub różnicowego). Ten rozdział jest poświęcony metodom analizy układu równań dynamicznych. Ponieważ wymaga to zajmowania się jednocześnie wieloma zmiennymi, więc Czytelnik zapewne spodziewa się nowych komplikacji. Ale tak naprawdę większość z tego, czego nauczyliśmy się o pojedyn czych równaniach dynamicznych, może być z łatwością rozszerzona na układy równań dynamicznych. Na przykład rozwiązanie układu dynamicznego wciąż będzie się składało ze zbioru całek szczególnych (wartości równowagi międzyokresowej dla różnych zmiennych) i funkcji uzupełniających (odchyleń od równowagi). Fimkcje uzupełniające wciąż będą oparte na równaniach zredukowanych, tzn. jednorodnych wersjach równań układu, a dynamiczna stabilność układu wciąż będzie zależała od znaków (jeśli jest to układ równań różniczkowych) lub od wartości bezwzględnych (jeśli jest to układ równań różnicowych) pierwiastków charakterystycznych funkcji uzupełniających. Układ dynamiczny jest tylko nieco bardziej skomplikowany od pojedynczego równania dynamicznego.
podać dokładną postać wyznaczników występujących w twierdzeniu Schura.
18.1. GENEZA UKŁADÓW DYNAMICZNYCH Istnieją dwa ogólne sposoby powstawania układu dyriapućźńego. Może on powstać z danego zbioru współdziałających schematów zmian, ale może też byę otrzymany z pojedynczego danego schematu zmian, jeśli stanowi on równanie dynamiczne drugiego (lub wyższego) rzędu.
Współdziałające schematy zmian Najbardziej oczywistym przypadkiem zbioru współdziałających schematów zmian jest model wielosektórowy, w którym każdy sektor, opisany równaniem różniczkowym, zależy od
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH
602 ANALIZA DYNAMICZNA
przynajmniej jednego z pozostałych sektorów. Dynamiczna wersja modelu nakładów i wyników może np. obejmować n gałęzi, których zmiany produkcji wywołują dynamicz ne reperkusje w pozostałych gałęziach. Model taki stanowi zatem układ dynamiczny. Podobnie, dynamiczny model ogólnej równowagi rynkowej może uwzględniać n dóbr, które są powiązane poprzez odpowiednio dostosowane ceny. Jest to zatem również układ dynamiczny. Współdziałające schematy zmian można znaleźć nawet w modelu dla pojedynczego sektora. Zmienne w takim modelu reprezentują wówczas różne aspekty gospodarki, a nie różne sektory czy różne dobra. Niemniej jednak mogą wpływać na siebie nawzajem w swoim zachowaniu dynamicznym, tworząc w ten sposób sieć wzajemnych oddziaływań (interakcji) l. Konkretny przykład takiej sytuacji napotkaliśmy w rozdz. 17. W zaprezentowanym tam modelu inflacji i bezrobocia oczekiwana stopa inflacji rozwijała się zgodnie ze schematem zmian (17.19), który zależał nie tylko od n, lecz również od stopy bezrobocia U (za pośrednictwem rzeczywistej stopy inflacji p ). Odwrotnie, schemat zmian U (17.20) zależał od n (również za pośrednictwem p). Zatem dynamiki n '\ U musiały być określone łącznie. Teraz widać, że model inflacji i bezrobocia moglibyśmy potraktować jako model dynamiczny o równaniach współzależnych. Dzięki temu uniknęlibyśmy długiego ciągu podstawień i przekształceń potrzebnych do kondensacji modelu w postaci pojedynczego równania względem jednej zmiennej. W podrozdz. 18.4 ponownie rozważymy ten model, traktując go jako układ dynamiczny. Tymczasem idea, że ten sam model może być traktowany albo jako pojedyncze równanie, albo jako układ równań, stanowi naturalny klucz do rozważań o drugim sposobie otrzymywania układu dynamicznego.
Aby zilustrować procedurę przekształceń, rozważmy pojedyncze równanie różnicowe: (18.1)
yi+2 + aiyi+1 + a 2y t = c.
Tworzymy nową zmienną x t, zdefiniowaną przez: (skąd wynika, że xt+i s yt+2).
x t = yt+1
Pierwotne równanie drugiego rzędu możemy wyrazić za pomocą dwu współzależnych równań pierwszego rzędu (z jednookresowym odroczeniem) w następujący sposób: (18 1')
Xt+1
+ a ix t + a 2 y t - c y
yt+1 -
xt
=0.
Widać, że jeśli tylko spełnione jest drugie równanie (definiujące zmienną xt), to pierwsze równanie jest identyczne z pierwotnym. W podobny sposób, ale używając większej liczby zmiennych sztucznych, możemy przekształcić pojedyncze równanie wyższego rzędu w rów noważny układ współzależnych równań pierwszego rzędu. Czytelnik może sprawdzić, że np. równanie trzeciego stopnia: (18.2)
yt+3 + yt+2 —3yi+i + 2 yt = 0
można przedstawić jako: wr+1 (18.20
+ wt - 3 x t + 2yt = 0, -w t =0,
x t+i
Przekształcenie równania dynamicznego wyższego rzędu Załóżmy, że dane jest równanie różniczkowe (lub różnicowe) n-tego rzędu względem jednej zmiennej. Wtedy — jak to wykażemy — można je przekształcić w matematycznie równoważny układ n współzależnych równań różniczkowych (lub różnicowych) pierwszego rzędu względem n zmiennych. W szczególności równanie różniczkowe drugiego rzędu można przekształcić w dwa współzależne równania różniczkowe pierwszego rzędu względem dwu zmiennych2. Jeśli zatem zaczynamy od jednego tylko równania dynamicznego (wyższego rzędu), to za pomocą przekształceń matematycznych możemy otrzymać układ dynamiczny. Fakt ten ma zarazem ważne znaczenie. W dalszych rozważaniach nad układami dynamicz nymi wystarczy, abyśmy zajmowali się układami równań pierwszego rzędu, jeśli bowiem pojawi się równanie wyższego rzędu, zawsze będziemy mogli przekształcić je w układ równań pierwszego rzędu. Będziemy wtedy mieć więcej równań w układzie, ale ich rząd będzie obniżony do minimum.
603
Yr+i
~ xt
= 0,
gdzie xt = yt+l (więc xt+i = yt+2) i wt = xt+l (więc wt+i = xt+2 = y t+3). W podobny sposób możemy przekształcić równanie różniczkowe n-tego rzędu w układ n równań pierwszego rzędu. Dla danego równania różniczkowego drugiego rzędu: (18.3)
y"(t) + aly'(t) + a2y ( t) = 0
możemy wprowadzić ^nową zmienną x (i) zdefiniowaną przez: [skąd wynika, że x '(t) = /'(*)]
x(t) = y'(t)
i zapisać (18.3) jako następujący układ dwu równań pierwszego rzędu: (18 30
+ a ix(t) + a2y (t) = 0, x(t) = 0,
y '( t ) 1 Jeśli mamy dwa takie dynamiczne równania względem dwu zmiennych yi i y2, że schemat zmian yi zależy wyłącznie od samego yxi podobnie jest dla y2, to tak naprawdę nie ma tu układu równań współzależnych. Zamiast tego mamy po prostu dwa oddzielne równania dynamiczne. Każde może być analizowane osobno i nie wymaga to „współzależności” . 2 Odwrotnie, dwa równania różniczkowe (lub różnicowe) pierwszego rzędu względem dwu zmiennych można połączyć w jedno równanie drugiego rzędu względem jednej zmiennej.
gdzie jak widać — drugie równanie pełni funkcję definiowania nowo wprowadzonej zmiennej x , podobnie jak drugie równanie w (18.10* Taka sama procedura może być stosowana do przekształcenia równania różniczkowego wyższego rzędu. Jedyna modyfikacja polega na tym, że musimy wprowadzić odpowiednio większą liczbę nowych zmiennych.
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 605
6 0 4 ANALIZA DYNAMICZNA
18.2. ROZWIĄZYWANIE UKŁADU RÓWNAŃ DYNAMICZNYCH Metody rozwiązywania współzależnych równań różnicowych i współzależnych równań różniczkowych są bardzo podobne. Omówimy je zatem łącznie. Nasze rozważania ograniczy my do liniowych równań o stałych, współczynnikach.
rozwiązanie m = n = 0 (por. tabl. 5.1 w podrozdz. 5.5). W takim przypadku obie funkcje uzupełniające w (18.6) będą tożsamościowo równe zeru, co oznacza, że x i y nigdy nie odbiegają od ich wartości równowagi międzyokresowej x i y. Jest to niezbyt interesujący przypadek szczególny, więc postaramy się wykluczyć to rozwiązanie, przyjmując założenie, że macierz współczynników układu ma być osobliwa. Wymagamy zatem, aby wyznacznik tej macierzy był równy zeru: b+6
9
-1
b
Współzależne równania różnicowe
(18.9)
Załóżmy, że dany jest następujący układ liniowych równań różnicowych:
Rozwiązanie tego równania kwadratowego, czyli b - b \ = b2 = -3 , jest jedyną wartoś cią, dla której m i n w (18.8) mogą być różne od zera. W dalszym ciągu będziemy używać właśnie tej wartości b. Równanie (18.9) jest nazywane równaniem charaktery stycznym, a jego pierwiastki —pierwiastkami charakterystycznymi danego układu współzależ nych równań różnicowych. Gdy określiliśmy już konkretną wartość b, możemy z (18.8) otrzymać odpowiadające jej rozwiązania dla m i «. Ponieważ układ jest jednorodny, więc ma nieskończenie wiele rozwiązań dla (m, «), które można wyrazić równaniem m = kn , gdzie k jest stałe. W ogól nym przypadku każdemu pierwiastkowi b{ odpowiada inne równanie m, = fc,«,. W naszym przykładzie mamy podwójny pierwiastek b = - 3, więc otrzymujemy tylko jedno równanie
(184)
*'+1
+ 6 *' + 9y, = 4, yt+1 -
=0.
Jak znaleźć ścieżki czasowe dla x i y, aby były spełnione oba równania? Nasze zadanie polega w istocie na szukaniu całek szczególnych oraz funkcji uzupełniających i na takim ich zsumowaniu, aby otrzymać szukane ścieżki czasowe dla dwu zmiennych. Ponieważ całki szczególne reprezentują wartości równowagi międzyokresowej, oznaczy my je symbolami x i y . Podobnie jak poprzednio, możemy najpierw wypróbować stałe rozwiązanie, mianowicie xt+i = xt = x oraz y J + l= y t = y . W naszym przykładzie to działa, ponieważ podstawiając te próbne rozwiązania do (18.4), otrzymujemy: ou)
l - w -”x +; 9ry = OJ
' 44
(gdyby takie rozwiązanie nie zadziałało, trzeba byłoby wypróbować rozwiązanie postaci xt = kit; y t = k2t itd.). Dla funkcji uzupełniających powinniśmy, korzystając z naszych poprzednich doświad czeń, wypróbować rozwiązanie postaci: (18.6)
i
xt = mbt
xt+i = m bt+l
i
yt+i = nbt+l.
Zwróćmy uwagę na to, że dlą uproszczenia przyjęliśmy tę samą podstawę potęgi h * 0 dla obu zmiennych, chociaż ich współczynniki mogą się różnić. Naszym celemjest znalezienie takich wartości bs m i n, dla których próbne rozwiązania (18,6) spełniają zredukowaną (jednorodną) wersję (18.4). Po podstawieniu tych próbnych rozwiązań do zredukowanej wersji (18,4) i skróceniu Wspólnego czynnika b{& 0, otrzymujemy układ: (18.8)
m = -3 n .
Jeśli teraz przyjmiemy n=A 3 (gdzie A3 jest dowolną stałą), tak iż m - -3A3, to rozwiązanie próbne (18.6) przyjmie postać: *, = -3A 3(-3)'
i
y,=A 3(-3)',
a funkcje uzupełniające należy zapisać jako: (18.10)
*c = -3A 3(-3)' - 3A4(t + l)(-3}', yc=A 3(-3)' + A4/(-3)'.
^
[z (17.6)]
yt - n b \
gdzie m i n są dowolnymi stałymi, ą podstawa potęgi b stanowi pierwiastek charakterystyczny, Wynika stąd automatycznie, że: (18.7)
= b2 + 6b + 9 = 0.
+m + b n =? 0^
+
który możemy traktować jako liniowy jednorodny układ równań z dwiema niewiadomymi m i n jeśli przyjmiemy tymczasowo b jako parametr. Ponieważ układ (18.8) jest jednorod ny, więc —jeśli macierz jego współczynników jest nieosobliwa —- może mięć tylko zerowe
Aby został spełniony warunek xt = yt+l z (18.4), w drugim składniku dla xc zastoso wano mnożnik t + 1 zamiast t. Ogólne rozwiązanie otrzymujemy z łatwością w wyniku połączenia całek szczególnych (18.5) ze znalezionymi właśnie funkcjami uzupełniającymi. Cechą szczególną powyższego rozwiązania jest to, że ponieważ obie ścieżki czasowe zawierają identyczne wyrażenia b \ więc muszą być albo obie zbieżne, albo obie rozbieżne. Jest to sensowne, ponieważ w modelu z dynamicznie współzależnymi zmiennymi nie można osiągnąć ogólnej równowagi międzyokresowej, jeśli w układzie występuje ruch dynamiczny. W przypadku podwójnego pierwiastka b = - 3 obie ścieżki czasowe dla x i y będą miały eksplodujące oscylacje.
Zapis macierzowy Aby ujawnić podstawowe podobieństwo między metodami rozwiązywania pojedynczego równania i układu równań, powyższe rozważania przeprowadzono bez zapisu macierzowego. Zobaczymy teraz, jak można w tym przypadku skorzystać z zapisu macierzowego. Chociaż nie warto, być może, stosować oznaczeń macierzowych w odniesieniu do prościutkiego układu
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH
606 ANALIZA DYNAMICZNA
dwu równań, jednak możliwość uogólnienia na przypadek n równan powoduje, że ćwiczenie to
i
(18.7) nadają
okazuje się pożyteczne. Dany układ (18.4) można wyrazić w postaci:
*r+i
(18.4')
6 -i
yt+i
u=
9
I
Iu + Kv = d,
gdzie I oznacza macierz jednostkową stopnia 2 , K jest macierzą stopnia 2 złożoną ze współczynników przy zmiennych xt i yt, a u, v i d są wektorami kolumnowymi : ;
v
;
=
d
= _o_
a
*.
A
Czytelnik mógłby zapytać, dlaczego wpisujemy tu I, chociaż wiemy, że Iu = u? Otóż, mimo iż w tym miejscu wydaje się to zbędne, to jednak macierz jednostkowa I będzie potrzebna w dalszych przekształceniach i dlatego lepiej wpisać ją w (18.4 ). Gdy jako całki szczególne wypróbujemy stałe rozwiązania xt+i=xt = x oraz yt+l = yt = y, wówczas w istocie przyjmujemy u = v =
x
; zredukuje to (18.4") do:
n
bt+l + K
(18.8')
m
’mb*
m
nb*_
n
b*.
h '= 0 ,
n
(M + K)
= 0,
gdzie 0 oznacza wektor zerowy. Właśnie z tego jednorodnego układu równań wyznaczamy wartości b, m i n , które posłużą do określenia próbnych rozwiązań. Aby uniknąć zerowego rozwiązania dla m in , konieczne jest spełnienie równości: (18.9')
|hI + K| = 0 ;
jest tó równanie charakterystyczne, z którego otrzymamy pierwiastki charakterystyczne b. Czytelnik może sprawdzić, że jeśli podstawimy do tego równania:
= d.
= (I + K)-1d;
~b
o'
0
b
1
7
9" -i ~4
Tó
•1
1
0
i ló"
9 ” 16 V 7 _0_
Tó
i
K=
’ 6 —1
9 0
to otrzymamy dokładnie równanie (18.9), które ma podwójny pierwiastek h = - 3 . W ogólnym przypadku dla każdego pierwiastka b\ równanie (18.8') będzie miało nieskończenie wiele rozwiązań m i n powiązanych równaniem m,- = k/n,. Dla każdej war tości b można zatem napisać: n,=A/
jest to oczywiście wzór ogólny, gdyż jest prawdziwy dla dowolnej macierzy K i wektora d, jeśli tylko istnieje (I + K)“1. Dla naszego przykładu liczbowego otrzymujemy:
(I + K)"1d =
bt+l
a po pomnożeniu przez liczbę b * i wyłączeniu wspólnego czynnika mamy:
y
Jeśli istnieje macierz odwrotna ( I + K)~\ to całki szczególne możemy wyrazić jako: (18.5')
n
m
bl =
(I + K)
m
n b t+l
i y konkretną postać:
V
Xt
X t+ l 11 =
~mbt+1~
u
Po podstawieniu tych próbnych rozwiązań do zredukowanego równania Iu + Kv = 0 przyjmie ono postać:
o
lub zwięźlej jako: (18.4")
w ek to ro m
607
oraz
m i = k iA ii
gdzie A i są dowolnymi stałymi, których wartości zostaną później określone. Po podsta wieniu do próbnych rozwiązań, wartości m,, n t oraz bi nadają funkcjom uzupełniającym konkretną postać. Jeśli wszystkie pierwiastki są różnymi liczbami rzeczywistymi, to możemy zastosować (17.5) i zapisać:
1
Em/h/ E«/hj_
J 1 A
a zatem x = y = —, co zgadza się z (18.5). 4 Przechodząc teraz do funkcji uzupełniającej, widzimy, że próbne rozwiązania (18.6)
A
Dla pierwiastków wielokrotnych stosujemy natomiast (17.6), w wyniku czego funkcje uzupełniające zawierają składniki w rodzaju A 3b t oraz A 4tb \ tak jak we wzorze (18.10) dla naszego przykładu liczbowego. W przypadku pierwiastków zespolonych funkcje uzupeł niające muszą być wzorowane na (17.10). W końcu, aby otrzymać rozwiązanie ogólne, tworzymy po prostu sumę: X
Xc =
3 Symbol v oznacza tu wektor. Nie należy go mylić z symbolem v oznaczającym skalar w zapisie liczb zespolonych h ± vi.
Ek/A/hf EA/hf _
A
+ A
y_
Pozostaje tylko problem określenia wartości stałych dowolnych A,*.
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 609
608 ANALIZA DYNAMICZNA
Rozszerzenie tej procedury dla układu n równań powinno być oczywiste. Jednakże dla dużego n rozwiązanie równania charakterystycznego, które jest równaniem wielomianowym stopnia n — może nie być łatwe. W takim przypadku twierdzenie Schiira może pomóc w otrzymaniu pewnych jakościowych wniosków dotyczących ścieżek czasowych zmiennych układu. Przypomnijmy, że rozwiązania próbne dla wszystkich tych zmiennych mają tę samą podstawę b, więc funkcje uzupełniające muszą zawierać te same wyrażenia b], a zatem te same własności, jeśli chodzi o zbieżność. Wystarczy więc raz zastosować twierdzenie Schura, aby określić zbieżność lub rozbieżność ścieżki czasowej dla każdej zmiennej układu.
Aby znaleźć całki szczególne, wypróbujemy stałe rozwiązania x (t)= x oraz y (t)= y , dla których x \ t ) = y'{t) = 0. Jeśli rozwiązania te spełniają równanie, to wektory v i u przyjmują dla nich postaci: X
V=
0“ 0
u=
oraz
y_
i równanie (18.13') sprowadza się do Mv = g. Zatem rozwiązanie dla x i y można zapisać jako: (18.14)
| = v = M l g.
Współzależne równania różniczkowe co można porównać z (18.5'). Numerycznie, nasze zadanie ma następujące całki szczególne: Opisaną wyżej metodę rozwiązania można również zastosować do układu równań różnicz kowych pierwszego rzędu. Niemal jedyna modyfikacja polega na zastąpieniu próbnych rozwiązań przez: (18.11)
i
x(t) - m ert
y(/) = «eri,
4
5
X
2
5' -i ' i i
3
3
'ii
y_
!
4_
1
2
6 !
6 !
T ! 5
skąd wynika, że: (18.12)
i
x'(t) = rm ert
Poszukamy teraz funkcji uzupełniających. Dla próbnych rozwiązań podanych w (18.11) i (18.12) wektory u i v przyjmują postać:
y'(t) = rn ert.
Zgodnie z przyjętą przez nas konwencją pierwiastki charakterystyczne oznaczamy teraz symbolem r zamiast b. Załóżmy, że dany jest następujący układ równań:
m
Ju + M y = g,
n
gdzie:
0
K
5' 4
u=
A t) y \t) ~x(t)
n
2 !
;
y(t)
m n
r e rt + M
m n
e" = 0 ,
(18.15)
(rJ + M)
=
0.
~11 6!
J _1Ju + J -1Mv = J - 1g, czyli (K = J - 1M; d = J - 1g).
Iu + Kv = d
Ten nowy zapis jest kopią (18.4"), chociaż trzeba pamiętać, że wektory u i v mają w obu tych przypadkach całkiem różne znaczenie. W dalszym ciągu będziemy się trzymać zapisu Ju + Mv = g podanego w (18.13'). 39 — Podstawy...
v=
czyli po pomnożeniu przez skalar e rł i wyłączeniu wspólnego czynnika mamy:
Ze względu na to, że w pierwszym równaniu (18.13) występuje składnik 2y'(t), musimy zamiast macierzy I — jak w (18.4") -—użyć tu macierzy J. Jeśli macierz J jest nieosobliwa (czyli istnieje J _1), to możemy w pewnym sensie znormalizować równanie (18.13'), mnożąc je z lewej strony przez J ”1; otrzymujemy wtedy: (18.13")
oraz
» VQ II
2
>
M=
1
rert
otrzymujemywynik:
który zapiszemy w postaci macierzowej, jako:
J=
n
Ju + Mv = 0,
y' (t )+ x(0 + 4y(t) = 61,
(18.13')
m
Po podstawieniu do równania zredukowanego:
x'(t) + 2 /( /) + 2x(t) + 5y(t) = 77,
(18.13)
u=
Czytelnik powinien porównać ten wynik z (18.80. Naszym celem jest znalezienie niezerowych rozwiązań dla m i n (tak więc nasze próbne rozwiązania też będą niezerowe), więc jest konieczne, aby: (18.16)
|r J + M| = 0.
To ostatnie równanie, analogon (18.9'), czyli równanie charakterystyczne danego układu równań, da nam poszukiwane pierwiastki rf. Wtedy już znajdziemy odpowiadające im (niezerowe) wartości m, i W naszym przykładzie równanie charakterystyczne jest równe: (18.16-)
I r jtM lJ '* 2
2r+S|
r+4
=
r2+ 4r + 3 =
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 611
610 ANALIZA DYNAMICZNA
i ma pierwiastki ri = —1; r2 = —3. Podstawiając te pierwiastki do (18.15), otrzymujemy: 1 1 -1
3‘ 3 -1
1
=0
(dla ri = - 1),
=0
(dlar 2 = -3),
m i = 3 A i;
nx = - A
b 2 + a xb + a2 = 0 .
1
Wynika stąd, że
=
oraz m2 = - n 2, co można też wyrazić jako:
m 2 = A 2,
r ,
Teraz, gdy znaleźliśmy już m, i nit można zapisać funkcje uzupełniające jako następujące liniowe kombinacje wyrażeń wykładniczych: [różne pierwiastki rzeczywiste] Zn,er' Ogólne rozwiązanie ma postać: Xc
X
y(t)
yc
y
a w naszym przykładzie rozwiązanie jest równe: *(0 y(t)
A co z równoważnym układem (18.1')? Jeśli zapiszemy ten układ w postaci Iu + Kv = d, a\ 02I jak w (18.4"), to macierz K = ^ . Równanie charakterystyczne wobec tego wynosi:
.
n 2 = - A 2.
'x ( t j
równanie (18.3) i układ (18.3') — ich równania charakterystyczne muszą być identyczne. Dla przykładu rozważmy równanie różnicowe (18.1) yt+2 + £ 1)^+1 + a2yt - c. Wcześniej nau czyliśmy się zapisywać jego równanie charakterystyczne, przenosząc jego stałe współczynniki do równania kwadratowego:
3Aie ' + A2e 3i+ l -A ie "'-A 2e~3'+ 15
Ponadto, jeśli dane są warunki początkowe x(0) = 6 i y(0)=12, to znajdujemy wartości stałych dowolnych A \ = 1 oraz A2 = 2. Posłużą one do określenia powyższego rozwiązania. Ponownie podkreślamy, że ponieważ wyrażenie e^' występuje w obu ścieżkach czasowych — dla x(t) i dla y(t) — więc albo obie ścieżki są zbieżne, albo obie rozbieżne. Ponieważ w tym przypadku pierwiastki mają wartości -1 i -3, więc obie ścieżki czasowe są zbieżne — dążą do położeń równowagi, odpowiednio, x = 1 i y = 15. Chociaż nasz przykład zawiera układ tylko dwu równań, to jednak metoda może być oczywiście rozszerzona na przypadek ogólnego układu n równań. Gdy n jest duże, otrzyma nie rozwiązania liczbowego może okazać się trudne, ale po znalezieniu równania charakterys tycznego zawsze można przeprowadzić analizę jakościową za pomocą twierdzenia Routha.
Dalsze komentarze dotyczące równania charakterystycznego Termin „równanie charakterystyczne” napotkaliśmy w trzech różnych kontekstach: w podrozdz. 11.3 mówiliśmy o równaniu charakterystycznym macierzy, w podrozdz. 15.1 i 17.1 termin ten był stosowany do pojedynczych liniowych równań różniczkowych i różnicowych, a w tym podrozdziale omówiliśmy równanie charakterystyczne układu liniowych równań różnicowych lub różniczkowych. Czy istnieje związek między nimi? Rzeczywiście istnieje bliski związek. Przede wszystkim dla danego równania i równo ważnego mu układu równań — czego przykładami są równanie (18.1) i układ (18.1') lub
(18.17)
|M + K| =
b + ai
a2
-1
b
= b2 + a1b + a2 = 0
[z (18.9')]
i jest dokładnie takie samo, jak otrzymane dla pojedynczego równania. Oczywiście ten sam wynik:—jednakowe równanie charakterystyczne dla pojedynczego równania i równoważnego mu układu — otrzymamy w przypadku równań różniczkowych, z tą różnicą, że wystąpi tam symbol r zamiast b. Można również powiązać równanie charakterystyczne układu równań różnicowych (lub różniczkowych) z równaniem charakterystycznym pewnej macierzy kwadratowej, którą oznaczymy symbolem D. Odwołując się do definicji (11.14), ale stosując oznaczenia b zamiast r dla równań różnicowych, możemy zapisać równanie charakterystyczne macierzy D w na stępujący sposób: (18.18)
|D - M | = 0.
W ogólnym przypadku, jeśli pomnożymy każdy element wyznacznika |D - b t\ przez -1, to: (1) wartość wyznacznika nie zmieni się, jeśli liczba wierszy (i kolumn) macierzy D jest parzysta i (2) wyznacznik zmieni znak, jeśli D ma nieparzystą liczbę wierszy. W obecnym przypadku | D - b l | ma być równe zeru, więc pomnożenie każdego elementu przez -1 nic nie zmieni, niezależnie od wymiaru macierzy D. Ale pomnożenie każdego elementu wyznacznika | D - M | przez -1 oznacza pomnożenie każdego elementu macierzy (D - b l) — przed obliczeniem jej wyznacznika — przez -1 (por. przykład 6 z podrozdz. 5.3). Wzór (18.18) można zatem przepisać jako: (18.18')
|M - D | = 0 .
Gdy porównamy to z (18.17), będzie wówczas jasne, że jeśli wybierzemy macierz D = -K , to jej równanie charakterystyczne będzie identyczne z równaniem charakterystycz nym układu (18.1'). Ta macierz -K ma szczególne znaczenie: jeśli weźmiemy zredukowaną wersję układu Iu + Kv = 0 i zapiszemy ją w postaci Iu = -K v lub po prostu u = -Kv, to zobaczymy, że -K jest macierzą, która w tym szczególnym równaniu przekształca wektor Y-
xt
A
w wektor u =
*m-i
A-i.
To samo rozumowanie można zastosować do układu równań różniczkowych (18.3'). Jednak w przypadku równania takiego, jak (18.13'), czyli Ju + Mv = g, gdzie w przeciwień stwie do układu (18.3') pierwszy składnik jest równy Ju, a nie Iu, nie możemy przyjąć D = -M . Trzeba najpierw znormalizować równanie Ju + Mv = g i sprowadzić je do postaci (18.13"), a potem przyjąć D = -K = - J _łM.
612 ANALIZA DYNAMICZNA
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 613
Reasumując, gdy dane są: (1) pojedyncze równanie różnicowe lub różniczkowe oraz (2) równoważny mu układ równań, dla którego możemy też (3) znaleźć odpowiadającą mu macierz D, jeśli próbujemy znaleźć równanie charakterystyczne dla wszystkich tych trzech obiektów, to wynik musi być za każdym razem dokładnie taki sam.
1. Sprawdzić, że układ równań różnicowych (18.4) jest równoważny pojedynczemu równaniu yt + 2 + 6yf+i + 9yt = 4 , które rozwiązaliśmy wcześniej w przykładzie 4 w podrozdz. 17.1 Jaki jest wynik porównania rozwiązań otrzymanych dwoma różnymi sposobami?
Rozważmy tu trzy elementy mające wpływ na dynamikę. Dla uproszczenia podawać będziemy przykłady dotyczące jedynie dwugałęziowych modeli otwartych. Niemniej jednak, ponieważ będziemy stosować zapis macierzowy, więc uogólnienie na przypadek n gałęzi nie powinno być trudne, wymaga bowiem po prostu odpowiedniej zmiany wymiarów macierzy. Dla celów takiego uogólnienia lepiej będzie, jeśli zmienne oznaczymy nie symbolami xt i yt, lecz Xijt i X2 tak aby w razie potrzeby rozszerzyć oznaczenia do x nt. Przypomnijmy, że w modelach nakładów i wyników xt reprezentuje wielkość produkcji /-tej gałęzi (mierzonej w dolarach); nowy indeks pozwala uwzględnić czynnik czasu. Symbol a^ dla współczynnika nakładów oznacza nadal wartość produkcji /-tej gałęzi (w dolarach), jaka jest potrzebna do wytworzenia produkcji y-tej gałęzi o wartości 1 dolara. Symbol di nadal oznacza popyt końcowy na/-te dobro.
2. Pokazać, że równanie charakterystyczne dla równania różnicowego (18.2) jest identyczne z równaniem różnicowym równoważnego układu (18.2').
Odroczenie produkcji
Ćwiczenie 18,2
;
__
3. Rozwiązać następujące dwa układy równań różnicowych: (a) x,+i
W statycznym modelu dwugałęziowym produkcja gałęzi I powinna być ustalona na pozio mie równym popytowi:
+ x t + 2yt = 24, yt+1+ 2xt - 2yt = 9 (dla x Q= 10 iy0 = 9);
(b) x t+i
. x i - a n x 1+ a n x2 + d l .
- x t ~ y t = - 1,
x t+i + y t+i
Załóżmy, że mamy jednookresowe odroczenie produkcji, tak iż wielkość popytu w okresie t wyznacza wielkość produkcji w okresie / + 1, a nie bieżącą. Aby przedstawić tę nową sytuację, musimy zmodyfikować powyższe równanie:
- “ ^ = 8 ^- ' (dla^0 = 51^0 = 4). o
z
(18.19)
4. Rozwiązać następujące dwa układy równań różniczkowych: (a
)
A t) - x(t) - 12y(t) - -60, y'(t) +
(b)
At)- 2x(t) + 3y(t) = 10, y'(t) - x(t) + 2y(t) = 9
x(t) +6y(t) = 36
(dla x(0) = 13 i y(0) = 4);
*i,i+i =
t + 0 i2*2,/ + d\yt.
Podobnie dla drugiej gałęzi możemy napisać: (18.19')
*2,f+l = 021* 1,*+ #22 *2,/ + d2it. X
(dla x(0) = 8 i y(0) = 5).
5. Dla układu równań różniczkowych (18.13) znaleźć macierz D, której równanie charak terystyczne jest takie samo, jak dla modelu. Sprawdzić, czy oba równania charakterystycz ne są rzeczywiście takie same.
Otrzymaliśmy układ współzależnych równań różnicowych; stanowi on dynamiczną wersję modelu nakładów i wyników. W zapisie macierzowym układ składa się z równania: (18.20)
x,+i- A x , = d„ i
gdzie:
18.3. DYNAMICZNE MODELE NAKŁADÓW I WYNIKÓW *2.f+L Z modelami nakładów i wyników po raz pierwszy zetknęliśmy się, szukając odpowiedzi na pytanie: jaki powinien być poziom produkcji każdej gałęzi, aby były zaspokojone zarówno zamówienia wszystkich gałęzi na nakłady, jak i popyt końcowy (w systemie otwartym)? Sytuacja była statyczna i problem dotyczył rozwiązania układu równań dotyczących poziomów produkcji wszystkich gałęzi dla położenia równowagi. Jeśli do modelu włączymy pewne dodatkowe zjawiska ekonomiczne, to model nakładów i wyników może przybrać charakter dynamiczny, a wtedy otrzymamy układ równań różniczkowych lub różnicowych takiego typu, jaki omawialiśmy w poprzednim podrozdziale.
;
x,=
*1.1 *2-tm
A=
#11
#12
#21
#22_
d,=
di,t
Jest jasne, że (18.20) ma postać (18,4") z dwoma wyjątkami. Po pierwsze, w przeciwień stwie do wektora u* przy wektorze x ,+1 nie ma macierzy jednostkowej I. Jednak -— jak wcześniej powiedziano — nie stanowi to wielkiej różnicy. Po drugie, co ważniejsze, wektor d, opatrzony jest indeksem oznaczającym czas, co wskazuje na to, że wektor popytu końcowego jest traktowany jako funkcja czasu. Jeśli funkcja ta jest różna od stałej, niezbędne będą modyfikacje metody znajdowania całek szczególnych, chociaż nie wpłynie to na funkcje uzupełniające. Następujący przykład zilustruje zmodyfikowaną procedurę.
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 615
614 ANALIZA DYNAMICZNA
przedstawionej w poprzednim podrozdziale. Ponieważ jednorodną wersją układu równań jest x ,+1 - Ax, = 0, więc równanie charakterystyczne jest równe:
Przykład 1. Dany jest wektor wykładniczego popytu końcowego:
d,=
Y 1
’8 f 8f
(¿jest dodatnim skalarem).
8*
\b l - A| =
Znaleźć całki szczególne dla dynamicznego modelu nakładów i wyników (18-20). Zgodnie z metodą nieoznaczonych współczynników, podaną w podrozdz. 17.4, powinniśmy wypróbować rozwiązanie postaci Xift = p i 8 t i x 2yt- p 28 \ gdzie P \ i p 2 są nieoznaczo nymi współczynnikami. To znaczy, że powinniśmy wypróbować: ~PiS‘~ xt— p 2s \
(18.21)
ß 2s t+1
ß 2s
8 f=
S 0 0
ö ‘.
s
0
8
X Ö21 #22 A ax2
A A
8'=
8 —aii
~ #21
—#i2 X A
A x ij(p x ^t+1 —Xi >f) =
Y
b —a22_
8 —a22 + a\2
ßi
ß 2= -
8 - a n + a2i
gdzie A = ( 8 - a n ) ( 8 - a 22) - a12a 2l. Ponieważ P i i p 2 są wyrażone całkowicie za pomocą znanych wartości parametrów, wystarczy więc podstawić je do rozwiązania próbnego (18.21), aby otrzymać określone wzory dla całek szczególnych. W ćwiczeniu 18.3-1 podana jest wersja wektora popytu końcowego bardziej ogólna od typu tutaj omówionego. Procedura znajdowania funkcji uzupełniających dla (18.20) nie różni się od procedury
4 Wektor
’i o' X ° i A
Pi8 można zapisać w równoważnych postaciach: PzS ~8
0
o' X 8 A
X lub 8['„ 8X 'I* 85 lub A A
,
lub
. Wybraliśmy tę trzecią możliwość, gdyż w kolejnym kroku chcemy dodać
8 0 do innej macierzy stopnia drugiego. Poprzednie zapisy powodowałyby kłopoty z racji niezgodności 0 8 wymiarów.
(podaż)
więc dostosowanie (wzrost) produkcji A x u musi być dokładnie równe jego poziomowi:
Zakładając, że macierz współczynników po lewej stronie jest nieosobliwa, za pomocą wzorów Cramera możemy obliczyć p i i p 2: (18.22')
[por. (18.9')]
x 2,14- d\tt —Xi11,
(popyt)
Y S' 1
lub — po skróceniu wspólnego czynnika, czyli liczby 8* & 0 — postać: (18.22)
= 0.
Możemy na tej podstawie obliczyć pierwiastki charakterystyczne bx oraz b2 i przejść do następnych etapów procesu rozwiązania.
a ii Xj714-
Jeśli podane próbne rozwiązanie obowiązuje, to układ (18.20) przyjmie postać: ~8 0“
—a2i b —a22
Sformułowanie modelu (18.20) może powstać w wyniku innych założeń ekonomicznych. Rozważmy sytuację, w której nadwyżkowy popyt na każdy produkt powoduje zawsze wzrost produkcji równy nadwyżce popytu. Ponieważ nadwyżkowy popyt na pierwszy produkt w okresie t jest równy:
skąd wynika4: ß iS
—<2i2
Nadwyżkowy popyt i dostosowanie produkcji
X A
ß i ö t+1
b - tfu
+ ai2x2it + di't ~ X iyt.
Jeśli jednak do obu stron tego równania dodamy jcu , to otrzymamy wynik identyczny z (18.19). Podobnie jest dla drugiej gałęzi; nasze założenie dotyczące dostosowania produkcji daje równanie takie samo, jak (18.19'). Słowem, ten sam model matematyczny może wynikać z całkiem różnych założeń ekonomicznych. Do tej pory model nakładów i wyników rozważaliśmy tylko dla czasu dyskretnego. Dla celów porównawczych przedstawimy teraz proces dostosowania produkcji w sytuacji czasu ciągłego. Wymaga to głównie zastosowania symbolu xt (t) zamiast x irt oraz pochodnej x \ (t) zamiast różnicy A x itt. Po tych zmianach przyjęte założenie o dostosowaniu produkcji będzie się przejawiało w postaci pary równań różniczkowych: x i(t) = a n xi(t) + ai2x 2(t) + d i( t) - x i( t) , x i(t) = a2iXi(t) +’a22x 2(t) + d2( t ) - x 2(t).
Dla każdego momentu t = t 0 symbol x¡(to) oznacza stopę strumienia produkcji na jednostkę czasu (np. miesiąc) występującą we wspomnianym momencie, a ¿¡(to) — wartość końcowego miesięcznego popytu dla tego momentu. Zatem wyrażenie po prawej stronie w każdym równaniu oznacza stopę nadwyżkowego popytu na miesiąc mierzoną w chwili t = t Q,a pochodna x /i (t0) po lewej stronie reprezentuje natomiast stopę nadwyżkowego popytu w ciągu miesiąca wywołaną przez nadwyżkowy popyt w chwili t0. To dostosowanie zlikwiduje całkowicie nadwyżkowy popyt (i doprowadzi do równowagi) w ciągu miesiąca, ale tylko wtedy, gdy nadwyżkowy popyt i dostosowanie produkcji zachowają te same wartości. W rzeczywistości nadwyżkowy popyt zmienia się wraz z upływem czasu, zmienia się również dostosowanie popytu, co prowadzi do „gry w kotka i myszkę” . Rozwiązanie tego modelu, złożone ze ścieżek czasowych produkcji x l9 stanowi schemat tego „polowania” . Jeśli
616 ANALIZA DYNAMICZNA
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 617
rozwiązanie jest zbieżne, to „kot” (dostosowanie podaży) będzie w końcu mógł złapać „mysz” (nadwyżkowy popyt) asymptotycznie przy /-»«>. Po odpowiedniej zmianie kolejności i pogrupowaniu składników układ równań różnicz kowych można zapisać zgodnie ze wzorem (18.130 w następujący sposób: (18.23)
x[{t) xź(t)
;
x=
|r l + (I - A ) | =
*i(0
;
A=
011
;
d=
P l=
021 022
r + 1 —a\\
—0 i2
-0 2 1
7* + 1 - 0 2 2
=
0.
[por. (18.16)]
Przykład 2. Dla danego wektora popytu krańcowego:
A 1ep<" A2ep'_
(18.24)
=>0 o"> r ep‘ P. A
x' = p f t i
A
[por. ostatni przypis]
Po podstawieniu do (18.23) i skróceniu wspólnego czynnika (niezerowego) t p\ otrzymujemy:
P. A
Powstanie dynamicznego modelu nakładów i wyników może również zostać spowodowane tworzeniem kapitału obejmującym akumulację zapasów. W rozważaniach statycznych braliśmy pod uwagę jedynie poziom produkcji każdego wyrobu potrzebny do zaspokojenia bieżącego popytu. Potrzeby akumulacji zasobów lub tworzenia kapitału były albo zignorowane, albo włączone do wektora końcowego. Aby ujawnić tworzenie kapitału, rozważmy teraz — oprócz macierzy współczynników nakładów A = [0 /j\ — macierz współczynników kapitału: C = [c¡j] =
x=
o" A
Tworzenie kapitału
'Ai"
gdzie A,- i p są stałymi, znaleźć całki szczególne dynamicznego modelu (18.23). Stosując metodę współczynników nieoznaczonych, możemy wypróbować rozwiązania w postaci = skąd wynika oczywiście, że x '(t) = p p , t pt. W zapisie macierzowym można to zapisać jako:
+ 1 - an -021
—a¡2
"P; 1~022_ _P2
Cli C12 ¿21
¿22
gdzie Cij oznacza wartość i-tego dobra potrzebnego /-tej gałęzi jako nowy kapitał (albo wyposażenie, albo zapasy, zależnie od natury i-tego dobra) w rezultacie zwiększenia produkcji /-tej gałęzi o 1 $. Na przykład, jeśli zwiększenie o 1 $ produkcji gałęzi /-tej wytwarzającej napoje wymaga zwiększenia w niej o 2 $ wartości maszyn do butelkowania (i-te dobro), tó C ij- 2. Taki współczynnik kapitałowy stanowi swego rodzaju krańcową proporcję kapitału i produkcji, przy czym proporcja ta jest ograniczona tylko do jednego typukapitału (i-tego dobra). Zakłada się, że współczynniki kapitałowe są ustalone podobnie,jakwspółczynniki nakładów a tJ. Idea polega na tym, aby gospodarka produkowała każde dobro w takiej ilości, aby spełnione były nie tylko popyt końcowy i popyt na nakłady, lecz również popyt na dobro wynikający z wymagąń kapitałowych. Jeśli czas jest ciągły, przyrosty produkcji są określone przez pochodne x\{t)\ produkcja każdej gałęzi powinna być zatem ustalona na poziomie: (0 = 011*1 (0 + 012*2(0 + c n x[(i) + cn xi(t) + dl (t)i *2(0 = 321*i(0 + 022*2(0 + C21*i (0 + ¿22*2(0 + d2(t).
Ai
zapotrzebowanie na nakłady
lub: (18,25)
A
Współczynniki nieoznaczone zostały w ten sposób określone i możemy podstawić te wartości do próbnego rozwiązania (18.24), aby otrzymać szukane całki szczególne.
’d M
Jeśli chodzi o całki szczególne, to w przypadku gdy wrektor końcowego popytu zawiera jako swe elementy funkcje czasu d\ (i) oraz d2(t) różne od stałych, wówczas konieczna będzie modyfikacja metody rozwiązania. Zilustrujemy to prostym przykładem.
~P 0
+ 1 —022) + A-2012 A 7■ Ai(p + 1 —0 n) + Ai 02i
gdzie: A = (p + 1 - an ) (p + 1 - a22) - 012021.
Funkcje uzupełniające można znaleźć omówioną wcześniej metodą. W szczególności pierwiastki charakterystyczne można wyznaczyć z równania:
d=
Pi =
Ix' + ( I -A )x = d,
gdzie (primy oznaczają pochodne, a nie transpozycje): x =
(18.25')
fi + 1 - 0 u
“ 021
~ 012 A P 4 1 —022 f i 2.
Ai
popyt końcowy
W zapisie macierzowym można to wyrazić równaniem:
f i 2.
Jeśli macierz po lewej stronie jest nieosobliwa, to możemy zastosować regułę Cramerą i wyznaczyć wartości współczynników /J, :
zapotrzebowanie na kapitał
Ix = Ax + Cx' + d lub: (18.26)
C x' + (A - I ) x = - d .
618 ANALIZA DYNAMICZNA
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 619
Jeśli czas jest dyskretny, to zapotrzebowanie na kapitał w okresie t będzie oparte na przyroście produkcji ( * , - , , =złjc/,r_i); poziomy produkcji powinny być zatem ustalone jako: a n
a \2
a2\
0 -2 2 _
+
_X 2 ,t _
* 2 ,t_
C11 _C 2 l’
C 12 _ * 2 ,/~ * 2 ,r- l_
A=
To To To
10
d2it_
Znaleźć: (a) całki szczególne; (b) funkcje uzupełniające; (c) określone ścieżki czasowe przy 187 72 założeniu, że początkowe poziomy produkcji są równe *i,o = i jc2,o= (we wszystkich
popyt końcowy
obliczeniach używać ułamków zwykłych, a nie dziesiętnych). 5. Dane są:
+ d ,.
Przesuwając indeksy czasowe ojeden i grupując wyrazy pochodne, możemy teraz zapisać równanie w postaci: (18.27)
d,=
_3_ _2 _ 10
+
C 2 2_
zapotrzebowanie na 1
zapotrzebowanie na i
czyli: Ix, = Ax, + C(x, -
ditt
_3_ _4_
A=
( I - A - C ) x , +1 + Cx, = di+1..
Układ równań różniczkowych (18.26) i układ równań różnicowych (18.27) można oczywiście rozwiązać metodami podanymi w poprzednim podrozdziale. Rozumie się samo przez się, że te oba równania macierzowe można rozszerzyć na przypadek n gałęzi przez odpowiednią zmianę wymiarów macierzy i dostosowanie ich elementów. Powyższe rozważania dotyczyły kwestii, w jaki sposób dynamiczny model nakładów i wyników może być wynikiem takich założeń, jak opóźnienie w czasie i mechanizmy dostosowań. Gdy podobne założenia zastosujemy do modeli ogólnej równowagi rynkowej, wówczas w bardzo podobny sposób przekształcą się one w modele dynamiczne. Ponieważ jednak sformułowanie takich modeli jest w swej istocie analogiczne do modeli nakładów i wyników, rezygnujemy więc z ich formalnego opisu i odsyłamy Czytelnika do przykładów podanych w ćwiczeniach 18.3—6 i 18.3-7.
Ćwiczenie 18.3 1. Jeśli w przykładzie 1 zastąpimy wektor popytu końcowego przez d, =
3
4
10
10
3
2
10
10
d=
- e*/io 2 e '/I0
dla modelu nakładów i wyników z dostosowaniem produkcji w przypadku czasu ciągłego opisanego w (18.23). Znaleźć: (a) całki szczególne; (b) funkcje uzupełniające; (c) określone ścieżki czasowe przy warunkach początkowych 53 25 *i(0) = — i * 2(0) = — (we wszystkich rachunkach używać ułamków 6
6
zwykłych, a nie dziesiętnych). 6. Dla rynku n dóbr wszystkie Qdi oraz Qsi (dla / = 1, 2, ..., ń) mogą być traktowane jako funkcje n cen P \ y..., Pn; podobnie może być traktowany popyt nadwyżkowy dla każdego dobra Et = Qdi - Qsi. Przy założeniu liniowości możemy zapisać: Ei = ¿Z10 + a n P ! + a \2P2 + ••• +Q\nPny E2 ~ #20 + d2\Pi + <*22P l + ••• + <*2nPn»
1x8* , to jakie X18 t
wtedy będą całki szczególne? Po udzieleniu odpowiedzi wykazać, że rozwiązania podane w przykładzie 1 są po prostu szczególnym przypadkiem tych rozwiązań dla = X2 = 12. a. Pokazać, że (18.22) można zapisać bardziej zwięźle jako ( 5 1 - A ) /3 = u. b. Spośród pięciu użytych tu symboli, które są skalarami, a które macierzami? c. Zapisać rozwiązanie dla /? w postaci macierzowej przy założeniu, że (5 1 - A) jest nieosobliwe. 3. a. Pokazać, że (18.25) można zapisać zwięźlej jako ( p l + 1 - A )p = A. b. Które spośród pięciu symboli reprezentują odpowiednio skalary, wektory i macierze? c. Zapisać rozwiązanie dla ¡5 w postaci macierzowej, zakładając, źe (pI + I - A ) jest nieosobliwa. 4. Dla modelu nakładów i wyników w czasie dyskretnym z odroczoną produkcją, opisanego w (18.20), dane są:
En - ano + an\P i + an2 Pi + ••• +annPn
lub w zapisie macierzowym: E = a + AP. a. Co oznaczają cztery ostatnie symbole; czy są to skalary, wektory czy macierze? Jakie są ich wymiary? b. Załóżmy, że wszystkie ceny są funkcjami czasu i że dP,/d/= (XiEi ( i - 1, 2 , ..., ri). Jaka jest interpretacja ekonomiczna takiego układu równań? c. Zapisać równanie różniczkowe pokazujące, że każde dPddt jest liniową funkcją n cen. d. Pokazać, że jeśli P ' oznacza wektor kolumnowy pochodnych dP,/dr o wymiarach n x 1 i jeśli ot oznacza macierz diagonalną stopnia n o elementach na głównej przekątnej «i, £*2,..., ccn (w tej kolejności) i równych zeru poza główną przekątną, to powyższy układ równań różniczkowych możemy zapisać macierzowo jako P' - aAP = aa.
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH
620 ANALIZA DYNAMICZNA
7. Dla rynku n dóbr z poprzedniego zadania wersja dla czasu dyskretnego składa się z układu n równań różnicowych APU = cCiEiit
(i = 1, 2,
18.4. JESZCZE RAZ O MODELU INFLACJI I BEZROBOCIA Za pomocą modeli nakładów i wyników zilustrowaliśmy wielosektorowy rodzaj nakładów dynamicznych. Teraz przedstawimy przykład ekonomiczny dotyczący współzależnych równań dynamicznych w ramach jednego sektora. W tym celu posłużymy się ponownie modelem inflacji i bezrobocia, który pojawiał się już dwukrotnie w dwu różnych sytuacjach.
Współzależne równania różniczkowe Model inflacji i bezrobocia był zapisany w podrozdz. 15.5 dla czasu ciągłego za pomocą następujących trzech równań (15.33)-(15.35):
ĆLK — = j(p -7 t)
dU ——= —k(m - p) di
(a,
fi>0; 0 < h ^
1),
(0 < / < l ) ,
(18.28) U '-
khjr+ kp U = k ( a - T - m ) ,
czyli w zapisie macierzowym:
j( a -T ) k(a -T -m )
Z układu tego można jednocześnie wyznaczyć ścieżki czasowe dla K \ U. Jeśli trzeba, można następnie na podstawie (15.33) obliczyć ścieżkę dla p.
Rozwiązanie Aby znaleźć całki szczególne, w modelu (18.28') przyjmujemy po prostu k '= U ' = Q (aby k i U były stacjonarne w czasie) i rozwiązujemy go względem n i U. W naszych wcześniejszych rozważaniach takie rozwiązania otrzymywaliśmy w wyniku odwracania macierzy; można oczywiście w takim przypadku skorzystać ze wzorów Cramera. Tak czy inaczej otrzymujemy wynik: (18.29)
i
1 t- m
U =-~ [ a -T -(\-K )m l
Wynik 7 t- m (wartość równowagi dla oczekiwanej stopy inflacji jest równa stopie ekspansji monetarnej) pokrywa się z otrzymanym w podrozdz. 15.5. Jeśli chodzi o stopę bezrobocia, to nie próbowaliśmy wtedy znaleźć jej poziomu równowagi. Gdybyśmy spróbowali (na podstawie równania różniczkowego względem U podanego w ćwiczeniu 15.5-2), odpowiedź nie różniłaby się od rozwiązania U w (18.29). Jeśli chodzi o funkcje uzupełniające, które opierają się na próbnych rozwiązaniach m trt i m r\ to możemy wyznaczyć m , n i r ze zredukowanego równania macierzowego: (rJ + M)
= 0,
[z (18.15)]
które przyjmuje obecnie postać:
(k> 0).
+ j(\-h )K + jP U = j ( a - T ) ,
jP kp
M
(18.30)
Nie byliśmy wówczas w stanie operować współzależnymi równaniami dynamicznymi, więc przy rozwiązywaniu problemu najpierw zapisaliśmy model w formie jednego równania z jedną zmienną. Wymagało to dość pracochłonnych podstawień i eliminacji. Obecnie, ze względu na współistnienie w modelu dwu danych schematów zmian dla n i U, możemy potraktować ten model jako układ dwu współzależnych równań różniczkowych. Gdy podstawimy (15.33) do dwu pozostałych równań i zapiszemy pochodne d n ld t = n '( t) i d U łd t = U '(t ) w skrócie jako n ' i U \ wówczas model przyjmie postać: nf
-kh
n), gdzie Eitt = aio + a n P i,t + a i2P 2,t + ••• + a inPnti.
a. Zapisać układ równań popytu nadwyżkowego i pokazać, że w zapisie macierzowym można go wyrazić jako E, = a + AP,. b. Pokazać, że równania dostosowania cen można zapisać jako Pi+i - P ^ o t E , , gdzie a jest diagonalną macierzą stopnia n zdefiniowaną w poprzednim zadaniu. c. Pokazać, że układ równań różnicowych dla obecnego .modelu z czasem dyskretnym można wyrazić w postaci P,+i - (I + aA )P, = aa.
p^a-T -pu+h n
7(1 “ h)
(18.28')
621
> + 7 (1 - h) - kh
jp r + kp
m
’o
n
0
Aby dla tego układu jednorodnego uniknąć zerowych rozwiązań dla m i n, przyjmu jemy, że wyznacznik macierzy współczynników jest równy zeru; tzn. żądamy, aby: (18.31)
| rj + M| = r 2 + [kp + j( 1 - h)] r + k p j = 0.
To równanie kwadratowe, które jest szczególnym przypadkiem równania charakterys tycznego r2 + a xr + a2 = 0 , ma następujące współczynniki: a i= k p + j(l-h )
• oraz
a2 = kP j\
są to —jak można było oczekiwać — dokładnie wartości a Y i a2 z (15.37") — wersji obec nego modelu w postaci pojedynczego równania względem zmiennej n . W rezultacie można tu zastosować poprzednią analizę dotyczącą trzech przypadków dla wartości pierwiastków charakterystycznych. Spośród innych wniosków przypomnijmy, że niezależnie od tego, czy pierwiastki były rzeczywiste, czy zespolone, część rzeczywista każdego pierwiastka dla
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 623
6 22 ANALIZA DYNAMICZNA
naszego modelu jest zawsze ujemna. Zatem ścieżki czasowe rozwiązań są zawsze zbieżne.
miQr^ + m 2Qr2t u c_
Przykład 1. Znaleźć rozwiązania dla 1
a -r= -;
0 = 3;
ni
;=
h = l;
3
, 1
_
ft= m
1 J_ _J_
[z (18.29)]
U~ 3"“ 6 _ l 8 ‘
(rńi + w2) cos v t .+ (mi - m2) i sin vt
[z (15.24)]
_(ni + n2) cos vt + (ni - n2) i sin vt
Jeśli dla uproszczenia oznaczeń wprowadzimy nowe stałe dowolne: oraz
A 5 = m l + m2
A6 = (mx - m2) i,
to wówczas5:
Dla równania charakterystycznego:
ni + n2 = y (A 5 - A 6)
r 2 + —r + —-= 0 2
[z (15.11)3
ń\ evii + n2 ę"Vłi
k =~ .
Ponieważ wartości parametrów są takie same, jak w przykładzie 1 z podrozdz. 15.5, więc wyniki, jakie otrzymamy, można porównać z uzyskanymi wcześniej. Najpierw wyznaczamy całki szczególne: (18.32)
niQri*+ n 2 er2i U,gdy dane są wartości parametrów: m i Qvit + m 2Q'vit
[z (18.31)]
8
oraz
(7i i - 7i2)i = y(A 5 +A6).
Korzystając z tych równości i włączając wartości h i v ze wzoru (18.33) do funkcji uzupełniających, otrzymamy ostatecznie:
oba pierwiastki są zespolone: /
(18.33)
----- ^ 3 3 . 3 9 9 n , r 2= X - ---- + 1 J— ~~~4~~4' 2 14 ) V
3" dla h = —- oraz v = — 4 4 3
(18.34) ~2~
(18.34')
4
T d +0 4
mi
"O"
Jii_
0
3 3 1 dla n = - — + —i 4 4 ,
9_
--(i +0 4
~4
~~1
jd -i) 4
m2 _«2_
"O" 0
3
3
dla r2 = - — - — i 4
4
Ponieważ r\ i r2 mają takie wartości — ze wzoru (18.31) — aby uczynić macierz współczynników macierzą osobliwą, więc każde z dwu powyższych równań macierzowych zawiera tak naprawdę tylko jedno równanie niezależne, które może określić jedynie relację proporcjonalności między dowolnymi stałymi ni/oraz n,-. Dokładniej mamy: oraz
— (1 H-z) ma =
Współzależne równania różnicowe Podejście do modelu inflacji i bezrobocia w czasie dyskretnym, wykorzystujące równania współzależne, jest zbliżone do rozważań dla czasu ciągłego. Ograniczymy się więc jedynie do podania kilku wskazó#wek. Rozważmy model (17.18)-(17.20), podany w podrozdz. 17.3, w którym dwa równania opisują schemat zmian odpowiednio dla n i U. Można to pokazać w następujący sposób: 1 1 1 1 ni + n2 = ~ (1 - i)m\ + ~ (1 + i)m2= — [(mi + m2) - (mi - m2)i] - — (A5- A6), 1
1
f1
-(A 6 + A 5)
Funkcje uzupełniające można wobec tego wyrazić jako:
A 6) c o s
4
3 1 3 —t + —(A5 + A6) sin — t 4 3 4
W końcu, łącząc całki szczególne z (18.32) z powyższymi funkcjami uzupełniającymi, możemy otrzymać rozwiązania (ścieżki czasowe) dla n i U. Jak można było oczekiwać, są one dokładnie takie same jak te, które otrzymaliśmy w (15.43) i (15.45) w podrozdz. 15.5.
( n i- n 2)i^=
— (1 —i)m.\ —ni
1 —(A5 3
<9 3
4
(18.35)
J
V
Podstawiając oba pierwiastki (i wartości parametrów) do (18.30), otrzymujemy równania macierzowe: - T (i-o
3 3 A5cos —t + A6sin —t
( /2 = - 1 ) .
1 i = ~ l(mi - m2) - (mi + m2)i]i =
624 ANALIZA DYNAMICZNA
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 625
Pt=a-T-put+hnt,
Ćwiczenie 18,4
n t+i - 7tt = j( p t - 7Ct), Ut+i - U t = - k ( m - p t+i).
1. Za pomocą reguły Cramera sprawdzić (18.29).
Eliminując p i łącząc wyrazy podobne, model możemy zapisać w postaci układu rów nali różnicowych: 1 kh
(18.36)
0 1+ pk
-(1 - j + j h )
flt+1
jp
n
-1
.u ‘.
3. Znaleźć ścieżki czasowe (rozwiązania ogólne) dla n i U, jeżeli: j(a -T )
‘
I
0
u,* 1.
2. Sprawdzić, że między m\ i nl jest taki sam związek (proporcjonalność) niezależnie od tego, czy stosujemy pierwsze czy drugie równanie układu (18.34).
k ( a - T —m)
(a) p = ~ - 2 U + n, . 4
(b) p = - i - 2 i / + ^ , 6 3
K
Rozwiązanie
U' = - ( m - p ) ;
Jeśli istnieją stacjonarne położenia równowagi, to całki szczególne dla (18.36) można zapisać jako lt= n t = 7tt+i oraz U = U t = Ut+\. Podstawiając f t i U do (18.36) i rozwiązując ten uk ład (przez odwracanie macierzy lub za pomocą wzoru Cramera), otrzymujemy: (18.37)
i
n =m
U = \-[ < x -T -(\-h )m ] .
P
Wartość U jest taka sama, jak znaleziona w podrozdz. 17.3. Chociaż w poprzednim podrozdziale nie znaleźliśmy 7t, to jednak informacja w ćwiczeniu 17.3-2 wskazuje, ż e f t = m , co jest zgodne z (18.37). W istocie wyniki (18.37) są również identyczne z wartościami równowagi międzyokresowej otrzymanymi dla czasu ciągłego w (18.29). Poszukiwanie funkcji uzupełniających, oparte tym razem na próbnych rozwiązaniach mb* oraz n b \ obejmuje zredukowane równanie macierzowe:
(W+ K)
= 0,
czyli, na podstawie (18.36): (18.38)
b ~ (i-j+ jh )
jp
-b kh
b (l+ p k )-l_
m
o"
A Chcąc uniknąć rozwiązań zerowych żądamy, aby: (18.39)
4. Znaleźć ścieżki czasowe (rozwiązania ogólne) dla Tr i f/, jeśli wiadomo, że: (a) p, = y - 3 f/, + | ^ .
(b)p ^
j
K ,+l- 7 t , = ~ ( p , - JT,), 4
Kt+i - K t = - ~ { p ,- K t), 4
Ut+i - U t = - ( m - p t+i)\
Ut+ l- U t = - ( m - p t+1).
-Ą U „
18,5. DIAGRAMY FAZOWE DLA DWU ZMIENNYCH Poprzednie podrozdziały były poświęcone ilościowym rozwiązaniom liniowych układów dynamicznych. Teraz omówimy graficzną analizę jakościową dla układu niejednorodnych równań różniczkowych. Dokładniej, skupimy uwagę na układzie równań różniczkowych pierwszego rzędu względem dwu zmiennych, który w ogólnej postaci można zapisać:
. n .
| b J + K | = (1 + p k )b 2 - [1 + hj + (1 - j ) (1 + pk)]b + (1 - j +jh) = 0.
Znormalizowaną wersją tego równania kwadratowego jest równanie charakterystyczne b 2 + aib + a2 = 0 , z takimi samymi współczynnikami ax i a2, jak otrzymane w (17.24) i (17.33) w podrozdz. 17.3. Wobec tego analiza trzech przypadków dla pierwiastków charakterystycz nych przeprowadzona w tamtym podrozdziale powinna tu mieć również zastosowanie. Równanie (18.38) wyznacza — dla każdego pierwiastka bt — konkretny związek (proporcjonalność) między dowolnymi stałymi m,- i nh co pozwala powiązać stałe dowolne funkcji uzupełniającej dla U ze stałymi dowolnymi funkcji uzupełniającej dla n. Łącząc następnie funkcje uzupełniające i całki szczególne, możemy otrzymać ścieżki czasowe dla n i U. 40 — Podstawy...
U’ = - \ O n -p ) .
? Zwróćmy uwagę na to, że pochodne względem czasu x \ t ) i y'{t) zależą tylko od x i y i że zmienna t nie stanowi osobnego argumentu funkcji / i g. Cecha ta, która czyni z na szego układu układ autonomiczny, jest warunkiem wstępnym zastosowania techniki dia gramów fazowych. Diagram fazowy dla dwu zmiennych, podobnie jak wersja dla jednej zmiennej wprowadzo na wcześniej w podrozdz. 14.6, ma pewne ograniczenia — może odpowiadać jedynie na pytania jakościowe dotyczące położenia i dynamicznej stabilności międzyokresowego położenia (lub położeń) równowagi. Ale za to— podobnie jak wersja jednej zmiennej — może z równą łatwością dotyczyć układów liniowych, jak i nieliniowych, a także zagadnień sformułowanych dla funkcji ogólnych, jak i dla konkretnych funkcji.
6 2 6 ANALIZA DYNAMICZNA
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 6 2 7
Przestrzeń fazowa
jawnej i stwierdzić, że nachylenie krzywej x* - 0 jest równe:
Gdy konstruujemy jednowymiarowy diagram fazowy (por. rys. 14.3) dla (autonomicznego) równania różniczkowego dy/d/=/(y), wówczas rysujemy po prostu wykres dy/d/jako funk cji y dla dwu osi w dwuwymiarowej przestrzeni fazowej. Obecnie, gdy liczba zmiennych uległa podwojeniu, czy potrzebna jest większa liczba osi i jak sobie z tym poradzić? Na szczęście wystarczy przestrzeń 2-wymiarowa. ; Najważniejszym zadaniem przy budowie diagramu fazowego jest określenie kierunku zmian zmiennej lub zmiennych wraz z upływem czasu. Ta właśnie interpretacja, wyrażona za pomocą strzałek na rys. 14.3, umożliwia nam wyprowadzenie wniosków jakościowych. Do narysowania tych strzałek potrzebne są tylko dwa elementy: ( 1) linia podziału — nazwijmy ją linią „dy/dr = 0 ” — która jest miejscem, gdzie mogą wystąpić ewentualne położenia równowagi i — co ważniejsze — dzieli płaszczyznę na dwa obszary, jeden charakteryzujący się tym, że dy/dt > 0 , a drugi tym, że dy/dt < 0 oraz (2 ) rzeczywista linia, na której można pokazać: wzrost i spadek wartości y wynikający z niezerowych wartości dy/dt. Na rys. 14.3 linia podziału, wspomniana w punkcie (1), to oś pozioma. Ale ta sama oś służy jednocześnie jako rzeczywista linia wspomniana w punkcie (2). Oznacza to, że możemy się pozbyć osi pionowej, dla d y/dt , jeśli tylko postaramy się rozróżniać obszar d y/d t > 0 od obszaru d y/d t < 0, oznaczając np. pierwszy znakiem plus, a drugi znakiem minus. Ta możliwość pozbycia się jednej z osi umożliwia umieszczenie diagramu fazowego dla dwu zmiennych w przestrzeni dwuwymiarowej. Potrzebne nam są teraz dwie linie rzeczywiste, zamiast jednej. Ale pojawiają się one automatycznie jako standardowe osie x i y dwu wymiarowego wykresu. Potrzebne są nam teraz dwie linie lub krzywe podziału, jedna dla dr/d/ = 0, a druga dla dy/d/ = 0. Ale można je narysować w dwuwymiarowej przestrzeni fazowej. Gdy już je narysujemy, nie sprawi nam trudności rozstrzygnięcie, po której stronie powinien być znak plus, a po której minus.
(18.43)
dy /
dx *'=0
d f/d x
m
fx
~
T Jy
« í0»'
Jeśli znamy znaki pochodnych cząstkowych^ i f y (^ 0), to (18.43) dostarcza wskazó wek jakościowych dotyczących nachylenia krzywej *' = 0. Na tej samej zasadzie można wnioskować o nachyleniu krzywej y' = 0 na podstawie pochodnej: dy / =-^ ( g y * 0). djc /=o & Dla przykładu załóżmy, że:
(18.44)
(18.45) f x < 0;
f y > 0;
gx > 0;
gy < 0;
wtedy obie krzywe x ' = 0 i y'= 0 będą miały dodatnie nachylenia. Jeśli ponadto założymy, że: fx
%x
- — > ----- ,
[krzywa x ' = 0 jest bardziej stroma niż krzywa y' = 0]
J y S y
to możemy napotkać sytuację taką, jak przedstawiona na rys. 18.1. Zwróćmy uwagę na to, że linie podziału mogą być teraz krzywymi i nie muszą pokrywać się z osiami. x =0
Krzywe podziału Dla następującego autonomicznego układu równań różniczkowych: * '= /(* , ?), (18.40) y' = g(x,y),
gdzie x i y ' oznaczają w skrócie odpowiednio pochodne względem czasu x '(t) i /( /) , dwie krzywe podziału — oznaczone odpowiednio x - 0 i y' = 0 —reprezentują wykresy dwu równań: (18.41)
f ( x , y) = 0,
[krzywa x ' = 0]
(18.42)
g(x, y) = 0.
[krzywa y ' - 0]
Jeśli znana jest konkretna postać funkcji /, to na ogół można rozwiązać równanie (18.41) względem y, wyrażając je jako funkcję x, której wykres na płaszczyźnie xy jest krzywą x . Jeśli się to nie uda, możemy uciec się do reguły dla pochodnej funkcji nie
Dwie linie podziału, przecinające się w punkcie E , dzielą płaszczyznę na cztery rozłączne regiony oznaczone liczbami od I do IV. Punkt E, w którym x i y są stacjo narne, (x' = y' = 0 ), reprezentuje międzyokresowe położenie równowagi dla naszego układu. We wszystkich pozostałych punktach x lub y albo oba zmieniają się w czasie, a kierunek zmian jest określony przez znaki pochodnych względem czasu x ' i y w tym punkcie. W naszym przykładzie na lewo od krzywej x ' = 0 mamy x ' > 0, a na prawo od niej ma my x ' < 0; dlatego napisano znak plus na lewo, a minus na prawo od krzywej. Znaki te wynikają stąd, że:
6 2 8 ANALIZA DYNAMICZNA
(18.46)
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 6 2 9
(z (18.40) i (18.45)]
skąd wynika, że w miarę jak przesuwamy się z zachodu na wschód w przestrzeni fazowej (w miarę jak * rośnie), x ' stopniowo maleje, tak iż znak x ' musi przechodzić przez trzy stadia w następującej kolejności: +, 0, Podobnie jest dla pochodnej: (18.47)
-^ - = ^< 0 , dy
[z (18.40) i (18.45)]
z czego wynika, że gdy przesuwamy się stopniowo z południa na północ (w miarę gdy y wzrasta), wówczas y ' stopniowo maleje, tak że znak y ' musi przechodzić przez trzy stadia w następującej kolejności: +, 0, -. Na rys. 18.1 zaznaczamy zatem znak plus poniżej, a znak minus powyżej krzywej y ' = 0 . Na podstawie znaków plus i minus można teraz wykreślić strzałki kierunkowe ukazujące międzyokresowy ruch x i y. Dla każdego punktu w obszarze I pochodne x ' i y f są ujemne. A zatem obie zmienne x i y muszą zmniejszać się w miarę upływu czasu, co oznacza ruch w kierunku zachodnim dla jc i ruch w kierunku południowym dla y. Jak pokazują dwie strzał ki dla obszaru I, jeśli dany punkt początkowy znajduje się w tym obszarze, to ruch międzyokresowy musi mieć ogólnie kierunek południowo-zachodni. Dokładnie odwrotnie jest dla obszaru Ul, gdzie pochodne x ' i y ' są dodatnie, tak więc obie zmienne x i y muszą rosnąć wraz z upływem czasu. W przeciwieństwie do tego x ' i y* mają różne znaki w obsza rze II. Ponieważ x ' jest dodatnie, a y' ujemne, więc x powinno przesuwać się na wschód, a y na południe. Obszar IV wykazuje tendencję dokładnie przeciwną do występującej w obszarze II.
Linie prądu (trajektorie) W celu lepszego zrozumienia znaczenia strzałek kierunkowych możemy na diagramie fazowym naszkicować wiele linh prądu (streamlines). Linie te, nazywame również trajek toriami fazowymi (w skrócie trajektoriami) lub ścieżkami fazowymi (phase paths), służą do ukazania ruchu dynamicznego układu z każdego możliwego punktu startowego. Niektóre z nich są zilustrowane na rys. 18.2, na którym powtórzono krzywe x ' = 0 i y' = 0 z rys. 18.1. Ponieważ każdy punkt przestrzeni fazowej musi leżeć na jednej z trajektorii, powinno więc istnieć nieskończenie wiele linii prądu i wszystkie powinny być zgodne z wymaganiami dotyczącymi kierunków opisanymi za pomocą strzałek xy dla każdego obszaru. W celu określenia ogólnego jakościowego charakteru diagramu fazowego na ogół wystarczy kilka reprezentatywnych linii prądu. Należy zwrócić uwagę na kilka cech linii prądu zamieszczonych na rys. 18.2 Po pierwsze, wszystkie skierowane są w stronę punktu E. Czyni to punkt E stabil nym położeniem równowagi międzyokresowej (tutaj globalnie stabilnym). W dalszych rozważaniach napotkamy inne typy układów lin ii prądu. _ Po drugie, niektóre linie prądu nie opuszczają jednego obszaru (np. linia przechodząca przez punkt A), inne mogą przechodzić z jednego obszaru do drugiego (np. linie przechodzące przez punkty B i C).
Po trzecie, gdy linia prądu przekracza linię podziału, musi mieć w tym punkcie albo nachylenie nieskończone (gdy przecina krzywą jc' = 0), albo nachylenie zerowe (gdy przecina krzywą y f = 0). Jest to spowodowane faktem, że wzdłuż krzywej j c ' = 0 zmienna x jest stacjonarna w czasie, więc linia prądu nie może wykonywać ruchu poziomego w punkcie przecięcia z tą krzywą, natomiast wzdłuż krzywej y ' = 0 zmienna y jest również stacjo narna, więc w punkcie przecięcia z tą krzywą linia prądu nie może przesuwać się pionowo. Aby zapewnić spełnienie tych warunków, radzimy po wykreśleniu linii podziału dodać kilka krótkich pionowych kresek przecinających krzywą x ' = 0 i kilka poziomych kresek przeci nających krzywą y' = 0 , co pomoże w rysowaniu linii prądu6. Po czwarte, chociaż linie prądu ukazują kierunki ruchu x i y w czasie, jednak nie podają konkretnych informacji dotyczących prędkości i przyspieszenia, ponieważ diagram fazowy nie zawiera osi dla t (czasu). Z tego właśnie powodu linie prądu przyjmują również nazwę ścieżek fazowych, w przeciwieństwie do ścieżek czasowych. Jedyna obserwacja dotycząca prędkości jest obserwacją jakościową. Gdy poruszamy się wzdłuż linii prądu co raz bliżej i bliżej krzywej x ' = 0 , wówczas prędkość ruchu zmniejsza się stopniowo w kienmku poziomym, a gdy przybliżamy się do krzywej y' = 0 , prędkość zmniejsza się w kierunku pionowym. Jest to spowodowane stopniowym zmniejszaniem wartości bezwzględnej pochod nej x ' = d x łd t (odpowiednio y ' = d yłd t) w miarę zbliżania się do linii podziału, na której wspomniana pochodna przyjmuje wartość zerową.
Rodzaje położeń równowagi W zależności od układu linii prądu wokół danego punktu równowagi międzyokresowej, położenie równowagi może należeć do jednej z czterech kategorii: (1) węzła, (2 ) punktu siodłowego, (3) ogniska, (4) wiru lub punktu wirowego. 6 Przypominamy, że kreski przecinające krzywą x ' = 0 powinny być prostopadłe do osi x, a kreski przecinające krzywą y ' = 0 powinny być prostopadłe do osi y.
630 ANALIZA DYNAMICZNA
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH
Węzeł jest to takie położenie równowagi, w którym wszystkie linie prądu z nim związane albo zbliżają się bez cykli do tego punktu ( węzeł stabilny), albo bez cykli oddalają się od tego punktu (węzeł niestabilny). Węzeł stabilny mieliśmy już na rys. 18.2. Niestabilny węzeł pokazany jest na rys. 18.3(a). Zwróćmy uwagę, że na tym przykładowym rysunku tak się złożyło, że linie prądu nie przechodzą z jednego obszaru do drugiego. Ponadto krzywe x ' - 0 i y ' = 0 są liniami prostymi oraz same stanowią linie prądu.
yi
x r=0
(a)
631
przybliżają się do punktu siodłowego, ale prędzej czy później oddalają się od niego. Ten podwójny charakter położenia równowagi inspiruje nazwę „punkt siodłowy” . Ponieważ stabilność nie jest powszechna i występuje tylko dla gałęzi stabilnych, więc punkt siodłowy jest ogólnie klasyfikowany jako punkt równowagi niestabilnej. Trzeci punkt równowagi, ognisko , charakteryzuje się spiralnymi trajektoriami, które albo dążą cyklicznie w jego stronę (stabilne ognisko), albo — krążąc — oddalają się od niego (ognisko niestabilne). Na rys. 18.3(c) pokazano stabilne ognisko (narysowano tylko jedną przykładową trajektorię, aby uniknąć zagęszczenia). Zastanówmy się, co powoduje powstanie ruchu wirowego. Odpowiedź uzyskamy, analizując położenia krzywych x ' = 0 i y ' = 0. Na rys. 18.3(c) obie krzywe podziału mają takie nachylenia, że kolejno przejmują blokowanie przepływu linii prądu w kierunku wyznaczonym przez strzałki xy. W wyniku tego linia prądu musi co chwila przechodzić z jednego obszaru do drugiego, kreśląc spiralę. To, czy otrzymamy stabilne ognisko (jak w tym przypadku), czy też niestabilne, zależy od wzajemnego położenia dwu krzywych podziału. Ale w obu przypadkach nachylenie linii prądu w punktach przecięcia z krzywymi podziału musi albo być nieskończone (przy przecinaniu krzywej x ' = 0), albo równe zeru (przy przecinaniu krzywej y ' = 0). W końcu możemy mieć wir (czyli środek , centrum). Jest to również punkt równowagi o zwijających się liniach prądu, ale tym razem linie te tworzą rodzinę pętli (współśrodkowych okręgów lub owali) okrążających położenie równowagi i będących w nieustającym ruchu. Przykład podano na rys. 18.3(d) (ponownie — dla jasności — pokazano tylko jedną linię prądu). Ponieważ takiego położenia równowagi nie można osiągnąć startując z dowolnego punktu różnego od E , więc środek jest również klasyfikowany jako niestabilne położenie równowagi. Wszystkie ilustracje na rys. 18.3 przedstawiają pojedyncze położenie równowagi. W przypadku nieliniowości układów dynamicznych dwie linie podziału mogą przecinać się w wielu punktach i tworzyć wiele położeń równowagi. Wówczas na jednym diagramie fazowym może wystąpić cały zestaw wspomnianych wyżej międzyokresowych położeń równowagi. Chociaż będzie wtedy więcej obszarów niż cztery, to jednak zasada analizy diagramu fazowego pozostanie zasadniczo nie zmieniona.
Inflacja i reguły monetarne a la Obst
L
-o
(fi)
Rysunek 18.3 Punkt siodłowy jest to położenie równowagi o podwójnym charakterze — jest stabilny w jednych kierunkach, ale niestabilny w innych. Odwołując się do ilustracji przedstawionej na rys. 18.3(b), możemy powiedzieć, że punkt siodłowy ma dokładnie jedną parę linii prądu — zwanych stabilnymi gałęziami punktu siodłowego — które stale dążą w stronę położenia równowagi, i dokładnie jedną parę linii prądu — zwanych niestabilnymi gałęziami punktu siodłowego — które stale oddalają się od niego. Wszystkie inne trajektorie początkowo
Jako ilustrację ekonbmiczną diagramu fazowego dla dwu zmiennych przedstawimy model podany przez profesora Obsta7. Ma on na celu wykazanie nieefektywności konwencjonalnego (a zatem potrzeby nowego) typu kontracyklicznej reguły polityki monetarnej, gdy działa „mechanizm dostosowawczy inflacji” . Model taki różni się od naszych wcześniejszych rozważań dotyczących inflacji tym, że nie bada znaczenia danej stopy ekspansji monetarnej, lecz jest poświęcony porównaniu skuteczności dwu różnych monetarnych reguł, z których każda wyznacza inny zestaw monetarnych działań, jakie należy wykonać w obliczu różnych warunków związanych z inflacją.
7 Norman P. Obst, Stabilization Policy with an Inflation Adjustment Mechanism, „Quarterly Journal of Economics** 1978, May, s. 355-359. W pracy Obsta nie podano żadnych diagramów fazowych, ale można je łatwo skonstruować na podstawie modelu.
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 6 3 3
6 3 2 ANALIZA DYNAMICZNA
Kluczowym założeniem modelu jest mechanizm dostosowawczy inflacji: (18.48)
Ms - Md ' dp -j~ = h =h dt Ms
Ms
Qi> 0 ),
który pokazuje, że efektem podaży pieniądza \M S > Md) jest wzrost stopy inflacji p, a nie poziomu cen P. Oczyszczenie rynku' pieniężnego nie powoduje stabilizacji cen, lecz jedynie ustabilizowanie stopy inflacji. Aby ułatwić rozważania, druga równość w (18.48) służy do przesunięcia ośrodka zainteresowania z nadwyżki podaży pieniądza na proporcję popytu i podaży pieniądza, Md/M s, którą będziemy oznaczać symbolem p . Zakładając, że Md jest wprost proporcjonalna do nominalnego produktu narodowego PQ, możemy napisać: Md
aPQ
Ms
Ms
Stopy wzrostu różnych zmiennych są wtedy powiązane w następujący sposób: (18.49)
áP¡át á a /á t áp fát d Q ld t - T — , = --------- + — — + p a P. Q =p +q -m ,
dM Jdt -L — = Ms
v
[z (10.24) i (10.25)] [a jest stałe]
gdzie p, q i m oznaczają odpowiednio stopę inflacji, egzogeniczną stopę wzrostu produktu narodowego w ujęciu realnym i stopę ekspansji monetarnej. Równania (18.48) i (18.49), stanowiące układ dwu równań różniczkowych, mogą łącznie wyznaczyć ścieżki czasowe dla p i p , jeśli — na razie — przyjmiemy, że m jest egzogeniczną. Stosując symbole p ' i p ' na oznaczenie pochodnych względem czasu p '{t) i p \ t ), możemy wyrazić ten układ jako:
Rysunek 18.4
(18.51)
p = 1,
[krzywa p ' = 0]
skąd wynika, że przekroczenie krzywej p ' = 0 przy ruchu w kierunku północnym powoduje zmiany znaku p ' w kolejności: +, 0 , a przekroczenie krzywej p ' = 0 przy ruchu w kie runku wschodnim powoduje ciąg znaków dla p ': - , 0, +. Otrzymujemy zatem cztery zestawy strzałek określających kierunki, takie jak na rysunku, generujące linie prądu (pokazano tylko jedną) i okrążające punkt E w kierunku przeciwnym do ruchu wskazówek zegara. Oczywiście powoduje to, że E jest środkiem. Jeśli gospodarka nie znajduje się na początku w położeniu E, to osiągnięcie równpwagi jest niemożliwe. Zamiast niej wystąpią nigdy nie kończące się fluktuacje. Powyższy wniosek jest jednak skutkiem egzogenicznej stopy ekspansji monetarnej. A co się stanie, jeśli m uczynimy zmienną endogeniczną poprzez przyjęcie antyinflacyjnej reguły dla polityki monetarnej? „Konwencjonalna” reguła monetarna wymagałaby ustalenia zależności między stopą ekspansji monetarnej a stopą inflacji:
(18.52)
p = m -q .
[krzywa p ' = 0]
(18.54)
p ' = h ( \ - p ),
(18.50) p ' = (p + q - m ) p .
Jeśli h jest dodatnie, to możemy mieć p ’ - 0 wtedy i tylko wtedy, gdy l - p = Q. Podobnie, ponieważ p jest zawsze dodatnie, więc p ' = 0 wtedy i tylko wtedy, gdy p + q - m = 0. Krzywe podziału p ' = 0 i p r = 0 są zatem związane z równaniami:
Jak pokazano na rys. 18.4(a), ich wykresami są odpowiednio linia pozioma oraz linia pionowa, które wyznaczają jedyne położenie równowagi E. Wartość równowagi p ~ \ oznacza, że w położeniu równowagi Md i Ms są równe, co powoduje wyczyszczenie rynku pieniądza. Fakt, że dla położenia równowagi stopa inflacji jest dodatnia, stanowi odbicie milczącego założenia, że m > g. Ponieważ krzywa p ' = 0 odpowiada krzywej jc' = 0 z naszych poprzednich rozważań, powinna więc mieć pionowe kreski; druga krzywa powinna mieć kreski poziome. Z (18.50) otrzymujemy: (18.53)
dp' - ^ - =-h < 0 dp
i
dp' ~^— = p > 0, dp
m = m (p );
m '(p )< 0 .
[konwencjonalna reguła monetarna]
Reguła taka wywołałaby następujące modyfikacje drugiego równania w (18.50): (18.55) p '= [ p + q - m ( p ) ] p i zmieniłaby (18.52) w: (18.56)
p =m (p )-q .
[krzywa p ' = Q przy przyjęciu konwencjonalnej reguły monetarnej]
Skoro wiadomo, że m(p) jest monotoniczna, to istnieje tylko jedna wartość p, np. p u która może spełniać to równanie. Nowa krzywa p ' = 0 musi być zatem również linią prostą, chociaż przecina oś poziomą w innym punkcie pi = m (pi) - q . Ponadto ze wzoru (18.55) wynika, że:
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 6 3 5
6 3 4 ANALIZA DYNAMICZNA
^ -= [1 óp
-m'(p))u>O,
[z (18.54)]
co jakościowo nie różni się od pochodnej otrzymanej w (18.53). Wynika stąd, że strzałki kierunkowe muszą pozostać takie same, jak na rys. 18.4(a). Jednym słowem, tak jak poprzednio otrzymujemy w końcu wir (centrum). 1 Alternatywna reguła polityki monetarnej zaproponowana przez Obsta polega na tym, aby m związać z tempem (a nie z poziomem) stopy inflacji: (18.57)
m = m (p f);
m '(p ') < 0.
: [alternatywna reguła monetarna]
Przy tej regule (18.55) i (18.56) przyjmują odpowiednio postaci: (18.58) (18.59)
p ' = [p + q - m ( p 'j ] p ,
[krzywa p ' = 0 przy alternatywnej regule monetarnej]
p = m ( p ') - q .
Tym razem krzywa p ' = 0 będzie pochylona i wznosząca się, ponieważ różniczkując (18.59) względem fi (stosując wzór na pochodną funkcji złożonej), otrzymujemy: ^ = fflV ) ? = m V ) ( - « > 0, dp dp
'
[z (18.50)]
a zatem ze wzoru na pochodną funkcji odwrotnej wynika, że d p ld p — nachylenie krzywej p ' = 0 —jest również dodatnie. Ta nowa sytuacja została przedstawiona na rys. 18.4(b), gdzie dla uproszczenia krzywa p ' = 0 jest naszkicowana jako linia prosta z dowolnie przyjętym nachyleniem8. Pomimo zmiany nachylenia pochodna cząstkowa: dp' ~^~ =p> 0 dp
[z (18.58)]
nie zmienia się w porównaniu z (18.53), więc strzałki dla p powinny zachować kierunek, jak na rys. 18.4(a). Linie prądu (z których tylko jedna jest pokazana na rysunku) będą zawijać wokół położenia równowagi (zbliżając się do niego) w punkcie /2 = 1 i p = m(Q) - q, gdzie m(0) oznacza wartość m (p ') w punkcie p - 0. Widać zatem, że alternatywna reguła monetarna zdolna jest przekształcić wir w stabilne ognisko i w ten sposób umożliwia asymptotyczną eliminację nieskończonych wahań stopy inflacji. W rzeczywistości dla wystarczająco płaskiej krzywej p ' = 0 wir można przekształcić nawet w stabilny węzeł.
Ćwiczenie 18.5 1. Pokazać, że diagram fazowy dla dwu zmiennych można zastosować również wtedy, gdy model składa się z jednego równania różniczkowego drugiego rzędu y"(t) = f ( y \ y), a nie z dwu równań pierwszego rzędu.
8 Nachylenie jest odwrotnie proporcjonalne do wartości bezwzględnej Im bardziej stopa ekspansji monetarnej m jest wrażliwa na tempo zmian stopy inflacji p \ tym krzywa /i ' = 0 na rys. 18.4(b) będzie bardziej płaska.
2. Przypisanie znaków plus i minus do obu stron krzywych x ' - 0 i y r - O na rys. 18.1 jest oparte odpowiednio na pochodnych cząstkowych d x rld x i dy'/dy. Czy takie same wnioski można uzyskać dla pochodnych d x'/dy i d y '/d x l 3. Za pomocą rys. 18.2 sprawdzić, że jeśli linia prądu nie ma nachylenia nieskończonego
(zerowego) w punkcie przecięcia z krzywą x ' = 0 (y' = 0 ), to kłóci się to z ograniczeniami dotyczącymi kierunków narzuconymi przez strzałki xy. 4. Jako szczególne przypadki układów równań różniczkowych (18.40) przyjąć, że: (a) /* = 0 , / v> 0 , 0 5) f x —0, fy < 0 ,
i gy = 0 ; i &/= 0 . Dla obu przypadków skonstruować odpowiadające im diagramy fazowe, narysować linie prądu i określić naturę położenia równowagi. > gx > 0 gX< 0
5. a. Pokazać, że z układu równań różniczkowych (18.40) możliwe jest uzyskanie albo stabilnego węzła, albo stabilnego ogniska, jeśli: fx<0; fy>0; gx < 0 i & < 0 . b. Jakie szczególne cechy konstrukcji tego diagramu fazowego mają wpływ na różnice wyniku (węzeł albo ognisko). 6 . W odniesieniu do modelu Obsta sprawdzić, że jeśli krzywa p ' = 0 o dodatnim nachyle
niu na rys. 18.4(b) stanie się wystarczająco płaska, to linie prądu, chociaż wciąż określane przez przecięcia, będą zbieżne do położenia równowagi w postaci węzła, a nie ogniska.
18.6. LINEARYZACJA NIELINIOWEGO UKŁADU RÓWNAŃ RÓŻNICZKOWYCH Inną jakościową techniką analizowania nieliniowego układu równań różniczkowych jest wnioskowanie na podstawie jego liniowego przybliżenia dokonanego za pomocą rozwinięcia Taylora tego układu wokół położenia równowagi9. W podrozdz. 9.5 dowiedzieliśmy się, że liniowe (lub otrzymane przy użyciu wielomianu nawet wyższego stopnia) przybliżenie dowolnej funkcji (p(x) może dawać dokładną wartość (p(x) w punkcie rozwinięcia, ale w miarę oddalania się od tego punktu będzie pociągało coraz to większe błędy przybliżeń. Stwierdzenie to jest również prawdziwe dla liniowego przybliżenia nieliniowego układu równań. W punkcie rozwinięcia — którym w tym przypadku jest położenie równowagi E — liniowe przybliżenie może „uchwycić” dokładnie taką samą równowagę, jak pierwotny układ nieliniowy. W dostatecznie małym otoczeniu E liniowe przybliżenie powinno mieć taki sam.ogólny układ linii prądu, jaki miał pierwotny układ nieliniowy. Dopóki w naszym wnioskowaniu o stabilności będziemy się ograniczać do bezpośredniego otoczenia położenia równowagi, dopóty liniowe przybliżenie będzie odpowiednim źródłem informacji. Analiza taka, zwana analizą lokalnej stabilności, może być stosowana samodzielnie lub jako uzupełnienie analizy
9 W przypadku występowania wielu położeń równowagi, każde z nich wymaga osobnego przybliżenia liniowego.
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH
636 ANALIZA DYNAMICZNA
diagramu fazowego. W niniejszym podrozdziale będziemy rozpatrywać tylko przypadek dwu zmiennych. •/
637
f { x o, yo), fx{x o, yo) oraz f yix 0, y 0) i ich odpowiedników dla funkcji g, a następnie rozwiązać układ (18.62) ilościowo. Nawet dla funkcji f i g zapisanych w postaci ogólnej
możliwa jest analiza jakościowa, pod warunkiem, że można uzyskać informację o zna-, kach f x, f y, gx i gy.
Rozwinięcie Taylora i linearyzacja Dla dowolnej, posiadającej kolejne pochodne, funkcji jednej zmiennej Taylora wokół punktu xg daje szereg: ę ( x ) =
+
~
X 0) 2 + ... + - t — ' ^ - ( X - X 0y
rozwinięcie
+ R n ,
w którym po prawej stronie pojawia się wielomian zawierający różne potęgi (x —x 0). Podobną strukturę ma rozwinięcie Taylora funkcji dwu zmiennych f i x , y ) wokół punk tu (xo , y0). W przypadku dwu zmiennych otrzymany wielomian będzie zawierał różne potęgi ( y - y 0) oraz ( x - x 0), a także iloczyny tych dwu wyrażeń: (18.60)
f { x , y)
=/(*o, yo) + f x i x o r y o ) ( x ~ X o ) + f y ( x o, yo)(y -yo) + +
Dla celów analizy lokalnej stabilności linearyzacja (18.62) może być zapisana w prostszej postaci. Ponieważ naszym punktem rozwinięcia nia być punkt równowagi (x, y), możemy więc (x0, yo) zastąpić przez (Y, y). Co ważniejsze, ponieważ w punkcie równowagi mamy z definicji x f = y ' = 0 , a zatem: [z (18.61)]
f i x , y) = gix, y) = 0
i można pominąć pierwszy składnik po prawej stronie każdego z równań (18.62). Po uwzględnieniu tych zmian oraz po wymnożeniu i uporządkowaniu pozostałych składników, otrzymujemy inną wersję linearyzacji:
[ f x x ( x o, y 0) ( x - X 0) 2 + 2 f xy( x 0 , y 0) ( x - x 0) ( y - y o ) +
x ' - f x i x , y ) x - fy ix , y ) y = - f xi x , y ) x - f y i x , y ) y ,
(18.63)
+ fyy(xo, y0) (y - yo)2]+ ••. +
y ' - g x ( x , y ) x - g y i x , y ) y = - g xi x , y ) x - g y i x , y ) y .
Współczynnikami wyrażeń (x - x0) i (y - yo) są obecnie pochodne cz ą s t k o w e f obliczone w punkcie rozwinięcia (x0, y0). Liniowe przybliżenie — lub w skrócie l i n e a r y z a c j a — w przypadku szeregu Taylora funkcji jest otrzymywane po prostu w wyniku pominięcia wszystkich składników rzędu wyższego niż pierwszy, a zatem dla jednej zmiennej linearyzacja jest następującą liniową funkcją x :
Zauważmy, że w (18.63) każdy składnik po prawych stronach znaków równości reprezentuje pewną stałą. Postaraliśmy się oddzielić wszystkie te stałe składniki, aby móc je teraz pominąć i otrzymać w ten sposób zredukowane równania dla linearyzacji. Rezultat, który można zapisać w notacji macierzowej jako: (18.64)
ę ( x 0) + ę ' ( x 0) ( x - X o ) .
y
~fx
fy
"o" 0_
X
_gx gy_ <*, y) X
Podobnie linearyzacja (18.60) jest następującą liniową funkcją x i y: f(xo, yo) + fx (xo, yo) (x - x Q) + fy(xo, y 0) (y - yo).
g(x,
Zredukowana linearyzacja
Zastępując w tym wzorze symbol/symbolem g , otrzymujemy odpowiednią lineaiyzację y). Wynika stąd, że dla danego układu nieliniowego: < x f = f ( x , y),
(18.61)
'
y' = g(x,y)
1
jego linearyzacja wokół punktu rozwinięcia (*0, yo) może być zapisana jako:
stanowi zredukowaną linearyzację dla (18.61). Ponieważ analiza jakościowa zależy wyłącznie od znajomości pierwiastków charakterystycznych, które z kolei zależą jedynie od zredukowa nych równań układu, więc (18.64) wystarcza do przeprowadzenia analizy stabilności. Idąc o krok dalęj widzimy, że jedyną cechą wyróżniającą zredukowaną linearyzację jest macierz pochodnych cząstkowych — macierz Jacobiego dla układu nieliniowego (18.61) — obliczonych w punkcie równowagi (x, y). W ostatecznej analizie lokalna stabilność lub niestabilność równowagi jest zatem przewidywana jedynie na podstawie struktury wspo mnianego jakobianu. Dla wygody zapisu w dalszych rozważaniach wartość jakobianu w punkcie równowagi będziemy oznaczać symbolem J^, a jego elementy symbo lami a ,b , c i d:
- f {xo, y0) + fxix o, y0) ix - x 0) + fyix0, yQ) (y - yo),
(18.62) y ' = g (x0, y0) + gxix o, y0) (x - x 0) + gy{xo, > ) (y - yo),
jeśii znane są konkretne postacie funkcji
f
i g, to można zńalezć wartości dla
(18.65)
i E=
_gx gy_ (x, y)
a
b
c
d
Zakładamy, że dwa równania różniczkowe są funkcjonalnie niezależne; wtedy zawsze będzie |J E| ź 0 (inne przypadki, gdy |J £| = 0, są podane w ćwiczeniu 18.6-4).
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 639
638 ANALIZA DYNAMICZNA
Analiza lokalnej stabilności Zgodnie z (18.16) i (18.65) równanie charakterystyczne zredukowanej linearyzacji powinno być równe: r- a -c
-b r-d
Pierwsza z tych liczb reprezentuje sumę elementów głównej przekątnej tego jakobianu, czyli ślad J E oznaczony symbolem tr J*: a + d = tr JE,
wobec czego pierwiastki charakterystyczne można zapisać jako:
/ Względne wielkości (trj £)2 i 4|J£| decydują o tym, czy dwa pierwiastki będą rzeczywiste, czy zespolone, tzn. czy ścieżki czasowe dla x i y będą jednostajne, czy będą wykazywać wahania. Aby sprawdzić natomiast dynamiczną stabilność równowagi, musimy stwierdzić, jakie są znaki obu pierwiastków. Najbardziej przydatne w tym celu są następujące dwa związki: n + r2 = ti J Et
[por. (15.5) i (15.6)] rir2 = \ i E\.
Przypadek 1 (tr J £)2 > 4 |J£| . W tym przypadku pierwiastki są różnymi liczbami rzeczywistymi i wahania nie są możliwe. Położenie równowagi może być zatem albo węzłem, albo punktem siodłowym, ale nigdy nie może być ogniskiem lub wirem (centrum). Ponieważ ^ * r2, istnieją więc trzy różne kombinacje znaków: oba pierwiastki mogą być ujemne, oba mogą być dodatnie lub mogą mieć przeciwne znaki10. Po uwzględnieniu informacji zawartych w (18.66) i (18.67) te trzy możliwości można scharakteryzować w następujący sposób: n<0; ri> 0 ; n> 0;
r2<0 =» Usl >0; r2 > 0 => | J > 0; r2< 0=*|J*.|<0;
gdzie stałe dowolne Ai i A2 mają być obliczone na podstawie warunków początkowych. Jeśli warunki początkowe są takie, że AL= 0 , to dodatni pierwiastek rLnie będzie miał wpływu na sytuację, a ujemny pierwiastek r2 spowoduje, że położenie równowagi będzie punktem siodłowym. Takie warunki początkowe odpowiadają stabilnym gałęziom punktu siodłowego. Jeśli natomiast warunki początkowe są takie, że A2 = 0, to ujemny pierwiastek zniknie, pozostawiając jedynie pierwiastek dodatni r u który spowoduje, że położenie równowagi będzie niestabilne. Takie warunki początkowe odnoszą się do punktów leżących na gałęziach niestabilnych. Ponieważ wszystkie pozostałe warunki początkowe obejmują Ax& 0, więc również muszą spowodować powstanie rozbieżnych funkcji uzupełniających, a zatem możliwość HI daje punkt siodłowy. Przypadek 2 (tr J £)2 = 4 1JE|. Ponieważ w tym przypadku mamy pierwiastki podwójne, więc możliwe są tylko dwie kombinacje znaków:
tr Je ± V(tr Je )2 - 4| J £| ru r2 =-------------------------
(I) (II) (IE)
.
yc = kiAi e ri' + k2A2 e r2'.
a d - b c = \JE\.
(18.67)
\
Xc - A 1Qrd + A 2Qr2t, = r 2 - (a + d )r+ (ad- be) = 0 .
Jest jasne, że pierwiastki charakterystyczne są określone przez wyrażenia (a + d) i ( a d -b c ). To ostatnie jest po prostu jakobianem z (18.65): "
(18.66)
dla możliwości II opisującej węzeł niestabilny. Natomiast dla możliwości HI, gdy mamy dwa pierwiastki o przeciwnych znakach, otrzymujemy punkt siodłowy. Aby jaśniej zobrazować tę ostatnią możliwość, przypomnijmy, że funkcje uzupełniające dla dwu zmiennych w przypadku 1 mają ogólną postać:
trj£<0, trj£ > 0 , trj* g 0 .
Dla możliwości I, gdy oba pierwiastki są ujemne, funkcje uzupełniające xc i yc dążą do zera przy t —>©o. Położenie równowagi jest zatem stabilnym węzłem. Przeciwnie jest
10 Ponieważ wykluczyliśmy możliwość |J £| = 0, więc żaden pierwiastek nie jest równy zeru.
(IV) (V)
r2<0 => \JE\ >0; r2 > 0 =» IJ^l > 0;
r\ <0; Ti > 0;
t r j £ <0, t r j £ >0.
Możliwości te są po prostu powtórzeniem możliwości l i n . Wskazują zatem na występowanie odpowiednio stabilnego węzła i niestabilnego węzła. Przypadek 3 (tr J E)2< 4| JE\. Tym razem, dla zespolonych pierwiastków, h ± vi, wy stępują wahania cykliczne i musimy napotkać albo ognisko, albo wir. Na podstawie (18.66) i (18.67) mamy w obecnym przypadku: tr
= rt + r2 =
(h
+ vi) + ( h
- vi)
= 2h,
\^E\ = r i r 2 = ( h + v i ) ( h - v i ) = h 2 + v 2,
a zatem tr J £ musi mieć taki sam znak, jak h, podczas gdy \JE\ jest zawsze dodatnie. W konsekwencji isttńeją trzy możliwości: (VI)
h<0
=» |J £|> 0 ;
trJ £ < 0,
(VE) (Vin)
h> 0
=» |J £|> 0 ; => |J^| > 0;
t r j £ >0, tr JE = 0;
h=0
są one związane — odpowiednio — z tłumionymi wahaniami, eksplodującymi wahaniami jednostajnymi wahaniami. Innymi słowy, możliwość VI implikuje stabilne ognisko, możliwość VH — niestabilne ognisko, a możliwość VIH — wir. Powyższe rozważania są streszczone w tabl. 18.1 mającej ułatwić wyprowadzanie jakościowych wniosków na podstawie |J £| i tr JE. Trzy cechy wynikające z danych zawartych w tablicy zasługują na szczególną uwagę. Po pierwsze, ujemna wartość \JE\ jest związana i
640 ANALIZA DYNAMICZNA
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 641
wyłącznie z typem równowagi w postaci punktu siodłowego. Możemy zatem przyjąć, że | J £| < 0 jest warunkiem koniecznym i dostatecznym punktu siodłowego. Po drugie, zerowa wartość tr J E występuje tylko w dwu okolicznościach: gdy występuje punkt siodłowy lub wir. Te dwie sytuacje odróżniamy na podstawie znaku |J£|. Zgodnie z tym zerowa wartość tr J £ połączona z dodatnim |J £| jest warunkiem koniecznym i dostatecznym wystąpienia wiru. Po trzecie, chociaż ujemny znak tr J £ jest konieczny dla dynamicznej stabilizacji, to jednak nie jest dostateczny ze względu na możliwość punktu siodłowego. Niemniej jednak koniecznym i dostatecznym warunkiem dynamicznej stabilności jest ujemna wartość tr J £ i towarzyszący jej dodatni |J£|. Tablica 18.1 Analiza lokalnej stabilności dla nieliniowego układu równań różniczkowych względem dwu zmiennych
2. (tr J*)2 = 4 |J £|
+ +
3. (tr J*)2< 4 |J d
+ + +
-
.
+ +, 0, -
+ -
+ 0
stabilny węzeł niestabilny węzeł punkt siodłowy stabilny węzeł niestabilny węzeł stabilne ognisko niestabilne ognisko wir
Wyniki rozważań przedstawione w tabl. 18.1 odnoszą się do liniowych aproksymacji sytemu nieliniowego. Tablica ta może być oczywiście stosowana również do jakościowej analizy układu, który o d początku jest liniowy. Dla takiego układu elementy macierzy Jacobiego będą zbiorem danych liczb, więc odpada konieczność obliczania, ich wartości w punkcie równowagi. Ponieważ nie występuje proces aproksymacji, wnioski dotyczące stabilności nie będą już miały natury „lokalnej” , lecz będą obowiązywały globalnie.
/= !-? ; przyjmując i E2 = (-1, 2* bianu J ei -
xf - y - 0, możemy znaleźć dla niego dwa punkty równowagi: E x = (1, 1) 1). Potrzebne są zatem dwie oddzielne linearyzacje. Obliczając wartość jako-ll ^ kolejno w dwu punktach równowagi, otrzymujemy:
f2
-ll
-2
r— 1i 1
+ + -
Typ położenia równowagi
x' = *2 -y ,
1
1. (tr J e)2> 4\Je\
Znak tr J e
Przykład 2. Dany jest układ liniowy:
O
Znak \3e\
Przypadek
Zwróćmy uwagę, że chociaż pierwotnie pierwszy wiersz macierzy Jacobiego zawiera zmienne y i x, to drugi wiersz nie zawiera zmiennych. Przyczyną tej różnicy jest fakt, że drugie równanie danego układu jest pierwotnie liniowe i nie wymaga linearyzacji.
i
-1
3e 20
_ 1 _
Pierwszy z nich ma ujemny wyznacznik, a zatem E x = (1, 1) jest lokalnie punktem siodłowym. Dla drugiego znajdujemy |J£2| = 2 i tr J £2 = -3 , a zatem — na podstawie tabl. 18.1 — E 2 = (-1, 1) jest lokalnie stabilnym węzłem zgodnie z przypadkiem 1. Przykład 3. Czy układ liniowy: x ' = x - y + 2,
y' = jc + y + 4 ma stabilne położenie równowagi? Aby odpowiedzieć na tak sformułowane pytanie jakościowe, możemy po prostu skoncentrować się na równaniach zredukowanych i zignori - i rować stałe 2 i 4. Jak można oczekiwać na podstawie układu liniowego, jakobian ^ ^ ma jako swe elementy cztery stałe. Ponieważ i jego wyznacznik, i ślad są równe 2,. więc położenie równowagi odpowiada przypadkowi 3 i jest niestabilnym ogniskiem. Zauważmy, że wniosek ten wysnuwamy bez konieczności rozwiązywania układu względem położenia równowagi i że jest on w tym przypadku globalnie obowiązujący.
Przykład 1. Przeanalizować lokalną stabilność układu nieliniowego:
Przykład 4. Przeanalizować lokalną stabilność modelu Obsta (18.50):
x '= f( x ,y ) = x y - 2
p' =h (l-p ),
y ' = g(x, y) = 2 x - y
(x, y ^ 0 ).
p ' = (p + q - m ) p ,
Najpierw przyjmujemy x ' = y ' = 0 i uwzględniając nieujemność x i y znajdujemy pojedynczy punkt równowagi E w punkcie (Jc, y) = (1, 2). Następnie bierzemy pochodne cząstkowe dla x f i y' i obliczając ich wartości w punkcie E, otrzymujemy: 3e
7/ =
fi
_gx 8y- (x,y)
y 2
X
-1 (1, 2)
2 l" 2 -1_
Ponieważ |J£| = -4 jest ujemne, więc możemy natychmiast stwierdzić, że punkt równowagi jest lokalnie punktem siodłowym.
przy założeniu, że stopa ekspansji monetarnej w jest egzogeniczna (nie jest stosowana żadna reguła monetarna). Zgodnie z rys. 18.3(a) położenie równowagi tego modelu występuje w punkcie E = (p, /Z) = (m - q, 1). Macierz Jacobiego obliczona w punkcie E jest równa:
3e
=
dp'
dp'
dp
dp
dp'
dp'
dp
dp
41 — Podstawy...
"o
-h p +q -m
(m -q, 1)
0
-/f
1
0
UKŁADY RÓWNAŃ RÓŻNICZKOWYCH I RÓŻNICOWYCH 6 4 3
6 4 2 ANALIZA DYNAMICZNA
Ponieważ |J £| = h > 0 i tr J £ = 0, więc — co wynika z tabl. 18.1 — położenie równo wagi jest lokalnie wirem. Jest to zgodne z wnioskami otrzymanymi w analizie diagramu fazowego przeprowadzonej w poprzednim podrozdziale. Przykład 5. Przeanalizować lokalną stabilność modelu Obsta, zakładając, że stosowana jest alternatywna reguła monetarną: p ' = h{ 1 - p ) ,
[z (18.50)]
p '= [ p + q - m ( p ' ) ] p
[z (18.58)]
Ponieważ p ' jest funkcją fl, więc funkcja m (p ') w obecnym modelu również jest funk cją fi. W punkcie równowagi E, gdzie p ' = ]u' = 0, mamy fl = 1 i p = m(0) - q. Jakobian obliczony w punkcie E jest zatem równy: "0
-h
3 o Í3-
-h p + q - m ( p ' ) - m '(p ')(-/*)//_ E
i
0 jl
gdzie m'(0) jest ujemne na mocy (18.57). Zgodnie z tabl. 18.1, dla \JE\ = h > 0 i tr J E = m '(0)h < 0 możemy mieć albo stabilne ognisko, albo stabilny węzeł — zależnie od względnych wielkości (tr J ^)2 i 4 |J £|. Dokładniej, im większa jest wartość bezwzględna pochodnej m'( 0), tym większa będzie wartość bezwzględna trJs i tym jest bardziej prawdopodobne, że wartość (trj £) 2 przekroczy 4|J^| i powstanie stabilny węzeł zamiast stabilnego ogniska. Wniosek ten jest również zgodny z wnioskiem otrzymanym w wyniku analizy diagramu fazowego.
Ćwiczenie 18.6 1. Przeanalizować lokalną stabilność każdego z następujących układów nieliniowych: (a) *' = ex- l , (c) x ' = l - e y, . y' = ye*; y' = 5 x-y; (b) x ' = x + 2 y, (d) x ' = x 3 + 3 x 2y + y, y ' = x 2 + y;
y ' = x ( l + y 2).
2. Za pomocą tabl. 18.1 określić typ położenia równowagi, jaki miałby lokalnie układ nieliniowy, jeżeli: (a) £ = 0 , f y > 0 , gx > 0 i gy = 0 ; (b) f x = 0 , f y < 0 , gx < 0 i &, = 0 ; (c) / x< 0 , f y > 0 9 gx < 0 i gy < 0. Czy wyniki są zgodne zodpowiedziami uzyskanymiw ćwiczeniach 18.5-4 i 18.5—5? 3. Przeanalizować lokalną stabilność modelu Obstaprzy konwencjonalna reguła monetarna.
założeniu, że stosowana jest
4. Następujące układy mają jakobiany o zerowej wartości. Skonstruować dla każdego z nich diagram fazowy i wywnioskować położenie wszystkich istniejących punktów równowagi: (a) x ' = x + y , (b) jc' = 0 ,
18.7. OGRANICZENIA ANALIZY DYNAMICZNEJ Analiza statyczna przedstawiona w drugiej części książki dotyczyła jedynie pytania, jakie będą położenia równowagi przy pewnych danych warunkach w modelu. Głównym problemem było: jakie wartości zmiennych — jeśli zostaną osiągnięte — będą wykazywały skłonność do powtarzania się? Możliwość osiągnięcia położenia równowagi była wówczas z góry założona. W części trzeciej, po przejściu do statyki porównawczej, główne pytanie dotyczyło bardziej interesującego problemu: jak zmieni się położenie równowagi w wyniku pewnej zmiany parametru? Wtedy również możliwość osiągnięcia położenia równowagi była pominięta. Dopiero gdy w części piątej doszliśmy do analizy dynamicznej, stanęliśmy wobec problemu osiągalnośd równowagi. Pytaliśmy tu mianowicie: jeśli początkowo jesteśmy poza położeniem równowagi — np. wskutek niedawnej wytrącającej z położenia równowagi zmiany wartości parametru — to czy różne siły działające w modelu skierują nas ku nowemu położeniu równowagi? Ponadto w analizie dynamicznej badaliśmy szczególny charakter ścieżki (czy to stabilnej, czy z wahaniami, czy oscylującej), po jakiej posuwać się będzie zmienna, dążąc do położenia równowagi (jeśli w ogóle dąży). Znaczenie analizy dynamicznej powinno być zatem oczywiste. Jednakże na zakończenie powinniśmy również zdać sobie sprawę z ograniczeń analizy dynamicznej. Przede wszystkim, aby umożliwić przeprowadzenie analizy, modele dynamicz ne są często formułowane za pomocą równań liniowych. Chociaż można w ten sposób zyskać większą prostotę, to jednak założenie o liniowości w wielu przypadkach oznacza rezygnację z realizmu. Ponieważ ścieżka czasowa odpowiadająca modelowi liniowemu nie zawsze musi aproksymować ścieżkę czasową nieliniowego odpowiednika, o czym świadczył przykład z pułapem cenowym w podrozdz. 16.6, trzeba więc zachowywać ostrożność przy inter pretowaniu i stosowaniu wyników liniowych modeli dynamicznych. W związku z tym jakościowe podejście graficzne może okazać się niezmiernie użyteczne, gdyż przy dość ogólnych założeniach umożliwia zastosowanie modelu nieliniowego bez nadmiernego komplikowania analizy. Inna wada, często spotykana w ekonomicznych modelach dynamicznych, polega na stosowaniu stałych współczynników w równaniach różniczkowych lub różnicowych. Ponie waż pierwszoplanową rolą współczynników jest określenie parametrów modelu, więc stałość współczynników — również przyjmowana w celu ułatwienia obliczeń — w istocie służy do „zamrożenia” ekonomicznego otoczenia badanego problemu. Innymi słowy oznacza to, że problem endogenicznych dostosowań modelu jest badany w swego rodzaju próżni ekonomicznej, gdyż nie pozwala się na interwencję czynników egzogenicznych. W pewnych przypad kach nie stanowi to oczywiście zbyt poważnego problemu, ponieważ wiele parametrów ekonomicznych ma tendencję do utrzymywania względnie stałej wartości w długich okresach. W niektórych innych przypadkach możliwe jest przeprowadzenie analizy typu dynamiki porównawczej pozwalającej zbadać, w jaki sposób na ścieżkę czasową zmiennej wpłynie zmiana pewnych parametrów. Mimo wszystko, jeśli interpretujemy ścieżkę czasową roz ciągającą się w daleką przyszłość, powinniśmy zawsze starać się unikać nadmiernego zaufania do otrzymanych wyników, jeśli przyjęto upraszczające założenie stałości parametrów. Czytelnik zdaje sobie oczywiście sprawę, że przedstawione ograniczenia nie mają na celu zdyskredytowania analizy dynamicznej jako takiej. W istocie pokazano, że każdy zaprezen towany do tej pory typ analizy ma swój własny rodzaj ograniczeń. Analiza dynamiczna —jak każdy typ analizy — dopóki jest należycie interpretowana i właściwie stosowana, dopóty może odgrywać ważną rolę w badaniu zjawisk ekonomicznych.
CZĘŚĆ
SZÓSTA PROGRAMOWANIE MATEMATYCZNE
19. PROGRAMOWANIE LINIOWE
W poprzednich pięciu częściach książki dokonaliśmy analitycznego przeglądu statyki, statyki porównawczej i dynamiki. Badanie różnych typów zagadnień optymalizacji należało do zakresu statyki lub analizy równowagi. Metodologicznie ograniczaliśmy się do klasycznych metod optymalizacji opartych głównie na rachunku różniczkowym. W tej części wprowadzi my nieklasyczne metody optymalizacji, rozwinięte stosunkowo niedawno, znane jako programowanie matematyczne obejmujące programowanie liniowe i nieliniowe. Programowanie matematyczne różni się od klasycznej optymalizacji tym, że dotyczy zagadnień, w których warunki ograniczające występują w postaci nierówności, np. g(x, y) ^ c, a nie g(:c, y) = c. Przykładowo, zamiast wymagać od konsumenta, aby wydał dokładnie 250 dolarów, należy mu pozwolić na wydanie 250 dolarów lub — jeśli woli — mniejszej kwoty. Dzięki takiemu rozluźnieniu ograniczeń rozpatrywane w tym nowym schemacie zagadnienia optymalizacji są bardziej interesujące i zarazem bardziej realistyczne. Wymagają jednak opracowania nowych metod rozwiązań, gdyż. klasyczna technika rachunku różnicz kowego nie nadaje się do rozwiązywania zagadnień z warunkami w postaci nierówności. Zaczniemy od programowania liniowego, prostszej odmiany zagadnień programowania, w której zarówno funkcja celu, jak i warunki ograniczające w postaci nierówności są liniowe.
19.1. PROSTE PRZYKŁADY PROGRAMOWANIA LINIOWEGO Istotę programowania liniowego najlepiej można przedstawić za pomocą prostych przyldadów. Jeden z nich będzie ilustrował maksymalizację, a drugi minimalizację.
Zagadnienie diety Pewna osoba, aby zachować dobre zdrowie, musi przyjmować w codziennym pożywieniu określone ilości substancji odżywczych. Przyjmijmy, że są to trzy typy substancji: wapń,
648 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE
proteiny i witamina A. Załóżmy, że dieta tej osoby składa się z dwu rodzajów żywności I i n, których ceny i zawartości składników odżywczych podano w tabl. 19.1, w której przytoczono również minimalne dzienne zapotrzebowanie na poszczególne składniki. Pytanie: jaka kombinacja dwu rodzajów żywności będzie zaspokajała dzienne zapotrzebowanie na substancje odżywcze najmniejszym kosztem?
wyższej niż 1 i nie występują iloczyny zmiennych. To właśnie jest przyczyną przyjęcia nazwy: programowanie liniowe.
Rozwiązanie graficzne
Tablica 19.1 Ceny i wartości odżywcze żywności
Cena
Żywność I (funt)
Żywność II (funt)
0,60$
1,00$
10 5 2
4 5 6
Wapń (jednostka*) Proteiny (jednostka *) Witamina A (jednostka *)
Ponieważ nasze zadanie zawiera tylko dwie zmienne decyzyjne, można więc je przeanalizo wać graficznie. Na rys. 19.1 na dwu osiach zaznaczyliśmy *i i *2. Ze względu na warunki nieujemności rozważamy jedynie I kwadrant, w którym zmienne są nieujemne. Minimalne dzienne zapotrzebowanie 20 20 12
' Z a s to s o w a n o je d n o s tk i u m o w n e , a b y u z y s k a ć o k r ą g łe lic z b y .
Jeśli ilości dwu rodzajów żywności, jakie mają być codziennie kupowane, oznaczymy przez xi i x 2 (traktujemy je jako zmienne ciągłe), to zagadnienie można sformułować matematycznie w następujący sposób: zminimalizować przy warunkach (19.1)
C = 0 ,6 *1 + 1 0 xi +
* 2,
4x2 ^
20 ,
5*1 + 5x2 ^ 20 , 2*
oraz
i +
6*2
^
12,
649
[ograniczenie dla wapnia] [ograniczenie dla protein] [ograniczenie dla witaminy A]
*1,* 2 ^ 0 .
Pierwsze równanie w (19.1), które jest funkcją kosztu wykorzystującą informacje o cenach zawarte w tabl. 19.1, stanowi funkcję celu zagadnienia liniowego; w tym przypadku funkcja ta ma być minimalizowana. Trzy następujące po niej nierówności to warunki ograniczające, sformułowane na podstawie trzech ostatnich wierszy tablicy, wyrażające dzienne zapotrzebowanie. Zwróćmy uwagę, że chociaż nie wolno zejść poniżej dziennego zapotrzebowania, to jednak osoba dokonująca optymalizacji może (ze względu na za stosowanie znaku nieostrej nierówności ^ ) przekroczyć podane ilości minimalne. Jest to podstawowa cecha różniąca programowanie liniowe od spotykanych wcześniej typów optymalizacji. Dodatkowe nierówności: *i, *2 ^ 0 , zwane warunkami nieujemności, wyrażają w jawny spósób fakt, że Ujemne wielkości zakupów są niedozwolone. Wymaganie takie nie było jawnie wyrażone W klasycznym schemacie optymalizacji ze względu na ograniczenia raćhuńku różniczkowego. Warto też zwrócić uwagę, że ńasże zagadnienie zawiera więcej warunków ograniczających niż zmiennych decyzyjnych. ¡Sytuacja taka nigdy nie mogłaby pojawić się W klasycznych problemach optymalizacji. Teraz jednak stała się możliwa, ponieważ warunki zostały osłabione — równania zastąpiono nierównościami — i tym samym łatwiej jest je spełnić. Reasumując, zagadnienie programowania liniowego składa się z trzech podstawowych składników: funkcji celu, zbioru warunków ograniczających i zbioru warunków nieujemności. Zauważmy, że wszędzie występuje liniowość — żadna zmienna nié jést podniesiona do potęgi
X2>
5 4 .V
3.
3 2
I
1
0
1
2
3 (*)
Rysunek 19.1
4
5
6
*!
PROGRAMOWANIE LINIOWE
650 PROGRAMOWANIE MATEMATYCZNE
Aby zobaczyć, co oznaczają graficznie podane warunki ograniczające, najpierw wykreślamy proste, których równania otrzymalibyśmy, gdyby warunki miały postać równości (rys. 19.1 (a)). Każda z tych linii prostych, oznaczonych odpowiednio jako granica wapnia, granica protein i granica witaminy A, dzieli kwadrant na dwa rozłączne obszary. Ponieważ każdy warunek ma postać 2*, więc spełniają go tylko punkty (czyli pary uporządkowane) leżące w obszarze północno-wschodnim lub na samej linii granicznej. Wszystkie trzy warunki są jednocześnie spełnione tylko dla tych punktów (*i, x2), które nie leżą na południowy wschód od żadnej linii granicznej. Na przykład punkt (1, 2) spełnia ograniczenie dotyczące witaminy A, ale nie spełnia dwu pozostałych; zatem nie jest rozwiązaniem dopuszczalnym dla naszego zagadnienia programowania liniowego. Wszystkie punkty położone w obszarze zaciemnionym na diagramie (b) spełniają jednocześnie wszystkie trzy warunki. Obszar zaciemniony jest zatem obszarem (lub zbiorem) rozwiązań dopuszczalnych (feasible region), a każdy punkt (parę uporządkowaną) tego obszaru nazywamy rozwiązaniem dopuszczalnym. Obszar rozwiązań dopuszczalnych zawiera również punkty leżące na jego brzegu, mającym postać linii łamanej. W szczególności, zarówno zbiór punktów na osi poziomej {(*i, * 2) • *1 ^ 6 , x 2 = 0}, jak i zbiór punktów na osi pionowej {(*1 , x2) : xi = 0, x 2 ^ 5} również należą do zbioru rozwiązań dopuszczalnych. Wobec tego obszar dopuszczalny jest zbiorem domkniętym (par uporządkowanych). Jest to pojęcie, pokrewne pojęciu przedziału dom kniętego, oznaczające zbiór, który zawiera wszystkie swoje punkty brzegowe. Zwróćmy uwagę na to, że łamany brzeg zbioru rozwiązań dopuszczalnych składa się z pewnych fragmentów trzech granic oraz osi. Zauważmy również, że w obecnej sytuacji (dwuwymiarowej) punkty wierzchołkowe na brzegu — które będziemy nazywać punktam i r
ekstremalnymi — występują albo na przecięciu dwu prostych granicznych
^2
1^
np. (3, 1)
651
rodzaju żywności nasz hipotetyczny konsument może być utrudzony jej spożywaniem, ale będzie miał pewność, że jej koszty będą najniższe. Opis ten jest zmodyfikowaną wersją zadania polegającego na znalezieniu kombinacji o najmniejszym koszcie. Idea linii stałego kosztu jest dokładnie taka sama jak poprzednio, ale gładka izokwanta, jaką mieliśmy poprzednio, została teraz zastąpiona przez zbiór rozwiązań dopuszczalnych z kanciastą granicą. W wyniku tego stosowane w rachunku różniczkowym pojęcie punktu styczności musimy porzucić na rzecz czegoś, co moglibyśmy nazwać punktem kontaktu . Na rys. 19.1(b) punkt kontaktu jest to punkt ekstremalny leżący na granicy. Fakt ten — zaznaczmy — nie jest przypadkowy. Jak to pokażemy za chwilę, optymalne rozwiązania wszystkich zagadnień programowania liniowego zawsze znajdują się w punktach ekstremal nych. Ponieważ punkt ekstremalny jest zawsze usytuowany na przecięciu dwu granic wyznaczonych przez warunki ograniczające lub jednej granicy z osią, możemy więc — po zlokalizowaniu optymalnego wierzchołka — znaleźć rozwiązanie optymalne (*1, *2), rozwiązując układ złożony z równań odpowiednich dwu przecinających się prostych. W rozważanym obecnie przykładzie wierzchołek optymalny leży na przecięciu granic dla protein i witaminy A. Rozwiązując zatem następujące dwa równania: 5*!+ 5jc2 = 20, 2*
i +
6*2
=
12,
możemy znaleźć (*!, *2) = (3, 1). Rozwiązanie to dokładnie spełnia wymagania dotyczące protein i witaminy A, natomiast przekracza zapotrzebowanie na wapń. Jest to sytuacja, która nie mogłaby wystąpić, gdyby wszystkie ograniczenia były ścisłymi równaniami.
, albo na przecięciu prostej granicznej z osią (np. (0,5) i (6 ,0)). Zobaczymy, że te
punkty ekstremalne mają w naszym rozwiązaniu wielkie znaczenie. Punkty zbioru rozwiązań dopuszczalnych reprezentują zbiór wszystkich zestawów żywności, które spełniają wszystkie warunki ograniczające oraz warunki nieujemności. Jednak niektóre z tych zestawów pociągałyby mniejsze koszty niż pozostałe. Aby zminimalizować koszt C, trzeba koniecznie uwzględnić również funkcję celu. Zapisując funkcję kosztu w postaci: x 2 = C - 0,6xi
i traktując C jako parametr, możemy sporządzić wykresy tego równania, czyli rodzinę równoległych linii prostych o jednakowym nachyleniu równym -0,6. Na rys. 19.1(b) pokazano dla przykładu trzy takie proste, zaznaczone linią przerywaną. Ponieważ każda z nich odpowiada pewnej określonej wartości C, więc zaznaczone proste są w istocie liniami stałego kosztu (isocost). Aby zminimalizować koszt, musimy wybrać najniższą możliwą linię stałego kosztu, wciąż pozostając w obszarze dopuszczalnym. Na rys. 19.1(b) otrzymujemy w wyniku takiego wyboru punkt wierzchołkowy (3, 1), a zatem optymalne rozwiązanie dopuszczalne (lub — w skrócie — rozwiązanie optymalne ) naszego zadania programowania liniowego to (*1, *2) = (3, 1). Wynika stąd, że minimalny koszt diety, obliczony dla podanych cen żywności, będzie wynosił Ć = 2,80 dolarów dziennie. Przy tak ustalonej diecie złożonej z 3 funtów pierwszego rodzaju żywności i 1 funta drugiego
Efekt zmiany cen Postawmy teraz pytanie z zakresu statyki porównawczej: co stanie się z rozwiązaniem optymalnym, jeśli zmienią się ceny żywności Pi i P2? Ponieważ nachylenie linii stałego kosztu jest mierzone proporcją - P J P 2 (w naszym przykładzie -0,60/1,00 = -0,6), więc bezpośrednim efektem zmiany cen będzie przesunięcie linii stałego kosztu. Ale może się pojawić kilka możliwości. Po pierwsze, jęśli dwie ceny zmieniają się dokładnie w tej samej proporcji, to nachylenie linii stałego kosztu pozostaje nie zmienione. W tym przypadku pierwotne rozwiązanie optymalne (*1, *2) musi pozostać nie zmienione, chociaż oczywiście koszt C wzrośnie lub zmaleje w zależności od P x i P2. Po drugie, jeżeli dwie ceny zmieniają się w różnych proporcjach, ale różnice są względnie małe, to nachylenie linii stałego kosztu zmieni się w niewielkim stopniu, np. z -0,6 lub -0,4 na -0,8. Jak można sprawdzić — wykreślając na rys. 19.1(b) rodzinę linii stałego kosztu o nachyleniu - 0,8 — taka wielkość zmiany nachylenia nie zmieni pierwotnego rozwiązania optymalnego. W przeciwieństwie do punktu styczności występującym w rachunku różniczkowym, punkt kontaktu (wierzchołek optymalny) jest niewrażliwy na niewielkie zmiany parametrów cen. Rozważmy jeszcze inną możliwość. Załóżmy, że obie ceny stały się równe, np.
652 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE
Pi = P2 = 1. Wtedy linie stałego kosztu, które mają teraz nachylenie - 1, będą równoległe do
Tablica 19.2
granicy protein. Najniższa możliwa nowa linia stałego kosztu będzie przecinać zbiór rozwiązań dopuszczalnych nie w jednym punkcie, lecz wzdłuż całego boku i w rezultacie r2 O każdy punkt odcinka o końcach (3 , 1) i będzie optymalny. ¥ ’ 3? / Jeśli chodzi o konsumenta, zjawisko polegające na występowaniu wielu rozwiązań optymalnych nie stanowi problemu, przeciwnie, umożliwia zróżnicowanie menu. W pierwszej chwili wydaje się jednak, że powinniśmy wycofać się z wcześniejszych zapewnień, iż rozwiązania optymalne zawsze występują w punktach ekstremalnych. Chwila zastanowienia prowadzi jednak do wniosku, że wszystko jest w porządku, gdyż nawet w przypadku, gdy mamy wiele rozwiązań optymalnych, do zbioru rozwiązań optymalnych należy między innymi wierzchołek, a nawet dwa wierzchołki. Wobec tego ograniczenie się do badania punktów wierzchołkowych nie powoduje ryzyka pominięcia jakiegoś lepszego rozwiązania. Taka właśnie idea stanowi podstawę tzw. metody simpleks rozwiązywania zagadnienia pro gramowania liniowego, którą przedstawiamy w podrozdz. 19.4-19.6.
Zysk! i proces przetwarzania dla wyrobów I i II Liczba godzin przetwarzania przypadających na tonę wyrobu I 1 Krojenie Mieszanie Paczkowanie Zysk na jednej tonie
653
Dzienne możliwości (w godzinach)
wyrobu H 0
8
0
1
8
1
■' 2
3
3
40$
30$
2
8
Zgodnie z danymi tabl. 19.2 ograniczenie dotyczące krojenia powinno mieć postać
Zagadnienie produkcji
i * ^ 8 . Aby pozbyć się ułamków, pomnożyliśmy jednak obie strony nierówności przez 2.
Zajmiemy się teraz następnym prostym przykładem, tym razem dotyczącym produkcji. Przyjmujemy następujące założenia. Zakład złożony z trzech wydziałów produkcyjnych, w których odbywa się krojenie, mieszanie i paczkowanie, produkuje dwa rodzaje wyrobów I i II. Maszyny w każdym wydziale mają pracować przez 8 godzin dziennie, a zatem tych 8 godzin potraktujemy jako dzienną zdolność produkcyjną każdego wydziału. Proces produkcji można w skrócie opisać w następujący sposób: wyrób I najpierw jest krojony,
Podobnie postąpiliśmy w przypadku ograniczenia dotyczącego paczkowania, mnożąc obie strony nierówności przez 3. Zapisaliśmy w ten sposób zadanie w postaci zagadnienia maksymalizacji. Warunki ograniczające mają postać nierówności gdyż nie musimy w pełni wykorzystywać możliwości produkcyjnych. Warunki nieujemności mają taką samą postać, jak w zagadnieniu minimalizacji.
a potem paczkowany. Wytworzenie każdej tony tego wyrobu zajmuje—godziny krojenia i — 2
3
godziny paczkowania. Wyrób II jest najpierw mieszany, a następnie paczkowany. Na każdą 2
tonę tego wyrobu przypada 1 godzina mieszania i — godziny paczkowania. Wyroby I i II mogą być sprzedawane — odpowiednio — w cenach 80 dolarów i 60 dolarów za tonę, ale po odjęciu kosztów zmiennych pozostaje netto 40 dolarów i 30 dolarów za tonę. Te wielkości mogą być traktowane jako przychody netto (po odliczeniu kosztów zmiennych) lub zyski brutto (przed odliczeniem kosztów stałych). Dla uproszczenia będziemy mówić, że są to „zyski za tonę” . Pytanie: jaki poziom produkcji obu wyrobów powinna ustalić firma, jeśli jej celem jest maksymalizacja całkowitego zysku (brutto)? Aby odpowiedzieć na to pytanie, informacje uporządkujemy w postaci tabl. 19.2, a potem zapiszemy je w postaci zagadnienia programowania liniowego z dwiema ciągłymi zmiennymi decyzyjnymi x x i x2: zmaksymalizować przy warunkach (19.2)
oraz
# = 40;^ + 30*2i x\ ^ 16, *2 ^ 8, *1 + 2*2^24, Jti, x2 ^ 0 .
[ograniczenie dotyczące krojenia] [ograniczenie dotyczące mieszania] [ograniczenie dotyczące paczkowania]
Rozwiązanie graficzne Zagadnienie programowania liniowego (19.2) można rozwiązać graficznie tak, jak to pokazano na rys. 19.2. Dzięki warunkom nieujemności zagadnienie dotyczy nieujemnej ćwiartki układu współrzędnych, w której możemy narysować trzy linie odpowiadające ograniczeniom. Wykresem linii dla krojenia f a = 16) jest linia pionowa, wykresem linii dla mieszania (x2 = 8) jest prosta pozioma, a brzegiem dla warunku paczkowania jest nachylona prosta przecinająca dwie pozostałe proste w punktach (16, 4) i (8 , 8). Ze względu na to, że ograniczenia mają postać nieostrych nierówności zbiór rozwiązań dopuszczalnych składa się z punktów spełniających jednocześnie wszystkie trzy warunki położenia: ( 1) leżących na brzegu odpowiadającym warunkowi mieszania lub pod nim; (2) leżących na brzegu odpowiadającym warunkowi krojenia lub na lewo od niego; (3) leżących na brzegu odpowiadającym warunkowi paczkowania lub pod nim. Zbiór wszystkich punktów spełniających te warunki przedstawiono na rys. 19.2(b) jako obszar zaciemniony. Ponieważ punktami dopuszczalnymi są — oprócz punktów wewnętrznych — wszystkie punkty brzegowe, więc zbiór rozwiązań dopuszczalnych jest zbiorem do mkniętym. Teraz zbiór ten jest ściśle ograniczony, co z grubsza oznacza, że można go umieścić w pewnym prostokącie (natomiast zbiór rozwiązań na rys. 19.1(b) był ograniczony tylko z dołu).
PROGRAMOWANIE LINIOWE 6 5 5
6 5 4 PROGRAMOWANIE MATEMATYCZNE
ii
Granica dla mieszania / *2 =8 Granic a dla paczkowania x 1+ 2 x 2= 2 4
/
7 \ j 8 , 8) -
. Granica dla krojenia * i = 16 (16, 4) ------- - I _ ------ 4— :-----1 ■ ' '"
8
12
16
20
24
(a)
cych mieszania musi pozostać nie wykorzystana. Taka sytuacja byłaby nie do pomyślenia, gdyby wszystkie warunki ograniczające były zapisane w postaci równań. Skoro mówimy o postaci warunków ograniczających, to powinniśmy wspomnieć, że chociaż w powyższych dwu przykładach wszystkie warunki miały postać ^ (w przypadku zagadnienia maksymalizacji) lub postać ^ (w przypadku zagadnienia minimalizacji), to jednak nie zawsze tak jest. Na przykład w zadaniu dotyczącym diety mogłoby wystąpić ograniczenie podwójne dotyczące witaminy A: „nie mniej niż 12” (dla zdrowia) i „nie więcej niż 86’’ (w celu uniknięcia przedawkowania). Taka sytuacja nie wpłynęłaby jednak na metodę rozwiązania, gdyż — co widzieliśmy już w (19.2) — warunki nieujemności ^ mogą współistnieć z warunkami w postaci ^ . W przypadku występowania dwu rodzajów warunków może się jednak zdarzyć, że będą one sprzeczne. W przykładzie pokazanym na rys. 19.3(a) rozwiązania mają być powyżej granicy I i jednocześnie poniżej granicy n, co prowadzi do tego, że zbiór rozwiązań dopuszczalnych jest zbiorem pustym i zadanie nie ma rozwiązania.
X2A
Zagadnienie programowania liniowego może również zawierać warunki w postaci równań. Na rys. 19.3(b) pokazano zaciemniony zbiór rozwiązań dopuszczalnych podobny do
zbioru na rys. 19.2(b). Jeśli dodamy warunek w postaci równania, to zbiór rozwiązań dopuszczalnych skurczy się do odcinka prostej oznaczonego kropkami, czyli do części wspólnej zaciemnionego obszaru i prostej odpowiadającej nowemu warunkowi. Metoda rozwiązywania i tym razem nie różni się.
(16, 4)
24 *1
Rysunek 19.2
Zajmijmy się teraz funkcją celu. Możemy ją zapisać następująco: n
4
i jeśli potraktujemy iz jako parametr, to otrzymamy wykres tego równania— rodzinę prostych 40 jednakowym nachyleniu trzy z nich zaznaczono (linią przerywaną) na diagramie (b). Ponieważ każdej z tych prostych odpowiada pewna ustalona wartość parametru zysku K, możemy więc je nazwać liniami stałego zysku (isoprofits). Naszym celem jest osiągnięcie w zbiorze rozwiązań dopuszczalnych linii stałego zysku o najwyższym możliwym poziomie zysku. Wybieramy zatem punkt wierzchołkowy (16, 4) jako najlepszą kombinację ilości wyrobów. W rozwiązaniu optymalnym x\ = 16 ton dziennie i x2 = 4 tony dziennie. Pod stawiamy te wartości do funkcji celu i obliczamy maksymalny zysk brutto równy n = 760 dolarów dziennie. Zwróćmy uwagę na to, że dla rozwiązania (16, 4) warunki dotyczące krojenia 1paczkowania są spełnione w postaci równości, a warunek dotyczący mieszania — w postaci nierówności. Aby zmaksymalizować zysk, pewna część zdolności produkcyjnych dotyczą
Rysunek 19.3
Ćwiczenie 19.1 1. Rozwiązać graficznie następujące zadania: (a) zmaksymalizować K - 2xi + 5x2> przy warunkach X\ ^ 4, *2 < 3 , X\ + 2^2 ^ 8, oraz xj, x 2 ^ 0 ;
PROGRAMOWANIE LINIOWE 6 5 7
6 5 6 PROGRAMOWANIE MATEMATYCZNE
przy warunkach ' oraz
(oznaczymy je symbolem x2) kosztują 4000 dolarów. W wybranym tygodniu wolne są jeszcze tylko cztery odcinki reklam telewizyjnych. Ocenia się, że ze względu na wielkość audytorium i inne czynniki reklama telewizyjna jest sześciokrotnie efektywniejsza niż reklama radiowa. Jak firma powinna zaplanować kampanię reklamową, aby dotrzeć do największej liczby potencjalnych klientów?
x x 4- 2 x 2 ^ 3, ..jci + 4jc2 -’> 4 , ■ 3*i + *2 ^ 3, * i,*2 ^ 0*
2. Jakie szczególne cechy mają rozwiązania graficzne następujących zagadnień? Jaka jest tego przyczyna? a. Zminimalizować przy warunkach oraz
C = 6xi + 24jc2, x x + 2;t2 ^ 3, x i + 4x 2 ^ 4 , xi, x 2 ^ 0 .
19.2. OGÓLNE SFORMUŁOWANIE ZAGADNIENIA PROGRAMOWANIA LINIOWEGO
b. Zminimalizować C = 6^1 + 30x2 przy tych samych warunkach, co w (a). 3. Właścicielka chce odnowić dom, malując go jedną warstwą farby. W tym celu farba musi mieć lepkość przynajmniej 200 centypuazów. Innym wymaganiem jest, aby każdy galon farby zawierał co najmniej 14 g składnika chemicznego Y nadającego pożądany połysk. Ponadto, w celu uzyskania odpowiedniej trwałości, każdy galon farby musi zawierać przynajmniej 30 g innej substancji Z. Właścicielka domu może kupić dwa rodzaje farby (I i II). Cena pierwszej farby wynosi 6 dolarów, a II 4 dolary za galon. Mają one następujące cechy: Farba 1 (galon) Lepkość
Farba II (galon)
400
100
20 20
10 60
(w centypuazach) Y (w gramach)
Z (w gramach)
7. Jak wpłynie na optymalne rozwiązanie poprzedniego zadania brak ograniczeń dostępności reklam telewizyjnych?
Właścicielka decyduje się zmieszać farby I i II, aby spełnićwszystkie trzy wymagania minimalnym kosztem. Jakie ilości I i II farby (oznaczmy je X\ i x2)utworzą każdy galon mieszanki? Jaki jest minimalny koszt farby mieszanej? Wskazówka: oprócz zwykłych ograniczeń musi być również spełnione równanie Xi + x2 = 1. Dlaczego? 4. Gdyby w poprzednim zadaniu ceny I i II farby były zamienione, to jak zmieniłby się skład mieszaniny? Jaka byłaby jej minimalna cena? 5. Jak będzie wyglądało rozwiązanie graficzne zadania programowania liniowego o dwu zmiennych decyzyjnych, jeśli prawdziwe są następujące założenia: (a) współczynnik przy Xi w funkcji celu jest równy zeru; (b) współczynnik przy x 2 w funkcji celu jest równy zeru; (c) pierwsze dwa warunki są odpowiednio równe: axi + bx2 c, -a x i - bx2 ^ —c. 6 . Lokalna firma planuje reklamowanie pewnego towaru w ciągu określonego tygodnia
w radiu i telewizji. Przeznaczyła na ten cel maksymalny budżet w wysokości 16000 dolarów. 30-sekundowa reklamówka radiowa (oznaczymy ją symbolem xi) kosztuje 800 dolarów, a minimalny kontrakt obejmuje pięciokrotne nadawanie. Reklamy telewizyjne
Przykłady podane w poprzednim podrozdziale zawierały dwie zmienne decyzyjne i dwa warunki ograniczające. Dla n zmiennych decyzyjnych i m warunków ograniczających ogól na postać zagadnienia programowania liniowego jest taka sama — jej głównymi składnikami są: liniowa funkcja celu, układ warunków ograniczających w postaci nierówności liniowych oraz układ warunków nieujemności. Ogólne zagadnienie liniowe z n zmiennymi można zapisać trzema sposobami: w pełnym zapisie, przy użyciu Z lub w zapisie macierzowym.
Pełny zapis Zagadnienie maksymalizacji w pełnym zapisie dla n zmiennych podlegających m ogranicze niom ma następującą postać: zmaksymalizować
n = cxx x + c2x 2 + ... + cnx n,
przy warunkach
an Xi + ai2x2 + ... + ainx n ^ rlt
(19.3)
a2ixi + a22x2+ . . . - f a ^ n ^ r ^
oraz
ów-^i -i- ów -^2 -ł- . •• "ł- a mnx n ^ rt (; = 1, 2 , ...,n).
x j^ 0
W (19.3) zastosowaliśmy symbol /r, zapożyczony z przykładu dotyczącego produkcji, na oznaczenie funkcji maksymalizowanej, chociaż w wielu przypadkach funkcja celu nie musi być funkcją zysku. Zmienne decyzyjne oznaczamy.symbolem Xj (dla j = 1, 2, n), a ich współczynniki w funkcji celu — stanowiące zbiór danych stałych — symbolem Cj (dla7 = 1,2,...,«). Symbole rf- (/ = 1,2,..., m) — również ustalone— reprezentują nałożone na zagadnienie warunki ograniczające. Dla ujednolicenia wszystkie warunki ograniczające zapisaliśmy w postaci nierówności ^ . Nie powoduje to jednak zmniejszenia ich ogólności, bowiem warunki zapisane jako nierówności ^ można przekształcić do postaci mnożąc obie strony przez -1. Współczynniki przy zmiennych decyzyjnych w warunkach ograniczają cych oznaczono symbolami a ijt a ich podwójne indeksy pokazują, w którym miejscu znajduje się dany współczynnik. Ponieważ w sumie mamy m warunków ograniczających nałożonych 42 — Podstawy....
658 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE 659
na n zmiennych (gdzie m może być większe, równe lub mniejsze od ń), więc współczynniki Wy tworzą macierz prostokątną o wymiarze m x n . Zagadnienie minimalizacji można analogicznie zapisać w pełnej postaci: zminimalizować przy warunkach
a2iX i+ a 22 X2 + . i . + a ^ n ^ r2, a ml -Tl "ł" Xj 5= 0
oraz
"i" ••• amnXn ^ Tmt (7 = 1, 2 ,..., w).
Xi
«11
«12
*2
«21
«22
;
C = ciXi + c2*2 + ••• + Wu-jci + w12x2 + ... + alnx n ^ > 1,
(19.4)
Cl Ci
.
x=
- Cn_
;
A=
_x n _
.. -
«In
n
a 2n
ri
; «m l
«m2
am n
„
r
=
-
Tm_
Trzy spośród nich są wektorami kolumnowymi: c i x mają wymiary n x l, a r ma wymiar m x 1. Macierz A ma wymiar m x n. Po przyjęciu tych definicji funkcja celu z (19.3) może być zapisana w postaci równania: 7t= c' : x,
(1 xn) (n x 1)
Z zadania dotyczącego diety zapożyczyliśmy symbol C jako ogólne oznaczenie funkcji minimalizowanej, chociaż funkcja celu wcale nie musi być funkcją kosztu. Symbole ej w funkcji celu reprezentują dane stałe współczynniki, podobnie jak r, w warunkach ograniczających, ale symbol r oznacza w tym przypadku zapotrzebowanie, a nie ograni czenie. Symbolika dla zmiennych decyzyjnych i współczynników w warunkach ograniczają cych pozostała nie zmieniona. Warunki ograniczające mają teraz postać nierówności ^ .
gdzie iloczyn wektorów c' i x ma wymiar 1x1, więc jest skalarem. Zapis macierzowy jest bardzo wygodny w przypadku występowania m warunków ograniczających, gdyż cały układ warunków np. z (19.3) można zapisać w postaci jednego równania: A
x ^
(m xń) (nx 1)
r.
(m x l)
Znak nierówności1 należy tu interpretować jako oznaczający nierówności dla każdego elementu, tzn. i-ty wiersz macierzy Ax jest mniejszy lub równy i-temu elementowi macie rzy r dla każdego i. Podobnie można wyrazić n warunków nieujemności za pomocą pojedynczej nierówności:
Zapis X Istotną oszczędność zapisu można osiągnąć, stosując w zagadnieniach programowania liniowego (19.3) i (19.4) symbol 2:
x 5* 0 .
(n x 1)
(n x 1)
.
W sumie zagadnienie programowania liniowego (19.3) można zwięźle wyrazić .wpostaci: zmaksymalizować
n - X CjXj9
;= i
n
przy warunkach oraz
X «//*, ^ r, ;=i a;- ^ 0
(i = 1, 2 , .. ., m),
(19.30
tz = c'x,
Ax ^ r, x ^ 0.
(7 = 1, 2 , ..., ń)
Na tej samej zasadzie można sformułować zagadnienie minimalizacji (19.4) w na stępującej prostej postaci:
i podobnie: n zminimalizować
zmaksymalizować przy warunkach oraz
C = '5Lcj xj , j =i
(19.40
przy warunkach
X«iy*/^G;=i
(i = 1, 2 , ..., m),
oraz
* ,^ 0
0 = 1, 2 , ..., n).
Stwierdzenia zapisane za pomocą symbolu Z są zwięzłe, ale nie są wygodne w użyciu, nie będziemy więc ich dalej stosować.
zminimalizować przy warUnkach oraz
C = c'x, Ax ^ r, x ^ 0.
Metody rozwiązania W przypadku dwu zmiennych (n = 2) można bez trudu uzyskać rozwiązanie optymalne metodą graficzną. Jest to prawdą niezależnie od liczby warunków ograniczających, gdyż
Zapis macierzowy W celu zastosowania zapisu macierzowego zdefiniujemy najpierw następujące cztery macierze:
1 Znak nierówności ^ w odniesieniu do liczb często jest wymiennie stosowany ze znakiem = . Dla wektorów oba te znaki mogą mieć odmienne znaczenie. Omówienie ich można znaleźć w książce Kelvina Lancastera, Mathematical Economics, The Macmillan Company, Nowy Jork 1968, s. 250.
PROGRAMOWANIE LINIOWE 661
660 PROGRAMOWANIE MATEMATYCZNE
dodatkowe warunki mogą jedynie zwiększyć liczbę punktów wierzchołkowych, nie zmieniają zaś liczby wymiarów diagramu. Dla trzech zmiennych decyzyjnych metoda graficzna jest niewygodna, gdyż wymaga trójwymiarowego diagramu, Dla większej liczby zmiennych metoda graficzna kompletnie się nie nadaje. Musimy zatem poszukać innej metody rozwiązania, możliwej do zastosowania dla dowolnej liczby zmiennych. Zobaczymy, jak można logicznie rozszerzyć metodę rozwiązania zagadnienia pro gramowania liniowego, w którym występują dwie zmienne decyzyjne, na przypadek n zmiennych. Dla « = 2 naszym polem działania jest przestrzeń dwuwymiarowa (płaszczy zna). Dzięki warunkom ograniczającym i warunkom nieujemności zawężamy obszar poszukiwań do zbioru rozwiązań dopuszczalnych, który jest podzbiorem przestrzeni dwu wymiarowej. Następnie za pomocą funkcji celu odnajdujemy pewien szczególny punkt (x Y,x2) tego podzbioru, stanowiący rozwiązanie optymalne. Dla ogólnego przypadku « zmiennych musimy działać w przestrzeni «-wymiarowej, w której każdy punkt reprezentuje «-tkę uporządkowaną (xu x 2, ..., x n) lub wektor «-wymiarowy. Warunki nieujemności ograniczają nas do nieujemnego ortantu («-wymiarowego analogonu ćwiartki nieujemnej), a warunki ograniczające określają pewien podzbiór nieujemnego ortantu jako zbiór rozwiązań dopusz czalnych. Możemy w końcu, za pomocą funkcji celu, zlokalizować pewien punkt w zbiorze rozwiązań dopuszczalnych jako rozwiązanie optymalne (Jći, x2, ..., x n). Jak już wcześniej powiedziano, rozwiązanie optymalne zawsze występuje w jednym z punktów wierzchołkowych zbioru rozwiązań dopuszczalnych — w dalszym ciągu wyjaśnimy, że jest to prawdą również dla przypadku «-wymiarowego. Wobec tego zamiast znajdować cały zbiór rozwiązań dopuszczalnych, wystarczy, abyśmy mieli metodę wy znaczania zbioru wszystkich punktów wierzchołkowych, spośród których możemy wybrać rozwiązanie optymalne. Wniosek ten jest oparty na tym, że niezależnie od liczby zmiennych decyzyjnych zbiór rozwiązań dopuszczalnych w zadaniu programowania liniowego jest zawsze domkniętym zbiorem wypukłym.
19.3 ZBIORY WYPUKŁE I PROGRAMOWANIE LINIOWE Zbiór wypukły, zdefiniowany wcześniej w podrozdz. 11.5, jest to zbiór punktów o tej własności, że jeśli u i v są dwoma punktami tego zbioru, to dowolna wypukła kombinacja u i v również należy do zbioru. Symbolicznie, zbiór S jest zbiorem wypukłym, czyli: u€ S] W e ^’
gdzie w = 0u + (l - 6 )v
(0 ^ 6 «£ 1).
Zbiory wypukłe często pojawiają się w programowaniu liniowym. Rozważmy na przykład funkcję celu, która dla każdej konkretnej wartości n (lub C) przyjmuje jedną z następujących postaci ogólnych:
(19.6)
przestrzeń dwuwymiarowa:
7t0 = CiXi + c2x2,
przestrzeń trójwymiarowa:
n 0 = 0i*i + c2x2 + c3x3i
przestrzeń «-wymiarowa:
k0 =
[co daje prostą] [co daje płaszczyznę]
ci*i + c2x2 + . . . cnxn.
[co daje hiperpłaszczyznę]
Proste i płaszczyzny, będące szczególnymi przypadkami hiperpłaszczyzn, są zbiorami wypukłymi. Nie jest trudno wykazać, że hiperpłaszczyzna w przestrzeni «-wymiarowej również jest zbiorem wypukłym. Nazwijmy zbiór punktów określonych wzorem (19.6) zbiorem H\ wtedy każdy punkt zbioru H będzie leżał na hiperpłaszczyźnie określonej wspomnianym równaniem2. Jeśli wybierzemy dowolne dwa punkty u i v zbioru H o współrzędnych (uu u2, . . . , u n) i (vi,v2, . . . , v n), to ze względu na to, że współrzędne te spełniają równanie (19.6) — po podstawieniu w, oraz v,- zamiat x t — muszą być prawdą stwierdzenia: 'V
Ćwiczenie 19.2
7 r0 = C iU i +
C2 U2 +
...
+ C n Mn ,
(19.7) 1. Czy m warunków ograniczających w (19.3) można zapisać w następujący sposób: an
012 022
a 2l Xl + _ ^ml
_
0/n2 _
n
01* X2 + . . , . +
02 n
&mit _
r
r2
^
.
r m_
Ko = c 1v l + c2v2+ ... cnvn.
W bardziej zwięzłym zapisie macierzowym można to wyrazić jako: (19.7') 7i0 = c'u ^ i 7i0 = c'v. Aby udowodnić, że zbiór H jest wypukły, trzeba pokazać że w — dowolna liniowa kombinacja u i v — spełnia (19.6), czyli że możemy zapisać 7T0 = c'w. Dowód jest dość
2. Czy funkcja celu w (19.3) może być zapisana w postaci iloczynu wewnętrznego? 3.
Przypuśćmy, że pierwsze ograniczenie w (19.4) jest równaniem au x i + ... + ainxn = r\. Pokazać, że zastępując to równanie dwiema odpowiednio dobranymi nierównościami, możemy zachować sposób zapisu wszystkich warunków ograniczających w postaci nierówności
2 Formalna definicja zbioru/i ma postać wyrażenia:
H={(*i, *2,
Xo = ciXi + ...+ c nxn}
lub w zapisie wektorowym: # = { x : / r 0 = c'x}.
[z (19.5)]
Zbiór H (hiperpłaszczyzna) może być określony w prostszy sposób wzorem (19.6) lub jego wersją wektorową 7T0 = c'x.
662
PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE 6 6 3
prosty. Ponieważ:
,
•
c'w = c '[ 0 u + (1 - 0 )v] = c ' 0 u + c '( l~ 0 ) \ = [rozdzielność] = 0 c'u + (1 - 9 ) ć \ = [mnożenie przez liczbę jest przemienne]
= 0;ro+ (l-0)>ro=
;
[z (19.701
= 7Zq,
i
c'x ^ 9
pierwsza z nich określa otwartą półprzestrzeń leżącą po jednej stronie hiperpłaszczyzny c'x = 9, a druga określa domkniętą półprzestrzeń zawierającą punkty tej hiperpłaszczyzny i punkty leżące po jej przeciwnej stronie Wobec tego każdy warunek ograniczający w (19.3) i (19.4) definiuje domkniętą półprzestrzeń. Każdy warunek nieujemności również określa domkniętą półprzestrzeń, gdyż nierówność (powiedzmy) Xi ^ 0 jest po prostu szczególnym przypadkiem warunku: (19.8)
an xi + an x2 + ...+ a inxn ^ rx\
gdzie an = 1, a pozostałe współczynniki (w tym także r j są równe zeru. Każda z tych półprzestrzeni jest zbiorem wypukłym. Prawdziwość tego ostatniego stwierdzenia jest całkiem oczywista dla przestrzeni dwuwymiarowej. Na rys. 19.1 widać, że zbiór punktów leżących na granicy wyznaczonej przez warunek lub po jej prawej stronie jest zbiorem wypukłym, gdyż odcinek łączący dowolne dwa punkty tego zbioru również musi do niego należeć. Pokażemy teraz, że domknięta półprzestrzeń w przestrzeni n-wymiarowej również jest wypukła. Rozważmy domkniętą półprzestrzeń określoną nierównością (19.8), którą można w zapisie wektorowym wyrazić jako: (19.8')
ą'w = a '[ 0 u + (1 - 0 )v] = 0 a'u + (l - 0 )a'v. Na podstawie (19.9) jest jasne, że:
więc wypukła kombinacja w należy do zbioru H, dla dowolnej wartości 6 z przedziału domkniętego (0, 1). Zatem zbiór H jest rzeczywiście wypukły. Hiperpłaszczyzna zawsze dzieli przestrzeń n- wymiarową; w której jest zawarta, na dwie półprzestrzenie. Na przykład w przypadku dwuwymiarowym linia prosta dzieli płaszczyznę współrzędnych na dwie dwuwymiarowe półpłaszczyzny leżące po obu stronach prostej —jak widzieliśmy na rys. 19.1 i 19.2. Podobnie przestrzeń n-wymiarową można podzielić na dwie n-wymiarowe półprzestrzenie, ale potrzebna jest do tego hiperpłaszczyzna. Zależnie od tego, czy hiperpłaszczyznę dołączymy do rozpatrywanej półprzestrzeni, czy też nie, otrzymujemy domkniętą lub otwartą półprzestrzeń. Na przykład w przypadku nierówności: c'x < 9
Niech w = 0 u + ( l - 0 ) v oznacza wypukłą kombinację u i v. Jeśli pokażemy, że w spełnia również (19.8'), to rozważana półpłaszczyzna będzie musiała być wypukła. Tworzymy zatem iloczyn wektorów:
a'x 5* ri,
gdzie
a'w ^ 0rx+ ( 1 - 0)rv
czyli
a'w ^ n ,
a zatem wypukła kombinacja w, podobnie jak u i v, również spełnia (19.8'). Dowodzi to, że domknięta półprzestrzeń w przestrzeni n-wymiarowej jest (domkniętym) zbiorem wypukłym. Rozumując w ten sam sposób, możemy wykazać, że zbiór rozwiązań dopuszczalnych zagadnienia programowania liniowego jest domkniętym zbiorem wypukłym. Zauważmy najpierw, że zbiór rozwiązań dopuszczalnych zawsze stanowi część wspólną (m + ń) domkniętych zbiorów wypukłych. W ogólnym przypadku każdy punkt należący do zbioru rozwiązań dopuszczalnych musi z definicji spełniać jednocześnie m + n liniowych nierówno ści (nieostrych): m warunków ograniczających i n warunków nieujemności. Punkt ten musi więc być elementem jednocześnie m + n domkniętych półprzestrzeni, tzn. musi być punktem należącym do części wspólnej tych m + n domkniętych zbiorów wypukłych. Można zatem — na podstawie następującego twierdzenia —- wywnioskować, że zbiór rozwiązań dopusz czalnych jest domkniętym zbiorem wypukłym: Iloczyn skończonej liczby zbiorów wypukłych jest zbiorem wypukłym; jeśli każdy z tych zbiorów jest domknięty, to ich iloczyn również jest domknięty. Istotę tego twierdzenia można zobaczyć na rys. 19.4, gdzie narysowano dwa zbiory wypukłe; zbiór S (kwadrat) i zbiór T (trójkąt). Ich część wspólna S n T, najbardziej zaciem niona, jest oczywiście również wypukła. PonadtoJeśli i 5, i T są domknięte, to S n T również będzie domknięte, ponieważ punkty brzegowe części wspólnej, która jest po prostu podzbiorem punktów brzegowych 5 i T , należą do części wspólnej obu zbiorów3.
a 's [an a l2... aln].
Niech u i v będą dwoma dowolnymi punktami tej półprzestrzeni. Ponieważ u i v spełniają (19.8), więc: a'u 5= n
i
a'v Ss n .
[por. (19.7')]
Rysunek 19.4
Ponadto możemy wnioskować, że dla dowolnego skalara 0 ^ 6 ^ 1: (19.9)
0a'u=ss0ri
i
(1 - 0)a'v ^ (1 - 0 ) n .
3 Zauważmy jednak, że suma dwu zbiorów wypukłych nie musi być wypukła. Na rys. 19.4 suma dwu zbiorów S i T składa się z całego przyciemnionego zbioru, który oczywiście jest wcięty.
PROGRAMOWANIE LINIOWE 6 6 5
6 6 4 PROGRAMOWANIE MATEMATYCZNE
Punkty ekstremalne i rozwiązania optymalne Efektem poprzednich rozważań są następujące wnioski: 1) dla każdej ustalonej wartości n (lub Q funkcja celu zagadnienia programowania liniowego dla « zmiennych zawsze definiuje hiperpłaszczyznę, która jest domkniętym zbio rem wypukłym, v 2 ) zbiór rozwiązań dopuszczalnych, który jest częścią wspólną m + n domkniętych półprzestrzeni, jest również domkniętym zbiorem wypukłym — nazwijmy go zbiorem F. Oba wnioski powiążemy teraz ze sób^. v . Najpierw musimy rozróżnić pojęcia: punkty wewnętrzne, punkty brzegowe i punkty wierzchołkowe. Rozróżnienie pomiędzy punktami brzegowymi i punktami wewnętrznymi jest intuicyjnie oczywiste. Na rys. 19.4 punkty jeżące na czterech bokach kwadratu są punktami brzegowymi zbioru S , a punkty kwadratu nie leżące na bokach są punktami wewnętrznymi. Formalnie, brzegowy punkt b dowolnego zbioru S jest zdefiniowany w ten sposób, że każde otoczenie punktu b, jakkolwiek małe, musi zawierać jeden lub więcej punktów nie należących do zbioru S. Punkt wewnętrzny zbioru S ma tę własność, że dostatecznie małe otoczenie4 punktu w będzie zawierać tylko punkty należące do zbioru S . Jeśli chodzi o punkty wierzchołkowe, to są one szczególnym przypadkiem punktów brzegowych. Dokładniej, punkt wierzchołkowy jest to punkt brzegowy, który nie leży na odcinku łączącym dwa różne punkty zbioru. To znaczy, że punkt wierzchołkowy jest to punkt, którego nie można zapisać w postaci wypukłej kombinacji liniowej dwu punktów zbioru. Na rys. 19.4 cztery wierzchołki kwadratu są punktami wierzchołkowymi, a wszystkie pozostałe punkty kwadratu nimi nie są. W sumie dla danego zbioru S zbiór wszystkich punktów wierzchołkowych zbioru S jest podzbiorem zbioru wszystkich punktów brzegowych zbioru S. Zbiory wszystkich punktów brzegowych i wszystkich punktów wewnętrznych są rozłączne. Przy optymalizacji staramy się „przesunąć’’ hiperpłaszczyznę funkcji celu — zmieniając wartość /r lub C — tak, aby osiągnąć najwyższe możliwe położenie (odpowiadające ft) lub najniższe możliwe położenie (odpowiadające Ć), wciąż pozostając w zbiorze F. Gdy osiągnięto położenie optymalne, wówczas H — optymalna hiperpłaszczyzna — nie może zawierać wewnętrznych punktów zbioru F, gdyż gdyby tak było, moglibyśmy „popchnąć” ją dalej i osiągnąć lepsze położenie. Zatem tylko punkty brzegowe zbioru F mogą należeć do iloczynu H r \F . Prowadzi to do pojęcia hiperpłaszczyzn podpierających. Hiperpłaszczyzna podpierająca (np. H) jest to hiperpłaszczyzna, która ma jeden lub więcej punktów wspólnych ze zbiorem wypukłym (F), ale jest tak położona, że zbiór F leży po jednej stronie H. Na rys. 19.5 pokazano przykłady takiej sytuacji w przypadku zbiorów dwu- i trójwymiarowych. Na diagramie (a) przykładami hiperpłaszczyzn podpierających (w tym przypadku prostych) są proste 1, 2 i 3. Linia 1 i linia 2 mają po jednym punkcie wspólnym z wielokątem F, a linia 3 ma wiele punktów wspólnych. We wszystkich trzech przypadkach zbiór F leży po jednej stronie prostej podpierającej; w rezultacie tylko punkty brzegowe zbioru F mogą należeć do tych prostych. Zwróćmy uwagę na to, że każda prosta podpierająca zawiera przynajmniej jeden punkt wierzchołkowy zbioru F, taki jak/, g i h. 4 Gdy stosujemy tu pojęcie otoczenia, musimy pamiętać o wymiarze przestrzeni, w której zdefiniowany jest rozpatrywany zbiór. Na przykład na rys. 19.4, ponieważ zbiory są zdefiniowane w przestrzeni dwuwymiarowej, każde otoczenie musi być dwuwymiarowe.
Ilustracja na diagramie (b) dla przestrzeni trójwymiarowej jest podobna, tyle że prostą podpierającą zastąpiła płaszczyzna podpierająca. Część wspólna H i F (który jest tym razem bryłą wielościenną) może składać się jedynie z punktów brzegowych F; w pokazanym przykładzie część wspólna składa się z jednego punktu (n) i punkt ten jest punktem wierzchołkowym zbioru F.
Rysunek 19.5
W ogólnym przypadku przestrzeni «-wymiarowej istota naszych rozważań dotyczących rys. 19.5 jest zawarta w następujących dwu twierdzeniach: Twierdzenie I. Dla danego punktu w, punktu brzegowego domkniętego zbioru wy pukłego, istnieje przynajmniej jedna hiperpłaszczyzna podpierająca przechodząca przez punkt«. Twierdzenie DL Dla domkniętego zbioru wypukłego ograniczonego z dołu istnieje przynajmniej jeden punkt wierzchołkowy w każdej hiperpłaszczyźnie podpierającej. Znaczenie tych twierdzeń dla programowania liniowego jest oczywiste. Gdy osiągamy rozwiązania optymalne, wówczas hiperpłaszczyzna^ dla funkcji celu — reprezentująca optymalną powierzchnię stałego kosztu lub stałego żysku — będzie hiperpłaszczyzną podpierającą. Zgodnie z twierdzeniem I każdy punkt brźegowy zbioru rozwiązań dopuszczal nych jest potencjalnym rozwiązaniem optymalnym. Ale twierdzenie II ogranicza zagadnienie umożliwiając nam skupienie uwagi na punktach wierzchołkowych , wtedy bowiem (chociaż mogą istnieć punkty brzegowe nie będące wierzchołkami i należące do tej samej hiperpłaszcżyzny podpierającej) odpowiada im ta sama wartość ;r(lub Ć), ćo i punktom wierzchołkowym należącym do tej samej hiperpłaszczyzny. Nie są one zatem lepsze niż punkty wierzchołkowe i mogą być bez szkody pominięte. Aspekt ten jest wykorzystany w metodzie simpleks rozwiązywania zagadnienia pro gramowania liniowego dla « zmiennych, opracowanej pierwotnie przez George’a B. Dantżiga5*którą omówimy w następnym podrozdziale. Simpleks jest to rodzaj «-Wymiarowego
5 George B. Dantzig, Maximization oj a Linear Function o f Variables Subject to Linear Inèqualities. W: Tjalliiig C. Koopmans (éd.), Activity Analysis o f Production and Allocation, John Wiley & Sons Inc., NoWy Jork 1951, s. 339-347. -
6 6 6 PROGRAMOWANIE MATEMATYCZNE
odpowiednika trójkąta, z wierzchołkami jako punktami wierzchołkowymi. Metoda simpleks stanowi systematyczną procedurę polegającą na przechodzeniu od jednego punktu wierzchoł kowego zbioru rozwiązań dopuszczalnych do następnego, aż do osiągnięcia rozwiązania optymalnego. Możliwość ograniczenia pola wyboru jedynie do punktów wierzchołkowych stanowi jedną z cech odróżniających programowanie liniowe od klasycznych zagadnień optymalizacji.
PROGRAMOWANIE LINIOWE 6 6 7
istnieje para rozwiązań optymalnych pewnego zagadnienia programowania liniowego (dwa rozwiązania jednakowo optymalne), to każda ich wypukła kombinacja, czyli średnia ważona, również musi być rozwiązaniem optymalnym.
19.4. METODA SIMPLEKS: ZNAJDOWANIE PUNKTÓW WIERZCHOŁKOWYCH
Optimum lokalne a optimum globalne Inną ważną cechą programowania liniowego, odróżniającą je od zagadnień klasycznej optymalizacji, jest to, że każde optymalne rozwiązanie wyznacza optimum, które nie jest jedynie lokalne, lecz globalne (absolutne). Powód tego zjawiska wyjaśnia następujące twierdzenie (o globalności), które podaje dostateczne ■ — chociaż nie konieczne — warunki, przy których optimum lokalne będzie również stanowiło optimum globalne.
Rozwiązanie optymalne zagadnienia programowania liniowego można znaleźć wśród punk tów wierzchołkowych. Jeśli dany jest zbiór rozwiązań dopuszczalnych F , który można narysować, to znalezienie jego punktów wierzchołkowych jest proste. Ale jak postąpić w przypadku n zmiennych, gdy nie można posłużyć się rysunkiem? Zbadajmy ponownie punkty wierzchołkowe na płaszczyźnie, aby znaleźć jakieś wskazówki.
Zmienne niedoboru i nadmiaru Jeśli zbiór rozwiązań dopuszczalnych F jest domkniętym zbiorem wypukłym i jeśli funkcja celu jest ciągłą wklęsłą funkcją (lub funkcją wypukłą) na całym zbiorze rozwiązań dopuszczalnych, to: (a) każde maksimum lokalne (albo minimum lokalne) będzie również maksimum globalnym (minimum globalnym) oraz (b) punkty zbioru F, w których funkcja przyjmuje wartość optymalną, stanowią zbiór wypukły. Jeśli funkcja celu jest ściśle wklęsła (wypukła) na zbiorze rozwiązań dopuszczalnych, to maksimum globalne (minimum globalne) będzie jednoznaczne.
Punkty wierzchołkowe na rys. 19.1 i 19.2 należą do trzech podstawowych rodzajów. Zostały odpowiednio pokazane na rys. 19.6, na którym powtórnie przedstawiono zbiór rozwiązań dopuszczalnych z rys. 19.2(b). *2 li Granica dla mieszania (drugi warunek)
Istota twierdzenia została już wcześniej zilustrowana na rys. 11.5/ Jego znaczenie w obecnej sytuacji polega na tym, że teraz warunki dostateczne dla globalności optimum są spełnione w programowaniu liniowym, co nie było prawdą dla klasycznej optymalizacji. Udowodniliśmy, że zbiór rozwiązań dopuszczalnych w programowaniu liniowym zawsze jest domkniętym zbiorem wypukłym. Ponadto, ponieważ funkcja celu jest ciągła i liniowa względem wszystkich zmiennych, więc można ją traktować jako funkcję wklęsłą lub wypukłą, zależnie od tego, czy zagadnienie dotyczy maksymalizacji czy minimalizacji. Warunki dostateczne sformułowane w twierdzeniu są więc rzeczywiście spełnione i każde znalezione rozwiązanie optymalne będzie globalne, zgodnie z częścią (a) tezy twierdzenia. Aby zrozumieć część (b) tezy twierdzenia, przyjrzyjmy się ponownie rys. 19.5. Jeśli rozwiązanie optymalne zagadnienia programowania liniowego występuje w pojedynczym punkcie wierzchołkowym, takim jak punkt / na diagramie (a) lub punkt u na diagramie (b), to — na mocy konwencji— punkt ten sam w sobie stanowi zbiór wypukły, co potwierdza postulat podany w twierdzeniu. Ale co się stanie, jeśli istnieje wiele rozwiązań optymalnych? Może się to zdarzyć wtedy, gdy płaszczyzna podpierająca styka się ze zbiorem rozwiązań dopuszczal nych w więcej niż w jednym punkcie, np. wtedy, gdy prosta 3 (diagram (a)) jest prostą podpierającą lub gdy płaszczyzna podpierająca H (na diagramie (b)) pokrywa się z jedną ze ścian bryły F. W takich przypadkach zbiór wszystkich punktów optymalnych będzie 5 odcinkiem hg lub pewną ścianą boczną bryły F. Zbiór ten jest więc zbiorem wypukłym, zgodnie z tym, co powiedziano w twierdzeniu. Ze względu na to możemy być pewni, że jeśli
(8, 8)
Granica dla paczkowania (trzeci warunek)
(16.4) \ Granica dia krojenia (pierwszy warunek)
(16. 0) 6
8
10
12
14
16
Rysunek 19.6
Pierwszy rodzaj to punkty leżące na przecięciu dwu granic warunków ograniczających, np. punkty (8, 8) i (16, 4). Dwa warunki ograniczające są dla nich spełnione jako równości (są aktywne), a pozostałe są spełnione jako ostre nierówności (są nieaktywne). Na przykład dla punktu (16, 4) warunki dotyczące krojenia i paczkowania są aktywne. Warunek dotyczący mieszania nie jest aktywny, gdyż punkt (16, 4) leży poniżej granicy wyznaczonej przez ten warunek. Ponieważ niektóre warunki są nieaktywne, więc w zadaniu dotyczącym produkcji pewne
PROGRAMOWANIE LINIOWE 669
6 6 8 PROGRAMOWANIE MATEMATYCZNE
możliwości wytwórcze pozostają nie wykorzystane, a w zadaniu dotyczącym diety przyj mowana jest większa ilość pewnej substancji odżywczej, niż to wynika z minimalnych wymagań. Powstaje zatem niedobór wykorzystania możliwości (lub nadwyżka spożycia substancji odżywczych). Drugi rodzaj punktów wierzchołkowych to takie punkty, jak (0, 8) i (16,0), które leżą na przecięciu granicy wyznaczonej przez warunek z jedną z osi. Tylko ten jeden warunek jest aktywny. Można powiedzieć, że dla takich punktów występuje niedobór (lub nadwyżka) w dwu ograniczeniach. Trzeci rodzaj punktu wierzchołkowego reprezentuje początek układu współrzędnych (0, 0), dla którego żadeji warunek ograniczający nie jest aktywny. Punkt wierzchołkowy (0 , 0) występuje jedynie w zagadnieniu maksymalizacji, gdyż w zagadnieniu minimalizacji zbiór rozwiązań dopuszczalnych zazwyczaj nie zawiera — jak to widać na rys. 19.1(b) — początku układu współrzędnych. W rezultacie w rozważanym przykładzie — gdzie liczba warunków ograniczających (3) przekracza liczbę zmiennych decyzyjnych (2) — każdy punkt wierzchołkowy powoduje niedobór dla przynajmniej jednego warunku ograniczającego. Ponadto, jak widać na rys. 19.6, łatwo można obliczyć wielkość niedoboru dla każdego punktu wierzchołkowego. Gdy wybieramy pewien punkt wierzchołkowy jako rozwiązanie optymalne, wówczas podej mujemy decyzję dotyczącą nie tylko optymalnych wartości Xi i *2, lecz również optymalnych wartości niedoborów. Wartości niedoboru będziemy uwzględniać w jawny sposób; niedobór w i-tym warunku ograniczającym oznaczymy symbolem ą. Symbole st reprezentują tu zmienne niedoboru , a w zagadnieniu minimalizacji będą to zmienne nadmiaru. Łącznie nazywa się je zmiennymi dodatkowymi.
Uwzględnienie nadmiaru lub niedoboru pozwala w sposób jawny przekształcić każdą nierówność wyrażającą warunek w ścisłą równość, a co ważniejsze, prowadzi do algebraicznej metody znajdowania punktów wierzchołkowych zbioru rozwiązań dopuszczalnych.
*1 1 0
(19.11)
0
o
1 0
1 0
Si
1
Powróćmy do zagadnienia produkcji (19.2), którego zbiór rozwiązań dopuszczalnych przedstawiono na rys. 19.6. Po dopisaniu zmiennej niedoboru do każdego warunku ograniczającego i odpowiednim zmodyfikowaniu funkcji celu, to zagadnienie programowania liniowego możemy przepisać w postaci: zmaksymalizować przy warunkach (19.10)
K - 40*i + 30*2 + Oji + 0i 2 + 0s3,
*i ' x\
oraz
+ Si t2 4-2*2
+ s2
= 16, - 8, 4 ^3 = 24,
[krojenie] [mieszanie] [paczkowanie]
xu x2, ii, ś2i s3 > Q .
Trzy przekształcone warunki ograniczające można zapisać w postaci równania łnaćićrżowego:
8
24
¿3 _
Mamy tu w sumie pięć zmiennych. Zmienne niedoboru sh tak jak *i i x2, muszą być nieujemne. Jeżeli Si > 0, to w i-tym ograniczeniu występuje niedobór, a gdy st = 0, wówczas i-ty warunek ograniczający jest spełniony w postaci równania: st nie może być ujemna. Współczynniki funkcji celu przy ą są równe zeru, gdyż zmienne niedoboru nie są wliczane w zysk. Można więc je całkiem pominąć w funkcji celu. Zwróćmy uwagę, że w zagadnieniu minimalizacji (nieujemne) zmienne dodatkowe muszą wystąpić w warunkach ograniczających jako - s h Wartości zmiennych niedoboru można bardzo łatwo znaleźć dla każdego punktu wierzchołkowego. Na przykład dla punktu (0,0) do przekształconych warunków ograniczają cych podstawiamy wartości X\ = 0 i x2 - 0 i otrzymujemy sx = 16, s2 = & i s3 = 24. Zatem punkt (x \, x2) = (0 , 0) należący do dwuwymiarowej przestrzeni produktu (output space) z rys. 19.6 może być odwzorowany w punkt: (xu x2, su s2, s3) = (0, 0, 16, 8 , 24)
należący do pięciowymiarowej przestrzeni rozwiązań , co pokazano w pierwszym wierszu tabl. 19.3. Stosując tę samą procedurę, możemy sprawdzić rezultaty odwzorowania dla każdego z pozostałych czterech punktów wierzchołkowych. Tablica 19.3 Przestrzeń produktów
Przekształcone zagadnienie programowania liniowego
=
S2 -
_
16
X2
1 0
1 2 0 0
_
-V
Przestrzeń rozwiązań
(xu x2, Su s2,s 3)
(0,0)
(0 ,0 ,1 6 ,8 ,2 4 )
(16, 0)
(1 6 ,0 ,0 ,8 ,8 )
(16,4)
(16, 4, 0, 4, 0)
(8,8)
(8,8, 8, 0,0)
(0, 8)
(0,8, 16,0,8)
Zwróćmy uwagę na wyniki podane w tabl. 19.3: wszystkie punkty w przestrzeni rozwiązań, reprezentujące punkty wierzchołkowe, mają tę wspólną cechę, że dokładnie trzy współrzędne przyjmują wartości niezerowe. Nie jest to czysty przypadek, liczba „trzy” jest dokładnie liczbą warunków ograniczających w naszym zagadnieniu programowania liniowego. Aby to zrozumieć, przypomnijmy sobie nasze wsześniejsze rozważania o liczbie równań i liczbie zmiennych. Zazwyczaj, przy założeniu zgodności i niezależności, układ m równań ma rozwiązanie tylko wtedy, gdy zawiera m zmiennych. W rozważanym teraz przypadku równanie (19.11) zawiera trzy warunki ograniczające, więc nie więcej niż trzy spośród pięciu
670 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE 671
zmiennych mogą mieć niezerową wartość w rozwiązaniu6. Stanie się to jaśniejsze, gdy zapiszemy warunki w postaci równania wektorowego:
lub równoważne: 1
16 (19.110
*1 +
x2 +
s2 +
Si +
S3 =
8
0
16
0
Sl s2 =
0
1
0
0
0
1
8
24 _
24 Jeśli przyrównamy do zera dwie z pięciu zmiennych, czyli wyrzucimy dwa składniki z lewej strony (19.110, to otrzymamy układ trzech równań względem trzech zmiennych. Można wtedy otrzymać jednoznaczne rozwiązanie, pod warunkiem, że pozostałe wektory współczynników po lewej stronie są liniowo niezależne. Gdy otrzymane dla tych trzech zmiennych wartości rozwiązań połączymy z dowolnie dobranymi zerowymi wartościami pozostałych dwu zmiennych, uzyskamy piątkę uporządkowaną taką, jak w tabl. 19.3.
Bazowe rozwiązania dopuszczalne i punkty wierzchołkowe Dla opisanego powyżej procesu mogą powstać dwie możliwe sytuacje. Po pierwsze, może się pojawić rozwiązanie ujemne. Jeśli np. przyjmiemy, że Xi = s3 = 0, to ze wzoru (19.11') otrzymamy x2 = 12, s x = 16 i s2 = -4. Ponieważ stanowi to naruszenie warunków nieujemności, więc takie rozwiązanie jest oczywiście niedopuszczalne i należy je odrzucić. Graficznie to właśnie rozwiązanie niedopuszczalne reprezentuje punkt przecięcia granicy wyznaczonej przez warunek paczkowania z osią pionową, który oczywiście leży poza zbiorem rozwiązań dopuszczalnych — w jego dopełnieniu F. Po drugie, może się okazać, że wszystkie wartości rozwiązań są nieujemne. W takim przypadku rozwiązanie będzie odpowiadało jednemu z punktów wierzchołkowych zbioru rozwiązań dopuszczalnych i będzie stanowić bazowe rozwiązanie dopuszczalne BRD (basie feasible solution) zagadnienia programowania liniowego. Jest ono dopuszczalne , ponieważ należy do zbioru rozwiązań dopuszczalnych — spełnia i warunki ograniczające, i warunki nieujemności. Jest bazowe, ponieważ istnienie tego rozwiązania wynika stąd, że mamy trzy liniowo niezależne wektory współczynników tworzące bazę przestrzeni trójwymiarowej (ta przestrzeń — zwana przestrzenią zapotrzebowań (requirement space) — jest związana z warunkami ograniczającymi; jej wymiar jest określony przez liczbę ograniczeń). Ze względu na wspomnianą odpówiedniość, poszukiwanie punktów wierzchołkowych sprowadza się teraz do poszukiwania bazowych rozwiązań dopuszczalnych dla przekształconych równań wyraża jących warunki. Dla przykładu podstawmy do wzoru (19.11') wartości *i = *2 = 0. Otrzymujemy wtedy: 1
(19.12)
0 0
0 Si +
1 s2 + 0 0
16
0
1
■*3 =
8
_24_
Ponieważ macierz po lewej stronie jest macierzą jednostkową, którą można pominąć bez zmiany równania, bezpośrednio odczytujemy rozwiązanie: s'i = 16, s2 = 8 , £3 = 24. Istnienie tego jedynego rozwiązania jest gwarantowane przez liniową niezależność trzech wektorów współczynników, którymi są wektory jednostkowe generujące przestrzeń trój wymiarową (przestrzeń zapotrzebowań). Ponieważ rozwiązanie jest nieujemne, stanowi zatem bazowe rozwiązanie dopuszczalne (BRD). A ponieważ wartości rozwiązań określają punkt (0,0,16,8,24) w przestrzeni rozwiązań, czyli punkt (0,0) na rys. 19.6, więc BRD rzeczywiście odpowiada punktowi wierzchołkowemu. Przyrównywanie do zera innej pary zmiennych w (19.11') prowadzi oczywiście do całkiem nowego układu równań. Jeśli wektory współczynników również są liniowo niezależ ne, to otrzymujemy nową bazę przestrzeni zapotrzebowań i nowe BRD — pod warunkiem, że rozwiązanie jest nieujemne — które może wyznaczyć nowy punkt wierzchołkowy. Zatem przejście do nowego punktu wierzchołkowego w zbiorze rozwiązań dopuszczalnych oznacza w istocie przejście do nowej bazy w trójwymiarowej przestrzeni zapotrzebowań. Jest to istotny podstawowy fakt i będzie on wykorzystywany w dalszych rozważaniach. Ważne jest to, że metoda wyznaczania BRD jest algebraiczna, a nie geometryczna, więc można ją łatwo rozszerzyć na ogólne zagadnienia programowania liniowego o m warunkach ograniczających i n zmiennych. W takim przypadku przestrzeń zapotrzebowań będzie m-wymiarowa, a przestrzeń rozwiązań będzie miała wymiar m + n. By znaleźć BRD , trzeba przyrównać do zera n spośród m + n zmiennych w przekształconych równaniach wyraża jących warunki ograniczające; ale procedura poza tym nie różni się od prostszego przypadku zilustrowanego w (19.12).
Ćwiczenie 19.4 1. Przekształcić następujące zagadnienia programowania liniowego do postaci (19.10): (a) zmaksymalizować 7r = 3*i + 2*2 + 5*3, przy warunkach 3*i+ *2 *£ 10, x2 + 2x3 ^ 6 , oraz (b) zminimalizować przy warunkach oraz
6 Może się też zdarzyć, że mniej niż m zmiennych przyjmie wartości niezerowe w rozwiązaniu. Jest to przypadek degeneracji, który omówimy w skrócie w podrozdz. 19.6.
2 x \+ x2+ x3 ^ xl f x2fx3 ^
8, 0;
C = x i+ 6*2 + 2*3, x\ + 2x2 ^ 2, X\ + *2 + 3 * 3 ^ 12, X\, *2, *3 ^ 0.
2. Przekształcić zagadnienia programowania liniowego podane w ćwiczeniu 19.1-1 przy użyciu zmiennych dodatkowych.
6 7 2 PROGRAMOWANIE MATEMATYCZNE
3. Zagadnienia liniowe podane w powyższym zadaniu mają następujące zestawy punktów wierzchołkowych: (a) (0,0) (0,3) (2,3) (4,2) (4,0); (b) (4,0)
'■ 4y
(0, 3).
Podstawiając te wartości (*i, xj) do odpowiednich przekształconych warunków, znaleźć wartości st odpowiadające każdemu punktowi wierzchołkowemu. Wyrazić następnie te punkty wierzchołkowe jako punkty pięciowymiarowej przestrzeni rozwiązań, jak w tabl. 19.3. 4. Jeżeli punkty wierzchołkowe z poprzedniego zadania są zapisane jako piątki uporząd kowane, to ile każdy z nich zawiera elementów niezerowych? Czy ten wynik jest przypadkowy? . 5. Rozważmy koło. Niech W oznacza zbiór wszystkich jego punktów wewnętrznych, B — zbiór wszystkich jego punktów brzegowych, a E — zbiór wszystkich jego punktów wierzchołkowych. Które z następujących zdań są prawdziwe: (a) W c E ; (d) B = E; (b) B czE; (e) - W n B = 0 ; (c) E c 5 ; (f) E u W = B t! 6 . Jakie są wymiary przestrzeni zapotrzebowań i przestrzeni rozwiązań dla zagadnienia
programowania liniowego, które zawiera: (a) 7 zmiennych decyzyjnych i 3 warunki ograniczające; (b) 3 zmienne decyzyjne i 5 warunków ograniczających; (c) n zmiennych decyzyjnych i m warunków ograniczających?
19.5. METODA SIMPLEKS: ZNAJDOWANIE OPTYMALNEGO PUNKTU WIERZCHOŁKOWEGO Ustalenie punktu wierzchołkowego oznacza znalezienie bazowego rozwiązania dopuszczal nego. Ale jak znaleźć optymalny punkt wierzchołkowy i BRD? Dla zagadnienia o małej licz bie wymiarów możemy oczywiście znaleźć wszystkie bazowe rozwiązania dopuszczalne, obliczyć odpowiadające im wartości funkcji maksymalizowanej (lub minimalizowanej) i wybrać z nich wartość optymalną. Gdy mamy wiele zmiennych i ograniczeń, wymagałoby to żmudnych obliczeń. Idea metody simpleks polega na tym, aby zacząć od pewnego początkowego punktu wierzchołkowego, obliczyć wartość funkcji celu i sprawdzić, czy można tę wartość poprawić przechodząc do sąsiedniego punktu wierzchołkowego. Jeśli można, to przechodzimy do tego punktu, a potem za pomocą następnego ruchu sprawdzamy, czy możliwe jest dalsze udoskonalenie. Gdy w końcu dojdziemy do punktu wierzchołkowego, dla którego nie jest możliwa dalsza poprawa, będzie on stanowił rozwiązanie optymalne. Procedura przechodzenia od jednego do następnego wierzchołka zbioru rozwiązań dopusz czalnych przyczynia się do oszczędności obliczeń, gdyż w całej procedurze rozważamy tylko podzbiór zbioru wszystkich punktów wierzchołkowych.
PROGRAMOWANIE LINIOWE 6 7 3
Stosowaną technikę zilustrujemy na przykładzie przekształconego zagadnienia pro gramowania liniowego (19.10), które jest zagadnieniem maksymalizacji.
Tablica simpleksowa Za pomocą wzorów (19.12) i (19.12'), przyjmując *i = *2 = 0, obliczyliśmy już początkowe BRD. Otrzymaliśmy następującą piątkę w przestrzeni rozwiązań S i odpowiadającą jej wartość zysku ;Ti: (1913) •
* = (0 ,0,16,8,24), = 40 • 0 + 30 • 0 = 0.
Tę samą odpowiedź można otrzymać przy użyciu tzw. tablicy simpleksowej1 19.4. Tablica 19.4 I tablica simpleksowa Wiersz 0 1
2 3
n
*1
x 2
Sl
1 0 0 0
-4 0
—30 0 1
“1
® 0 1
2
0 0 „0
*
s2
•*3
Stała
0 0 1 0
0 0" 0 1.
ta
*
*
16 8 24
W tablicy takiej każdej zmiennej odpowiada jedna kolumna; mamy ponadto kolum nę n i kolumnę wyrazów wolnych. Włączenie kolumny n ma za zadanie uwzględnienie w tab licy zarówno informacji zawartej w funkcji celu (wiersz 0), jak i danych dla przekształconych warunków ograniczających (wiersze 1,2 i 3). Wszystkie liczby wpisane poniżej każdej zmiennej są to po prostu współczynniki tej zmiennej w odpowiednim równaniu, a liczby w ostatniej kolumnie to wyrazy wolne, nie przypisane do żadnej zmiennej. Linia pionowa na lewo od kolumny wyrazów wolnych jest w tym miejscu, w którym w równaniach powinny być znaki równości. Wiersz 0 należy zatem odczytywać jako n - 40*i - 30*2= 0, co jest po prostu inaczej pogrupowaną funkcją celu. Podobnie wiersz 1 stwierdza, że*i + Si = 16 (pierwsze ograniczenie) itd. Zauważmy, że jeśli pominiemy wiersz 0 i kolumnę /r, to pozostałe elementy tablicy są dokładnie współczynnikami z (19.11), należycie rozmieszczonymi. Zgodnie z naszymi poprzednimi rozważaniami, znalezienie BRD oznacza znalezienie pewnej bazy trójwymiarowej przestrzeni zapotrzebowań. Oznacza to, że (pomijając na razie wiersz 0 ) z trzech pozostałych wierszy musimy wybrać trzy liniowo niezależne wektory kolumnowe. Oczywisty wybór to trzy kolumny oznaczone gwiazdkami, tworzące macierz jednostkową stopnia 3. Możemy zatem wybrać jako zmienne bazowe ją, s2 i s3 i przyjąć zgodnie z tym x x - x 2- 0. Gdybyśmy pominęli kolumny dla i *2, to trzy dolne wiersze sprowadziłyby się do postaci (19.12'), co daje'(są, s2, s3) = (16, 8, 24) będące rozwiązaniem nieujemnym, a zatem stanowiące BRD * 7 Opisujemy tu zrewidowaną metodę simpleks, która różni się od metody simpleks tym, że funkcja celu jest włączona do tablicy. 43 — Podstawy...
6 7 4 PROGRAMOWANIE MATEMATYCZNE
Ponieważ nie jest wytwarzany żaden produkt, więc zysk jest równy zeru i takie bazowe rozwiązanie dopuszczalne nie jest oczywiście optymalne. Niemniej jednak w zagadnieniach maksymalizacji jest zawsze pożądane (jeśli to możliwe) przyjęcie jako BRD takiego rozwiązania, które zawiera jedynie zmienne dodatkowe niedoboru. Zmienne niedoboru jako wektory współczynników liniowo niezależnych zawsze mają wektory jednostkowe; mogą więc automatycznie utworzyć bazę. Z tablicy można także odczytać informację dotyczącą zysku. Jeśli bowiem weźmiemy pod uwagę również wiersz 0 — wciąż pomijając kolumny *1 i x2 — to tablica przekształca się w układ równań: 1 0
(19.14)
0
0
0
0
1 0
0
16
0
0
0
8
1
24
0
0
1 0
który pokazuje nie tylko wartości zmiennych niedoboru, lecz również dodatkową informację, że K\ = 0 (indeks 1 odnosi się tu do początkowego BRD). Ogólna reguła jest taka, że gdy w tablicy mamy macierz jednostkową stopnia 4 określającą BRD, tak jak w tabl. 19.4, to wartość funkcji celu związana z tym BRD może być odczytana z tablicy, podobnie jak wartość zmiennych tworzących bazę przestrzeni zapotrzebowań. Porównanie (19.14) z tabl. 19.4 pokazuje, że najwyżej położony element wektora wyrazów wolnych (zakreśliliśmy go kwadracikiem) pokazuje wartość funkcji celu, a pozostałe elementy wektora wyrazów wolnych pokazują wartości elementów bazy. Aby umożliwić uzyskiwanie informacji ó zysku, od tej pory zawsze będziemy rozważać macierz jednostkową stopnia 4, a nie 3, a w przypadku ogólnym macierz stopnia m + n, a nie stopnia m.
Iteracja Postaramy się teraz zwiększyć wartość zysku w wyniku przejścia do nowego BRD dzięki utworzeniu nowej bazy. Główną ideą iteracyjnego procesu zmiany bazy jest zastąpienie wektora, który jest w bazie, przez inny wektor kolumnowy, nie należący do bazy. Innymi słowy, musimy zastąpić zmienną bazową ($i, s2, s3) inną zmienną, która jest teraz niebazowa (*i lub x2). Jakie kryteria możemy zastosować przy wyborze wychodzących i wchodzących wektorów (lub zmiennych)? Ponieważ naszym celem jest poprawa wartości zysku, naturalne jest więc odwołanie się do funkcji celu w poszukiwaniu wskazówek. Funkcja celu w postaci zapisanej w (19.10) pokazuje, że krańcowa stopa zysku dla X\ wynosi 40 $, a dla x2 30 $. Wydaje się rozsądne, że wybranie x x jako zmiennej wchodzącej do bazy jest bardziej obiecujące, jeśli chodzi o zwiększenie zysku. W przypadku naszej tablicy oznacza to, że powinniśmy wybrać tę zmienną, której odpowiada element ujemny o największej wartości bezwzględnej występujący w wierszu 0. Odpowiednią wielkością jest tu -40, a zmienną wchodzącą do bazy jest *f, kolumnę wchodzącą do bazy nazwijmy kolumną wiodącą (pivot column). Kolumna wiodąca ma zastąpić jedną z kolumn ą . Stwarza to jednak dwa problemy. Po pierwsze, musimy zdecydować, którą z kolumn pominąć. Po drugie, musimy się zatroszczyć, aby kolumna wiodąca, jako nowy element bazy, była niezależna od kolumn pozostawionych
PROGRAMOWANIE LINIOWE 6 7 5
w bazie. Oba problemy można rozstrzygnąć łącznie, przekształcając kolumnę wiodącą w wektor jednostkowy zawierający 1 w jednym z trzech dolnych wierszy, a wszędzie poza tym zera. Zastanówmy się nad implikacją takiego przekształcenia. Jeśli przekształcona kolumna wiodąca ma jedynkę w pierwszym wierszu, czyli wygląda dokładnie tak jak kolumna s u to możemy oczywiście przyjąć, że s3 wychodzi z bazy, gdyż to zapewnia liniową niezależność wektorów bazy. Podobnie, jeśli element jednostkowy jest w wierszu 2, to przekształcona kolumna wiodąca zastępuje kolumnę s2. W ten sposób problemy wyboru zmiennej wychodzącej z bazy i zachowania liniowej niezależności wektorów mogą być zawsze rozstrzygnięte jednocześnie. ^ Pozostaje podjęcie decyzji co do umieszczenia elementu jednostkowego w kolumnie wiodącej. Dla wygody element kolumny wiodącej, który ma być równy 1, będziemy nazywać elementem wiodącym. Przy wyborze elementu wiodącego należy pamiętać, aby pozostawać w ramach ograniczeń wydajności trzech zakładów. Jeśli przyjmiemy jako element wiodący element wiersza 3, to kolumna x { po przekształceniu będzie identyczna z obecną kolum ną ¿3. Oznacza to, że zmienna x\ zastąpi zmienną s3 w drugim BRD i — jak widać z (19.14) — wartością x t otrzymaną w rozwiązaniu będzie x2 = 24 (zastąpi ona s3 = 24). Jed nak zgodnie z (19.10) taka wielkość produkcji będzie naruszać warunek ograniczający dotyczący krojenia, a zatem jest niedopuszczalna. Można również patrzeć na to w ten sposób, że jeśli *i zastąpi s3, to nowa tablica będzie zawierać w kolumnie wyrazów wolnych i w pierwszym wierszu liczbę ujemną. Otrzymane rozwiązanie nie jest więc rozwiązaniem dopuszczalnym i musi być wykluczone. Jeśli natomiast jako element wiodący wybierzemy element wiersza 1 (zaznaczony kółeczkiem), to zmienna *i w otrzymanym rozwiązaniu będzie równa x x = 16 (co zastąpi Si = 16). Ponieważ ten (niższy) poziom produkcji nie narusza żadnego warunku ograniczającego podanego w (19.10), możemy zatem zaakceptować zaznaczony element (1) jako element wiodący. W tym przypadku wszystkie elementy w kolumnie wyrazów wolnych nowej tablicy będą nieujemne. Zauważmy, że nie musimy się martwić tym, że w drugim wierszu występuje element 0 (w kolumnie wiodącej); element ten oznacza, że zmienna x x nie występuje w drugim warunku ograniczającym, więc wprowadzenie *i do bazy nie napotyka żadnych przeszkód ze strony drugiego warunku. Omówione właśnie kwestie dotyczące warunków ograniczających można w pełni uwzględnić, jeśli element wiodący będzie wybierany zgodnie z następującą procedurą: 1) wybieramy te elementy kolumny wiodącej — ze wszystkich wierszy prócz 0 — które są dodatnie, 2) dzielimy każdy z nich przez odpowiadający mu element kolumny wyrazów wolnych, 3) porównujemy otrzymane ilorazy, które możemy nazwać ilorazami wyjścia, i wybiera my wiersz, w którym iloraz jest najmniejszy, jako wiersz wiodący, 4) wybieramy element na przecięciu kolumny wiodącej i wiersza wiodącego jako element wiodący. Wybierając w kryterium wyjścia najmniejszy iloraz, gwarantujemy tym samym, że wzrost produkcji (*i) będzie na tyle mały, aby pozostawać w ramach wyznaczonych przez warunki ograniczające i aby żadna zmienna nie naruszała warunków nieujemności. W oma16 wianym przykładzie kryterium wyjścia sprowadza się do porównania dwu takich ilorazów: — 24 i — . Ponieważ pierwszy z nich jest mniejszy, więc pierwszy wiersz jest wierszem wiodącym, a element ( 1) zakreślony kółeczkiem jest elementem wiodącym.
6 7 6 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE 6 7 7
Naszym następnym zadaniem jest przekształcenie wektora wiodącego w wektor jednostkowy, poprzez nadanie elementowi wiodącemu wartości 1, a innym jego elementom wartości 0 . W naszym przykładzie element wiodący jest równy 1, więc nic nie trzeba z nim robie. W ogólnym przypadku, jeśli element wiodący jest równy pewnej liczbie k, to możemy go przekształcić w 1, dzieląc przez ¿wszystkie elementy wiersza wiodącego, również element kolumny wyrazów wolnych (sprowadza się to do podzielenia wszystkich elementów równania wyrażającego warunek ograniczający przez tę samą stałą). Nowa wersja wiersza wiodącego będzie następnie służyć do przekształcenia pozostałych wierszy do pożądanej postaci — z zerami w kolumnie wiodącej. Element wiersza drugiego, równy 0, nie wymaga przekształceń. Natomiast element -40 w wierszu 0 należy wyzerować. Osiągamy to, dodając do wiersza zerowego pomnożony przez 40 wiersz wiodący, czyli wiersz 1 zawierający jedynkę (sprowadza się to do dodawania do jednego równania stałej wielokrotności innego równania, co nie narusza równości). Podobnie, aby wyzerować ele ment 1 w wierszu 3, możemy odjąć wiersz wiodący (czyli wiersz 1) od wiersza 3. Wyniki podano w tabl. 19.5, która zawiera nową tablicę simpleksową.
(1916)
Następny krok iteracyjny W wierszu 0 tablicy simpleksowej II występuje składnik -3 0 związany ze zmienną x 2. Ponieważ ujemny element w wierszu 0 oznacza dodatnią krańcową stopę zysku, więc można zwiększyć zysk, jeśli zmienna x2 zostanie wprowadzona do bazy zamiast zmiennej, dla której stopa zysku jest zerowa lub ujemna. Przyjmujemy więc kolumnę x2 jako następną kolumnę wiodącą. Jako wiersz wiodący wybieramy wiersz 3, gdyż najmniejszy iloraz w kryterium wyjścia to: mtn m j y , y j = min {8, 4} = 4,
Wiersz
n
*i
*2
Si
s2
*3
0 1
1 0 0 0
0 1 0 0
-3 0 0 1
40 1 0 -1
0 0 1 0
0 0 0 1
3
©
Stała
■ [640} 16 8 8
Jeśli pominiemy kolumny x2 i su to tablica simpleksowa II będzie reprezentowała następujący układ równań:
(19.15)
10 0 0 0 1 0 0
Xl
640 16
0
s2
8
0
1 0
0 0 0 1
■. . 1
W porównaniu z Si zysk jest znacznie większy (640, a nie 0). Z punktu widzenia danych umieszczonych w tabl. 19.3, przeszliśmy od pierwszego do drugiego punktu wierzchoł kowego.
Tablica 19.5 II tablica simpleksowa
2
= 0 6 .0 .0 .8 .8 ). #2 = 640.
n
8
z którego z łatwością można odczytać wartości rozwiązań dla czterech zmiennych, ponieważ macierz jednostkową występującą po lewej stronie można pominąć. Pojawienie się macierzy jednostkowej oczywiście nie jest przypadkowe, gdyż procedura przekształceń prowadzących do rozwiązania (19.15) jest w istocie procedurą rozwiązywania układu równań za pomocą odwracania macierzy. Zamiast wyznaczać macierz odwrotną, przeszliśmy tu bezpośrednio do macierzy jednostkowej AA-1 = 1. W istocie bezpośrednio z kolumny wyrazów wolnych zamieszczonej w II tablicy simpleksowej można odczytać rozwiązanie bez zapisywania (19.5). W kolumnie k jedno stkowy element tego wektora jednostkowego występuje w wierszu 0. Wobec tego stała w wierszu 0 jest równa wartości rozwiązania dla n, podobnie jak dla zmiennych x it s2 i s3 w nowej bazie. Kolumny x 2 i su nie zawierające wektorów jednostkowych, nie należą do bazy i wartości rozwiązań są dla nich równe zeru. Zatem drugie bazowe rozwiązanie dopuszczalne implikuje:
a zatem elementem wiodącym jest 2 , co oznaczyliśmy kółkiem. Aby przekształcić elementy w kolumnie x2 w 0, 0, 0 i 1 (w tej właśnie kolejności), musimy: 1) dodać wiersz 3 (wiersz wiodący) pomnożony przez 15 do wiersza 0, 2) pozostawić wiersz 1 bez zmian, 3) odjąć od wiersza 2 wiersz 3 pomnożony przez —, ■ V ■ •• z 4) podzielić wiersz 3 przez 2. Czytelnik zechce przeprowadzić te operacje i sprawdzić wyniki z danymi m tablicy simpleksowej 19.6. x . . .
Tablica 19.6 m tablica simpleksowa Wiersz it
*2
0 1
0
0 1
0 0
2
0
0
0
3
0
0
1
Si
S2
25
0 0 .
1 1 2 1 ■ -9 —
2
1 0
s3
Stała
15
(7601 16
0 1 ~ 2
1 ~2
4 4
W tablicy tej kolumny i jednostkowymi wektorami odpowiadają zmiennym n y x u x2 i s2y dla których inożńą odczytać nąstępuj^ęe wartości rozwiązań: k = 760, x\ = 16, x2 = 4 (ż wiersza 3) i s2 ==4 (z wiersza 2). Możemy zatem ńapisać: (19,17)
5 s= ( 16,4,0,4,0), fc3 —760.
6 78 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE 679
Produkowane są teraz dwa wyroby, a zysk wzrósł do 760. Możemy sprawdzić w tabl. 19.3, że w drugiej iteracji przeszliśmy do nowego punktu wierzchołkowego zbioru rozwiązań dopuszczalnych. , Jesteśmy gotowi do następnej iteracji, ale ponieważ wiersz 0 tabl. 19.6 nie zawiera już elementów ujemnych, dalsze przekształcenia nie mogłyby zwiększyć zysku. Aby to sprawdzić, zapiszmy wiersz 0 w postaci równania: ^ = 760 -2 5 ^1 -1 5 ^3.'
-
4. Zmaksymalizować n = 3*i + 2*2 + 6*3, > przy tych samych warunkach, co w poprzednim zadaniu.
19.6. DALSZE UWAGI O METODZIE SIMPLEKS
.
Aby zmaksymalizować wartość k w tym równaniu, musimy przyjąć si = s3 = 0, ale w rozwiązaniu S3 mają właśnie takie wartości. Zatem S3 musi być optymalna! Jak można było oczekiwać, to rozwiązanie optymalne jest identyczne z rozwiązaniem otrzymanym metodą graficzną w podrozdz. 19.1. Spójrzmy na rys. 19.6. Widzimy, że metoda simpleks spowodowała, że przeszliśmy od początku układu współrzędnych — pierwszego punktu wierzchołkowego — do następnego punktu wierzchołkowego (16, 0), a potem do optymalnego punktu wierzchołkowego (16, 4). Zwróćmy uwagę, że otrzymaliśmy rozwiązanie bez konieczności porównywania wszystkich pięciu punktów wierzchołkowych. Zauważmy też, że dzięki temu, iż wybraliśmy kolumnę dla *i jako kolumnę wiodącą w I tablicy simpleksowej (zgodnie z kryterium krańcowej stopy zysku), doszliśmy do rozwiązania optymalnego krótszą drogą: gdybyśmy wybrali kolumnę przy x2, przeszlibyśmy najpierw do punktu (0, 8) na rys. 19.6, a potem potrzebne byłyby trzy etapy, aby dojść do punktu (16, 4).
W omawianym powyżej zagadnieniu maksymalizacji nie trzeba było szukać początkowego BRD, g dyż mieliśmy gotowe bazowe rozwiązanie dopuszczalne w początku układu współ rzędnych. Ponieważ początek układu zazwyczaj należy do zbioru rozwiązań dopuszczalnych zagadnienia maksymalizacji, więc może służyć jako początkowe BRD. Natomiast dla zagadnienia minimalizacji zbiór rozwiązań dopuszczalnych zazwyczaj nie zawiera początku układu współrzędnych, co pozbawia nas wygody startowania z punktu początkowego. Dla ilustracji przekształcamy zadanie dotyczące diety z podrozdz. 19.1 do postaci: C = 0 ,6 *i+ *2, Xl
10 4 (19.18)
przy warunkach
5 5 2
6
-1
0
0
0 -1
0
0 0 -1
oraz
1. Zmaksymalizować
tt = 4 xi
przy warunkach oraz
S2
12 _
* 1, *2, Si, s2, s3 > 0.
1
2
1
Xl
4
*2
6
macierzy współczynników w (19.18) tworzą więc macierz przeciwną do macierzy jedno stkowej. Jeśli spróbujemy podstawić * 1= * 2 = 0, to dla trzech warunków ograniczających otrzymamy rozwiązanie (su s2, s3) = (- 20 , - 20 , - 12), które oczywiście nie jest dopuszczalne. Musimy zatem podjąć poszukiwania odpowiedniego początkowego bazowego rozwiązania dopuszczalnego.
Zastosowanie sztucznych zmiennych w zagadnieniach minimalizacji
;r = 4 * i + 3 * 2 ,
i
przy warunkach
iir* ri
Jedna z metod ułatwiająca poszukiwanie początkowego BRD polega na rozszerzeniu zagadnienia przez dodanie nieujemnej sztucznej zmiennej do każdego warunku ograniczającego.Zmiennym sztucznym, oznaczonym symbolem vi9 nadaje się w funkcji celu dużfc współczynniki— duże w porównaniu ze współczynnikami przy zmiennych decyzyjnych. Jeśli nadamy im wartość 100, to będziemy mogli zapisać zagadnienie (19.18) w następujący sposób8:
r 5
3 2J[*2J
oraz
oraz
1
+ 3*2,
*1,* 2 ^ 0 .
2. Zmaksymalizować
przy warunkach
= 20
Si
Zwróćmy uwagę na to, że (nieujemne) zmienne st, reprezentujące nadwyżki (a nie niedobory), należy odjąć od lewej strony warunków ograniczających. Ostatnie trzy kolumny
Dopisać odpowiednie zmienne dodatkowe i rozwiązać następujące zagadnienia programowa nia liniowego metodą simpleks:
3. Zmaksymalizować ' V * •• ‘ • ■ •
.
20
x2
- S3
Ćwiczenie 19.5
r
L12.
*1, *2 ^ 0 . # = 6*1 + 2 *2 + 5*3, •
"2 3 f 1 0
2
.1 2
5.
Xi,*2 ,* 3
Xi *2 -*3_
0.
’ l0 " 8
.19.
8 W macierzy współczynników o wymiarze 3x8 zostawiliśmy dwie linie przerywane, aby ukazać związki między trzema grupami wektorów kolumnowych i trzema grupami zmiennych (zmienne decyzyjne, niedoboru i sztuczne).
PROGRAMOWANIE LINIOWE 681
6 80 PROGRAMOWANIE MATEMATYCZNE
zminimalizować
Tablica 19.7 Tablice simpleksowe od I do VI
C - 0,6xi + x2 + 100 (vi + v2 + v3), *1 X2
-1
(19.18')
przy warunkach
0
0 -1
0 S1
o !o
0 1
SX S2
20 =
20
S3
0
0
-1 I o
o
yr.
■12
V2 V3
oraz
X U X2 y SU
S2 y S3 ,
V l, V2, V3 ;
Ponieważ sztucznym zmiennym odpowiadają trzy liniowo niezależne wektory jedno stkowe (tworzące macierz jednostkową), podobnie jak to było dla zmiennych ą w tabl. 19.4, możemy więc wprowadzić do bazy początkowej zmienne v, bez dalszych poszukiwań. Zmienne v, — „twory” czysto matematyczne — chociaż pożyteczne jako początkowe BRD, nie mogą znaleźć się w rozwiązaniu optymalnym. Dlatego nadajemy im duże współczynniki w funkcji celu, aby zostały usunięte z bazy. Jeśli sztuczne zmienne interpretujemy jako pewne jednostki żywności, to ich współczynniki trzeba interpretować jako ceny, podobnie jak 0,6 było ceną żywności I; zatem nadanie im niezmiernie dużych wartości spowoduje, że te „sztuczne’’ rodzaje żywności będą zbyt drogie, aby je włączyć do optymalnej diety. Zapewnia to, że vx = v2 = v3 = 0 w rozwiązaniu optymalnym i powoduje, że rozsze rzone zagadnienie programowania liniowego (19.180 ma optymalne rozwiązanie równoważ ne optymalnemu rozwiązaniu wersji (19.18). Teraz można już zastosować metodę simpleks zasadniczo w taki sam sposób jak poprzednio, tylko z niewielkimi prostymi modyfikacjami. Przede wszystkim po zapisaniu zagadnienia (19.18') w formie I tablicy simpleksowej 19.7 widzimy, że kolumny v, nie stanowią jeszcze 4-elementowych wektorów jednostkowych. Dopisujemy najpierw 100 x x (wiersz 1 + wiersz 2 + wiersz 3) do wiersza 0, aby przekształcić tablicę I w tablicę U. Ponieważ ta druga tablica zawiera macierz jednostkową stopnia 4, możemy więc odczytać rozwiązanie (C, vi, v2, v3) = (5200, 20, 20, 12). Inna hiodyfikacja metody dotyczy kryterium wyboru kolumny wiodącej. Dla zagadnienia minimalizacji musimy szukać takiej kolumny — pomijając kolumnę C i kolumnę wyrazów wolnych — dla której w więrszu 0 Występuje największy dodatni élément. Uzasadnienie tęgo nowego kryterium stanie się jasne po przekształceniu wiersza 0 tablicy Ü w równanie: 8497 C = 5200 - —
- I 499 jc2+ 100 (sx + *2+ s3).
Jeśli jako zmienną Wchodzącą do baży i żastępującą zmienną sztuczną mamy wybrać jedną %pięciu zmiennych, to największe zmniejszenie kosztu spowoduje x x, gdyż ma ujem ny współczynnik o największej wartości bezwzględnej. Jednak w tablicy D zmienna jci ma Wwierszu 0 największy dodatni współczynnik i. stąd wynika powyższe kryterium, Zgodnie z tym można Wybrać kolumnę *1 jako kolumnę Wiodącą.
PROGRAMOWANIE LINIOWE 6 8 3
6 8 2 PROGRAMOWANIE MATEMATYCZNE
Wybór wiersza wiodącego w tablicy II jest dokładnie zgodny z poprzednią procedurą. Ponieważ najmniejszy iloraz jest tu równy: r . [2 0 20 mmł— , — ,
12 ) . „ • ■_ _ y ^ = m m { 2 ,4 ,6 } = 2,
'
~
więc wiersz 1jest wierszem wiodącym i (zakółkowany) element 10 jest elementem wiodącym. Przekształcając kolumnę wiodącą w kolumnę jednostkową, otrzymujemy tablicę m , z której (9006 > 2, 10, 8 . Po zastąpieniu Vi w bazie przez x u wynika rozwiązanie (C, *i, v2, v3) = 5 koszt diety znacznie się zmniejszył: z 5200 $ do nieco ponad 1800 $. Następne kroki są powtórzeniami tej samej procedury. Zwróćmy uwagę, że aby pozbyć się pozostałych dwu zmiennych sztucznych, musimy wykonać dwa następne kroki. Ponieważ wprowadzenie zmiennych Vi wydłuża proces obliczeń, powinniśmy więc starać się—jeśli jest to tylko możliwe — zmniejszyć liczbę takich zmiennych. Można to zrobić np. wtedy, gdy pierwsza kolumna macierzy współczynników zawiera elementy 0, 1 i 0 (a nie 10, 5 i 2), gdyż wtedy można pominąć v2 i jej miejsce w bazie początkowej zajmuje zmienna X\. Począwszy od tablicy n, każda kolejna w tabl. 19.7 wykazuje redukcję kosztów. Gdy 14 ; koszt spadnie do — = 2,80 w tablicy VI, możemy zobaczyć na podstawie wiersza 0, że nie jest możliwa żadna dalsza redukcja, gdyż nie ma w nim dodatnich współczynników w kolumnach dla xjy s> i v,. Naszym rozwiązaniem optymalnym jest wobec tego: (*i, *2, Ji, ¿2, £3) = (3, 1, 14, 0, 0), C = 2,80 $, co jest identyczne z rozwiązaniem graficznym otrzymanym w podrozdz. 19.1.
Inne zastosowania zmiennych sztucznych Zastosowanie zmiennych sztucznych nie ogranicza się dó zagadnień minimalizacji. Można je z pożytkiem stosować w niektórych zagadnieniach maksymalizacji. Gdy w przypadku maksymalizacji jeden z warunków ograniczających ( np. trzeci) jest ścisłą równością, nie ma potrzeby wprowadzania zmiennej £3. Ale wtedy w tablicy simpleksowej brakuje nam jednego wektora jednostkowego i tzw. gotowe początkowe BRD nie jest już osiągalne. Aby zmienić tę sytuację, wprowadzamy zmienną sztuczną v3 (do trzeciego warunku) zapełniającą puste miejsce wywołane brakiem zmiennej s3 i powodującą pojawienie się wektora jednostkowego o właściwej postaci. Oczywiście aby zapewnić usunięcie v3 z rozwiązania optymalnego, musimy tym razem nadać jej ujemny współczynnik (ujemną krańcową stopę zysku) w funkcji celu. Poza tym stosowanie metody simpleks będzie takie samo, jak poprzednio.
kombinacji wektorów współrzędnych w liczbie mniejszej niż m. Na przykład wektor po prawej stronie w (19.11') nie może być zapisany w postaci kombinacji liniowej mniej niż trzech wektorów po lewej stronie. W rezultacie każda z m zmiennych bazowych musi przyjmować wartość nieujemną i właśnie dlatego każdy punkt przestrzeni rozwiązań w tabl. 19.3 ma dokładnie trzy elementy niezerowe. Gdy ta własność nie jest spełniona, wówczas mówimy, że zagadnienie programowania liniowego jest zdegenerowane. Jeśli chodzi o metodę simpleks, jedynym przejawem degeneracji jest pojawienie się „związanych” ilorazów w kryterium wyjścia. Polega to na tym, że dwa lub więcej ilora zów mają tę samą najmniejszą wartość, więc dwa lub więcej wierszy może być wybranych jako wiersz wiodący. Oczywiście trzeba spośród nich wybrać jeden, gdyż tylko jedna zmienna może wyjść z bazy. Trzeba zatem znaleźć jakiś sposób rozwiązania tego pro blemu. ' Metoda praktyczna, aczkolwiek arbitralna, polega na wybraniu wiersza wiodącego w taki sposób, aby usunąć z bazy tę spośród związanych zmiennych, która w tablicy simpleksowej jest położona najbardziej na lewo. Po zastosowaniu tego kryterium można kontynuować procedurę simpleksową w zwykły sposób. W przypadku degeneracji zwykły krok iteracyjny nie musi wcale powodować podwyż szenia zysku lub redukcji kosztu. Może się zdarzyć, że trzeba będzie wykonać kilka iteracji, dla których zmiana funkcji celu będzie zerowa. Poza tym zastosowanie metody simpleks do przypadków degeneracji jest takie samo, jak poprzednio. Na tym zakończymy wprowadzenie do metody simpleks lub algorytmu9 simpleksowego. Proces postępowania nie jest sam w sobie trudny, ale w zagadnieniach programowania liniowego o dużych wymiarach obliczenia będą długotrwałe i męczące. Na szczęście możnaje doskonale wykonywać za pomocą komputera. Odpowiednio formułując zestaw instrukcji (tzn. dzięki odpowiedniemu oprogramowaniu komputera), możemy być pewni, że komputer wykona wszystkie kroki algorytmu simpleks w sposób niezawodny i z nadludzką prędkością. Zagadnienia o dużych wymiarach nie stwarzają wielkiego problemu; ich rozwiązanie zależy tylko od mocy obliczeniowej komputera:
Ćwiczenie 19.6 1. Wykonać obliczenia prowadzące od tablicy n do kolejnych tablic simpleksowych przedstawionych w tabl. 19.7. Rozwiązać następujące zagadnienia metodą simpleks: 2. Zminimalizować przy warunkach oraz
Degeneracja Rozważane powyżej zagadnienia programowania liniowego mają tę wspólną własność, że wektora wyrazów wolnych m równań wyrażających ograniczenia nie można zapisać w postaci
3. Zminimalizować
C = x i + 4*2,
"i 21 m > r 8 ■ 3 2 \ [x2\ ^ [ l 2 *i, *2 ^ 0 . C = 2x\ + l x 2,
9 Algorytm jest słowem oznaczającym zrutynizowaną procedurę obliczeniową.
684 PROGRAMOWANIE MATEMATYCZNE
przy warunkach
Y 2 *1 0 1 A
y _3_
oraz xi, x 2 0 (wskazówka: potrzebna jest tylko jedna zmienna sztuczna). 4. Zminimalizować przy warunkach oraz
C = 12*i + 42x2, 1 2 r ""-i ^1
1 4 *2m 3 1. x u X2 ^
3 4 .3 .
20. PROGRAMOWANIE LINIOWE (KONTYNUACJA)
0.
20.1. DUALNOŚĆ Liniowe zagadnienia maksymalizacji i minimalizacji omawialiśmy do tej pory jako dwa oddzielne typy problemów. W istocie jednak każde zagadnienie minimalizacji (zminimalizo wać C) ma odpowiednik w postaci zagadnienia maksymalizacji (zmaksymalizować C*), przy czym nowa zmienna charakteryzuje się tym, że Ć* = C. Podobnie dla każdego zagadnienia maksymalizacji zawsze istnieje odpowiadające mu zagadnienie minimalizacji takiej zmiennej tu*, że ft = ft* . Jedno z tych zagadnień liniowych zazwyczaj jest nazywane zagadnieniem pierwotnym lub prymalnym , a jego odpowiednik zagadnieniem podwójnym lub dualnym. Zagadnienia maksymalizacji i minimalizacji nie są więc tak rozłączne, jak się to wydawało. Ponieważ wartości optymalne funkcji celu w zagadnieniach prymalnym i dualnym są zawsze identyczne, możemy więc rozwiązać to z nich, które jest łatwiejsze. Możliwe jest również „przetłumaczenie ’\ wartości rozwiązań dla zmiennych zagadnienia dualnego na wartości dla zmiennych zagadnienia pierwotnego i vice versa.
Zagadnienie dualne Zmienne decyzyjne zagadnienia prymalnego oznaczymy przez xj (jak poprzednio), a zmienne decyzyjne zagadnienia dualnego — dla odróżnienia — przez y ir Struktury zagadnień prymalnego i dualnego są ze sobą związane w sposób ukazany w przykładach 1 i 2 . Przykład 1.
Zagadnienie prymalne: zmaksymalizować
/r= 3x\ + 4x2 + 3*3,
\
6 8 6 PROGRAMOWANIE MATEMATYCZNE
1
przy warunkach
3 1
1
2 4
\
\ : .'■■■ .■ zagadnienia prymalnego po przetransponowaniu staje się wektorem wierszowym współczyn ników dualnej funkcji celu. Na podstawie powyższych reguł łatwo wywnioskować, że zagadnieniem dualnym do dualnego jest samo zagadnienie prymalne (pod warunkiem, że zastąpimy y przez x i usuniemy gwiazdkę przy symbolu funkcji celu). Aby uogólnić przytoczone powyżej przykłady, związki między zagadnieniami prymalnymi i dualnymi podamy w zapisie macierzowym:
*2 L*3 J
oraz
x \, x2, x3 2* 0.
Zagadnienie dualne: zminimalizować
/r* = 12yi + 42y2,
_
12 przy warunkach oraz
PROGRAMOWANIE LINIOWE 6 8 7
yi
1 4 -3 1. J 2.
Zagadnienie prymalne
"3" 4
.3 .
przy warunku
/r = c 'x , Ax < r, k
* przy warunku
/r* = r'y , A'y ^ c,
oraz
X 25 0,
, oraz
y 2* 0,
m in
przy warunku
C = c'x, Ax 2* r,
oraz
X 25 0,
max
(20.1)
y i , y i s* 0 .
,
Przykład 2.
Zagadnienie prymalne: zminimalizować przy warunkach
C = Axx + 3x2 + 8*3, 1
0
1
0
1
2
Xi x2 X3.
oraz
X ly X 2i X3 ^
0 .
Zagadnienie dualne: zmaksymalizować przy warunkach oraz
C* = 2 yi + 5y2,
"l O" 0 1 yi _1 2. -?2_
4 3 _8_
y u y i ^ o.
Reguły transformacji można w skrócie zawrzeć w czterech punktach: 1) zmienić „maksymalizację’’ na „minimalizację’’ i vice versa; dodać gwiazdkę do symbolu zmiennej maksymalizowanej lub minimalizowanej w zagadnieniu prymalnym, w celu otrzymania symbolu zmiennej minimalizowanej lub maksymalizowanej w zagadnieniu dualnym. 2) zmienić zwroty nierówności występujące w pierwotnych ograniczeniach na przeciw ne w ograniczeniach dualnych, ale znak ^ w warunkach nieujemności pozostawić bez zmian, 3) jako macierz współczynników dualnych dla danych warunków ograniczają cych przyjąć transpozycję macierzy współczynników prymalnych warunków ograniczają cych, ^ 4) wektor wierszowy współczynników prymalnej funkcji celu po przetransponowaniu staje się wektorem kolumnowym wyrazów wolnych w warunkach ograniczających zagad nienia dualnego; podobnie wektor kolumnowy wyrazów wolnych warunków ograniczających
(20.2)
Zagadnienie dualne min
max przy warunku ,
, oraz
C* = r'y , A'y ^ c, y^0.
Zwróćmy uwagę, że jeśli zagadnienie pierwotne ma m warunków ograniczających i « zmiennych decyzyjnych, tak iż macierz A ma wymiar m x n , to zagadnienie dualne będzie miało « warunków ograniczających im zmiennych decyzyjnych, ponieważ macierz A', jako transpozycja A, ma wymiar n x m . Wymiary pozostałych macierzy pojawiających się w prymalnym zagadnieniu są następujące: c' — lx « ; x — n x l ; a r —: m x l, jak pokazano w (19.5). Wektor y w zagadnieniu dualnym ma wymiar mx 1. Fakt, że zagadnienia prymalne i dualne mogą mieć różne liczby warunków i zmiennych decyzyjnych, sprawia, że mamy do czynienia z różnym stopniem trudności przy ich rozwiązywaniu. W dwu podanych powyżej przykładach zagadnienia prymalne (z trzema zmiennymi) nie mogą być rozwiązane graficznie; natomiast zagadnienia dualne zawierające tylko dwie zmienne można łatwo w taki sposób rozwiązać. Ponadto, gdy oba zagadnienia nie poddają się analizie graficznej, trzeba zastosować metodę simpleks. Możemy jednak wybrać zagadnienie, które ma mniej warunków ograniczających, gdyż im mniej jest ograniczeń, tym mniejszy będzie wymiar bazy i tym mniej zmiennych dodatkowych musimy wprowadzić. A nawet wtedy, gdy zagadnienia prymalne i dualne mają równą (lub niemal równą) liczbę warunków ograniczających, łatwiej jest rozwiązać zagadnienie maksymalizacji, gdyż na ogół zawiera ono początkowe bazowe rozwiązanie dopuszczalne i nie trzeba się martwić zmiennymi sztucznymi.
Twierdzenia o dualności Jeśli decydujemy się rozwiązywać zagadnienie dualne, to rozwiązanie będzie się składać z wartości y t (i, powiedzmy, Ć*); ale jeśli tak naprawdę interesują nas wartości rozwiązania zagadnienia prymalnego xj (i Q , to stajemy wobec problemu: jak otrzymać rozwiązanie prymalne z dualnego i vice versa? Odpowiedzi udzielają następujące dwa twierdzenia:
PROGRAMOWANIE LINIOWE 689
68 8 PROGRAMOWANIE MATEMATYCZNE
Twierdzenie o dualności I. Optymalne wartości prymalnej i dualnej funkcji ¿elu są zawsze identyczne, pod warunkiem, że optymalne rozwiązania dopuszczalne rzeczywiś cie istnieją, tzn.Ć = Ć* i Tt=Tt*. [
macierzowe: .
Twierdzenie o dualności II. a. Jeśli pewna zmienna decyzyjna w zagadnieniu programowania liniowego ma wartość optymalną różną ód zera, to odpowiednia zmienna dodatkowa w zagadnieniu dualnym do podanego musi mieć optymalną wartość zero , tzn. (gdy Si oznacza i-tą zmienną dodatkową zagadnienia prymalnego, a tj — y-tą zmienną dodatkową zagadnienia dualnego): i
Ponieważ każdy składnik w (20,5) ma wymiar n x 1, więc możemy pomnożyć to równanie z lewej strony przez wektor x' o wymiarze 1 x n . W wyniku otrzymujemy:
y t > Q=> śi = 0
i
xj > 0=»7, = 0 .
i
tj > 0 =* Xj = 0.
A'y - 1 = c
—
(t^ 0 ).
x'A'y - x't = x'c, czyli po transpozycji każdego składnika mamy: (20.6)
b. Jeśli pewna zmienna dodatkowa w zagadnieniu programowania liniowego ma optymalną wartość różną od zera, to odpowiednia zmienna decyzyjna w zagadnieniu dualnym do niego musi mieć optymalną wartość zero , tzn.: Si > 0 =» y i = 0
(20.5) \
a , ^ ^ V '- '
y'Ax - t'x = c'x = = *.
[z (4.11) i ćwiczenia 4.6-3] [z (20 . 1)]
Z (20.4) i (20.6) wynika natychmiast: (20 .7)
n * -7 Z = y's + t ' x ^ 0 ,
[z warunków nieujemności]
Zgodnie z pierwszym twierdzeniem optymalna wartość funkcji celu jest taka sama, niezależnie od tego, czy wybraliśmy zadanie prymalne, czy dualne. Drugie twierdzenie ustanawia natomiast związek komplementamości (sprzężenia) między zmiennymi decyzyj nymi pierwszego zadania i zmiennymi dodatkowymi drugiego zadania. Dzięki niemu, na podstawie optymalnego rozwiązania otrzymanego dla zagadnienia programowania liniowego, możemy wyznaczyć rozwiązanie optymalne dla zadania dualnego. Zanim przejdziemy do zastosowania powyższych twierdzeń, postarajmy się je uzasadnić. Przykładowo, omówimy zagadnienie prymalne typu maksymalizacji (dla minimalizacji rozumowanie będzie analogiczne). Warunki zasadnicze dla zadania prymalnego maksy malizacji mogą być wyrażone nierównością macierzową Ax ^ r, jak w (20.1). Używając wektora zmiennych dodatkowych s, możemy nierówność tę przekształcić w równanie macierzowe:
a zatem 7t* (wielkość minimalizowana w zagadnieniu dualnym) nigdy nie może być mniejsza niż TC (wielkość maksymalizowana w zagadnieniu prymalnym), a tc nigdy nie może przekroczyć tc*. Gdy natomiast tc* jest minimalizowana, a tc maksymalizowana, wówczas obie wartości będą równe. Jest to podstawą wyniku ft= 7t* z twierdzenia I, który będziemy mieć okazję rozważać dokładniej w podrozdz. 21.4. Dla optymalnych rozwiązań zagadnień prymalnego i dualnego, gdzie TCi TC* są sobie równe, wynik (20.7) implikuje, że:
(20.3)
Ze względu na warunki nieujemności dla zmiennych, jedynym sposobem spełnienia tego równania jest, aby każdy z występujących w nim m + n iloczynów był równy zeru. Prowadzi to bezpośrednio do tezy twierdzenia n. Wymaganie, aby każdy iloczyn był równy zeru, pozwala tylko na stwierdzenie, że skoro wiadomo, iż jeden z czynników jest dodatni, np. y, > 0 , to drugi musi być równy zeru (57 = 0). Nie wolno natomiast traktować zerowej wartości jednego czynnika (np. 7/ = 0 ) jako przesłanki dla wniosku, że drugi czynnik iloczynu jest dodatni (xj > 0), ponieważ zerowa wartość tj może być połączona z zerową wartością Xj i będzie wówczas spełnione wymaganie, aby ljXj = 0 .
Ax + s = r
(s^O ).
Jeśli zagadnienie zawiera m prymalnych warunków, ograniczających i n prymalnych zmiennych decyzyjnych, to A ma wymiar m x n , a x — n x 1, więc Ax — tak jak s i r — ma wymiar m x 1. Dopuszczalne jest zatem pomnożenie z lewej strony każdego składnika w (20.3) przez wektor o wymiarze l xm. Ponieważ zagadnienie dualne powinno mieć m zmiennych decyzyjnych, więc wektor y ma wymiar mx 1, a jego transpozycja y' — wymiar 1 xm. Po przemnożeniu (20.3) z lewej strony przez ten wektor otrzymujemy: (20.4)
y'Ax + y's = y 'r = r'y = tc*.
y's + t'x = 0 lub — zapisując to w bardziej jawny sposób: (20 .8)
(yiii + ...+ym5m) + (ii^i + ... + iĄ ) = 0 .
[z (20.1)]
Zwróćmy uwagę na to, że każdy składnik w (20.4) ma wymiar 1x 1, a więc jest skalarem. Dwa wyrażenia y 'r i r'y są nie tylko iloczynami skalarnymi, ale ponadto mają taką samą wartość. Przechodząc do zagadnienia dualnego, jego warunki ograniczające możemy wyrazić przy użyciu nierówności macierzowej A'y ^ c, tak jak w (20.1). Ale stosując wektor zmiennych nadmiaru — który oznaczymy przez t — możemy również przekształcić ją w równanie
Rozwiązywanie zadania prymalnego za pośrednictwem dualnego Zilustrujemy teraz zastosowanie twierdzeń o dualności dla danych przedstawionych w przy kładzie 1. Ponieważ podane tam zagadnienie dualne zawiera tylko dwie zmienne, znajdziemy najpierw jego rozwiązanie metodą graficzną, a potem określimy prymalne rozwiązanie optymalne przy użyciu twierdzenia o dualności. 44 — Podstawy...
/ 690 PROGRAMOWANIE MATEMATYCZNE
Ponadto, po podstawieniu wartości y , do dualnych warunków ograniczających, pierwsze dwa warunki sprowadzają się do dwuiownań, a trzeci przyjmuje postać ostrej nierówności. Zatem t x = t2 = 0, a 13 > 0. Na podstawie tych informacji będziemy mogli znaleźć opty malne rozwiązanie zagadnienia prymalnego. Ponieważ yi i y 2 są niezerowe, więc ze względu na relację sprzężenia zmiennych dodatkowych (complementary slackness) — podaną w twierdzeniu o dualności II — musi być śl = s 2 = 0 , czyli pierwsze dwa (jedyne dwa) warunki ograniczające w zagadnieniu prymalnym muszą być dla rozwiązania optymalnego ścisłymi równościami. Ponadto, ponieważ 73 > 0, więc x 3 = 0. Zatem część zagadnienia prymalnego z przykładu 1 obejmująca warunki ograniczające ma dla rozwiązania optymalnego następującą postać: “12
42
czyli
1
1
*i 2 4 *2
12“ 42
skąd mamy Xi = 3 i x 2 = 9. Możemy zatem wyrazić wartości prymalnych zmiennych decyzyjnych równaniem: (20 . 10)
(xu x 2, x 3) = (3i 9, 0),
co kończy przejście od y t do Xj. Wartość fty zgodnie z twierdzeniem o dualności I, powinna być równa 45. Jeśli podstawimy wartość xj do prymalnej funkcji celu, odpowiedz rzeczywiście będzie się zgadzała: ft= 3 • 3 + 4 • 9 + 0 = 45. Jest godne podkreślenia, że jeśli zagadnienie dualne rozwiązujemy metodą simpleks (a nie graficznie), to możemy bezpośrednio z optymalnej (końcowej) tablicy odczytać zarówno prymalne , jak i dualne rozwiązanie optymalne. A skoro tak jest, to przejście od y,- do Xj rzeczywiście staje się automatyczne. Zilustrujemy to za pomocą optymalnej tablicy dla zagadnienia dualnego z przykładu 1, przedstawionej w tabl. 20.1. Z czterech wektorów jednostkowych w tej tablicy dualne rozwiązanie optymalne może być z łatwością odczytane jako: ( * * .* .* ,
7T*
0
1
3
2
13 4 1
Wiersz
2
ft* = 12 -2 + 42 •— = 45.
1
Tablica 20.1 Dualna tablica optymalna
1
więc na podstawie funkcji celu możemy łatwo obliczyć, że:
2
PROGRAMOWANIE LINIOWE 691
\
Czytelnik może sprawdzić, że graficzna analiza zadania dualnego daje następujące informacje:
(20.9)
\
h)=
gdzie t3 oznacza trzecią dualną zmienną dodatkową.
0
0 0
yi
yi
tl
h
(o o) 1-3 - 9 o| 11 5 1 0 0 2 2 1 1 0 0 i 2 2 1 0 -2 1 0 _ —
—
—
Vi
V2
v3
Stała
nu nie dotyczy, a zatem
— —
7
■ — 2
1.
—
pomijamy _
2 2
Te cztery liczby są oczywiście wzięte z kolumny wyrazów wolnych. Jeśli jednak popatrzymy na część wiersza 0 na przecięciu z kolumnami zmiennych dodatkowych i weźmiemy wartości bezwzględne trzech wielkości (obwiedzionych prostokątem), to otrzymamy liczby 3, 9 i 0, które są dokładnie wartościami x u x 2 i x 3 w (20.10) uporządkowanymi w odpowiedniej kolejności1. Zgodnie z ogólną zasadą zawsze możemy powiązać kolumny tj dualnej tablicy optymalnej ze zmiennymi xj i odczytać z nich wartości bezwzględne elementów położonych w najwyższym wierszu, jako optymalne wartości prymalne zmiennych decyzyjnych2. Ponadto możemy powiązać kolumny y, z prymalnymi zmiennymi dodatkowymi i odczytać wartości bezwzględne najwyżej położonych elementów tych kolumn, jako wartości sh W tabl. 20.1 dwa zera w wierszu 0 otoczone elipsą wskazują na to, że śi = ś 2- 0 , co — jak już wiemy — jest prawdą. Ponieważ dodatkowo zakreślony kwadracikiem element kolumny wyrazów wolnych podaje również wartość ft na mocy twierdzenia o dualności I, więc cała niezbędna informacja dotycząca prymalnego rozwiązania optymalnego może być odczytana z wiersza 0 dualnej tablicy optymalnej! Analogicznie można odczytać dualne rozwiązanie optymalne z wiersza 0 danej prymalnej tablicy optymalnej. Istota tego niezmiernie pożytecznego wyniku jest całkowicie zgodna z twierdzeniem o dualności n. Każda zmienna dualna przyjmująca w rozwiązaniu optymalnym wartość różną od zera — w naszym przykładzie y i9 y 2 i t3 — musi mleć jednostkowy wektor kolumnowy w tablicy optymalnej. Ponieważ kolumna n* wykorzystała już wektor ei (z jedynką na pierwszym miejscu), więc wektory jednostkowe w kolumnach przy y i9 y 2 i t3 muszą mieć w wierszu 0 zerowe»elementy. Zgodnie z przedstawioną właśnie metodą możemy zatem przyjąć, że ij = ś 2 = x 3 = 0. Wniosek jest dokładnie tym, co pokazuje twierdzenie o dualności U. Podobnie, przez odwrotne zastosowanie metody, fakt, że f i i x 2 są niezerowe (w prymalnej tablicy optymalnej), implikuje, że 1\ i 72 muszą być zerowe; powoduje to, że kolumny tx i t2 w tabl. 20.1 nie mogą być wektorami zerowymi.
1 Wzięcie wartości bezwzględnych jest konieczne, ponieważ Xj muszą być nieujemne. 2 Ponieważ liczba dualnych zmiennych dodatkowych jest na mocy konstrukcji dokładnie taka sama, jak liczba prymalnych zmiennych decyzyjnych, więc nie powstają tu żadne problemy dotyczące wymiarów.
PROGRAMOWANIE LINIOWE 693
6 9 2 PROGRAMOWANIE MATEMATYCZNE
Ćwiczenie 20,1
J:
Dla następujących trzech zagadnień prymalnych sformułować odpowiadające im zagadnienia dualne: ’ * ■• r 1. Zmaksymalizować przy warunkach
/r= 9 ;ti+ *2, 2*! + * 2 ^ 8 , 4*i + 3*2 ^ 1 4 ,
oraz
*i, *2^ 0.
2. Zminimalizować
C = *1 + 4*2, przy warunkach ; oraz
"1 2 "
oraz
’5“ 4
X i
0
1
2
3_
x2_
9.
# = Ci*i + c 2*2 + <^3*3, 011 a 21
przy warunkach
012
013
a 22 023
-031
032
oraz
0
* 1
Ty
X2
r2
033- -* 3 -
C*
yl
0 1 2 3
1 0 0 0
0 0 0 1
-^*3-
(/ = 1, 2 , 3).
ti 0
0
0
1
1
0
0
0
'■
h
1 2 1 -2
2
*1
*2
0
1
0
0
1
0
0
1
2
0
1
0
Sl
2 2 - 1
przy warunkach
011*1 + a
3
1
’
oraz
. .
2
.
2
5. Po kilku iteracjach tablica simpleksowa danego zagadnienia programowania liniowego przyjmuje postać: 1t
C = ci*i + c 2* 2 + c 3*3 , 021*1 +
[¡9] ...
-1 0 "
zminimalizować
Stała
h
a. Zapisać rozwiązanie optymalne zagadnienia dualnego i prymalnego. b. Podstawić wartość y t i Xj odpowiednio do dualnej i prymalnej funkcji celu, aby sprawdzić Ć* = Ć.
Wiersz
*i, *2->.0
7. Reguły transformacji zagadnienia prymalnego w dualne (20.1) i (20.2) dotyczą jedynie przypadków, gdy wszystkie warunki ograniczające mają postać nierówności. Rozważmy teraz zagadnienie programowania liniowego z warunkiem ograniczającym w postaci równości:
4. Dla zagadnienia dualnego z przykładu 2 podanego w tekście optymalna tablica simplek sowa wygląda następująco: Wiersz
"
1 2
3 2
rozwiązaniem optymalnym jest *i = 8 i *2 = 0 . a. Znaleźć h i Ć. b. Zapisać zagadnienie dualne. c. Na podstawie odpowiedzi do punktu (a) powiedzieć, jaka musi być wartość y2? Który z warunków ograniczających w zagadnieniu dualnym ma postać ostrej nierówności dla podanego rozwiązania optymalnego? d. Wykorzystać odpowiedź do punktu (c) w celu obliczenia y i. e. Podstawić y x i y 2 do funkcji C* i sprawdzić, czy C* = Ć.
*1,*2 ^ 0 .
3. Zmaksymalizować
Czy jest to tablica optymalna? Dlaczego? iJakie są wartości * 1, *2 i # ? f.:. De zmiennych decyzyjnych będzie zawierać zagadnienie dualne? Dlaczego? Jakie są optymalne wartości dualnych zmiennych decyzyjnych i dualnej funkcji celu?
6 . Wiadomo, że dla następującego zagadnienia programowania liniowego:
C = *i + 7*2,
przy warunkach
a. b. c. d.
¿2
Stała
1
nu
~ 1
2
1
2
1
i2*2 + 013*3 ^ r x , 22*2 + 0 2 3 * 3 = r u
¿
*1, *2, * 3 ^ 0 .
a. Opracować sposób przepisania tego zagadnienia liniowego tak, aby można było zastosować — jak zwykle — (20.2). Napisać zagadnienie dualne. Czy liczba dualnych zmiennych decyzyjnych jest identyczna z liczbą prymalnych warunków ograniczają cych? b. Pokazać, że wprowadzając nową zmienną y 4 = y 2 - y 3, możemy przywrócić zgodność liczby dualnych zmiennych decyzyjnych i liczby prymalnych warunków ograniczają cych. Czy y 4 jest nieujemne? Dlaczego tak lub dlaczego nie? c. Skomentować prawdziwość stwierdzenia, ża „nawet gdy j- te ograniczenie w zagad nieniu prymalnym jest równością, możemy mimo wszystko stosować zwykłe reguły formułowania zagadnienia, z tą różnicą, że j- ta dualna zmienna decyzyjna może mieć dowolny znak” .
694 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE
20.2. EKONOMICZNA INTERPRETACJA ZAGADNIENIA DUALNEGO '
-ii
Wiemy już, że w obliczeniach można wykorzystać dualne zagadnienie programowania liniowego zamiast prymalnego. Jednak zagadnienie dualne ma również własne, odrębne i ważne znaczenie ekonomiczne.
Zagadnienie dualne dla zadania dotyczącego produkcji Zinterpretujemy najpierw zagadnienie dualne zadania dotyczącego produkcji. W prostym przypadku, gdy mamy dwa produkty i dwa warunki ograniczające, zagadnienie prymalne ma postać: zmaksymalizować
K - C \ X \
au
przy warunkach oraz
+
a X2
C
2* 2 > *i
a 21 a 22] [x2]
<
n
J2
*1, *2 25 0.
Zagadnienie dualne można więc zapisać w postaci: zminimalizować (20.11)
przy warunkach oraz
# * = n y i + V2y2, 011
021
012
02 2
yi A
$5
C1 A
y u y 2 ^ 0.
Przed zinterpretowaniem zagadnienia dualnego określmy naturę zmiennych dualnych, w tym ich jednostkę miary. W zagadnieniu prymalnym K oznacza całkowity zysk brutto w dolarach3. Ponieważ #* = # , więc w zagadnieniu dualnym zarówno # * , jak i r xy x + r 2y 2 muszą być również wyrażone w dolarach. Symbol rt oznacza całkowitą ilość i-tego zasobu należącego do ustalonego wyposażenia firmy (ilość tę nazywaliśmy poprzednio możliwoś ciami produkcyjnymi i-tego wydziału), więc symbol r,y, musi być mierzony w dolarach przypadających na jednostkę i-tego zasobu. Zatem y, określa pewien rodzaj wyceny (valuation) rozpatrywanego zasobu. Nie jest to oczywiście cena rynkowa, gdyż rozważany zasób jest już w posiadaniu firmy, która nie musi kupować go po cenie y t na rynku. Jest to raczej wartość przypisana zasobowi. Z tego powodu wartość y,- jest nazywana ceną księgową (accounting price) lub ceną dualną (ceną-cieniem; shadow price) i-tego zasobu. Możemy ją również traktować jako kay# utraconych możliwości (opportunity cost) wynikający że stosowania i-tego zasobu. Zbadajmy z tego punktu widzenia trzy części składowe zagadnienia dualnego. Warunki nieujemności y / ^ 0 oznaczają, że żadnemu zasobowi nie można przypisywać kosztu alternatywnego mniejszego niż zero. W istocie możemy zawsze przypisać zasobowi wartość 3 Jak wyjaśniono w podrozdz. 19.1, całkowity zysk brutto oznacza tu całkowite przychody ze sprzedaży minus koszty zmienne, ale przed obliczeniem kosztów stałych.
695
dodatnią, chyba że nie jest on w pełni wykorzy stany . W takim bowiem przypadku użycie go do produkcji pociąga za sobą zerowy koszt alternatywny. Oznacza to, że jeśli dany zasób jest w pełni wykorzystany dla rozwiązania optymalnego ($,- = 0), to musimy mu przypisać dodatni koszt alternatywny (yt > 0). Zauważmy, że ten sposób interpretacji znów doprowadził nas do drugiego twierdzenia o dualności, które — dotychczas interpretowane jedynie matematycznie — uzyskało teraz ekonomiczne konotacje. Zajmijmy się teraz warunkami ograniczającymi w zagadnieniu dualnym i zbadajmy pierwsze ograniczenie podane w (20.11): (20.12)
a n y i + a 2iy2 ^ c i .
•
Ponieważ współczynnik a^ oznacza ilość i-tego zasobu używaną do wytworzenia jednostki y-tego produktu, lewa strona (20.12) reprezentuje całkowity koszt alternatywny wytworzenia jednostki pierwszego produktu (y = 1). Składnik c x po prawej stronie oznacza zysk brutto przypadający na jednostkę pierwszego produktu. Zatem ograniczenie to wymaga, aby koszt alternatywny produkcji był utrzymany na poziomie równym co najmniej zyskowi brutto z produkcji. Chwila namysłu pozwala stwierdzić, że jeśli koszt alternatywny produkcji przekracza zysk, to alokacja zasobów musi być na pewno nieoptymalna, ponieważ po prostu przez rezygnację z pierwszego produktu można „uwolnić” zasoby, które natychmiast można zużyć gdzie indziej z większym pożytkiem. Matematycznie, jeśli (20.12) jest spełnione dla rozwiązania optymalnego jako ostra nierówność, to pierwszy produkt nie powinien być wytwarzany (xx = 0). Z drugiej strony, jeśli pierwszy produkt jest rzeczywiście wytwarzany, tzn. jeśli *1 ^ 0, to koszt alternatywny produkcji musi być dokładnie równy zyskowi brutto i dla rozwiązania optymalnego (20.12) musi być spełniony jako równość. W skrócie, ii > 0 => *1 = 0 i *1 > 0 => 7i = 0. Jest to również po prostu inne sformułowanie twier dzenia o dualności II. Drugie ograniczenie w (20.11) może oczywiście mieć analogiczną interpretację. Przyjrzyjmy się teraz dualnej funkcji celu. Przypomnijmy, że r x i r 2 są całkowitymi ilościami dostępnych zapasów w ustalonym wyposażeniu firmy, więc wyrażenie:
#* = riyj + r2y2 oznacza oczywiście całkowitą wartość, jaką należy przypisać tym zasobom. Idea zagadnienia dualnego polega właśnie na minimalizacji tej sumy przy spełnieniu warunków ograniczają cych zinterpretowanych powyżej. Odpowiedniość między zagadnieniem prymalnym i dual nym sugeruje zatem, że maksymalizacja zysku na drodze znajdowania optymalnych poziomów produkcji (zagadnienie prymalne) jest dokładnie równoważna minimalizacji całkowitej przypisanej wartości lub kosztu alternatywnego (opportunity cost) zasobów, z zastrzeżeniem, że koszt alternatywny wytwarzania każdego produktu nie może być mniejszy niż zysk brutto z tego produktu. A fakt, że ft = ft* oznacza, iż w rozwiązaniu optymalnym całkowity zysk brutto musi być w całości rozdzielony między zasoby za pośrednictwem ceń dualnych. Jest to zakończenie ekonomicznej interpretacji zagadnienia dualnego. Dla uproszczenia przedstawiliśmy problem produkcji dla dwu produktów i dwu zaso bów. Ponieważ jednak rozumowanie przeprowadzone w trakcie powyższych rozważań nie zależy od założenia, iż m = n = 2, więc interpretacja zagadnienia dualnego za po mocą kosztu alternatywnego może być z łatwością uogólniona na przypadek m zasobów i n produktów.
696 PROGRAMOWANIE MATEMATYCZNE
Zagadnienie dualne dla zadania dotyczącego diety Za pomocą analogicznego rozumowania zmienne decyzyjne w zagadnieniu dualnym do zadania diety mogą być również'interpretowane jako przypisane wartości. Ogólne zagadnienie diety, zapisane w notacji macierzowej, ma postać: zminimalizować
C = c'x,
przy warunkach
Ax ^ r,
oraz
x ^ 0,
gdzie C jest całkowitym kosztem diety, ć — wektorem wierszowym cen żywności, x — wektorem kolumnowym ilości poszczególnych rodzajów żywności, A — macierzą współczynników a u (ilość i-tej substancji odżywczej zawartej w ./-tym rodzaju żywności), a r — wektorem kolumnowym m in im a ln y c h wielkości zapotrzebowania na poszczególne substancje odżywcze. Zagadnienie dualne może być wobec tego zapisane jako: zmaksymalizować
C * = r'y ,
przy warunku
A'y ^ c,
oraz
y^O ,
gdzie y jest wektorem kolumnowym dualnych zmiennych decyzyjnych. Ponieważ C jest wyrażone w dolarach, więc jego dualny odpowiednik C* również musi być wyrażony w dolarach. Ale elementy wektorowe r' są wyrażone w jednostkach fizycznych odpowiednich substancji odżywczych, więc elementy wektora y powinny być wyrażone w dolarach na jednostkę odpowiedniej substancji odżywczej. Innymi słowy, dualne zmienne decyzyjne ponownie mają naturę pewnego rodzaju wyceny, tym razem oznaczają wartości przypisane różnym substancjom odżywczym. Jako takie, nie mogą być nigdy ujemne. Z tego punktu widzenia każde dualne ograniczenie, które można skonstruować, będzie oznaczać, że całkowita wartość przypisywana walorom odżywczym zawartym w jednostce każdego rodzaju żywności nie może być większa niż jego cena. W istocie zdrowy rozsądek powstrzyma nas przed kupowaniem ./-tego rodzaju żywności, jeśli jego cena przekracza wartość, jaką jej przypisujemy. Rozwiązaniem optymalnym jest zatem kupowanie tylko takiej żywności, której cena odpowiada wartości jej przypisywanej. Oczywiście jest to znów przykład twierdzenia o dualności II. Celem zagadnienia dualnego jest maksymalizacja całkowitej wartości przypisywanej walorom odżywczym, przy podanych powyżej ograniczeniach. Gdy osiągniemy to maksi mum, w istocie jednocześnie zminimalizujemy koszt diety przy zaspokojeniu minimalnego zapotrzebowania na wartości odżywcze. ■
Dualne zmienne decyzyjne i mnożniki Lagrange9a Pokazaliśmy, że dualne zmienne decyzyjne y t reprezentują ceny dualne, czyli przypisane wartości. W rozwiązaniu optymalnym programowania liniowego odgrywają one taką samą rolę, jak mnożniki Lagrange’a w klasycznych zagadnieniach optymalizacji; służą mianowicie
PROGRAMOWANIE LINIOWE
697
do mierzenia wrażliwości optymalnej wartości prymalnej funkcji celu na zmiany wyrazów wolnych występujących w prymalnych warunkach ograniczających. Aby to pokazać, ponownie rozważymy problem produkcji i jego zagadnienie dualne, pokazane w (20.11). W rozwiązaniu optymalnym zmienne y,- przyjmują wartości y h a dualna funkcja celu staje się równa = rxyi + r2y2. Ponieważ możemy więc również napisać:" ’"1 '• ^ = r 1y l f r 2y 2t a zatem obliczając pochodne JTwzględem ri i r2, mamy:
dft
dft
.
1 co wskazuje, że y,* (optymalna wartość i-tej dualnej zmiennej decyzyjnej) jest miarą wrażliwości 7t (zoptymalizowanej wartości prymalnej funkcji celu) na nieskończenie małe zmiany r\ (stałych parametrycznych w /-tym prymalnym warunku ograniczającym). Dokład niej, y,* mówi, jak niewielkie rozluźnienie /-tego ograniczenia dotyczącego możliwości produkcyjnych (zwiększenie ilości /-tego zasobu) zmieni całkowity przychód netto w roz wiązaniu optymalnym. Ponieważ w klasycznym zagadnieniu maksymalizacji z = f( x , y) przy warunku g(x, y) = c, który powoduje powstanie funkcji Lagrange’a Z=f(x> y) + + X [c - g (x, y)], optymalna wartość mnożnika Lagrange’a ma znaczenie wyrażone wzorem:
.
. dc
■
.
'
[por. (12.16)]
jasne więc jest, że dualne zmienne decyzyjne i mnożniki Lagrange’a odgrywają identyczną rolę, mimo iż struktury, w których to się odbywa, tak się różnią. Interpretacja y,- związana z mnożnikiem Lagrange’a jest oczywiście doskonale zgodna z naszą wcześniejszą interpretacją y, jako wartości przypisanej /-temu zasobowi. Gdy /-ty warunek zostaje osłabiony, wówczas i-ty zasób staje się dostępny w większej ilości, co ma Wpływ na to, że całkowity zysk (interpretacja mnożnika Lagrange’a) będzie bezpośrednio zależny ód wielkości wartości przypisanej i-temu zasobowi (wcześniejsza interpretacja). Jest tak, ponieważ w rozwiązaniu optymalnym całkowity zysk brutto i całkowita przypisana wartość zasobów finny muszą być sóbie równe, tzn. całkowity zysk brutto ma zostać w całości rozdzielony między‘zasoby będące w stałym wyposażeniu (fixed plant) firmy jako wyna grodzenie zą rolę, jaką te Zasoby odgrywają w procesie produkcji.
Ćwiczeni® 20.2 1. Sformułować zagadnienie dualne do problemu reklam w ćwiczeniu 19.1-6 i nadać mu interpretację ekonomiczną. 2, Dla zagadnienia dotyczącego diety podać interpretację typu mnożnika Lagrange’a optymalnych wartości dualnych zmiennych decyzyjnych y,- i wyjaśnić dokładnie, co one mierzą, ę z y ta interpretacją jest zgodna z interpretacją y, jako wartości przypisanej?
PROGRAMOWANIE LINIOWE
698 PROGRAMOWANIE MATEMATYCZNE
20.3. ANALIZA DZIAŁALNOŚCI: POZIOM MIKRO Do tej pory część zagadnienia programowania liniowego obejmującą warunki ograniczające odczytywaliśmy poziomo, tzn. traktowaliśmy ją jako całość odpowiadającą linii brzegowej (lub hiperpłaszczyźnie), która z kolei powodowała powstanie dwuhiperprzestrzeni. W jednym podrozdziale — dotyczącym rozważań o bazowych rozwiązaniach dopuszczalnych — od stąpiliśmy od powyższej praktyki i odczytaliśmy współczynniki w warunkach ograniczających pionowo, jako wektory kolumnowe w (19.11') i (19.12). Takie spojrzenie stanowi inny sposób rozpatrywania zagadnienia programowania liniowego.
Pojęcie działalności Wybraliśmy sobie firmę wykorzystującą dwa zasoby (K i L) do produkcji dwu dóbr (*i, *2). Jeśli dostępne zasoby są ograniczone do K 0 i L0, to warunki ograniczające dla firmy można zapisać jako pojedyncze równanie wektorowe: 0
(20.13)
n
*1 4-
J*21.
012
*2 +
022_
"l“ 0
S l 4-
"o'
1 s2 =
Y 0
i
e2 =
"0" 1
Ai*! + A 2*2 + «i-si + e 2s 2 = r .
-¿Zn , w którym górny element oznacza jednostkowy poziom
rozszerzonym wektorem
021J produkcji, a pozostałe elementy są niezbędnymi nakładami. Dla naszych celów wygodniej jest jednak pozostać przy poprzedniej wersji tego wektora. r -
_ L q_
Jeśli dwa pierwsze wektory aktywności oznaczymy przez Ai i A2 i zapiszemy wek tor zasobów po prawej stronie (20.13) jako r, to równanie wektorowe (20.13) może być przedstawione prościej jako: (20.13')
Równanie to stwierdza, że aktywność produkcyjna i aktywności niedoboru (slack activities) muszą w sumie wyczerpać całkowicie dostępne zasoby. Równanie stanowi zatem warunek ograniczający w zagadnieniu programowania liniowego opisującym produkcję firmy. Idea zagadnienia polega na tym, aby wybrać takie nieujemne poziomy dla tych czterech rodzajów aktywności, aby zmaksymalizować pewną funkcję celu, przy zachowaniu warunku (20.13') dotyczącego wyczerpania zasobów. Z tego punktu widzenia zagadnienie przekształca się w analizę aktywności. Zdefiniowany tak jak wyżej wektor aktywności pokazuje jedynie zapotrzebowanie na nakłady ze strony rozpatrywanej aktywności. Możliwe jest również uwzględnienie w wektoCl\\ \-v możemy na przykład — stosując znak plus na rze stanu produkcji. Zamiast wektora a 12 opisać pierwszą aktywność oznaczenie produktu, a minus na oznaczenie nakładu Y
'Ko
Czytając poziomo, tzn. biorąc każdą zmienną (wraz z jej wektorem współczynników) z osobna, możemy rozważać każdą z nich jako reprezentującą osobną działalność (activity) firmy. Pierwsza działalność polega np. na wytwarzaniu pierwszego produktu, więc problem określania wartości rozwiązania * Ł polega tak naprawdę na znajdowaniu optymalnego poziomu pierwszej działalności. Podobnie wytwarzanie drugiego produktu stanowi drugą czynność firmy. Możemy nawet potraktować każdą zmienną nadmiaru (slack variable) jako odnoszącą się do odrębnej czynności — a mianowicie „pozostawiania pewnego zasobu bezczynnym” , chociaż jest to z natury raczej bezczynnością, a nie czynnością. Każda działalność będzie miała określone reperkusje dla zasobów finny. Jak określono za pomocą pierwszego wektora w (20.13), każda jednostka pierwszego rodzaju aktywności pochłonie a n jednostek kapitału i a2\ jednostek pracy. Analogicznie drugi wektor pokazuje, że każda jednostka drugiego rodzaju aktywności zużyje a n jednostek kapitału i ¿z22 jednostek pracy. Wektory te, które nazwiemy wektorami aktywności, są zatem wskaźnikami zapo trzebowania na nakłady niezbędne dla jednostkowego zwiększenia poziomu aktywności. Ponieważ każda zmienna niedoboru jest związana wyłącznie z jednym szczególnym zasobem, więc ich wektorami aktywności są odpowiednio wektory jednostkowe: ei =
699
Stałe przychody skali i ustalone proporcje nakładów Rozpatrywanie zagadnienia produkcji jako analizy aktywności pozwala ujawnić dwa założenia dotyczące funkcji produkcji, które w zagadnieniu programowania liniowego były milcząco przyjmowane. Jedno z nich to założenie o stałych przychodach skali (CRTS — constant return to scalę), a drugie — założenie o ustalonych proporcjach nakładów. r
są stałe. Ze względu na to, jeśli
0 ii _ 0 !2_
jednostek
K L
n
potrzeba do wyprodukowania jednej
jednostki * 1, to wytworzenie K jednostek *1 wymagać będzie dokładnie k razy więcej każ dego zasobu. To samo dotyczy drugiego produktu; w istocie założenie CRTS stosuje się również do aktywności niedoboru. Założenie o ustalonych proporcjach czynników znajduję potwierdzenie w fakcie, że każdy produkt jest rezultatem tylko jednego rodzaju działalności, dla którego proporcja kapitału i pracy jest ustalona przez dany wektor aktywności, co pokazano w (20.13). Oznacza to, że substytucja kapitału i pracy jest w naszym przykładzie całkowicie wykluczona. Ale programowanie liniowe nie jest oczywiście aż tak nieelastyczne. Gdy praca i kapitał mogą być połączone, np. w trzech różnych proporcjach, w celu wytworzenia * 1, wówczas możemy to z łatwością uwzględnić w zagadnieniu programowania liniowego, podając dla danego produktu trzy — zamiast jednej — oddzielne aktywności w następujący sposób: (20.14)
(Aj*! + A^*!* + AJ****) + A2*2 + e151+ e2s2 = r,
gdzie A 1ź A* ź Aj** są trzema różnymi wektorami aktywności i każdy z nich opisuje inną proporcję kapitału i pracy przy innym procesie produkcyjnym, a x v ** i *** reprezentują ilości pierwszego produktu, jakie mają być wytworzone w trakcie tych trzech procesów. W ten
700 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE
sposób możemy osłabić założenie o ustalonych proporcjach nakładów. Założenie CRTS jest jednak zawsze utrzymywane w mocy. We wzorze (20.14) podano dokładnie trzy procesy dla pierwszego produktu; ponieważ jednak procesy te mogą być stosowane jednocześnie w postaci pewnej kombinacji, więc pierwszy produkt tak naprawdę może być wytwarzany ńa więcej niż trzy sposoby. Jeśli np. firma chce otrzymać w sumie 12 jednostek tego produktu, to może przyjąć JCj = 3, x* = 5 i x * * = 4 lub wybrać kombinację (2, 9, 1), lub (6, 0, 6), lub (3,5; 4,5; 4) itd. Ponieważ każda z tych możliwych kombinacji wymaga innej ogólnej proporcji kapitału i pracy dla wytworzenia całkowitego produktu i może w istocie być traktowana jako oddzielny sposób produkcji, wydaje się więc, że po Wprowadzeniu wieloprocesowej produkcji do zagadnienia programowania liniowego ograniczenie dotyczące ustalonych proporcji nakładów w znacz nym stopniu zniknie. Czy oznacza to, że funkcja produkcji implikowana w strukturze programowania liniowego będzie taka sama, jak ta, którą rozważamy w klasycznej teorii produkcji? Odpowiedź brzmi: nie całkiem.
Funkcja produkcji: analiza klasyczna kontra programowanie liniowe
Rozważmy najpierw przypadek pojedynczego procesu, przyjmując stały wektor aktywności dla pierwszego produktu: Ai s który jest tu traktowany jako jedyny produkt. Ponieważ poziom produkcji 2 = 1 może być wytworzony jedynie przy użyciu K\ jednostek produkcji i L\ jednostek pracy, równanie izokwanty dla tego poziomu produkcji jest następujące: ~
i = * (* !,w .
Jego wykresem będzie pojedynczy punkt A i na płaszczyźnie KL na rys. 20.2. Ponieważ K x i Li są dwiema stałymi, więc g(K \, Li) odnosi się jedynie do wartości funkcji produkcji w jednym punkcie należącym do dziedziny. Punkt Ai jest oczywiście graficzną reprezentacją podanego powyżej wektora aktywności. Dzięki założeniu CRTS w programowaniu liniowym łatwo wywnioskować, że izokwanta dla 2 = 2, również złożona z jednego punktu, będzie się znajdowała w punkcie: 2
Zbadajmy funkcję produkcji firmy używającej do wytworzenia jednego produktu dwu zasobów K i L. Aby ułatwić porównanie z wcześniejszymi rozważaniami dotyczącymi funkcji produkcji, oznaczmy wielkość produkcji symbolem Q. W analizie klasycznej funkcja produkcji: > Q = m D
' ';
701
Ai s
2
Ponieważ ponadto wszystkie takie punkty są nieujemnymi wielokrotnościami wektora aktywności A i, więc wszystkie muszą leżeć na liniowej półprostej aktywności pokazanej na rys. 20.2.
■
jest z założenia wszędzie ciągła i różniczkowalna. Dla ustalonego poziomu produkcji, np. 2 = 1, funkcja / prowadzi do równania izokwanty: l= f( K , L), której wykresem jest gładka krzywa, jak na rys. 20.1. Izokwanta ta wskazuje na ciągłą możliwość substytucji między pracą i kapitałem. Gdy kontynuujemy substytucję, stopa substytucji zmienia się w sposób ciągły. To samo dotyczy izokwant odpowiadających wszystkim pozostałym możliwym poziomom produkcji. Ale klasyczna funkcja produkcji może być lub może nie być charakteryzowana przez CRTS.
Rysunek 20.2
Rysunek 20.1
Zastosowanie słowa izokwanta — zwykle związanego z krzywą — na oznaczenie pojedynczego punktu może wydać się nieco dziwne. W istocie możliwe jest zinterpretowanie punktowych izokwant z rys. 20.2 jako krzywych. Ze względu na ustalone proporcje nakładów wiemy, że jeśli kapitał jest ustalony na poziomie K u a zasób pracy jest zwiększany i przekracza Li, to produkcja będzie pozostawała na poziomie 2 = 1 » ponieważ nadwyżka pracy jest bezużyteczna przy braku odpowiedniego przyrostu kapitału. Podobny wynik jest
PROGRAMOWANIE LINIOWE 703
702 PROGRAMOWANIE MATEMATYCZNE
prawdziwy dla nadwyżki kapitału. Fakt ten, który można wyrazić równaniem: 1 = g (K 1, L 1 + S )
i
i = * (* ! + $ , 1 0
(5 ^ 0 ),
oznacza graficznie, że każdy punkt leżący na północ lub na wschód od Ai musi również dawać produkcję 2 = 1. W rezultacie izokwantę dla 2 = 1 można narysować alternatywnie jako krzywą w kształcie litery L z wierzchołkiem w punkcie A i. Ńa tej samej zasadzie izokwanta 2 = 2 może być narysowana jako inna krzywa w kształcie litery L o wierzchołku w punkcie 2 A ! , leżącym na półprostej. Powinno być oczywiste, że punkt wierzchołkowy — w którym zużywana jest mniejsza ilość danego zasobu i nie większą ilość drugiego zasobu niż w jakimkolwiek innym punkcie izokwanty — jest najbardziej efektywną kombinacją na izokwancie. Zatem wszystkie punkty, o których mówimy, że są dominowane przez punkt wierzchołkowy, mogą być pominięte w rozważaniach. Z tego powodu firma produkująca za pomocą jednego tylko procesu musi działać na półprostej aktywności: r ,• , \
2
A x2 =
(2 > 0),
gdzie 2 — poziom produkcji — może być alternatywnie opisany jako poziom, na którym ma być realizowana dana aktywność. Gdy rozważamy wieloprocesowy sposób wytwarzania tego samego produktu, powstanie wówczas pewna liczba półprostych aktywności. Na przykład dla czterech wektorów aktywności: (20.15)
A xm
'K i _Li_
>
A2=
'Kr M .
;
A 3=
k 3"
;
A
A4s
"Ka A
z których każdy pokazuje inną proporcję nakładów umożliwiającą uzyskanie jednostkowego
nakładu, możemy narysować cztery półproste aktywności,4 tak jak na rys. 20.3. Półproste te oznaczono A /g / ( j = 1 ,..., 4), gdzie 2; oznacza liczbę produktów, jaka ma być wytworzona przy wykorzystaniu y-tego procesu. Jak w tym wieloprocesowym przypadku znajdujemy izokwanty dla Q {='LQj) = 1? Przede wszystkim cztery punkty A i, . . . , A4 — każdy oznaczający użycie wyłącznie jednego procesu w celu wytworzenia jednego produktu — powinny z definicji zostać włączone do wspomnianej izokwanty. Przy założeniu podzielności produktu można jednak również prowadzić procesy w różnych zestawieniach, takich jak:
{ A i + y A2;
y A 2+ | A 3;
j
A 3+ j A „
ponieważ dopóki współczynniki Qj kombinacji mają sumę równą 1, dopóty otrzymywać będziemy produkcję 2 = 1 * Matematycznie oznacza to, że do wytworzenia jednostki produktu musimy używać tylko wypukłych kombinacji wektorów aktywności; graficznie oznacza to, że proporcje nakładów odnoszące się do kombinowanych procesów muszą leżeć na odcin kach prostej łączących wektory aktywności A i, . . . , A 4. Możemy w związku z tym zauważyć, że chociaż do wypukłej kombinacji na rys. 20.3 można włączyć każdą parę wektorów aktywności, to jednak wystarczy rozważać jedynie wypukłe kombinacje sąsiednich wektorów (takich jak A iA 2 i A 2A 3). Kombinacje we ktorów, które nie są sąsiednie, można odrzucić jako nieefektywne. Rozważmy np. odcinek A iA 3 (zaznaczony linią przerywaną). Punkty odcinka A iA 3 — z wyjątkiem końców A i i A 3 — leżą na północny wschód od A iA 2 i od A2A 3, wymagają więc większych na kładów, zarówno kapitału, ja k i pracy, niż punkty Aj A2 lub A 2A3. Tymczasem otrzymany produkt jest dla nich wszystkich identyczny i równy Q - 1. Wypukła kombinacja A i i A4 (pary punktów najbardziej oddalonych od siebie) wypada jeszcze gorzej, gdyż odcinek (linia przerywana) Ai A4 leży jeszcze dalej i wymaga jeszcze większego zużycia nakładów. Z tego powodu odcinki prostych A jA 3, A iA 4 i A2A4 (nie zaznaczone na rysunku) są oczy wiście dominowane przez A iA 2, A2A3 i A3A4 i wobec tego mogą być po prostu pominięte. Punkty na trzech narysowanych odcinkach nie dominują się nawzajem; gdy przechodzimy od jednej proporcji nakładów do innej, wzrostowi zużycia jednego zasobu towarzyszy zmniejszenie zużycia drugiego. W rezultacie łamaną A iA 2A3A4 możemy przyjąć jako izokwantę dla 2 = 1Izokwanta ta oczywiście różni się od klasycznej gładkiej izokwanty pokazanej na rys. 20.1, chociaż jest,jej znacznie bliższa niż przypadek pojedynczego procesu pokazany na rys. 20.2. Izokwanta A iA 2A 3A4 nie jest gładka. Stopą substytucji jest w pewnym zakresie stała, potem skokowo się zmienia. Cecha ta będzie występować dopóty, dopóki firma będzie dysponować jedynie skończoną liczbą czystych procesów produkcyjnych, gdyż kążde zwiększenie liczby procesów o skończoną liczbę spowoduje jedynie zwiększenie liczby odcinków na izokwancie, ale nie może wygładzić załamań. Z tego punktu widzenia gładka izokwanta klasycznej teorii może się pojawić jedynie przy założeniu, że firma dysponuje nieskończoną liczbą czystych procesów produkcyjnych. Izokwanty dla innych poziomów produkcji można skonstruować w analogiczny sposób. 4 Zwróćmy uwagę, że narysowane wektory aktywności A i,..., A4 pokazują, że żaden z nich nie jest „dominowany” przez trzy pozostałe w tym sensie, że wymaga więcej K i więcej L do wytworzenia jednostki produktu, czyli jest oczywiście nieefektywny i jako taki nigdy nie zostanie wykorzystany.
704 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE 705
produkcję Q w ramach danych zasobów K iL . Wtedy odpowiednim zadaniem programowania liniowego będzie: ^ . zmaksymalizować (20.16)
Q = g i + Q i + 23 + 24»
przy warunkach
A XQ X+ A 2g 2 + A 3Q 3 + A 4Q 4 ^ r,
oraz
2 ,^ 0
(7 = 1 . ...¿ 4 ),
gdzie symbole Q są skalarami, symbole Af oznaczają wektory aktywności zdefiniowane ............ jr w (20.15), a r s oznacza dostępne zasoby. Dla naszych obecnych celów aktywności
[L0J
Rysunek 20.4 Na przykład dla Q —2 , możemy po prostu dla każdego wektora Ą,* utworzyć 2 A (podw a jając rzędną i odciętą punktu), a następnie połączyć odcinkami sąsiadujące punkty. Na mocy założenia CRTS w programowaniu liniowym wszystkie punkty na nowej łamanej izokwancie będą odpowiadały produkcji Q = 2. Na rys. 20.4 narysowano cztery takie izokwanty. Tutaj różnica w porównaniu z klasycznym podejściem jest widoczna. Chociaż zjawisko CRTS można włączyć do klasycznych izokwant (ustalając dla nich jednakowe odległości), jednak nie musi ono wystąpić; przeciwnie, w programowaniu liniowym zawsze zakładamy, że CRTS występuje. Zwróćmy uwagę na to, że chociaż dopuszczalne jest przyłączenie do pierwszej izokwanty (2 = 1) punktów leżących na północ od Ai i na wschód od A4, nie zrobiliśmy tego z prostego powodu: takie punkty byłyby dominowane. W konsekwencji wszystkie izokwanty będą leżały wewnątrz obszaru o kształcie stożka, ograniczonego przez dwie półproste aktywności położone najbardziej na zewnątrz, a więc przez A'iQi i A 4Q4. Taki obszar, który jest wy pukłym zbiorem punktów i w związku ż tym jest nazywany stoikiem wypukłym, reprezentuje wszystkie nieujemne liniowe kombinacje dwu wektorów (tu Ai i A4). To znaczy, że jeśli weźmiemy wszystkie możliwe nieujemne wielokrotności dwu wektorów i utworzymy wszystkie możliwe sumy metodą równoległoboku, to otrzymane wektory wypełnią obszar stożkowy.
Optymalizacja Spójrzmy teraz na zagadnienie programowania liniowego z punktu widzenia warunków ograniczających interpretowanych jako aktywności. Załóżmy, że wieloprocesowa, wy twarzająca pojedynczy produkt firma przedstawiona na rys. 20.4 chcę maksymalizować
niedoboru nie będą przydatne, więc je pomijamy. Pomimo to, że występują tu cztery zmienne decyzyjne, zagadnienie można rozwiązać graficznie. Jest to możliwe, ponieważ warunki ograniczające możemy odczytywać pionowo i każdy wektor aktywności jest wektorem dwuwymiarowym. W tej sytuacji dla każdego składnika A jQ j, występującego w ograniczeniach, możemy wykreślić półprostą aktywności na płaszczyźnie KL (przestrzeń nakładów)— por. rys. 20.4. W wyniku umieszczenia na osiach zasobów, a nie zmiennych decyzyjnych, sprowadzamy zagadnienie czterowymiarowe do dwuwymiarowego. Ponieważ izokwanty — które obejmują ekonomicznie efektywne kombinacje nakładów — są ograniczone do wypukłego stożka wyznaczonego przez dwie półproste aktywności leżące najbardziej na zewnątrz, firma nie musi wychodzić poza stożek w poszukiwaniu optymalnego rozwiązania. Ale ograniczenia dotyczące zasobów w istocie jeszcze bardziej zawężają pole poszukiwań. JeśU na diagramie zaznaczymy K 0 i L0, to prostokątny obszar OK0rL 0 określa zbiór wszystkich dopuszczalnych kombinacji nakładów możliwych do wykorzystania przez firmę. Wyrzucając z tego prostokąta wszystko to, co leży poza stożkiem wypukłym, otrzymujemy zaciemniony obszar (część wspólną prostokąta i stożka), który jest ostatecznym obszarem wyboru. Zmaksymalizowanie produkcji Q oznacza wspięcie się na najwyższą możliwą izokwantę. Przy ograniczeniu dotyczącym zasobów największą osiągalną wielkością produkcji na rys. 20.4 jest Q = 4, która wymaga pełnego zużycia dostępnych zasobów K 0 i L 0 w punkcie r. Ponieważ punkt r leży na odcinku łączącym 4A i i 4 A 2, więc jest oczywiste, że tylko pier wsze dwa procesy będą przyjęte w rozwiązaniu optymalnym, tzn. musimy przyjąć 23 = 24 = 0- To oraz» fakt, że K 0 i L0 mogą być w pełni wykorzystane, powoduje, że A ig i + A2g 2 = r, czyli:
~k 2 "Ki "k ó Qi 2i + l2 L0 U
(20.17)
z tego układu równań liniowych obliczamy z łatwością: -
K oL 2 —K 2L o
.
-
^ “7“ K XL 2—K 2L X
1
22 = ~ K xL 2- K 2L x
K \ L q —K qL \
Na zagadnienie to można spojrzeć inaczej. Ponieważ r jest wypukłą kombinacją 4Ai i 4A2, więc musi istnieć w przedziale (0, 1) jedna jedyna taka liczba 9 , że 0(4Ai) + (l-< 9 )4 A 2 = r, tzn.: 45 — Podstawy..
PROGRAMOWANIE LINIOWE 707
706 PROGRAMOWANIE MATEMATYCZNE
(20.18)
4(9
A A
+ 4 (1 —0)
b. Czy te półproste określają również wypukły stożek? c. Czy stożek ten bardziej przypomina wafelkowy kubeczek do lodów, czy odwróconą piramidę? Dlaczego?
A 'Ko A A
wynika stąd, że: ^ K o -4 K 2 u —4 (K i-K £
L o -4 1 * 4(L i - L 2)
5. Jak zmieniłoby się rozwiązanie zagadnienia przedstawionego na rys. 20.4, gdyby ograniczenia dotyczące zasobów zastąpiono przez: 3KĄ
(a)
3L4
Porównując (20.17) z (20.18), możemy zapisać wartości rozwiązań również jako: K 0- 4K 2
K q - 4 K 2' Cl =40 =
0 2 = 4 (1 - 0 ) = 4-
k> -k2
K ,- K 2
Powyższe zagadnienia można oczywiście rozwiązać zwyczajną metodą simpleks; można również najpierw sformułować dualne zagadnienie programowania liniowego, rozwiązać je i obliczyć rozwiązanie zagadnienia prymalnego. Ponieważ występują tu dwa warunki ograniczające, więc .wiadomo, że w rozwiązaniu optymalnym nie więcej niż dwie zmienne decyzyjne Qj będą różne od zera. Jest to dokładnie ten sam wynik, jaki otrzymaliśmy na podstawie wersji wykorzystującej analizę aktywności.
Ćwiczenie 20.3 1.
[2l
a. b. c. d.
K 24- 3 K 3 L 2 4-3 L3
6. Jakie byłoby nowe rozwiązanie optymalne zadania z rys. 20.4, gdyby punkt r został przesunięty na północ od punktu 4AX? Czym różniłoby się ono od typu rozwiązania pokazanego na rys. 20.4? 7. Pokazać, że funkcja produkcji dla firmy stosującej jeden proces produkcyjny, z CRTS i ustaloną proporcją nakładów zilustrowaną na rys. 20,2, może być reprezentowana przez równanie:
^
\K
L
20.4. ANALIZA DZIAŁALNOŚCI: POZIOM MAKRO
Załóżmy, że jednostka produktu może być wytwarzana za pomocą każdej z następu[k \ jących trzech kombinacji L A 2—
A i- . ;
(b)
A3 =
Narysować wektory A i, A 2 i A 3. Skonstruować izokwantę dla produkcji Q = 1. Ile załamań zawiera ta izokwanta? Narysować półproste aktywności A i 2 i » A2G2 i A 3g 3. Przy założeniu CRTS narysować izokwantę dla Q = 2.
2. Jeśli w poprzednim zagadnieniu byłoby wiadomo, że jednostkową produkcję można [3] otrzymać dla czwartego wektora aktywności ^ , to czy włączylibyśmy go do izokwanty
Wiele wiadomości przekazanych w poprzednim podrozdziale można również zastosować do analizy na poziomie makro. W przypadku analizowania firmy każda aktywność jest wiązana z oddzielnym procesem produkcji. Na poziomie całej gospodarki każdą aktywność możemy traktować jako reprezentującą gałąź gospodarki. Zgodnie z tym poziom aktywności będzie teraz określał poziom produkcji (pojedynczego) produktu całej gałęzi. Jeśli ponadto zakładamy, że każda gałąź charakteryzuje się stałymi przychodami skali i stałymi proporcjami nakładów, to związek nakładów i wyników dla kążdej gałęzi może być przedstawiony za pomocą jednej półprostej aktywności, na której punkt położony dwa razy dalej od początku układu zawsze będzie oznaczał dwukrotnie większą produkcję. Ponieważ CRTS i stałe proporcje nakładów to standardowe założenia w modelach nakładów i wyników, więc wydaje się, że teraz będziemy mogli interpretować te modele za pomocą analizy aktywności lub programowania liniowego. Rzeczywiście tak jest.
<2=1? Dlaczego tak lub dlaczego nie? 3. W ćwiczeniu 20.3-1 wyjaśnić, czy izokwanta dla Q = 1 zawiera następujące trzy punkty:
(a) 4.
r5 7 \ ?
2j
(b)
i8 ~3 \
^ ; j /
(c)
[7
\
Analiza nakładów i wyników a programowanie liniowe
7)
2’ 4
y
Załóżmy, że firma ma cztery aktywności wykorzystujące trzy zasoby do wytwarzania jej produktu. a. Czyjej półproste aktywności znajdują się w przestrzeni 3-wymiarowej, czy w 4-wymiarowej?
Każda gałąź wytwarzając jakieś produkty korzysta z dwojakiego rodzaju nakładów, a mianowicie z nakładów pierwotnych (primary inputs), które nie są produktem żadnej gałęzi, i nakładów pośrednich (intermediate inputs), które są produktami innych gałęzi. Jeśli założymy, że w sumie jest n gałęzi i każda produkuje inne dobro, to — przyjmując takie same symbole na oznaczenia współczynników nakładów, jak w podrozdz. 5.7 — możemy stwierdzić, że istotne są następujące trzy typy nakładów:
708 PROGRAMOWANIE MATEMATYCZNE
r
1
00j -0 < V
a M
PROGRAMOWANIE UNIO WE 709
widzenia. Przede wszystkim łatwo zauważyć, że aby zaspokoić całkowity popyt, wystarczy, żeby produkcja każdej gałęzi była nie mniejsza niż całkowity popyt na nią (a nie równa popytowi). W rezultacie (20.20) można zastąpić nierównością:
«1i - a u
a V ,
■
>
a 2j
(I-A )x ^ d .
- a 2j
- 0 / i/
_
~ a nj
Pierwszy wektor stanowi pełny opis związku nakładów i wyników jf-tej działalności (gałęzi): pierwszy występujący tu element (1) oznacza jednostkową produkcję y-tego dobra, drugi element oznacza niezbędną w tym celu ilość pierwotnego nakładu, a pozostałe elementy oznaczają zapotrzebowanie na nakłady pośrednie. Drugi wektor, w którym pominięto pierwszy element, a znaki pozostałych elementów zmieniono na przeciwne, dotyczy jedynie opisu zapotrzebowania gałęzi na nakłady. Trzeci wektor jeszcze bardziej zawęża perspektywę, opisując jedynie nakłady pośrednie. Nazwa: wektor aktywności najczęściej nadawana jest pierwszemu wektorowi w (20.19). Ale, podobnie jak w poprzednim podrozdziale, zarezer wujemy tę nazwę dla zmodyfikowanej wersji tego wektora, którą wprowadzimy później. Rozważmy na razie trzeci wektor z (20.19); Ponieważ gospodarka liczy n gałęzi, więc można zapisać n takich wektorów. Po połączeniu utworzą one znaną macierz stopnia n: a u 012 ...
0i„
021 022 •••
02/i
Chcąc zabezpieczyć się przed niepożądanymi nadwyżkami — aby nie pojawiły się nie kontrolowane wartości w nierównościach > — powinniśmy dodać do tych nierówności również wymaganie minimalizacji. Zakładając na przykład, że praca jest jedynym nakładem wytworzenia wskazanego powyżej produktu. Oznacza to, że dążymy do zminimalizowania:
L
—
Dla danej macierzy A oraz wektora produkcji globalnej i wektora popytu końcowego: d,
*1 X=
*2
;
d =
¿2
dn
nasze zadanie — zgodnie z wcześniejszymi rozważaniami dotyczącymi modelu nakładów i wyników — polega na znalezieniu takiego wektora x, aby: (20.20)
( I - A ) x = d.
Rozwiązaniem, przy założeniu, że ( I - A ) jest nieosobliwa, jest po prostu równość: (20.21)
x = ( I - A ) - 1d.
Tak sformułowane zagadnienie nie przypomina optymalizacji typu programowania liniowego, ponieważ nie występuje tu funkcja celu, która miałaby być optymalizowana, oraz równanie (20.20), chociaż ma charakter ograniczenia nałożonego na poziom produkcji każdej gałęzi (każda gałąź powinna wytwarzać produkcję wystarczającą do zaspokojenia całkpwitego popytu), nie zawiera żadnych nierówności. Jednak na to samo zagadnienie nakładów i wyników można spojrzeć z innego punktu
a o j X j ■
—
[001 002
••• 0 o j
= A'0x,
gdzie L oznacza całkowite nakłady pracy, a A '0 — wektor wierszowy współczynników nakładów pracy. Dodatkowo, ponieważ poziomy produkcji xj nie mogą być ujemne, więc uzasadnione jest również przyjęcie ograniczeń x 5* 0. Z tego punktu widzenia model nakładów i wyników (20.20) może być przeformułowany i zapisany w równoważnej matematycznej postaci: zminimalizować (20 .22)
0/tl 0/12 ••• 0/i/j
X
7=1
przy warunku oraz
L - A qX, \
(I - A)x = d, x^0,
co — jak widać — jest po prostu standardowym zagadnieniem programowania liniowego.
Rozwiązanie Zagadnienie programowania liniowego (20.22) może być rozwiązane dwoma sposobami. Pierwszy polega na odczytaniu n Warunków ograniczających w kierunku poźiomym, a drugi na odczytaniu ich w kierunku pionowym. W pierwszym przypadku n warunków okreś la n domkniętych półprżestrzeni, które wraz ż warunkami nieujemności wyznaczają zbiór rozwiązań dopuszczalnych (który jest zbiorem wypukłym) w nieujemnym oktancie. Funkcja celu generuje natomiast rodzinę hiperpłasżczyzn, dla których zużycie pracy jest stałe (isolabor hyperplaneś). Znalezienie optymalnego rozwiązania oznacza wybranie ze zbioru rozwiązań dopuszczalnych punktu należącego do hiperpłaszczyzny z minimalną wartością L. Ten punkt (*) musi koniecznie być tym samym, który otrzymaliśmy w (20.21), bo jeśli praca jest niezbędnym nakładem dla każdego wytwarzanego dobra, to wektor produktu z najmniejszym zapotrzebowaniem na pracę musi koniecznie być tym samym, który nie Zawiera nadwyżkowej :pródukcji przekraczającej cąłkówity popyt. Oznacza to, że optymalny wektor produkcji musi być równy x = ( I - A ) “l d, czyli musi być taki sam, jak otrzymany w rozwiązaniu modelu nakładów i wyników. Zauważmy, że w tym przypadku wszystkie ograniczenia są spełnione W postaci równości. Dzieje się tak dlatego, ponieważ w rozpatrywanym zagadnieńiu liczba warunków ograniczających jest równa liczbie zmiennych decyzyjnych.
710 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE 711
Odczytajmy teraz ograniczenia w kierunku pionowym. Ponieważ macierz (I - A) składa się z następujących n wektorów:
—#21
~ P12
P ln
1 — Cl22
~ Pin
- Przykładowy wypukły stożek wielościenny na rys. 20.5 jest całkowicie usytuowany w nieujemnej ćwiartce. Tak jednak nie będzie w przypadku zagadnienia programowania liniowego nakładów i wyników. Dla modelu trój gałęziowego warunki ograniczające przyj mują postać: “
1 - '.< * 1 1
“ a n\
# /i2
1
(20.23)
;“
a 2ł
# 12
1 — ¿222
*1 +
... “
a l3
— #23
*2 +
di
^ 3 ^
# n n
„
możemy je więc wykreślić jako wektory aktywności w przestrzeni n-wymiarowej. Dokładniej, możemy je wykreślić w przestrzeni popytu końcowego (gdzie na j-tej osi zaznaczono popyt końcowy na Xj) na takiej samej zasadzie, na jakiej wektory aktywności w (20.13) powinny być wykreślone w przestrzeni nakładów (w przestrzeni KL). Dla wektorów tych należy następnie utworzyć kombinację liniową o współczynnikach nieujemnychx l t x 2, . . . , x n. Zbiór — n-wymiarowego analogonu wypukłego stożka z rys. 20.4. Przykładowy obraz takiego stożka pokazano na rys. 20.5 dla przypadku n = 3. Jeśli trzy strzałki oznaczają trzy wektory, to zbiór wszystkich nieujemnych kombinacji dwu z tych wektorów (otrzymanych metodą równoległoboku) będzie stanowić taką część płaszczyzny, jak Fr lub F2, która — jak zakładamy —■rozciąga się w nieskończoność w kierunku przeciwnym do początku układu współrzędnych i tworzy dwuwymiarowy stożek wypukły podobny do tego, który pokazano na rys. 20.4. Jeśli następnie utworzymy wszystkie możliwe nieujemne kombinacje punktów leżących na F Y i F2, to będziemy również mogli wypełnić przestrzeń ograniczoną przez powierzchnie Fu F 2 i F3 (której kawałek widać z tyłu). Zatem wszystkie nieujemne kombinacje danych wektorów będą stanowić zbiór punktów położonych na brzegu lub we wnętrzu bryły w kształcie piramidy pokazanej na rys. 20.5, która — podobnie jak Fi i F2 — rozciąga się w nieskończoność na zewnątrz. Bryła ta stanowi wielościenny stożek, będący zbiorem wypukłym, a powierzchnie reprezentowane przez (przedłużone wersje) Fiy F2 i F 3 są nazywane ścianami stożka.
“
# 31_
_
“
# 32.
.
d 3_
a ponieważ wszystkie współczynniki ¿z¿/są albo dodatnimi ułamkami, albo zerami, więc elementy trzech wektorów aktywności będą miały następujące znaki (w przypadku gdy są niezerowe): wektor 1
wektor 2
wektor 3
Ze względu na obecność w każdym z trzech wektorów ujemnych elementów, półproste aktywności muszą leżeć poza nieujemną częścią przestrzeni. Na rys. 20.6(a), który przedstawia widok naszej trójwymiarowej przestrzeni z lotu ptaka, widzimy, że np. półprosta 1 jest dodatnia w kierunku x u ale ujemna w kierunku x 2; ma ona w istocie ujemne współrzę dne jc3, tzn. z naszego punktu widzenia jest na zewnątrz. Półprosta 2 może być podobnie interpretowana. Gdy narysujemy półproste w przestrzeni trójwymiarowej, jak na rys. 20.6(b), muszą one tworzyć wypukły wielościenny stożek zawierający nieujemny ortant. Co ciekawe, nieujemny ortant jest teraz podzbiorem wypukłego wielościennego stożka, có jest od wróceniem sytuacji przedstawionej na rys. 20.5. Zinterpretowaliśmy nieujemne kombinacje trzech wektorów leżących po lewej stronie (20.23) jako odpowiadające punktom wypukłego stożka wielościennego. Jak zinterpretujemy Popyt końcowy na x 2
Popyt 4 końcowy na x 3
_ 1 — # 33_
Popyt 4. Popyt końcowy końcowy na x 2 VPółprosta 3 na x 3
Półprosta 2
Półprosta 2
E&y
Popyt końcowy na
na %2 Popyt końcowy na x 1
Półprosta 1
Popyt końcowy na
Półprosta 1
(a)
Rysunek 20.5
Rysunek 20.6
(b)
712 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE LINIOWE 713
pozostałe wyrażenie 5* d? Punkt wektorowy d o współrzędnych (d i, d 2,d 3) leży dokładnie nad punktem (du d2) 0) leżącym na płaszczyźnie podstawy na rys. 20.7. Wyrażenie ^ d definiuje podzbiór przestrzeni końcowego popytu spełniających warunek, że popyt naj -te dobro jest nie mniejszy niż konkretna wielkość d j( j = 1 ,2 ,3 ). Jeśli przyjmiemy punkt d jako nowy początek układu współrzędnych i wykreślimy trzy nowe osie równoległe do pierwotnych (zaznaczone strzałkami), to wspomniany podzbiór będzie miał taki sam związek z punktem d, jak nieujemny ortant ma z początkiem układu współrzędnych. Ponieważ zbiór ten przypomina „górny pokój w domu” , więc będziemy go nazywać d-strychem (d loft). Odczytując (20.23) w całości, musimy skupie uwagę na tych punktach wielościennych stożka wypukłego, które są zawarte w ¿/-strychu. Ponieważ jednak ¿/-strych jest podzbiorem nieujemnego ortantu, a zatem jest podzbiorem stożka, oznacza to, że należy uwzględnić jedynie ¿/-strych. Popyt | końcowy na x 3
(d\r dg, d/jj [ I Popyt końcowy
na *2 I * W„ d„ Ó)
Popyt końcowy na x x
Rysunek 20.7 Cfelem zagadnienia programowania liniowego jest zatem zminimalizowanie L, podczas gdy wciąż pozostajemy w Obrębie zbioru ¿/-strychu, tzn. wybranie z całej rodziny ń płasżczyżń o stałym nakładzie pracy lub — dokładniej — podzbioru płaszczyzn tej płaszczyzny, która jest najniżej położona spośród płaszczyzn przecinających ¿/-strych. Ponieważ takie fragmenty płaszczyzny, wszystkie równoległe, mają na ogół taki kształt jak zaciemniony trójkąt ha ryś. 20.7 (porównaj ćwiczenie 20.4-4), więc Optymalny jest ten, który śtyka się z ¿/-strychem w punkcie d. W rezultacie ograniczenie (20.23) musi dla rozwiązania optymalnego być ostrą nierównością. Prowadzi nas to ponownie do wzoru (20.20) i do tego samego rozwiązania, jakie otrzymaliśmy wcześniej W (20.21).
ćwiczenie 20.4 1. W modelu nakładów i wyników omówionym W tekście nić nałożono ograniczeń dotyczących dostępnych zasobów pracy. Gdyby dostępna była jedynie ograniczona ilość
L0, to jakie dodatkowe ograniczenie należałoby uwzględnić w modelu? Podać je w zapisach sumacyjnym i wektorowym. ^ 2. Początek układu współrzędnych jest elementem dowolnego stożka (nazywanym wierzchoł kiem stożka). Na podstawie analizy aktywności wyjaśnić, dlaczego tak właśnie powinno być. 3. Dane są trzy wektory:
Y iy
"
2
-1
i
y i
Narysować stożek generowany przez nieujemne kombinacje tych wektorów. 4. a. Wyjaśnić, dlaczego część płaszczyzny na rys. 20.7 dotycząca nakładu pracy ma kształt trójkąta. b. Dlaczego wszystkie fragmenty płaszczyzn o stałych nakładach pracy są równoległe?
PROGRAMOWANIE NIELINIOWE 715
Podobne zagadnienie minimalizacji można zapisać w postaci: zminimalizować
C = f( x x, x 2, ..., x n),
przy warunkach
gKxu x 2, ..., *„) ^ ru g 2{xi, x 2, .,.,* „ ) ^ r2,
(21.2)
2 1 .
P R O G R A M O W A N IE
N IE L IN IO W E
gm{ x U oraz
X j> 0
x 2,X„)
3= rm,
0 = 1. 2, . . . , n )
lub zwięźlej: zminimalizować (21.2')
Programowanie liniowe, opisane w dwu ostatnich rozdziałach, jest rzeczywiście udoskonalone w porównaniu z klasyczną optymalizacją, ponieważ mogą w nim występować warunki ograniczające w postaci nierówności oraz uwzględnione w jawny sposób warunki nieujemności. Konieczność ograniczenia się do liniowej funkcji celu i liniowych ograniczeń może jednak niekiedy stanowić poważny niedostatek. Kolejnym udoskonaleniem schematu optymalizacji jest programowanie nieliniowe, w którym można uwzględnić nieliniowe funkcje celu oraz nieliniowe warunki ograniczające w postaci nierówności..
21.1. NATURA PROGRAMOWANIA NIELINIOWEGO Zagadnienie maksymalizacji w programowaniu nieliniowym ma następujący ogólny schemat: zmaksymalizować
n = f( x i, x 2, ..., *„),
przy warunkach
g \ x u *2,
(21.1)
gm(x 1, * 2, ...,*n) ^ rm, X j^ 0 (j = 1, 2, ..., n).
Jeśli w-tkę zmiennych decyzyjnych oznaczymy symbolem * bez indeksów, to (21.1) możemy zapisać zwięźlej jako: zmaksymalizować (21.1')
przy warunkach oraz
k
= /(*),
g' (*) ^ ¿y *2^0.
(i= 1, 2,
przy warunkach
g ‘(x) > r,
oraz
x5= 0.
( i = l , 2, . .. , m ),
Na podstawie powyższych zapisów jasno widać, że zagadnienie programowania nieliniowego, podobnie jak liniowego, składa się z trzech czynników: funkcji celu, zbioru m warunków ograniczających oraz zbioru warunków nieujemności nałożonych na n zmien nych decyzyjnych. Podobnie jak w programowaniu liniowym, m może być większe, równe lub mniejsze od n. Zakłada się, że wszystkie funkcje/(* ) i g \x ) występujące w zagadnieniu są różniczkowalue. Aby zachować zgodność z naszymi wcześniejszymi ustaleniami dotyczą cymi programowania liniowego, w zagadnieniu maksymalizacji przyjmujemy jedynie warunki ograniczające typu a w zagadnieniu minimalizacji -— tylko rodzaju W przypadku gdy pojawi się nierówność o przeciwnym zwrocie, można ją z łatwością zmienić, mnożąc przez- 1 . Sformułowania w (21.1) i (21.2) są oczywiście najbardziej ogólnymi zagadnieniami optymalizacji, z jakimi do tej pory mieliśmy do czynienia. Obejmują one wszystkie omawiane poprzednio zagadnienia optymalizacji, w tym programowanie liniowe jako szczególny przypadek. Jeśli uwzględnimy samą funkcję celu, mamy zagadnienie ekstremum bezwarun kowego, a gdy do funkcji celu dodajemy warunki ograniczające w postaci ścisłych równań dla m < n , otrzymujemy klasyczne zagadnienie optymalizacji warunkowej1.
Nieliniowość w ekonomii
^ rx,
g \ x l, x 2, . . . , x j ^ r 2,
oraz
C =/(.<),
ni),
Nieliniowość może wynikać z różnych powodów. W zagadnieniu produkcji w programowa niu liniowym zakładano, że przypadający na jednostkę zysk brutto dla każdego produktu jest stały. Ale może równie dobrze być malejącą funkcją poziomu produkcji albo dlate go, że większa produkcja powoduje zmniejszenie ceny rynkowej (przeciętnego przycho-
1 W istocie związek między programowaniem nieliniowym i klasyczną optymalizacją jest jeszcze bliższy, ponieważ — jeśli się chce — problem programowania nieliniowego można przekształcić w zagadnienie klasyczne, wykonując następujące dwa kroki: ( 1 ) wprowadzić m zmiennych dodatkowych, aby warunki zapisane w postaci nierówności przekształcić w równania; (2 ) potraktować każdą z n zmiennych decyzyjnych i każdą z m zmiennych dodatkowych jako kwadrat nowej zmiennej sztucz nej, aby zapewnić nieujemność (zobacz ćwiczenie 2 1 .1 - 6 ).
PROGRAMOWANIE NIELINIOWE 717
71 6 PROGRAMOWANIE MATEMATYCZNE
du), albo dlatego, że podnosi przeciętny koszt zmienny produktu. Jeśli tak, to liniowa funkcja celu 7U= ciX i + . . . + c nxn musi być zastąpiona przez wersję nieliniową taką, jak n - c x(a:i)jci + ... + cn(*„)*„, gdzie cj(xjj oznacza malejącą funkcję zmiennej xj. Podobnie w części zawierającej warunki ograniczające może się zdarzyć, żę zapo trzebowanie na nakłady zasobu z w produkcji dobra / maleje wraz ze wzrostem poziomu produkcji dobra/. Na przykład można sobie wyobrazić, że pewne produkty będą wytwarzane coraz szybciej, więc każdy następny produkt będzie wymagał mniej czasu maszynowego. Oczywiście niweczy to stałość współczynnika zakładaną w programowaniu liniowym. Może się też zdarzyć, że współczynnik a tj zależy od poziomu produkcji nie tylko produktu/*, lecz również innego produktu k. Wtedy w warunkach ograniczających pojawi się składnik zawierający iloczyn dwu zmiennych xj i **, co również powoduje nieliniowość. Jeśli opisane okoliczności ekonomiczne występują dla rozpatrywanego problemu, sformułowanie nieliniowe będzie bardziej odpowiednie niż liniowe. Niestety zniknie wówczas wiele wygodnych cech programowania liniowego. Można to zilustrować kilkoma przykładami prostych zagadnień nieliniowych, które można rozwiązać graficznie.
Rozwiązanie graficzne Przedstawimy trzy konkretne przykłady, z których każdy rzuca światło na pewne cechy szczególne odróżniające programowanie nieliniowe od programowania liniowego. Przykład 1. Mamy następujące zagadnienie: zminimalizować przy warunkach
:
C - (xi - 4 ) 2 + (x2- 4 ) 2,
2xi + 3x2 ^
2 10 C = f 2 —2 - 4 1 + 2 -------4 13 V ) s
13 J
12 U*
Dokładne wartości x x i *2 podane powyżej, oparte na geometrycznym fakcie styczności, znajdujemy algebraicznie. Przede wszystkim, ponieważ punkt styczności na rys. 21.1 (a) leży na północno-wschodniej granicy, spełnia oczywiście równanie: 3*i + 2*2 = 12.
[z drugiego warunku ograniczającego]
6,
— 3 * 1 - 2*2 ^ -12, oraz
Rysunek 21.1
* i,* 2 ^ 0 .
Ponieważ w zadaniu tym warunki ograniczające są liniowe, więc kształt zbioru roz wiązań dopuszczalnych nie różni się zasadniczo od zbioru rozwiązań dla zagadnienia programowania liniowego. Zbiór rozwiązań dopuszczalnych, pokazany na rys. 21.1 (a) jako obszar zaciemniony, ma południowo-zachodnią granicę wyznaczoną przez pierwszy warunek, a północno-wschodnią granicę wyznaczoną przez drugi warunek. Ponieważ funkcja celu jest nieliniowa, nie generuje więc rodziny równoległych linii prostych odpowiadających stałym wartościom. Zamiast tego otrzymujemy rodzinę koncentrycznych okręgów, o środku (4, 4); coraz mniejszym okręgom odpowiadają coraz mniejsze wartości C. W zagadnieniu ekstre mum bezwarunkowego wybraliśmy oczywiście punkt (*i, *2) - ( 4 , 4), dla którego otrzy mujemy minimalną wartość C = 0. Skoro jednak ograniczamy się do obszaru zacienionego, najlepsze co możemy zrobić, to wybrać punkt: ( . 3 . 10^ (* i,* 2) = 2 — ; 2 — 13 13 gdzie północno-wschodnia granica jest styczna do jednego z okręgów. Minimalna war tość C jest równa: -
Okrąg styczny do tej granicy w tym punkcie musi mieć takie samo nachylenie, jak granica, a mianowicie -3 /2 . Ponieważ nachylenie okręgu jest równe (stosujemy wzór dla funkcji niejawnej do równania F (x u * 2) = (*i - 4)2 + (*2 - 4)2 - C = 0): d*2
dF /dxi
2 (* i-4 )
* i-4
d*i
3F/3*2
2(*2- 4 )
* 2 -4
więc przyrównując je do -3/2, możemy otrzymać inne równanie: 2*i - 3*2 = - 4 . Rozwiązując te dwa równania liniowe jako układ równań, otrzymujemy optymalne rozwiązanie: ( * i,* 2) = o 2 X 10 13 ’ 13 Zwróćmy uwagę, że rozwiązanie optymalne nie jest zlokalizowane w punkcie wierzchoł kowym zbioru rozwiązań dopuszczalnych, jak oczekiwaliśmy przy programowaniu liniowym. Wydaje się, że tylko jeden warunek ograniczający — zamiast dwu — jest spełniony jako równość. Zwróćmy uwagę również na to, że gdy skierujemy się na północny wschód
PROGRAMOWANIE NIELINIOWE 719
718 PROGRAMOWANIE MATEMATYCZNE
w kierunku punktu (4,4), wówczas C najpierw zmaleje, ale utrzymanie tego samego kierunku po przekroczeniu punktu C prowadzi zamiast tego do rosnących wartości C. Zatem nie jest już uzasadnione — tak jak przy programowaniu liniowym — przesuwanie krzywej o stałej wartości jak najdalej w jednym ustalonym kierunku. l Przykład 2. Zanalizujemy następujące zagadnienie: zminimalizować przy warunkach
C = (* i -
*i +
-* i oraz
4 ) 2 + (* 2 -
*2 ^
4 ) 2,
5,
^ -6 , - 2 * 2> - l l ,
*1, * 2 ^ 0 .
Zagadnienie to różni się od poprzedniego tylko częścią zawierającą warunki ograniczają ce. Ze względu na liniowość ograniczeń zbiór rozwiązań dopuszczalnych jest ponownie wielokątem, ale jego nowe położenie względem okręgów o stałej wartości daje całkiem nowy typ wyników. Jak pokazuje rys. 21.1(b), punkt odpowiadający minimum bezwarunkowemu (4, 4) jest teraz zawarty wewnątrz zbioru rozwiązań dopuszczalnych, więc warunkowe rozwiązanie optymalne jest w tym samym punkcie, dla Ć = 0. Wobec tego rozwiązanie optymalne w tym przykładzie nie leży nawet na brzegu zbioru rozwiązań dopuszczalnych i w konsekwencji żadne z ograniczeń nie jest w tym punkcie spełnione jako równanie. W przeciwieństwie do programowania liniowego nie jest już możliwe zawężenie pola wyboru do punktów ekstremalnych zbioru rozwiązań dopuszczalnych. P r z y k ła d
3
. Mamy następujące zagadnienie:
zmaksymalizować
K - 2*i + * 2,
przy warunkach
-* i + 4 *i-
*2 ^ 0 ,
2*i + 3*2 ^ 12, oraz
* i, *2 ^ 0.
Nieliniowość pojawia się w tym przykładzie za pośrednictwem pierwszego warunku. Jeśli przepiszemy ten warunek w postaci *2 ^ - * i + 4 * i, gdzie wyrażenie po prawej stronie jest kwadratową funkcją *i, to widzimy, że ograniczenie to wymaga, abyśmy wybierali jedynie punkty leżące nad lub na paraboli pokazanej na rys. 21.2. Drugie ograniczenie wymaga, abyśmy pozostawali na linii prostej o ujemnym nachyleniu lub pod nią. Wobec tego zbiór rozwiązań dopuszczalnych składa się z dwu rozłącznych części F x i F2. Zatem w tym przypadku zbiór rozwiązań dopuszczalnych nie jest nawet zbiorem wypukłymi Dla liniowej funkcji celu otrzymujemy rodzinę warstwie w postaci prostych równoleg łych. Jeśli bierzemy pod uwagę tylko zbiór F x, to punkt P daje największą możliwą wartość /r, ale ponieważ F2 również jest dopuszczalne, więc punkt P jest tylko lokalnym, a nie global nym optimum. W istocie, każdy punkt F 2stanowi lepszy wybór niż P . Pokazuje to, że gdy zbiór rozwiązań dopuszczalnych nie jest zbiorem wypukłym, wówczas warunki dostateczne twierdzenia globalnego (por. podrozdz. 19.3) nie są spełnione, a zatem optimum lokalne nie musi koniecznie być optimum globalnym. -
1
2
3
4
5
6
Rysunek 21.2
Podsumowując, programowanie nieliniowe różni się od programowania liniowego przynajmniej pod następującymi pięcioma względami, z których niektóre są ściśle ze sobą związane: 1) pole wyboru obejmuje cały zbiór rozwiązań dopuszczalnych, a nie tylko zbiór jego punktów brzegowych; 2) liczba warunków ograniczających spełnionych w postaci równości (oraz warunków nieujemności) może nie być równa liczbie zmiennych decyzyjnych; 3) trzymanie się jednego kierunku ruchu nie musi prowadzić do wciąż rosnących (lub wciąż malejących) wartości funkcji celu; 4) zbiór rozwiązań dopuszczalnych nie musi być zbiorem wypukłym; 5) optimum lokalne nie musi być optimum globalnym. W wyniku tych różnic metody rozwiązań odpowiednie dla programowania liniowego są na ogół nieodpowiednie dla programowania nieliniowego; niezbędne są zatem nowe metody. W rozdziale tym skupimy jednak uwagę nie na algorytmach rozwiązań (które bywają zagmatwane i wyspecjalizowane), ale przede wszystkim na pewnych wynikach aiialityczhych (warunkach koniecznych i dostatecznych) zapewniających jakościowe, a nie ilościowe scharakteryzowanie rozwiązania optymalnego.
Ćwiczenie 21.1 Rozwiązać graficznie następujące trzy zagadnieUia programowania nieliniowego; w każdym przypadku podać konkretne wartości *i i *2: 1. Zminimalizować
C = x i + x 2y
przy warunkach
*i *2 ^ 25,
oraz
*i , * 2 ^ 0.
PROGRAMOWANIE NIELINIOWE 721
720 PROGRAMOWANIE MATEMATYCZNE
2. Zmaksymalizować przy warunkach oraz 3. Zminimalizować przy warunkach oraz
Wpływ warunków nieujemności
7t= x j + (*2 - 2)2, 5*1 + 3*2^ 15, *i, *2 ^ 0. C = * i + * 2, *2 + *2 ^ 9, —* i* 2 > - 8 , *i, *2 ^ 0.
X
Rozważmy zagadnienie zawierające jedynie warunki nieujemności. Dla przypadku jednej zmiennej otrzymujemy w szczególności:
__
\ zmaksymalizować ci V
4. Firma produkuje dwa wyroby. Liniowe funkcje popytu na nie są następujące: x x- a - bPx oraz *2 = c - dP2 . Przeciętne koszty zmienne dla dwu produktów są równe odpowiednio V i - m + x x i V2 = n + x Znaleźć funkcję celu równą całkowitemu zyskowi brutto. 5. Funkcja celu C = (* i - 4)2 + (*2- 4 ) 2 z przykładów 1 i 2 generuje rodzinę warstwie w postaci koncentrycznych okręgów na płaszczyźnie * i* 2. Jeśli wprowadzimy trzecią oś C, prostopadłą do dwu poprzednich, to jaką powierzchnię określi wtedy funkcja celu? 6. Przekształcić zagadnienie nieliniowe z ćwiczenia 21.1-1 w równanie klasyczne zagad nienia warunkowej optymalizacji: (1) stosując zmienną dodatkową s i (2) zapisując * i, *2 i s jako kwadraty trzech innych zmiennych, odpowiednio u, v i w. Rozwiązać zadanie klasyczną metodą i porównać wynik z graficznym rozwiązaniem otrzymanym wcześniej.
(21.3)
K = f(xf),
) przy warunkach
*i ^ 0,
gdzie zakładamy, że / jest różniczkowalna. Ze względu na ograniczenie * t ^ 0 mogą pojawić się trzy możliwości. Po pierwsze, jeśli lokalne maksimum dla n należy do wnętrza przyciemnionego zbioru rozwiązań dopuszczalnych przedstawionego na rys. 21.3, tak jak punkt A na diagramie (a), to otrzymujemy rozwiązanie wewnętrzne. Warunek pierwszego rzędu ma w tym przypadku postać d/r/d*i = /'(* 0 = 0, tak samo jak w zagadnieniu klasycznym. Po drugie, jak pokazuje punkt B na diagramie (b), maksimum lokalne może również leżeć na osi pionowej, gdzie *i = 0. Nawet w tym przypadku, tzn. dla rozwiązania brzegowego, obowiązuje warunek pierwszego rzędu/'(*0 = 0. Po trzecie, maksimum lokal ne może znajdować się w punkcie C lub D na diagramie (c), gdyż punkt, który ma być maksimum lokalnym dla zagadnienia (21.3), musi po prostu leżeć wyżej niż sąsiednie punkty wewnątrz zbioru rozwiązań dopuszczalnych. Ze względu na to punkt maksimum w zagad nieniu (21.3) może spełniać równanie/'(*i) = 0, ale może też spełniać nierówność/'(*0 < 0. Zuważmy natomiast, że możliwość wystąpienia przeciwnej nierówności /'(* i) > 0 możemy wykluczyć, gdy w punkcie, w którym krzywa ma nachylenie dodatnie, maksimum nie może wystąpić, nawet jeśli ten punkt leży na osi pionowej, tak jak punkt E na diagramie (a).
21.2. WARUNKI KUHNA-TUCKERA W klasycznym zagadnieniu optymalizacji, w którym nie nałożono jawnych ograniczeń na znaki zmiennych decyzyjnych i w którym nie występują warunki ograniczające w postaci nierówności, warunek pierwszego rzędu dla względnego lub lokalnego ekstremum wymaga, aby pierwsze pochodne cząstkowe (gładkiej) funkcji Lagrange’a względem wszystkich zmiennych decyzyjnych i mnożników Lagrange’a były równe zeru. W programowaniu nieliniowym istnieje podobny warunek pierwszego rzędu, zwany warunkiem Kuhna-Tuckera2. Zobaczymy jednak, że choć warunek pierwszego rzędu jest zawsze warunkiem koniecznym, to jednak warunek Kuhna-Tuckera nie może uzyskać statusu warunku koniecznego, jeśli nie jest spełnione pewne zastrzeżenie. W pewnych tylko sytuacjach warunki Kuhna-Tuckera są warunkami dostatecznymi lub nawet warunkami koniecznymi i dostatecz nymi. Ponieważ warunki Kuhna-Tuckera są najważniejszym rezultatem analitycznym pro gramowania nieliniowego, więc jest niezmiernie ważne, aby dobrzeje zrozumieć oraz poznać ich implikacje. W celu ułatwienia rozważań dotyczących warunków, rozłożymy je na dwa etapy.
Rysunek 2 13
W rezultacie możemy stwierdzić, że aby wartość *i wyznaczała maksimum lokalne dla K w zagadnieniu (21.3), musi ona spełniać jeden z następujących trzech warunków: (21.4)
/ ' ( * i) = 0
i
*i > 0,
[punktA]
(21.5)
f\x 0 -0
i
*i = 0,
[punkt B]
(21.6)
/'(* i)< 0
i
*i = 0.
[punkty C i D]
Te trzy warunki można połączyć w jedno stwierdzenie: (21.7) H.W. Kuhn, A.W. Tucker, Nonlinear Programming. W: Proceedings o f the Second Berkeley Symposium on Mathematical Statistics and Probability, pod red. J. Neymana, University of California Press, Berkeley (California) 1951, s. 481— 492.
/'(* !) ^ 0,
*x ^ 0
i
* i/'(* 1) = 0.
2
Pierwsza nierówność w (21.7) jest streszczeniem informacji dotyczącej /'( * i) zawartej w warunkach (21.4)-(21.6). Druga nierówność jest podobnym podsumowaniem dla 46 — Podstawy...
72 2 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE NIELINIOWE 723
*1 — po prostu powtórzeniem warunku nieujemności podanego w zagadnieniu. Jako trzecią część (21.7) mamy równanie wyrażające ważną wspólną cechę (21.4), (21.5) i (21.6), a mianowicie, że spośród dwu wartości x x i/'(* i) przynajmniej jedna musi mieć wartość zero, więc ich iloczyn musi być równy zeru. Trzy części (21.7) razem wzięte stanowią warunek pierwszego rzędu konieczny dla maksimum lokalnego w zagadnieniu, w którym zmienna decyzyjna musi być nieujemna. Możemy jednak powiedzieć, że jest to warunek konieczny dla maksimum globalnego, bowiem maksimum globalne musi być również maksimum lokalnym i jako takie musi spełniać warunek konieczny dla maksimum lokalnego. i Gdy zagadnienie zawiera n zmiennych decyzyjnych: (21 8)
zmaksymalizować przy warunkach
0,
X j^ 0
i
xjfj = 0
5Z*
5Z*
dZ*
5Z*
5Z*
5Z*
5*2
5*3
Si'i
ds 2
5 ji
5y 2
Przejdziemy teraz do następnego etapu i uwzględnimy warunki ograniczające w postaci nierówności. Dla ułatwienia zaczniemy od zagadnienia zawierającego trzy zmienne decyzyjne (n = 3) i dwa ograniczenia (m = 2): zmaksymalizować
7i = f ( x x, *2, * 3),
przy warunkach
g \ x Xi *2, *3) ^ ru
oraz
x l , x 2, x 3 ^ 0,
(21.10)
g2(*u x 2, x 3) ^ r2,
5Z*
0,
5xj
(21.12)
5 Z* dsi
^0,
5Z* =
5yt
7T = f(x x, *2, * 3),
przy warunkach
g 1(xx, *2, x 3) + s x = rx,
(21. 10')
g 2(xu *2, x 3) + s 2 = r2, x x, x 2, x 39s i 9s 2 ^ 0 .
Gdyby nie było warunków nieujemności, moglibyśmy — zgodnie z podejściem klasycznym — utworzyć funkcję Lagrange’a (mnożnik Lagrange’a oznaczamy tu symbo lem y, a nie X) :
0.
dZ* . *,— — = 0, J dxj
x j^ 0 Si ^ 0
sr
dZ* 5 Si
= 0,
/ z = l, 1, 2 J = \ , 2 ,3;
0 5Z*
muszą być równe zeru. (Dlaczego?) 5y/ Każdy wiersz wzoru (21.12) dotyczy innego typu zmiennych. Możemy jednak połączyć dwa ostatnie i wyeliminować zmienne dodatkowe warunku pierwszego rzędu. Ponieważ dZ*/dsi = - y iy więc drugi wiersz oznacza, że musi być - y L^ 0, s, ^ 0 i -J/y, = 0, czyli równoważnie: : (21.13)
Si& 0,
y, ^ 0
i
y ^ = 0.
Trzeci wiersz — przeformułowanie warunków ograniczających z (21.10') — oznacza, że Si = rt - g'(x 1, * 2, * 3). Podstawiając to wyrażenie do wzoru (21.13), możemy połączyć drugi i trzeci wiersz (21.12): ^H ri ~ g i(xu x 2, * 3) ^ 0 ,
y i^ O
i
y i [ r i - g i( x i , x 2, x 3)] = 0.
Dzięki temu warunek pierwszego rzędu (21.12) możemy wyrazić w postaci równoważnej bez zmiennych dodatkowych. Stosując symbol gj na oznaczenie d g lłdxjy możemy zapisać: 5Z*
i s2 można przekształcić do równoważnej
zmaksymalizować
=
Ponieważ jednak zmienne Xj i s,- muszą być nieujemne, więc warunki pierwszego rzędu dla tych zmiennych trzeba zmodyfikować zgodnie z (21.9). Otrzymujemy zatem następujący układ warunków:
Zwróćmy uwagę, że pochodne
Wpływ warunków ograniczających w postaci nierówności
oraz
dZ*
0*= 1 ,2 , ...,72),
gdzie f i jest pochodną cząstkową dttldxj.
które przy użyciu zmiennych dodatkowych, postaci:
Z* ==/(*!, *2, x 3) + y x [rx - g l(xx, x 2yx 3) - s x] + + y 2 \r2 g 2(xx, *2, * 3) $2] i*.«
i zapisać warunki pierwszego rzędu w postaci:
* = /( * ! , x 2y ..., xn), X j> 0 ( / = 1 ,2 ,...,7 * ),
wówczas w podobny sposób należy zmodyfikować klasyczny warunek pierwszego rzędu f i - f i = .../„ = 0. Możemy w tym celu zastosować ten sam sposób rozumowania, jak dla (21.7), do każdej zmiennej decyzyjnej Xj z osobna. Graficznie sprowadza się to do rozpatrywania osi poziomej na rys. 21.3 jako reprezentującej kolejno każdą Xj. Wymagana modyfikacja warunku pierwszego rzędu sama się narzuca: (21.9)
(21.11) ^ V-
5 xj
5Z* = fj - ( y ig ) + y 2g ] ) ** o,
o
i
J dxj
-= o ,
(21.14) r i - g ‘(x 1,
x x 3) 3» 0,
ydn-g'ixiyXz, x3)] = o.
Są to warunki Kuhna-Tuckera dla zagadnienia (21.10), a dokładniej — jedna z wersji warunków Kuhna-Tuckera wyrażona przy użyciu funkcji Lagrange’a Z* z (21.11). Teraz, gdy znamy już wyniki, spróbujemy je uzyskać bardziej bezpośrednio, stosując inną funkcję Lagrange’a. Dla zagadnienia (21.10) zignorujmy warunki nieujemności i znaki nierówności w ograniczeniach i zapiszmy funkcję Lagrange’a Z w klasycznej postaci: (21.15)
Z = f ( x u x 2, x 3) + y l {rl - g l (xu x 2, x i)] +
724 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE NIELINIOWE 725
Następnie: (1) przyjmiemy dla pochodnych cząstkowych warunki d Z I d x j^ 0 oraz dZ/dyt ^ 0, (2) nałożymy warunki nieujemności na xy i yt oraz (3) sprostamy wymaganiu, aby był spełniony warunek komplementamości (complementary slackness) dla każdej zmiennej i pochodnej Z względem tej zmiennej, tzn. aby ich iloczyn był równy zeru. W rezultacie takiego postępowania otrzymamy wynik dokładnie taki sam, jak w (21.14): dZ = fi~ + y 2g j ) * o,
Xj ^ 0
i
dZ n Xj— = 0, ÓXj
(21.16) dz 3
—
=
n
- !, X 2 ,
oyj
X3)
&
0 ,
. i
dZ y ,— = 0,
czyli warunki Kuhna-Tuckera można wyrazić również za pomocą funkcji Lagrange’a Z, (a nie tylko Z*). Zauważmy, że przestawiając się z Z* na Z, możemy nie tylko wyprowadzić warunki Kuhna-Tuckera bardziej bezpośrednio, lecz także utożsamić wyrażenie ri ~ g l(x i > * 2, * 3) , które w (21.14) nie było nazwane, z pochodną cząstkową 3Z/dyf. W dalszych rozważaniach będziemy stosować wersję (21.16) warunków Kuhna-Tuckera, opartą na funkcji Lagrange’a Z. X
Interpretacja warunków Kuhna-Tuckera Niektóre z warunków Kuhna-Tuckera stanowią po prostu powtórzenie pewnych fragmentów zagadnienia. Na przykład warunki xj ^ 0 są powtórzeniem warunków nieujemności, a wa runki dZIdyi ^ 0 są innym sformułowaniem warunków ograniczających. Uwzględnienie ich w (21.16) pozwala na ukazanie symetrii między dwoma typami zmiennych, a mianowicie między xj (zmiennymi decyzyjnymi) i y t (mnożnikami Lagrange’a). Każdej zmiennej, należącej do jednej z tych dwu kategorii, odpowiada warunek krańcowy dZIdxj ^ 0 lub dZIdyi ^ 0, który musi spełniać rozwiązanie optymalne. Każda zmienna musi być nieujemna i komplementarna względem pewnej pochodnej cząstkowej funkcji Lagrange’a Z. Oznacza to, dla każdego Xj, że w rozwiązaniu optymalnym albo warunek brzegowy jest spełniony jako równość (tak jak w ujęciu klasycznym), albo ta zmienna decyzyjna jest równa zeru, albo spełnione są oba te warunki. Analogicznie, dla każdego y,, w rozwiązaniu optymalnym albo warunek brzegowy jest spełniony jako równość, co oznacza, że i-ty warunek jest napięty, albo zeruje się mnożnik Lagrange’a, albo spełnione są oba te warunki. Rozważenie rozwiniętego zapisu dZIdxj i dZIdy) podanego w (21.16) umożliwi nam jaśniejszą interpretację warunków Kuhna-Tuckera. Załóżmy, że omawiane zagadnienie dotyczy produkcji. Wtedy:
Warunek krańcowy:
dz
'
^
'
.'
•
.
wymaga zatem, aby krańcowy zysk brutto dla /-tego wyrobu nie przekracza jego zagre gowanego krańcowego kosztu kalkulacyjnego, tzn. że nie jest możliwe niedokalkulowanie (underimputation). Warunek komplementamości oznacza, że jeśli w rozwiązaniu optymalnym j -ty wyrób ma być produkowany (xj > 0), to krańcowy zysk bmtto musi być dokładnie równy zagregowanemu krańcowemu kosztowi kalkulacyjnemu (d Z Id x j- 0), tak jak w klasycznym zagadnieniu optymalizacji. Jeśli natomiast optymalny krańcowy zysk brutto jest mniejszy niż zagregowany koszt kalkulacyjny (dZIdxj < 0), a więc powodujący nadwyżkę kalkulacyjną, to wyrobu tego nie należy produkować (x = 0), Ta ostatnia sytuacja3 nie może wystąpić w ujęciu klasycznym, gdyż gdyby zysk krańcowy bmtto był mniejszy niż krańcowy koszt kalkulacyjny, to produkcja zostałaby zmniejszona do poziomu, dla którego warunek krańcowy byłby spełniony jako równość. W obecnym ujęciu warunki nieujemności zostały natomiast sformułowane w sposób jawny, a to powoduje, że dZIdxj < 0 może być częścią rozwiązania optymalnego. Możemy bowiem zmniejszyć produkcję co najwyżej do poziomu x} = 0 i jeśli dla zerowej produkcji wciąż spełniona jest nierówność d Z /d xj < 0, i tak na tym poprzestajemy. Pozostałe warunki, dotyczące zmiennych y i9 są łatwiejsze do zrozumienia. Przede wszystkim warunek krańcowy d Z Id y, ^ 0 oznacza po prostu, że firma musi respektować ograniczenia dotyczące zasobów. Warunek komplementamości wymaga, aby cena dualna (zawsze nieujemna) /-tego zasobu, który nie jest całkowicie zużyty, była w rozwiązaniu optymalnym (dZIdyi > 0) równa zeru (y,- = 0). Jeśli natomiast zasób ma dodatnią cenę dualną w rozwiązaniu optymalnym (yf > 0 ), to musi być całkowicie zużyty (dZIdyi ~ 0). Są to oczywiście wnioski wynikające z twierdzenia o dualności II przedstawionego w poprzednim rozdziale. Wartość mnożnika Lagrange’a y, można naturalnie traktować jako miarę reakcji funkcji celu na niewielkie rozluźnienie /-tego ograniczenia (por. podrozdz. 12.2). Z tego punktu widzenia warunek wzajemnego uzupełniania oznacza, że jeśli i-ty warunek nie jest napięty dla rozwiązania optymalnego (dZ/dyt > 0), to osłabienie tego właśnie warunku nie wpłynie na optymalną wartość zysku bmtto (y, = 0). Jeśli natomiast niewielkie rozluźnienie /-tego warunku (zwiększenie ilości /-tego zasobu) powoduje zwiększenie zysku bmtto (y*> 0), to warunek dotyczący tego zasobu musi rzeczywiście być napięty dla rozwiązania optymalnego (dZIdy. = 0).
Przypadek n zmiennych z m ograniczeniami
fj = krańcowy zysk brutto dla/-tego wyrobu, y t = cena dualna /-tego zasobu, gj = ilość /-tego zasobu zużywanego do wytworzenia krańcowej jednostki /-tego wyrobu, yigj = kalkulacyjny koszt krańcowy /-tego zasobu przy produkcji jednostki/-tego wyrobu, X y,gj = zagregowany krańcowy koszt kalkulacyjny /-tego wyrobu. i
-
Powyższe rozważania można bezpośrednio uogólnić na przypadek zagadnienia maksymaliza cji (21.1) lub (21.1'). Ponieważ mamy teraz n zmiennych decyzyjnych i m ograniczeń, więc
3 Przypomnijmy, że gdy dane jest równanie ab = 0, gdzie a i b są liczbami rzeczywistymi, to z a ź 0 wynika b = 0, ale nie jest prawdą, że z a —0 wynika ¿ ^ 0 , gdyż b = 0 jest również niesprzeczne z a - 0.
PROGRAMOWANIE NIELINIOWE
726 PROGRAMOWANIE MATEMATYCZNE
lokalnego maksimum i dla lokalnego minimum. Ponieważ jednak globalne maksimum (lub minimum) musi być również maksimum (lub minimum) lokalnym, więc warunki Kuh na-Tuckera mogą być również traktowane jako warunki konieczne dla globalnego maksimum (lub minimum), przy spełnieniu wspomnianego zastrzeżenia.
funkcja Lagrange’a Z przyjmuje ogólniejszą postać: (21.17)
Z = /( * i, *2, ■ .V. .
..
xd +
*2» .v .,* n)],
. -i ‘ /= 1
727
a warunki Kuhna-Tuckera są następujące: dZ Xj d ź
'
Przykład
.
(21.18)
[maksymalizacj a] dZ
A
dyj r i= 1, 2, ..., / = !, 2,
Z = (*i - 4)2 + (*2 - 4)2 + yi(6 - 2*i - 3*2) + Y2(-12 + 3*i + 2*2)n
Nie podaliśmy tym razem pełnych wzorów dla pochodnych cząstkowych dZ/dxj i dZ Idy j . Czytelnik zechce je zapisać w rozwiniętej postaci, aby otrzymać dokładniejszy obraz warunków Kuhna-Tuckera, podobny do podanego w (21.16). Pomijając zmianę wymiarów zagadnienia, warunki Kuhna-Tuckera są takie same, jak w przypadku trzech zmiennych i dwu ograniczeń. Interpretacja tych warunków jest oczywiście taka sama. A co będzie dla zagadnienia minimalizacji, takiego jak (21.2) lub (21.2')? Można je przekształcić w zagadnienie maksymalizacji, a potem zastosować (21.18). Minimalizacja C jest równoważna maksymalizacji -Ç , więc takie przekształcenie jest zawsze możliwe. Trzeba oczywiście zmienić również zwrot nierówności w każdym z ograniczeń, mnożąc je przez -1 . Zamiast takich przekształceń można — korzystając z funkcji Lagrange’a Z zdefiniowanej w (21.17) — zastosować bezpośrednio minimalizacyjną wersję warunków Kuhna-Tuckera: dz dxj
■0,
(21.19) dZ — ^0, dyi
Sprawdźmy, czy rozwiązanie przykładu 1 z podrozdz. 21.1, zilustrowane na rys. 21.1 (a), spełnia warunki Kuhna-Tuckera. Funkcja Lagrange’a dla tego zagadnienia ma postać:
^ a T 0’ [minimalizacja]
az n
Ponieważ zagadnienie dotyczy minimalizacji, więc odpowiadają mu warunki (21.19) obejmujące cztery warunki krańcowe: dZ —- = 2(*i - 4) - 2y 1 + 3y2 3= 0, 0*1
= 2(x2 - 4 ) - 3?! + 2y2 3= 0, <7*2
dZ - — = 6 - 2 * i - 3*2 ^ 0, dyi dZ —— = —12 + 3*1 + 2*2 ^ 0 dy2
oraz warunki nieujemności i wzajemnego uzupełnienia. Pytanie brzmi: czy możemy znaleźć nieujemne wartości y x i y 2y które wraz z wartościami optymalnymi: 2
* . áy¡ 3- = . °
28
X l~ l 3 _ l3 i = 1, 2, ..., m j = 1, 2, ..., n
proszę to porównać z (21.18). Odczytując (21.18) i (21.19) poziomo (wierszami), widzimy, że warunki Kuhna-Tuckera dla zagadnienia minimalizacji i maksymalizacji składają się z układu warunków dotyczących zmiennych decyzyjnych *; (pierwszy wiersz) i innego układu dotyczącego mnożników Lagrange’a (drugi wiersz). Odczytując je pionowo (kolumnami), widzimy, że dla każdego Xj i y i jest tu warunek krańcowy (pierwsza kolumna), warunek nieujemności (druga kolumna) i warunek wzajemnego uzupełniania, czyli komplementamości (trzecia kolumna). W każdym zagadnieniu warunki krańcowe dotyczące zmiennych decyzyjnych różnią się od warunków dotyczących mnożników Lagrange’a zwrotem nierówności. Warunki krańcowe dla zagad nienia maksymalizacji mają przeciwny zwrot nierówności w stosunku do zagadnienia m . minimalizacji. Przy zastrzeżeniu, które wyjaśnimy w następnym podrozdziale, warunki Kuhna-Tuckera dla maksimum (21.18) i dla minimum (21.19) są warunkami koniecznymi odpowiednio dla
i
.
_
1
X2~
n 10
36
13 “ 13
będą spełniać wszystkie te równania? Skoro wiadomo, że *1 i *2 są różne od zera, więc ze względu na warunek wzajemnego uzupełniania d Z /d A = 0 i dZ /d x 2 = 0. Podstawiając zatem wartości x x i *2 do pierwszych dwu warunków krańcowych, otrzymujemy dwa równania: 48 - 2 y i + 3y2 - — »
32 - 3 y i + 2y 2 = — ,
o rozwiązaniach y 1 = 0 i y 2 =
16
—1
3
które są nieujemne. Ponieważ dla tych wartości i dla
wartości *1 i x 2 musi być d Z ld x i = 0, dZ /d x 2 = 0, d Z Id yx < 0 i d Z ld y 2 = 0 — co jest zgodne z warunkami końcowymi i warunkami komplementamości — więc spełnione są wszystkie warunki Kuhna-Tuckera dla minimum.
PROGRAMOWANIE NIELINIOWE 729
728 PROGRAMOWANIE MATEMATYCZNE
Ćwiczenie 21.2 1. Narysować diagramy, podobne do tych na rys. 21.3, dla minimalizacji i wyprowadzić zbiór warunków koniecznych dla lokalnego minimum odpowiadających (21.4)-(21.6). Następ nie streścić te warunki w postaci pojedynczego stwierdzenia podobnego do (21.7). 2. a. Pokazać, że w (21.18) zamiast zapisywania m osobnych warunków: dZ y ,^ — = 0 0 = 1, ..., ni) dyi ■ ■ v ; ; r wystarczy napisać pojedyncze równanie: ^ 5Z 3
—= 0.
‘ =1 dyt b . Czy możemy zrobić tak samo ze zbiorem warunków: dZ xj — = 0 ( j = l , ..., «)?
Nieregulamości w punktach brzegowych Pokażemy najpierw na konkretnych przykładach, jakie to mogą być nieregulamości. Przykład 1. Mamy następujące zagadnienie: zmaksymalizować K - x i, przy warunkach
x 2- (1 - * i ) 3^ 0,
oraz
* i, *2 ^ 0.
Jak pokazano na rys. 21.4, zbiorem rozwiązań dopuszczalnych jest zbiór punktów pierwszej ćwiartki leżących na krzywej *2 = ( l - * i ) 3 lub poniżej niej. Ponieważ mamy maksymalizować * i, więc rozwiązaniem optymalnym jest punkt (1,0). Rozwiązanie to nie spełnia warunków Kuhna-Tuckera dla maksimum. Aby to pokazać, zapiszmy najpierw funkcję Lagrange’a: Z
3. Który zbiór (lub które zbiory) warunków podanych w (21.19) można zapisać jednym równaniem na podstawie rozumowania zastosowanego w poprzednim zadaniu? 4. Dla zagadnienia minimalizacji (21.2) — stosując funkcję Lagrange’a (21.17) — obliczyć pochodne dZ ldxj i d Z /d y ¡ oraz zapisać rozwiniętą wersję warunków Kuhna-Tuckera dla minimum (21.19). 5. Przekształcić zagadnienie minimalizacji (21.2) w zagadnienie maksymalizacji, sfor mułować funkcję Lagrange’a, obliczyć pochodne względem x j i y, oraz zastosować warunki Kuhna-Tuckera dla maksimum (21.18). Czy wynik jest zgodny z rezultatem poprzedniego zadania?
=
[ ~ x 2+
x x + y i
( 1 — A i ) 3] .
Pierwszy warunek krańcowy ma postać: ■3 — = 1 -
—x i )2
0.
Ponieważ *1 = 1 jest dodatnie, więc warunek komplementamości wymaga, aby wartość tej pochodnej w punkcie (1, 0) była równa zeru. Wartość, jaką otrzymujemy, jest natomiast równa dZldx\ = 1, co jest niezgodne z powyższym warunkiem krańcowym.
X2 i
6. Sprawdzić możliwość stosowania warunków Kuhna-Tuckera do przykładu 2 z podrozdz. 21.1. a. Zapisać funkcję Lagrange’a i warunki Kuhna-Tuckera. b. Dla rozwiązania pokazanego na rys. 21.1 (b) znaleźć optymalne wartości d Z /d y, 0 = 1 , 2, 3). Co można powiedzieć o y,? c. Znaleźć optymalne wartości d Z łd x x i d Z /d x2. d. Czy spełnione są wszystkie warunki Kuhna-Tuckera?
21.3. KWALIFIKACJA OGRANICZEŃ W podrozdz. 21.2 podkreślono, że warunki Kuhna-Tuckera są warunkami koniecznymi tylko wtedy, gdy jest spełnione pewne zastrzeżenie. Zastrzeżenie to, zwane kwalifikacją ograniczeń, nakłada pewne warunki na funkcje występujące w ograniczeniach zagadnienia programowania nieliniowego. Celem jest wykluczenie pewnych nieregulamości brzegu zbioru rozwiązań dopuszczalnych, które mogłyby spowodować naruszenie warunków Kuh na-Tuckera, gdyby optymalne rozwiązanie znalazło się właśnie w takim właśnie punkcie brzegowym.
Rysunek 21.4
Powodem tej anomalii jest to, że rozwiązanie optymalne (1, 0) występuje w tym przykładzie ną cżubku skierowanego na zewnątrz ostrza (rys. 21.4). Takie ostrze stanowi jeden z rodzajów nieregulamości, które mogą spowodować naruszenie warunków Kuhna-Tuckera dla brzegowego rozwiązania optymalnego. Ostrze jest to wystający punkt, który powstaje
730 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE NIELINIOWE 731
wówczas, gdy krzywa nagle zmienia kierunek w taki sposób, źe obie części krzywej po obu stronach punktu mają takie samo nachylenie. W naszym przypadku brzeg zbioru rozwiązań dopuszczalnych najpierw pokrywa się ż krzywą podaną w ograniczeniu, ale po dojściu do punktu (1, 0) skręca nagle na zachód i leży wzdłuż osi poziomej. Ponieważ nachylenie fragmentu krzywej i fragmentu osi jest w punkcie (1,0) takie samo, równe zeru, więc ten punkt jest ostrzem (cusp). . Ostrza są najczęstszymi przyczynami naruszenia warunków Kuhna-Tuckera, ale tak naprawdę występowanie ostrza nie jest ani warunkiem koniecznym, ani dostatecznym na to, aby te warunki nie były spełnione w rozwiązaniu optymalnym. Następne dwa przykłady to potwierdzą.
warunki Kuhna-Tuckera nie są spełnione. Dla funkcji Lagrange’a: Z = x 2 - x \ + y 1 (10 - x 2! - x 2)3 + y2( -2 + x j drugi warunek brzegowy wymaga bowiem, aby:
-Ę—= 1 - 3y ,(10 - * ! - X2)2
óx 2
*2
^i x r-=2
10/ /
Przykład 2. Do zagadnienia z poprzedniego zadania dodajmy nowe ograniczenie:
• 2xi +x2^ 2, ' ■
’ --v
;
którego granica, x 2 = 2 - 2 x u jest linią prostą o nachyleniu - 2 przechodzącą przez punkt optymalny na rys. 21.4. Zbiór rozwiązań dopuszczalnych pozostaje taki sam, jak poprzednio, podobnie jak rozwiązanie optymalne na ostrzu. Jeśli jednak zapiszemy nową funkcję Lagrange’a: z = *1 + y
i
[~x 2+ (1 - *x)3] +
1
/ / / (2, 6) l L
4-
✓/
/
:
o
/
ł
ł
ł
i
ft ' t\ / I
/
✓
t 1 1
/ / /
/
/
-(10-ac?-je2)3ss0
y s
✓ ✓✓
dZ
1
/
• H— 2
’ 3
Rysunek 21.5
d Z = ~y i ~ y 2 ^ ° ’ dZ , = -* 2 + ( l - * ! ) 3 oyi oy 2
/
8-
2-
^ ~ = 1 3 >»i(J — A i)2 — 2 y 2 *£ 0 ,
dZ
1 1
y 22( - 2 x x -
i warunki brzegowe:
= 2 - 2 * i - * 2 3=0,
to okaże się, że wartości x = 1, x = 0 , y = 1 i y = — spełniają powyższe cztery nierówności 2 fr-oraz warunki nieujemności. W istocie y x może przyjąć dowolną nieujemną wartość (nie tylko 1) i wszystkie warunki wciąż mogą być spełnione, co pokazuje, że optymalna wartość mnożnika Lagrange’a nie musi być jedyna. Co ważniejsze, przykład ten pokazuje, że warunki Kuhna-Tuckera mogą zostać spełnione pomimo występowania ostrza. Przykład 3. Zbiór rozwiązań dopuszczalnych zagadnienia: zmaksymalizować
7C = x 2 — X i ,
przy warunkach
-(1 0 - x \ - x 2) 3 ^ 0,
oraz
^ -2 , x i,x 2^ 0
nie zawiera ostrzy, co pokazano na rys. 21.5. Jednak dla rozwiązania optymalnego (2, 6)
0.,
l— — ► 4 *1
*
Rzeczywiście, wartość tej pochodnej obliczona w punkcie (2,6) powinna znikać, gdyż x 2 jest dodatnie. Otrzymujemy jednak dZ łdx 2 = 1, niezależnie od wartości nadanej y 1. Warunki Kuhna-Tuckera mogą więc nie być spełnione nawet wtedy, gdy nie występuje ostrze, a nawet wtedy, gdy zbiór rozwiązań dopuszczalnych jest zbiorem wypukłym, jak na rys. 21.5. Podstawową przyczyną, dla której ostrza nie są ani konieczne, ani dostateczne dla naruszenia warunków Kuhna-Tuckera, jest to, że wspomniane wcześniej nieregulamości dotyczą nie kształtu samego zbioru rozwiązań dopuszczalnych, ale postaci samych funkcji ograniczają cych. ", • -’ ■
Kwalifikacja ograniczeń Nieregulamości brzegu — ostrza lub inne —- nie pojawią się, jeśli zostanie spełniony pewien warunek kwalifikujący ograniczenia. Spróbujemy to wyjaśnić. Oznaczmy symbolem x = (xu x 2, ..., x n) pewien punkt brzegowy zbioru rozwiązań dopuszczalnych, będący możliwym rozwiązaniem, a symbolem dx = (d*i, dx2, d xn) — pewien kierunek mchu od wspomnianego punktu brzegowego. Interpretacja wektora dx, jako kierunku mchu, jest całkowicie zgodna z naszą wcześniejszą interpretacją wektora, jako skierowanego odcinka (strzałki), ale tym razem wektor jest zaczepiony w punkcie x, a nie w początku układu; tak więc wektor dx nie jest wektorem wodzącym. Nałożymy na wektor dx
732 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE NIELINIOWE
dwa warunki. Po pierwsze, jeśli /-ta. zmienna decyzyjna jest w punkcie * równa zeru, to dozwolona jest jedynie nieujemna zmiana współrzędnej Xj, czyli: (21.20)
ćxj ** 0,
jeśli
Xj —0.
Po drugie, jeśli i-ty warunek ograniczający jest w punkcie * spełniony jako równość, to dopuszczamy tylko takie wartości d xx, ..., <Łcn, dla których wartość funkcji g ‘(x) występu jącej w ograniczeniu nie zwiększy się (dla zagadnienia maksymalizacji) lub nie zmniejszy się (dla zagadnienia minimalizacji), to znaczy: (21.21)
dgi(x) = g{dxl + g jd x 2 + ... + gndxn
0
(maksymalizacja),
0
(minimalizacja),
733
ograniczeń i warunki Kuhna-Tuckera. Podobnie jak w przykładzie 4, musimy zażądać, aby d*2 ^ 0 (ponieważ x 2 = 0) i dx2 ^ 0 (ponieważ pierwszy warunek jest spełniony jako równość); a zatem d*2 = 0. Ale drugi warunek też jest spełniony jako równość, a więc wymaga to, aby: g id x x + g \d x 2 - 2d*i + d*2 = 2d*i ^ 0.
[z (21.21)]
ł Dla niedodatniego d xx i zerowego dx2 jedyne dopuszczalne wektory testujące — różne od wektora zerowego —- to te, które skierowane są na wschód i zaczepione w punkcie (1,0). Wszystkie te wektory leżą na osi poziomej w zbiorze rozwiązań dopuszczalnych i oczywiście można dla każdego z nich narysować łuk kwalifikujący. Tym razem kwalifikacja ograniczeń rzeczywiście jest spełniona.
jeśli g ‘(x) = rh gdzie wartości wszystkich pochodnych gj są obliczone w punkcie x . Jeśli wektor dx spełnia (21.20) i (21.21), to nazywamy go wektorem testującym (test vector). Jeśli istnieje różniczkowalny łuk, który spełnia następujące warunki: (1) przechodzi przez punkt *, (2) jest całkowicie zawarty w zbiorze dopuszczalnym i (3) jest styczny do danego wektora testującego, to nazywamy go lukiem kwalifikującym (qualifying arc) dla tego wektora testującego. Teraz możemy już sformułować warunek kwalifikujący ograniczenia:
Liniowe warunki ograniczające
Warunek kwalifikujący ograniczenia jest spełniony, jeśli dla każdego punktu * na brzegu zbioru rozwiązań dopuszczalnych istnieje łuk kwalifikujący dla każdego wektora testującego dx.
Wcześniej, w przykładzie 3, pokazaliśmy, że wypukłość zbioru rozwiązań dopuszczalnych nie gwarantuje obowiązywania warunków Kuhna-Tuckera jako warunków koniecznych. Jeśli jednak zbiór rozwiązań dopuszczalnych jest zbiorem wypukłym określonym przez warunki liniowe, to kwalifikacja ograniczeń będzie spełniona i warunki Kuhna-Tuckera będą zawsze obowiązywały dla rozwiązania optymalnego. W takim przypadku nie musimy martwić się nieręgularnościami brzegu, jeśli mamy do czynienia z zagadnieniem programowania nielimówego o liniowych warunkach ograniczających lub (jako szczególnym przypadkiem) z zagadnieniem programowania liniowego.
Przykład 4. Pokażemy, że punkt optymalny (1, 0) z przykładu 1 pokazany na rys. 21.4, który nie spełnia warunków Kuhna-Tuckera, nie spełnia również kwalifikacji ograniczeń. A zatem dla tego punktu x 2 = 0 wektoiy testujące muszą spełniać warunek:
Przykład 6. Przedstawimy przykład dla liniowych warunków ograniczających w przy padku dwu zmiennych i dwu warunków ograniczających. Dla zagadnienia maksymalizacji liniowe warunki ograniczające można zapisać jako:
[na mocy (21.20)]
a xxx x + a x2x2 ^ ru
Ponadto, ponieważ jedyny warunek ograniczający g 1 = x2 - (1 - x x) 3 ^ 0 jest dla punktu (1, 0) spełniony jako równość, więc musimy przyjąć:
a 2xx x + a 22x 2 ^ r2,
dx2 ^ 0 .
g ld *1+ gld*2 = 3 ( i - x i ) 2d*i + d*2 = d*2 ^ 0.
[z (21.21)]
Z tych dwu warunków razem wziętych wynika, że dx 2 = 0. Możemy natomiast dowolnie wybrać d xx. Na przykład zarówno wektor (d*i, d*2) = (X 0), jak i (d*lr d x2) = (-1 , 0), są możliwymi wektorami testującymi. Drugi z tych wektorów nie jest zaznaczony ha rys. 21.4, ale wyglądałby jak strzałka zaczepiona w punkcie (1,0) skierowana na zachód. Oczywiście można dla niej wykreślić łuk kwalifikujący (takim łukiem może być np. wygięty brzeg obszaru rozwiązań dopuszczalnych). Wektor testujący (d*i, dx2) = (2, 0) wyglądałby natomiast iia rysunku tak, jak strzałka zaczepiona w punkcie (1, 0) skierowana ku wschodowi. Ponieważ nie da się wykreślić gładkiego luku stycznego do tego wektora i leżącego całkowicie w obszarze rozwiązań dopuszczalnych, więc nie istnieje dla niego łuk kwalifikujący i Zatem rozwiązanie optymalne (1*0) nie spełnią kwalifikacji ograniczeń, Przykład 5. W odniesieniu do powyższego przykładu 2 pokażemy, że po uwzględnieniu ha rys. 21.4 dodatkowego ograniczenia 2xx + x 2 ^ 2 punkt (1* 0) będzie spełniał kwalifikacje
gdzie zakładamy, że wszystkie parametry są dodatnie. Wtedy, jak pokazano na rys. 21.6, brzeg dla pierwszego ograniczenia będzie miał nachylenie - a xll a l2 < 0, a drugiego — nachylenie - a 2X/a 22 < 0. Punkty brzegowe przyciemnionego zbioru rozwiązań dopuszczalnych należą do pięciu rodzajów: (1) punkt będący początkiem układu współrzędnych, gdzie przecinają się dwie osie; (2) punkty, które leżą na odcinku jednej osi, takie jak J i S\ (3) punkty na prze cięciu jednej osi i jednej granicy ograniczenia, a mianowicie K i R\ (4) punkty leżące na jednej granicy ograniczenia, takie jak L i N; (5) punkt przecięcia dwu ograniczeń M. Omó wimy pokrótce każdy z tych rodzajów punktów ze względu na spełnienie kwalifikacji ograniczeń. 1. W początku układu współrzędnych żaden warunek ograniczający nie jest spełniony w postaci równości, więc możemy pominąć (21.21). Ponieważ jednak x x= x 2 = 0, więc ze wzoru (21.20) musimy wybrać wektory testujące dx i ^ 0 i dx2 ^ 0. Zatem wszystkie wektory testujące zaczepione w początku układu współrzędnych muszą być skierowane na wschód, na północ lub w kierunku północno-wschodnim, jak pokazano na rys. 21.6. Wszystkie te wektory należą do zbioru rozwiązań dopuszczalnych i można oczywiście dla każdego z nich znaleźć łuk kwalifikujący.
PROGRAMOWANIE NIELINIOWE 735
734 PROGRAMOWANIE MATEMATYCZNE
*2 A
R
"■
C11*1+012*2ssr1
(nachylenie- -0 ,^ 2 )
Rysunek 21.6 2. W punkcie takim, jak / możemy ponownie pominąć (21.21).Równość x 2 = 0 ozna cza, że musimy wybrać dx2 ^ 0, ale dxi możemy wybrać dowolnie. Zatem możliwe do przyjęcia są wszystkie wektory oprócz tych, które są skierowane na południe (dx2 < 0). Wszystkie takie wektory należą do zbioru rozwiązań dopuszczalnych i dla każdego a nich istnieje łuk kwalifikujący. Analiza dla punktu S przebiega podobnie. * 3. W punktach K i R należy uwzględnić zarówno (21.20), jak i (21.21). Dokładnie, w punkcie K musimy wybrać dx2 ^ 0; ponieważ x 2 = 0, trzeba więc wykluczyć wszystkie strzałki skierowane na południe. Ponieważ drugi warunek jest spełniony jako równość, więc wektory testujące dla punktu K muszą spełniać: (21.22)
g \d x i + g 2dx 2 = a2i dxi + a 22dx 2 ^ 0.
Ponieważ w punkcie K mamy również a2i*i + a 22x 2 = r 2 (granica dla drugiego wa runku ograniczającego), więc możemy dodać ten warunek do (20.22) i sprowadzić warunek nałożony na warunki testujące do postaci: ( 21.22')
a2i(xi + dxi) + a22{x2 + d x d ^ r 2.
Ponieważ (xj + dxj) interpretujemy jako nową wartość Xj osiąganą na końcu strzałki, możemy więc odczytać (21.22') jako stwierdzenie, że końce wszystkich strzałek muszą leżeć na granicy drugiego ograniczenia lub poniżej. W konsekwencji wszystkie te wektory ponownie będą należały do zbioru rozwiązań dopuszczalnych i dla każdego można znaleźć łuk kwalifikujący. Analiza dla punktu R przebiega analogicznie. 4. W punktach takich, jak L i N, żadna ze zmiennych nie przyjmuje wartości zero wej i można pominąć (21.20). Jednak z (21.21) wynika dla N, że: (21.23)
g id x 1+ g id x 2 = «n d x i + ai2dx2 ^ 0 .
Ponieważ punkt N spełnia a n xi + a 12x 2 = r x (granica dla pierwszego warunku), możemy więc dodać to równanie do (21.23) i napisać: (21.23')
a n (xi + d*i) + a 12(x2 + d x 2) ^ ri.
Wymaga to, aby wektory testujące miały wierzchołki na lub pod granicą pierwszego ograniczenia na rys. 21.6. Otrzymujemy w istocie ten sam wynik, co w pozostałych przypadkach. Anahza dla punktu L jest analogiczna. 5. W punkcie M możemy ponownie pominąć (21.20), ale tym razem z (21.21) wynika, że wszystkie wektory testujące mają spełniać oba warunki (21.22) i (21.23). Ponieważ warunki te możemy zapisać w postaci (21.22') i (21.23'), oznacza to, że końce wszystkich wektorów testujących muszą być na lub pod granicą dla pierwszego i drugiego ograniczenia. Wyniki te stanowią powtórzenie poprzednich przypadków. W tym przykładzie, dla każdego rozważanego rodzaju punktu brzegowego, wszystkie wektory testujące należą do zbioru rozwiązań dopuszczalnych. Ułatwia to znalezienie łuków kwalifikujących, ale nie stanowi niezbędnego warunku wstępnego ich istnienia. Na przy kład w zagadnieniu z nieliniową granicą ograniczenia sama granica ograniczająca może słu żyć jako łuk kwalifikujący dla pewnych wektorów testujących leżących poza zbiorem rozwiązań dopuszczalnych. Przykład takiej sytuacji można znaleźć w jednym z zadań z ćwiczenia 21.3.
Ćwiczenie 21.3 1. Sprawdzić, czy rozwiązanie (jci, x 2) = (2,6) z przykładu 3 spełnia kwalifikację ograniczeń. 2. Rozwiązać graficznie zadanie: zmaksymalizować n = X i, przy warunkach x j + x 2 ^ 1, oraz x \ , x 2 ^ 0. Sprawdzić, czy punkt dla rozwiązania optymalnego spełnia: (a) kwalifikację ograniczeń i (b) warunki Kuhna-Tuckera dla maksimum. 3. Rozwiązać graficznie zadanie: X zminimalizować C = x X x przy warunkach x \ - x 2 ^ 0, oraz x i, x 2 ^ 0. Czy rozwiązanie optymalne leży na ostrzu? Sprawdzić, czy rozwiązanie optymalne spełnia: (a) kwalifikację ograniczeń i (b) warunki Kuhna-Tuckera dla minimum. 4. Znaleźć graficznie minimum globalne: zminimalizować C - 2 x Y+ x 2, przy warunkach xj -4 x i + x2 ^ 0, - 2 x i - 3 x 2> - 1 2 , oraz x it x 2 ^ 0. Sprawdzić, czy rozwiązanie optymalne spełnia: (a) kwalifikację ograniczeń i (b) warunki Kuhna-Tuckera (wskazówka: zbiór rozwiązań dopuszczalnych jest taki, jak na rys. 21.2). 5. Mamy następujące zadanie: zminimalizować C = x it przy warunkach - jc2 - (1 - x 0 3 ^ 0, oraz . jti, x 2 ^ 0.
736 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE NIELINIOWE 737
Pokazać, że: (a) rozwiązanie optymalne (Jći, *2) = (1, 0) nie spełnia warunków Ku hna-Tuckera, ale (b) jeśli wprowadzimy nowy składnik y 0 ^ 0 i przekształcimy funkcję Lagrange’a (21.17) do postaci: , : - '
.. .V
Z o = y o f(x t ,X 2, . . . , x n) + ' Z y i [ r i - g i(x 1,X 2, . . . , x n)], i= l
- .............
V ' — .....................................
nieliniowym, warunki dostateczne będą sformułowane bezpośrednio w terminach wypu kłości i wklęsłości. Pojęcia te będą zastosowane zarówno do funkcji celu, jak i funkcji ograniczających g'(x). > Dla zagadnienia maksymalizacji Kuhn i Tucker podali następujące sformułowanie warunków dostatecznych (twierdzenie o dostateczności):
to warunki Kuhna-Tuckera mogą być spełnione w punkcie (1, 0) (uwaga: warunki Kuhna-Tuckera dla mnożników dotyczą jedynie y x, ..., y m, ale nie y o) • Dla danego zagadnienia programowania nieliniowego:
21.4. TWIERDZENIE KUHNA-TUCKERA O WARUNKU DOSTATECZNYM: PROGRAMOWANIE WKLĘSŁE Do tej pory zajmowaliśmy się warunkami koniecznymi dla maksimum lub minimum w programowaniu nieliniowym. Warunki konieczne są przydatne jako metoda „odsiewu” kandydatów nieodpowiednich dla rozwiązania optymalnego. W programowaniu nieliniowym żaden punkt wewnętrzny zbioru rozwiązań dopuszczalnych, nie spełniający warunków Kuhna-Tuckera, nie może być rozwiązaniem optymalnym. Podobnie można wykluczyć punkt brzegowy, który spełnia warunki kwalifikacji ograniczeń, ale nie spełnia warunków Kuhna-Tuckera. Jeśli pewien punkt*0 spełnia warunki konieczne, nie możemy automatycznie wnioskować, że jest to punkt optymalny, gdyż niektóre punkty nieoptymalne mogą „przejść przez sito” -— przypomnijmy, że np. w najprostszym zagadnieniu optymalizacji dla punktu przegięcia spełniony jest warunek dy/d* = 0. Innymi słowy, za pomocą warunków' koniecz nych, traktowanych jako „sieć rybacka” , możemy „wyłowić” prawdziwe rozwiązania optymalne i punkty, które nimi nie są. Warunek dostateczny to zupełnie inna sprawa, gdyż jeśli punkt * spełnia warunek dostateczny dla maksimum, to punkt ten musi maksymalizować funkcję celu. W tym sensie warunek dostateczny stanowi dokładniej określony rodzaj testu. Może on jednak mieć wady, a mianowicie warunek dostateczny nie musi być konieczny, więc prawdziwe rozwiązanie optymalne nie musi spełniać warunku dostatecznego. Innymi słowy, jeśli jako „sieć” wykorzystamy warunek dostateczny, to może nam się wymknąć prawdziwe rozwiązanie optymalne. Najlepsza sytuacja jest wtedy, gdy są spełnione i warunek konieczny, i dostateczny. Mamy wtedy pewność, że znajdziemy wszystkie rozwiązania optymalne i jednocześnie nie przyjmiemy jako optymalnych żadnych punktów nieodpowiednich. Pokażemy teraz, że w pewnych okolicznościach warunki Kuhna-Tuckera mogą stanowić warunki dostateczne dla ekstremum, a niekiedy nawet warunki konieczne i dostateczne.
Twierdzenie Kuhna-Tuckera — warunki dostateczne W klasycznych zagadnieniach optymalizacji warunki dostateczne dla maksimum i minimum są tradycyjnie wyrażane w postaci warunków określających znaki pochodnych lub róż niczek drugiego rzędu. Jak pokazaliśmy w podrozdz. 11.5, warunki drugiego rzędu są blis ko związane z pojęciami wklęsłości i wypukłości funkcji celu. Tutaj, w programowaniu
zmaksymalizować
k
przy warunkach
g l(x) ^ r.
= /(* ),
oraz
* ^ 0,
(i = 1, 2, ..., m),
jeśli spełnione są następujące warunki: (a) funkcja celu /(*) jest różniczkowalna i wklęsła w nieujemnym ortancie, (b) każda funkcja ograniczająca g ‘(x) jest różniczkowalna i wypukła w nieujemnym ortancie, (c) punkt * spełnia warunki Kuhna-Tuckera dla maksimum, to * stanowi globalne maksimum dla k = /(* ).
Zwróćmy uwagę, że w tym twierdzeniu nie, wspomina się o kwalifikacji ograniczeń. Jest tak, ponieważ w (c) przyjęto założenie, że w punkcie * spełnione są warunki Kuhna-Tuckera, a zatem kwalifikacja ograniczeń nie stanowi już problemu. Powyższe twierdzenie wskazuje, że warunki (a), (b) i (c) są dostateczne na to, aby uznać, że * jest rozwiązaniem optymalnym. Możemy również interpretować je w ten sposób, że jeśli spełnione jest (a) i (b), to warunki Kuhna-Tuckera dla maksimum są wystarczające na to, aby maksimum istniało. Dowiedzieliśmy się, że warunki Kuhna-Tuckera, chociaż same w sobie nie są konieczne, stają się jednak konieczne, gdy spełniona jest kwalifikacja ograniczeń. Informacja ta w połączeniu z twierdzeniem o warunkach dostatecznych pozwala stwierdzić, że jeśli spełniona jest kwalifikacja ograniczeń i jeśli spełnione są warunki (a) i (b), to warunki Kuhna-Tuckera będą warunkami koniecznymi i dostatecznymi dla maksimum. Stanie się tak np. wtedy, gdy wszystkie warunki ograniczające są liniowe, co wystarcza na to, aby była spełniona kwalifikacja ograniczeń. Później omówimy następne okoliczności, w których spełnienie kwalifikacji ograniczeń jest zagwarantowane, nawet jeśli nie wszystkie funkcje g*(x) są liniowe. Problem maksymalizacji omówiony w twierdzeniu o warunku dostatecznym jest często nazywany programowaniem wklęsłym. Nazwa ta wynika stąd, że Kuhn i Tucker przyjęli w każdym warunku nierówność ^ zamiast więc warunek (b) sprowadza się do wymaga nia, aby wszystkie funkcje g*(*) hyły wklęsłe, podobnie jak funkcja/(*). Zmodyfikowaliśmy sformułowanie twierdzenia, aby utrzymać zgodność z naszymi wcześniejszymi rozważaniami dotyczącymi programowania liniowego. Oba sformułowania twierdzenia — chociaż odmien ne w formie— są oczywiście równoważne. Twierdzenie o warunku dostatecznym w podanym powyżej ujęciu dotyczy jedynie problemów maksymalizacji. Ale dostosowanie go do zagadnień minimalizacji nie jest trudne. Oprócz zmian stanowiących odwrócenie samego zagadnienia, musimy ponadto zamienić 47 — Podstawy...
PROGRAMOWANIE NIELINIOWE 739
738 PROGRAMOWANIE MATEMATYCZNE
miejscami dwa słowa: wklęsły i wypukły w warunkach (a) i (b) oraz wykorzystać warunki Kuhna-Tuckera dla minimum w założeniu (c) (por. Ćwiczenie 21.4-1). Ponieważ dowód twierdzenia Kuhna-Tuckera jest dosyć prosty, przytoczymy go poniżej.
Dowód twierdzenia o dostateczności Dla zagadnienia maksymalizacji funkcję Lagrange’a można zapisać w postaci: (21.24)
Z = / ( x ) = S ÿ , [ r , - f ,(*)];
[por. (21.17)]
nadaliśmy tu mnożnikom Lagrange’a konkretne wartości y¡ i dzięki temu Z jest funkcją jedynie zmiennych Xj. Zgodnie z założeniem (a) i (b) twierdzenia o dostateczności przyj mijmy, że f( x ) jest wklęsła i każda funkcja g'(jc) jest wypukła, czyli - g ‘(x) jest wklęsła. W takim razie Z, jako suma funkcji wklęsłych, musi również być wklęsłą funkcją x. W myśl (11.24') wklęsłość Z implikuje: n
(21.25)
-
. Z (* )« Z (f)+ I — j= 1 OXj
(x j-x j),
gdzie x jest pewnym konkretnym punktem dziedziny, a dZ ldxj oznacza wartość pochodnej cząstkowej dZldxj w punkcie x. Wybierzmy jako x i y te wartości zmiennych decyzyjnych i mnożników, które spełniają warunki maksimum Kuhna-Tuckera, zgodnie z założeniem (c) twierdzenia o warunku dostatecznym. Można wtedy pokazać, że wyrażenie Z w (21.25) jest niedodatnie, więc jego usunięcie nie narusza nierówności, co pozwala nam wnioskować, że Z(x) ^ Z(x). Aby to sprawdzić, dzielimy wyrażenie Z na dwa składniki: . 1
" dZ T\ — X ~=zzrxj j= 1 OXj
" dZ_ T2 —— 2h ~^—Xj. j~\ ĆXj
Ze względu na własność wzajemnego uzupełniania w punkcie x, T2 musi być równe zeru. Jeśli chodzi o 7\, w którym występuje xj, a nie x (więc nie można zastosować wła sności wzajemnego uzupełniania), to możemy być jedynie pewni, że d Z /d x ^ O (waru nek krańcowy) i xj ^ 0 (specyfikacja modelu) dla każdego j. Zatem Ti jest niedodatnie. Dodając oba składniki widzimy, że wyrażenie Z jest niedodatnie, a zatem możemy wywnioskować, że: (21.26)
Z(x) ^ Z(x)
lub odwołując się do (21.24): m (21.260
/(-<) +
1=1
m l ÿ i [ r l - g i( . x ) ] ^ m + E f t [ n -* '(* )]• 1= 1 . .
Jeśli zdołamy wykazać, że dwa wyrażenia Z w (21.26') można pominąć bez naru szenia nierówności, to będziemy mogli wnioskować, że f( x ) ^ f ( x ) , co udowodni, że x rzeczywiście maksymalizuje funkcję celu f(x). Spróbujmy to zrobić. Wyrażenie Z po lewej stronie musi być nieujemne, gdyż dla każdego i mamy y¡ ^ 0 (z nieujemności) i ri~ § l (x) ^ 0 (specyfikacja warunków). Natomiast wyrażenie Z po prawej stronie musi
być równe zeru, ponieważ [r, - g l (*)] jest równe dokładnie d Z I d y więc stosuje się do niego własność wzajemnego uzupełniania. W rezultacie, f ( x j ^ f( x ) i x rzeczywiście jest roz wiązaniem optymalnym. Maksymalna wartość n = f(x ) jest maksimum globalnym. Jednym ze sposobów pokaza nia tego jest przyjęcie faktu, że obowiązywanie nierówności/(jc) ^ f ( x ) nie zależy od wyboru punktu W leżącego w ograniczonym sąsiedztwie x. Postępując bardziej formalnie, możemy odwołać się do twierdzenia globalnego wprowadzonego w podrozdz. 19.3. Nasza funkcja celu jest z założenia różniczkowalna i wklęsła. Ponieważ każde g ‘(x) jest wypukłe, więc wcześniejszy wynik podany w (11.27) — po odpowiednim uogólnieniu na przypadek /z-wymiarowy — będzie oznaczać, że zbiór:
musi być zbiorem wypukłym, a ściślej — domkniętym zbiorem wypukłym. Ponadto, ponieważ zbiór rozwiązań dopuszczalnych jest częścią wspólną domkniętych zbiorów wypukłych S * (/= 1, 2, ..., m), więc jest on również domkniętym zbiorem wypukłym. Można zatem zastosować twierdzenie globalne, że każde maksimum lokalne musi być maksimum globalnym. Zwróćmy uwagę, że jeśli funkcja celu / ( x) jest ściśle wklęsła, to maksimum globalne musi być jedynym maksimum. W powyższych rozważaniach, przyjmując postulowane założenia, że: (a) f( x ) jest różniczkowalna i wklęsła, (b) każde g'(x) jest różniczkowalne i wypukłe i (c) punkt x spełnia warunki Kuhna-Tuckera dla maksimum, wywnioskowaliśmy, że x rzeczywiście maksy malizuje n . Twierdzenie o warunku dostatecznym zostało zatem udowodnione.
Punkt siodłowy
'
Wynik (21.26) — wyprowadzony dla wybranego y — oznacza, że, dla danego ÿ , x jest tą wartością spośród wszystkich dopuszczalnych wartości x, która maksymalizuje funkcję Lagrange’a Z. Okazuje się, że dla ustalonego x, y jest tą wartością, która minimalizuje Z. Mamy więc: (21.27)
Z (x, ÿ) ^ Z (x, ÿ)
Z(x, y).
Sytuacja ta przypomina diagram pokazany na rys. 11.3(a) i dlatego punkt (Jć, y) jest nazywany punkiem siodłowym (saddle point), a Z (x ,y ) — wartością siodłową (saddle value) dla funkcji Lagrange’a. Zwróćmy uwagę na to, że pierwsza nierówność w (21.27) — która jest po prostu powtórzeniem (21.26) z uwzględnieniem tego, że dana jest wartość ÿ — wynika z faktu, że Z jest wklęsłe względem zmiennych x , przy ustalonej wartości ÿ. Można zatem pokazać, że druga nierówność w (21.17) jest związana z faktem, że Z jest wypukłe względem y, przy ustalonym x. Jeśli podstawimy do funkcji Lagrange’a x = x, to otrzymamy: z = / ( x ) + L.v, [/•/ - g'(x)] . 1=1 Ponieważ r¡ oraz gl (x) reprezentują stałe, więc Z jest oczywiście liniowe względem zmiennych y it a zatem wypukłe względem y ¿. Odwohijąc się do (11.24'), możemy wnioskować, że z wypukłości Z względem y¡ wynika:
740 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE NIELINIOWE 741
m 02 ’
(21.28)
Z (y ) S * Z (y )+ I 1= 1 dy, ^
[por. (21.25)]
gdzie y jest wartością y spełniającą warunek Kuhna-Tuckera dla maksimum. Wyrażenie 2 w (21.28) musi być nieujemne (co można pokazać za pomocą takiej samej analizy, jak w (21.25)), więc jeśli je pominiemy, to nierówność nie przestanie być prawdziwa. Otrzymujemy zatem Z (y) ^ Z(y) lub — dokładniej — Z (x , y ) ^ Z(x, y), Możemy za tem scharakteryzować punkt siodłowy (Jć, y ) jako punkt, w którym dana funkcja Z(x, y) jest wklęsła względem jednego zestawu zmiennych niezależnych (tutaj *), ale wypukła względem drugiego zestawu (tutaj y). Pojęcie punktu siodłowego jest szczególnie ważne w programowaniu liniowym, ponieważ jest bezpośrednio związane z dualizmem. Prymalne i dualne zagadnienia programowania liniowego mogą być ogólnie zapisane w notacji wektorowej w następujący sposób:
b. Co w tym zagadnieniu jest odpowiednikiem funkcji f i g * z twierdzenia Kuhna-Tuckera o warunku dostatecznym? c. Jakie warunki wklęsłości i wypukłości trzeba nałożyć na F i G', aby można tu było zastosować warunki dostateczne dla maksimum? d. Na podstawie powyższych punktów wyjaśnić, jak można sformułować warunki Kuhna-Tuckera dla minimum. 2. Pokazać, że jeżeli zagadnienie minimalizacji podane w poprzednim zadaniu spełnia warunki dostateczne dla minimum, to można zastosować twierdzenie globalne, a więc osiągnięte minimum będzie minimum globalnym. 3. Czy w (21.27) punkt Z (x , y ) stanowi jedyną wartość siodłową. Jak można zmodyfikować wzór (21.27), aby opisywał jednoznacznie wartość siodłową?
4. Czy można zastosować twierdzenie Kuhna-Tuckera o warunku dostatecznym do na zmaksymalizować
# = c'x,
zminimalizować
7T* = r'y,
przy warunkach
Ax ^ r,
przy warunkach
A'y 2= c,
oraz
x^0;
oraz
y ^ 0.
Funkcja Lagrange’a (21.17) dla każdego z nich ma postać: Z = c'x + y'(r - Ax) = c'x + y 'r - y'Ax Z' = r'y + x'(c - A'y) = r'y + x'c - x'A'y
[prymalne] [dualne]
Zwróćmy uwagę, że Z i Z' są wzajemnymi transpozycjami. Ponieważ Z i Z' mają wy miary 1 x 1 , więc muszą oczywiście reprezentować jedną i tę samą liczbę. Zatem w istocie identyczną funkcję Lagrange’a maksymalizujemy względem zmiennych Xj (w zagadnieniu prymalnym) i minimalizujemy względem zmiennych y, (w zagadnieniu dualnym). Roz wiązania optymalne x oraz y osiągnięte w tych dwu zagadnieniach muszą spełniać nierówność (21.27). Pokazuje to, że pojęcia dualności i punktu siodłowego sprowadzają się do tego samego. Na zasadzie wzajemnego uzupełniania y'(r - Ax) w powyższym wzorze dla Z musi być dla rozwiązania optymalnego równe zeru (por. (21.14) — ostatnie równanie). Podobnie musi znikać x'(c - A'y) — składnik wzoru dla Z'. Fakty te stanowią istotę twierdzenia o dualnoś ci II podanego w podrozdz. 20.1. Następnie, odejmując te zerujące się składniki odpowiednio od Z i od Z', możemy otrzymać, że dla rozwiązania optymalnego Z = c 'x - ń oraz Ź'= r'y = fi*. Ponieważ Ż = Ż', więc ń - ;r*, co stanowi istotę twierdzenia o dualności I. Wydaje się więc^ że dualność programowania liniowego jest najlepiej widoczna, gdy rozważamy ją w kontekście programowania nieliniowego.
Ćwiczenie 21.4 1. Dane jest zagadnienie: zminimalizować C - F(x) , przy warunkach G l(x) ^ r, ( /= 1, 2, ..., m), oraz x ^ 0. a. Przekształcić je w zagadnienie maksymalizacji.
stępujących zagadnień: (a) zmaksymalizować k = x \, przy warunkach oraz x u x 2 ^ 0; (b) zminimalizować C = (jcj - 3)3 + (jc2 ~ 4 ) 2, przy warunkach x x + x 2 ^ 4, oraz xu x2^ 0; (c) zminimalizować C = 2xi + x 2 , przy warunkach x \ - 4xi + x 2 ^ 0, oraz x i, x 2 ^ 0.
/
21.5. TWIERDZENIE ARROWA-ENTHOVENA O WARUNKU DOSTATECZNYM: PROGRAMOWANIE QUASI-WKLĘSŁE Aby można było zastosować twierdzenie Kuhna-Tuckera o warunku dostatecznym, muszą być spełnione pewnp własności dotyczące wklęsłości i wypukłości. Są to dość twarde wymagania. W innym twierdzeniu o warunku dostatecznym — twierdzeniu Arrowa-Enthovena — wymagania te są osłabione, gdyż żąda się jedynie ąuasi-wklęsłości i quasi-wypukłości funkcji celu i funkcji ograniczających, Dzięki takiemu osłabieniu założeń zakres stosowalności warunków dostatecznych odpowiednio się zwiększa. W pierwotnym sformułowaniu podanym w prący4 Arrowa i Enthovena, dotyczącym zagadnienia maksymalizacji ż Ograniczeniem w postaci wszystkie funkcje f(x ) i g*(x) muszą być quasi-wklęsłe. Stąd pochodzi nazWa programowanie ąuasi-wklęsle. W dalszych rozważaniach będziemy stosować nierówność ^ dla warunków ograniczają cych w zagadnieniu maksymalizacji, natomiast ^ w zagadnieniu minimalizacji.
1. Kenneth J. Arrow, Alain C, Enthoven, Quasi-concave Programming, „Econometrica” 1961, October, s. 779-800.
742 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE NIELINIOWE
743
Twierdzenie Arrowa-Enthovena o warunku dostatecznym
Test kwalifikacji ograniczeń
Twierdzenie to jest następujące: -
Wspomniano wcześniej, ze jeśli wszystkie funkcje w warunkach ograniczających są liniowe, to spełniony jest warunek kwalifikacji ograniczeń. Jeśli funkcje g i(x) są nieliniowe, to do sprawdzenia, czy kwalifikacja ograniczeń jest spełniona, może posłużyć test zaproponowany przez Arrowa i Enthovena:
^
Dla danego zagadnienia programowania nieliniowego: zmaksymalizować # = /( * ) ,
-
,,
przy warunkach #'(*) ^ r,- (r= 1, 2, oraz * 5» 0, k; : jeśli spełnione są następujące warunki: (a) funkcja celu /(* ) jest różniczkowalna i ąuasi-wklęsła w nieujemnym ortancie, (b) każda funkcja £*(*) z warunku ograniczającego jest różniczkowalna i quasi-wypukła w nieujemnym ortancie, (c) punkt x spełnia warunki Kuhna-Tuckera dla maksimum, M (d) spełniony jest którykolwiek z poniższych warunków: (d-I) fj(x ) < 0 dla przynajmniej jednej zmiennej *,-, (d—II) fj(x ) > 0 dla pewnej zmiennej xjy która może przyjmować dodatnią wartość bez naruszenia warunków ograniczających, (d-III) pochodne fj( x ) y w liczbie ny nie są jednocześnie równe zeru, funkcja /(* ) jest dwukrotnie różniczkowalna w otoczeniu * (tzn. wszystkie pochodne cząstkowe drugiego rzędu funkcji /(* ) istnieją w punkcie *), (d-IV) funkcja/(* ) jest wklęsła, to x jest maksimum globalnym dla n = /(* ). Ponieważ dowód tego twierdzenia jest dość skomplikowany, więc go pomijamy. Przedstawimy jednak kilka ważnych jego cech. Przede wszystkim Arrow i Enthoven zdołali osłabić założenie o wklęsłości i wypukłości do założenia o quasi-wklęsłości i qua si-wypukłości, stwierdzili jednak, że konieczne jest dodanie nowego założenia (d). Niezbędne jest spełnienie jednego z czterech warunków podanych w punkcie (d). W rezultacie powyższe twierdzenie zawiera cztery różne zestawy warunków dostatecznych dla maksimum. W przypa dku (d-IV), gdy f( x ) ma być wklęsłe, mogłoby się wydawać, że twierdzenie Arro wa-Enthovena dla dostateczności jest identyczne z twierdzeniem Kuhna-Tuckera o dostateczności. Ale to nieprawda. Ponieważ Arrow i Enthoven żądają jedynie, aby funkcje g'(x) występujące w warunkach ograniczających były quasi-wypukle, więc ich warunki dostateczne są słabsze. W podanym sformułowaniu warunki (a)-(d) są połączone w zestaw warunków dostatecznych. Można jednak przyjąć taką interpretację, że gdy są spełnione (a), (b) i (d), to warunki Kuhna-Tuckera dla maksimum będą warunkami dostatecznymi dla maksimum. Jeśli ponadto spełniony jest warunek kwalifikacji ograniczeń, to warunki Kuhna-Tuckera staną się warunkami koniecznymi i dostatecznymi dla maksimum. Podobnie jak twierdzenie Kuhna-Tuckera, również twierdzenie Arrowa-Enthovena może być z łatwością dostosowane do zagadnienia minimalizacji. Oprócz oczywistych zmian potrzebnych do zwrotu optymalizacji, musimy po prostu w warunkach (a) i (b) zamienić miejscami słowa quasi-wklęsły i quasi-wypukfy, zastąpić warunki Kuhna-Tuckera dla maksimum przez warunki dla minimum, zmienić zwrot nierówności w (d-I) oraz w (d-II) i zastąpić w (d-IV) słowo wklęsły słowem wypukły.
Dla zagadnienia maksymalizacji, jeżeli: (a) każda funkcja g'(x) występująca w ograniczeniu jest różniczkowalna i quasi-wypukła, (b) istnieje taki punkt x° należący do nieujemnego ortantu, że wszystkie warunki ograniczające są w nim spełnione jako ostre równości, (c) jeden z następujących warunków jest spełniony: (c-d) każda funkcja g'(x) jest wypukła, (c-II) pochodne cząstkowe każdej funkcji g l(x), obliczone w każdym punkcie x zbioru rozwiązań dopuszczalnych, nie są jednocześnie równe zeru, to spełniony jest warunek kwalifikacji ograniczeń. Test ten można również z łatwością dostosować do zagadnienia minimalizacji. Aby to uczynić, wystarczy zastąpić w warunku (a) słowo quasi-wypukły przez quasi-wklęsły> a w warun ku (c-I) zastąpić słowo wypukły słowem wklęsły. Przykłady zastosowania testu podamy poniżej.
Ćwiczenie 21.5 1. Uzasadnić zmiany zaproponowane w tekście dla twierdzenia Arrowa-Enthovena i testu kwalifikacji ograniczeń, gdy stosowane są one do zagadnień minimalizacji. 2. Czy test kwalifikacji ograniczeń jest zbiorem warunków koniecznych, czy dostatecznych? 3. Która z następujących funkcji jest akceptowalna z punktu widzenia matematycznego jako funkcja celu dla zagadnienia maksymalizacji, do którego można zastosować twierdzenie Arrowa-Enthovena (uwaga: porównać ćwiczenie 12.4-4): (a) / ( * ) = * 3- 2 * ; (b) f ( x u x 2) = 6 x i - 9 x 2', (c) f ( x u x 2) = x 2 - \ n x 1. , 4. Czy warunek kwalifikacji ograniczeń jest spełniony, jeśli warunki ograniczające w zagad nieniu maksymalizacji mają postać (uwaga: ~XiX 2 nie jest wypukła): (a) x \ + {x2 - 5)2 ^ 4 i 5 * i+ 10; (b) *i + * 2 ^ 8 i - * i* 2 ^ - 8 .
21.6. ZASTOSOWANIA EKONOMICZNE Możemy teraz przedstawić przykłady prostych ekonomicznych zastosowań obu twierdzeń.
PROGRAMOWANE NIELINIOWE 745
7 4 4 PROGRAMOWANE MATEMATYCZNE
Ponownie o maksymalizacji użyteczności Przy naszym poprzednim spotkaniu z teorią konsumenta w podrozdz. 12.5 rozpatrywane było sformułowanie w postaci: „zmaksymalizować U = U(x i , x 2) przy warunku P ix i + P 2x 2 = £ ” . Wówczas warunek ograniczający miał postać równania i nie było jawnego ograniczenia dotyczącego nieujemności zmiennych decyzyjnych. Możemy teraz ponownie sformułować to zagadnienie w sposób bardziej realistyczny. Dla « zmiennych możemy je zapisać jako zagadnienie programowania nieliniowego: zmaksymalizować (21.29)
przy warunku oraz
U = U (xi, x 2l
xn),
PiXi + ...+ P nxn ^ B,
to ograniczenie powierzchni użyteczności do wznoszącej się części dzwonu, tak iż krzywe obojętności będą miały zwykły kształt — będą wypukłe i malejące — a nie kształt owali lub okręgów, jak na rys. 21.7. Uzasadnienie tego założenia" można znaleźć w przyjmowanej w klasycznym schemacie zasadzie, że rozwiązaniem jest punkt styczności. Punkt stycz ności H rzeczywiście reprezentuje najlepszy w danych okolicznościach wybór (gdyż osiągnięcie najwyższego punktu na powierzchni użyteczności dzięki przesunięciu się ku punktowi A na płaszczyźnie nie jest możliwe ze względu na ograniczenie budżetowe), ale punkt styczności po przeciwnej stronie wierzchołka, taki jak / , jest nieoptymalny i trzeba go kategorycznie odrzucić. W schemacie programowania nieliniowego widzimy natomiast, że założenie nienasycenia może być również przydatne dla spełnienia warunku (d—II). Ponieważ jednak warunek (d) w twierdzeniu Arrowa-Enthovena może być spełniony na wiele innych sposobów, więc założenie, że U(x) jest rosnące, nie jest absolutnie konieczne.
x i, ..., x n ^ 0,
gdzie wszystkie ceny są traktowane jako egzogeniczne. W tym nowym sformułowaniu konsument ma możliwość wydawania mniejszej sumy niż wielkość budżetu B. Wyraźnie zapisano też, że wielkość każdego dobra nie może być ujemna. Ponieważ funkcja (jedyna) wyrażająca warunek ograniczający g 1(x) = Pi Xi + ... + Pnxn jest liniowa, więc spełniony jest warunek kwalifikacji ograniczeń, a warunki Kuhna-Tuckera dla maksimum są warunkami koniecznymi i dostatecznymi wtedy, gdy spełnione są inne warunki podane w jednym z dwu twierdzeń o warunkach dostatecznych. Zastosowanie twierdzenia Kuhna-Tuckera wymaga, aby U(x) była różniczkowalna i wklęsła, a g l(x) — różniczkowalna i wypukła. Ten drugi warunek jest automatycznie spełniony, ponieważ gl(x) jest liniowa. Pierwszy zostanie spełniony, jeśli zatroszczymy się o to przy specyfikowaniu modelu. Czytając twierdzenie Arrowa-Enthovena, zwróćmy uwagę, że wystarcza, aby U(x) była różniczkowalna i quasi-wklęsła — jest to znacznie mniej restrykcyjne ogranicze nie — pod warunkiem oczywiście, że spełniony będzie warunek (d). Jeśli np. istnieje pewne dobro j, które znajduje się w zasięgu możliwości budżetowej konsumenta i zawsze daje dodatnią użyteczność krańcową (nienasycenie), to automatycznie Uj(x) > 0 i warunek (d-II) będzie spełniony. Ale oczywiście istnieją inne sposoby spełnienia warunku (d) umożli wiające uczynienie warunków Kuhna-Tuckera dla maksimum warunkami koniecznymi i dostatecznymi. Sprecyzowanie quasi-wklęsłości jest zgodne z wcześniejszymi rozważaniami zawartymi' w podrozdz. 12.5. Przypomnijmy jednak, że wtedy — w modelu dla dwu dóbr z warunkiem w postaci równości — funkcja U(x) była ściśle quasi-wklęsła. Założenie o ścisłości miało na celu wykluczenie możliwości pojawienia się poziomyćh fragmentów na powierzchni użyteczności (w kształcie dzwonu) w przestrzeni XiX2U, aby każda warstwica (tu zbiór obojętności) była cienką krzywą, a nie szerokim obszarem. Tylko w takiej sytuacji można bowiem mówić o optymalnym rozwiązaniu w postąci punktu styczności, które jest zgodne z duchem tradycji klasycznej. Jeśli natomiast ograniczenie budżetowe jest wyrażone w postaci nierówności, to wszystko wygląda inaczej. Ponieważ szukamy nie punktu styczności, lecz rozwiązania optymalnego w zbiorze rozwiązań dopuszczalnych, możemy zatem zaakceptować możliwość istnienia poziomych płaskich fragmentów na powierzchni użyteczności i nie ma już potrzeby przyjmowania założenia o ścisłej ąuasi-wklęsłości. ' W podrozdz. 12.5 zakładaliśmy również, że U(x) jest rosnącą funkcją x \ i x 2. Ekonomicznie można to zinterpretować jako brak nasycenia dla obu dóbr. Graficznie oznacza
Rysunek 21.7
Warunki Kuhna-Tuckera dla tego zagadnienia można bardzo łatwo zapisać i zinter pretować. Pozostawimy to Czytelnikowi jako ćwiczenie.
Ponownie o kombinacji zapewniającej najmniejszy koszt Załóżmy, że funkcja produkcji pewnej firmy ma postać funkcji Cóbba-Douglasa: Q = KaLP, gdzie Q< a , /?< 1. Załóżmy też, że P* > 0 i PL> 0 (ceny usług kapitałowych i pracy) są określane egzogenicznie. Wtedy zagadnienie kombinacji o minimalnym koszcie może być sformułowane jako zagadnienie programowania nieliniowego: zminimalizować (21.30)
przy warunkach oraz
C = Pk K + Pl L , K aLp ^ Q o K, L** 0.
( g o > 0),
746 PROGRAMOWANIE MATEMATYCZNE Sformułowanie to różni się od zadania podanego w podrozdz. 12.7, gdyż pozwala, aby firma produkowała więcej niż założona ilość go i wyraźnie zaznacza, że używane ilości poszczególnych czynników nie mogą być ujemne. Rzeczywiście, skoro g 0 jest dodatnie, to obie wielkości nakładów K i L w funkcji Cobba-Douglasa też muszą być dodatnie. Ponieważ funkcja celu jést liniowa, więc automatycznie jest wypukła i quasi-wypukła. Jedyny występujący tu warunek ograniczający K aL? jest quasi-wklęsły dla dodatnich K i L, niezależnie od tego, czy a + ¡3% 1, tzn. niezależnie od tego, czy przychody skali są rosnące, stałe lub malejące (por. podrozdz. 12.4, przykład 5 i rozważania dotyczące (12.52)). Jednakże funkcja ta nie je st wklęsła, gdyż a + f3> 1 (rosnące przychody skali). W tym przypadku każdy kolejny wzrost produkcji o jednostkę będzie wymagać mniejszego, niż proporcjo nalny, wzrostu obu nakładów. Geometrycznie, kolejne izokwanty odpowiadające jedno stkowym przyrostom produkcji w miarę oddalania się od początku układu współrzędnych będą coraz to gęściej rozmieszczone wzdłuż dowolnej półprostej na płaszczyźnie KL. Zgodnie z tym rzut takiej półprostej na powierzchnię produkcji utworzy krzywą coraz bardziej stromo wznoszącą się ku górze, a zatem powierzchnia nie może być wklęsła. Ze względu na to nie można stosować twierdzenia Kuhna-Tuckera o warunku dostatecznym w przypadku rosnących przychodów skali. Można natomiast stosować twier dzenie Arrowa-Enthovena. Dla zadania minimalizacji twierdzenie to wymaga quasi-wy pukłej funkcji celu i quasi-wklęsłej funkcji ograniczeń. Wymagania te rzeczywiście są spełnione w rozpatrywanym zagadnieniu. Spełniony jest ponadto warunek (d-I), ponieważ dla zagadnienia minimalizacji zakłada się, ż e /7(*) > 0 dla pewnej zmiennej decyzyjnej xjy a tu mamy dC /dK = PK> 0 i dC /dL = PL> 0 dla wszystkich wartości K i L, w tym dla K i L. Idąc o krok dalej, możemy również stwierdzić, że funkcja ograniczenia g 1= K ahP speł nia test kwalifikacji ograniczeń. Po pierwsze, g 1 jest funkcją quasi-wklęsłą. Po drugie, na pewno istnieje nieujemna para uporządkowana (K, L), dla której warunek ten jest spełnio ny jako ostra nierówność. Po trzecie, ponieważ każdy punkt w zbiorze rozwiązań dopusz czalnych spełnia nierówności K > 0 i L > 0 (gdyż w przeciwnym przypadku g 0 nie mo głoby być dodatnie), pochodne cząstkowe d g lld K = a K a~lL^ oraz d g l/d L = p K aLp~l są dodatnie w całym zbiorze rozwiązań dopuszczalnych, spełniają więc warunek (c-II) testu. Wobec tego, ponieważ spełniony jest warunek kwalifikacji ograniczeń, więc — zgodnie z twierdzeniem Arrowa-Enthovena — warunki Kuhna-Tuckera dla minimum są warunkami koniecznymi i dostatecznymi.
Firma maksymalizująca sprzedaż W standardowej analizie działalności firmy zwykle zakłada się, że celem jest maksymalizacja zysków. Jednakże gdy firma ta jest korporacją, w której własność i zarządzanie są rozdzielone, może być sensowne — z punktu widzenia zarządzających — aby celem było maksy malizowanie wielkości sprzedaży (lub wielkości przychodu)5. Całkowity przychód jest często traktowany jako ważny wskaźnik pozycji konkurencyjnej firmy w ramach danej gałęzi
PROGRAMOWANIE NIELINIOWE
747
przemysłu. Wzrost wielkości sprzedaży jest ponadto często traktowany jako oznaka sukcesu w zarządzaniu. Może nawet być tak, że wynagrodzenie zarządzających zależy bezpośrednio od tego właśnie wskaźnika. Maksymalizacją wielkości "sprzedaży wydaje się być zatem możliwym celem alternatywnym w ramach korporacji, pod warunkiem, że dla uniknięcia niezadowolenia akcjonariuszy zawsze będzie się dbać o to, aby poziom zysku nie spadł poniżej pewnego ustalonego minimum, np. które jest ustalone poniżej maksymalnego poziomu zysku związanego z warunkiem MR = MC. Jeśli tak, to zagadnieniem, przed jakim stoi zarządca, jest maksymalizowanie R = R (Q \ przy warunku n = R (Q ) -C (Q ) ^7T0, czyli: zmaksymalizować
R = R(Q),
przy warunkach
C(Q) - R(Q )
oraz
0^0.
(#o > 0),
Jeśli R(Q) jest różniczkowalne i wklęsłe oraz C(Q) jest różniczkowalne i wypukłe — z czego wynika, że funkcja występująca w warunku ograniczającym C (Q )-R (Q ) jest również różniczkowalna i wypukła — to można zastosować twierdzenie Kuhna-Tuckera (warunek dostateczny). Jest interesujące, że w tym przypadku nie można zwiększyć ogólności przez osłabienie założeń o wklęsłości oraz wypukłości i przyjęcie, że R(Q) jest quasi-wklęsła, a C (ß) quasi-wypukła. Przy tych słabszych założeniach funkcja występująca w warunku ograniczającym C(Q) - R(Q) byłaby sumą dwu funkcji quasi-wypukłych, a nie ma gwarancji, że sama byłaby quasi-wypukła. Nie można zatem automatycznie stosować twierdzenia Arrowa-Enthovena o warunku dostatecznym, chyba że przyjmiemy nowe osobne założenie, że funkcja jest quasi-wypukła. Przypadek, gdy funkcja R(Q) jest wklęsła, a funkcja C(Q) wypukła, zilustrowano na rys. 21.8. Dwie krzywe na diagramie (a) narysowano przy założeniu, że R(0) = 0 i C(0) > 0. Krzywa na diagramie (b), reprezentująca funkcję występującą w warunku ograniczającym, jest lustrzanym odbiciem (względem osi poziomej) krzywej zysku. Każdy poziom produkcji w otwartym przedziale (Q i , ß 6) daje dodatni zysk, jednakże tylko poziomy Q należące do przedziału domkniętego (Q 2 , Q a) zapewniają zysk nie mniejszy niż k q i spełniający warunek ograniczający dla zysku. Możemy zatem zidentyfikować przedział (02 >(24) jako zbiór rozwiązań dopuszczalnych. Jak można się było spodziewać, do zbioru tego należy Q3, czyli poziom produkcji maksymalizujący zysk. Dla tego zagadnienia, przy funkcji Lagrange’a: Z = R(Q) + y [ -X o - C ( Q ) + R (Q )l warunki Kuhna-Tuckera składają się z warunków krańcowych: 3Z — =
R'(Q ) - y C'«2) + y R \ Q )« o,
(21.31) Ł - 7 r o - C ( 0 + ,R(j2)&O
William J. Baumol, On the Theory of Oligopoly, „Econometrica” 1958, August, s. 187-198. Zob. też: J. Baumol, Business Behavior, Value and Growth (wyd. poprawione), Harcourt, Brace & World, Inc., Nowy Jork 1967.
oy
5
oraz warunków nieujemności i wzajemnego uzupełniania. Ponieważ R(0) = 0 i C (0)> 0, więc dla zerowego poziomu produkcji byłoby dZ ldy = - K 0 - C(0 )< 0 , co narusza drugi
7 4 8 PROGRAMOWANIE MATEMATYCZNE
PROGRAMOWANIE NIELINIOWE 74 9
warunek krańcowy. Musimy więc przyjąć g > 0, co jest wymaganiem całkowicie zgodnym z faktem, że zerowy poziom produkcji leży poza zbiorem rozwiązań dopuszczalnych. Z dodatniości g — na mocy warunku o komplementamości — wynika, że dZ /dQ = 0, co oznacza, że pierwsza nieostra nierówność w (21.31) musi być spełniona jako równanie. Rozwiązując ją, otrzymujemy (obwarowaną ograniczeniem) regułę dla poziomu produkcji maksymalizującego sprzedaż: a (21.32) 1
R ,(Q) = - r — C'(Q). y. . : +
V-,
, ;
We wzorze (21.32) y może przyjmować wartość zero lub wartości dodatnie. Jeśli y = 0, to wzór sprowadza się do R'(Q) = 0, co oznacza, że firma ustali wielkość produkcji na takim poziomie, przy którym zeruje się przychód krańcowy ( g 5 ńa rys. 21.8). Będzie to maksymalizacja sprzedaży w najczystszej postaci, gdyż w tym przypadku firma „będzie” w najwyższym punkcie krzywej całkowitego przychodu. Ale takie ekstremalne zachowanie nie jest przy naszych założeniach dopuszczalne, gdyż g 5 również znajduje się poza zbiorem rozwiązań dopuszczalnych. Wobec tego musimy przyjąć y > 0. Z zasady komplementamości wynika wobec tego, że dZ/dy = 0, co z kolei oznacza, że warunek dla zysku ma być spełniony jako równanie, przy czym firma stara się osiągnąć minimalny wymagany zysk równy /r0.
Dla dodatniego y reguła dla maksymalizującego sprzedaż poziomu produkcji (21.32) oznacza, że:
gd y żT + 7 < 1 a to na ogół będzie implikować wyższy poziom produkcji niż reguła maksymalizacji zysku R \Q ) ~ C'(Q). Na rys. 21.8 poziom produkcji maksymalizujący zy sk jest równy g 3. Poziom produkcji spełniający regułę (21.32) i dający dokładnie minimalną wymaganą wielkość zysku jest równy g 4 i rzeczywiście przekracza g 3.
Rozwiązywanie zagadnienia programowania nieliniowego za pomocą warunków Kuhna-Tuckera Nasze rozważania dotyczące warunków Kuhna-Tuckera koncentrowały się jedynie na ich roli analitycznej, tymczasem warunki te mogą również odgrywać rolę obliczeniową w sytuacji, gdy są warunkami koniecznymi i dostatecznymi6 i jeśli liczba zmiennych decyzyjnych jest dość mała. Zilustrujemy to przykładem dotyczącym firmy maksymalizującej sprzedaż. Załóżmy, że funkcja zysku i kosztów dla firmy są następujące: R = 3 2 Q - Q 2,
[wklęsła]
C = Q2+ 8 Q + 4
[wypukła]
i minimalny poziom zysku jest równy 18. W tej sytuacji warunki Kuhna-Tuckera są rzeczywiście konieczne i dostateczne. Zgodnie z (21.31) dwa warunki krańcowe przyjmują teraz postać: | | = 3 2 -2 g -y (4 g -2 4 )^ 0 , dz — = - 2 g 2+ 2 4 g -2 2 * * 0 . dy
^
Wartość g musi być dodatnia lub równa zeru. Próba przyjęcia Q = 0 natychmiast prowadzi do sprzeczności w drugim warunkukrańcowym. Musimyzatem przyjąć g > 0, a wobec tego z zasadywzajemnegouzupełniania wynika 3 Z /3 g = 0, co daje równanie względem dwu zmiennych. Wartość y w tym równaniu musi być dodatnia lub równa zeru. Podstawiając y = 0 i rozwiązując względem g , otrzymujemy g = 16. Ta wartość g , chociaż sama w sobie jest do przyjęcia, implikuje jednak dZ /d y = - 150, co jest sprzeczne z drugim warunkiem krańcowym (ograniczeniem dotyczącym zysku). Musimy więc przyjąć y > 0. Ale z kom plementamości wynika, że dZ /dy = 0. Rozwiązując to nowe równanie, otrzymujemy dw a, pierwiastki: g i = 11 i g 2 = 1- Ponieważ tylko pierwszy z nich jest zgodny z warunkiem dZ Idg = 0, więc poziom produkcji maksymalizujący sprzedaż jest równy g = 11. Przeciw-
Rysunek 21.8
6 Jeśli są tylko dostateczne, ale nie konieczne, to rozwiązanie optymalne może nie spełniać warunków Kuhna-Tuckera i nie będą one efektywnie „wyławiać’’ takiego rozwiązania.
750 PROGRAMOWANIE MATEMATYCZNE nie* R'(Q) = C'(Q) prowadzi do mniejszej liczby Q = 6 wyrażającej produkcję maksymali zującą zysk. 7 . 7 7;., .: . ■ Powinno być zatem jasne, że procedura obliczeniowa przeprowadzana jest metodą prób i błędów. Podstawowa idea polega na tym, aby najpierw wypróbować zerową wartość dla każdej zmiennej decyzyjnej. Przyrównanie zmiennej do zera zawsze powoduje uproszczenie wyników krańcowych dzięki wyzerowaniu pewnych składników. Jeśli można wtedy znaleźć odpowiednie, nieujemne wartości mnożników Lagrange’a, spełniające wszystkie warunki krańcowe, to rozwiązanie zerowe będzie optymalne. Jeśli natomiast zerowe rozwiązanie narusza którąś z nierówności, to musimy przyjąć, że jedna lub więcej zmiennych decyzyjnych są niezerowe. Dla każdej dodatniej zmiennej decyzyjnej możemy — na mocy warunku wzajemnego uzupełniania — warunki krańcowe w postaci nieostrej nierówności przekształcić w równania. Każde takie równanie doprowadzi albo do rozwiązania, albo do sprzeczności, która zmusi nas do wypróbowania innego wariantu. Jeśli rozwiązanie istnieje, to w końcu takie próby nas do niego doprowadzą. Zauważmy, że dla dwu zmiennych musimy wypróbować nie mniej niż cztery (22) możliwe kombinacje znaków zmiennych decyzyjnych: (0, 0), (0, +), (+, 0) i (+, +). Dla zagadnienia z trzema zmiennymi trzeba sprawdzić 2 3 możliwości; złożoność pro blemu wzrasta bardzo szybko w miarę wzrostu liczby zmiennych decyzyjnych. Metoda ta nie nadaje się do rozwiązywania zagadnień programowania nieliniowego bez użycia komputera.
Ćwiczenie 21.6 1. Zapisać warunki Kuhna-Tuckera dla zagadnienia (21.29). 2. Zapisać warunki Kuhna-Tuckera dla zagadnienia (21.30). 3. Załóżmy, że całkowity przychód R pewnej firmy maksymalizującej sprzedaż zależy od wielkości produkcji Q i wydatków na reklamę A. Załóżmy dalej, że jej koszt całkowity składa się z kosztu produkcji C i kosztu reklam A. a. Sformułować zagadnienie programowania nieliniowego. b. Jakie warunki trzeba nałożyć na funkcje R i C, aby można było zastosować twierdze nie Kuchna-Tuckera? c. Jakie warunki są potrzebne, aby można było stosować twierdzenie Arrowa-Enthovena o warunku dostatecznym? 4. Mamy następujące zagadnienie: zminimalizować
C = x j = x f,
przy warunkach
x x + x 2 ^ 2,
oraz
x u x 2 ^ 0.
a. Czy można do tego zagadnienia zastosować twierdzenie Kuhna-Tuckera o warunku dostatecznym? Czy warunki Kuhna-Tuckera dla minimum są konieczne i dostateczne? b. Zapisać warunki Kuhna-Tuckera i zastosować je do znalezienia rozwiązania optymal nego metodą prób i błędów. Jakie są wartości x x i x 2l 5. a. Sformułować zagadnienie programowania nieliniowego dla następującego pytania: jaka jest najkrótsza odległość od początku układu współrzędnych (0, 0) do punktu
PROGRAMOWANIE NIELINIOWE
751
leżącego na prostej przechodzącej przez punkty (0, 2) i (2, 0) lub nad tą prostą? Oznaczyć odległość przez d (wskazówka: posłużyć się twierdzeniem Pitagorasa). b. Jak to zagadnienie różni się od zagadnienia z poprzedniego zadania? Czy można potraktować rozwiązanie (£j, x 2) z poprzedniego zadania jako rozwiązanie dla tego zadania? Dlaczego? c. Jaka jest najkrótsza odległość d l
21.7. OGRANICZENIA PROGRAMOWANIA MATEMATYCZNEGO Programowanie matematyczne pozwala na uwzględnienie warunków w postaci nierówności, co znacznie rozszerza zakres rozważań dotyczących optymalizacji. Oprócz oczywistych zastosowań do praktycznych zagadnień zarządzania firmą, pozwala ekonomiście ujrzeć w nowym świetle teorię konsumpcji, produkcji i alokacji zasobów. Podobnie jak inne omówione przez nas metody, programowanie matematyczne nie jest jednak pozbawione pewnych ograniczeń. W powyższych rozważaniach zakładaliśmy między innymi, że zmienne decyzyjne są ciągłe. W rzeczywistości jedna lub więcej zmiennych może przyjmować tylko wartości całkowite, np. optymalny poziom produkcji równy 3,75 samolotu nie jest sensowny. Na szczęście trudność ta została rozwiązana dzięki gałęzi programowania matematycznego zwanej programowaniem całkowitoliczbowym, w którym otrzymane warto ści rozwiązań są liczbami całkowitymi. Poważniejsze ograniczenie — dotyczące nie tylko programowania matematycznego, lecz wszystkich omawianych w tej książce zagadnień optymalizacji — polega na tym, że otrzymane rozwiązanie jest ze swej natury statyczne. Zapisując rozwiązanie optymalne, np. (jći, ..., *„), wyrażamy najlepszy wybór, jakiego można dokonać dla każdej zmiennej Xj w danych okolicznościach. Ponieważ jednak każda xj reprezentuje jedną jedyną wartość liczbową, więc może odpowiadać albo jednej jedynej chwili, albo też pewnemu okresowi, w ciągu którego wszystkie okoliczności uwzględnione w zapisie zagadnienia nie zmieniają się. W obu przypadkach zagadnienie i jego rozwiązanie są statyczne. Zagadnienie dynamicznej optymalizacji wymaga natomiast określenia dla każdej zmiennej decyzyjnej jej optymalnej ścieżki czasowej w danym okresie, a niejednej wartości optymalnej. Aby rozwiązać takie zagadnienie, musimy najpierw poznać metody matematycz ne należące do takich dziedzin, jak rachunek wariacyjny, optymalna teoria sterowania oraz programowanie dynamiczne. Tematy te nie mogą być dostatecznie jasno i rzetelnie wyłożone w ramach ograniczonej liczby stron, więc najlepiej odłożyć je do osobnego tomu. Zakończyliśmy zatem ostatnią już część książki omówieniem ograniczeń technik i sposobów analizy. Nie chcemy pomniejszać znaczenia metod matematycznych, które tak pracowicie omawialiśmy, ale pragniemy ostrzec Czytelników, aby nie przypisywali im cech uniwersalności, których nie posiadają. Niezmiernie ważna jest pełna świadomość ograniczeń metod analitycznych, gdyż bez niej stalibyśmy się niewolnikami, a nie panami poznanych technik.
SYMBOLE MATEMATYCZNE
|H | r(A) 0 u*y u'v
S Y M B O L E
hesjan obrzeżony rząd macierzy A macierz zerowa < iloczyn wewnętrzny wektorów u i v iloczyn skalamy wektorów u i v
M A T E M A T Y C Z N E 3.
Rachunek różniczkowy
,
Dana jest funkcja jednej zmiennej x: y = f(x) lim/(jc) dy d2y
ae S b£S SczT T id S Au B A r \B S { } lub 0 {a, b, c] {*: * ma własność P} min {a, b, c} R R2 Rn (x, y) (■*, y, z) (a, b) {a, b)
pierwsza różniczka y druga różniczka y
— lu b/'(x) dx dy lub /'(jc0) dx x - x 0
1. Zbiory a jest elementem (należy do) zbioru S Z? nie jest elementem zbioru 5 zbiór S jest podzbiorem zbioruT, jest zawarty w zbiorze T zbiór T zawiera zbiór S suma zbiorów A i B iloczyn (część wspólna) zbiorów A i B dopełnienie zbioru S zbiór pusty zbiór o elementach a , b y c zbiór wszystkich obiektówo własności P najmniejszy element wskazanego zbioru zbiór wszystkich liczb rzeczywistych dwuwymiarowa przestrzeń rzeczywista n-wymiarowa przestrzeń rzeczywista para uporządkowana trójka uporządkowana przedział otwarty o końcach a i b przedział domknięty o końcach a i b
granica / ( x) przy x dążącym do nieskończoności
pierwsza pochodna funkcji y - f { x ) wartość pierwszej pochodnej w punkcie x - x 0
d y — — lub f ' \ x ) dx
druga pochodna funkcji y = f(x)
dny — — lub / (n) (jc) d xn
n-ta pochodna funkcji y = /(* )
J/(.jc) dx
całka nieoznaczona f( x )
lf(x ) dx
całka oznaczona funkcji f(x ) w granicach od x = a do x = b
a
Dana jest funkcja y = f( x u x 2, •.., xn) 3v - Z - lub fi dx i
pochodna cząstkowa / względem x t pochodna zupełna /w zględem x ,•
dxt cząstkowa pochodna zupełna / względem x ( §Xi 4.
Równania różnicowe i różniczkowe
2. Macierze i wyznaczniki j; s A ' lub Ar A“1 IA | IJI !H |
transpozycja macierzy A macierz odwrotna do macierzy A wyznacznik macierzy A wyznacznik Jacobiego (jakobian) hesjan
dv
pochodna y względemczasu
A yt
pierwszy przyrost y t
A 2y t yp yc
drugi przyrost y t rozwiązanie szczególne, całka szczególna funkcja dopełniająca
48 — Podstawy...
754 SYMBOLE MATEMATYCZNE Inne
X*,i~l p=>q p*= q p& q wtw, gdy \m \ nl lo gbx l o g e X lub Inx e sin 0 cos 6 Rn
■ ii
- -\v: ■ :
M
5.
suma x¿ dla i od 1 do n p tylko wtedy, gdy q (p implikuje q) p jeśli q ;; p wtedy i tylko wtedy, gdy q wtedy i tylko wtedy, gdy wartość bezwzględna liczby m n silnia s n(n - l)(n - 2) ... *3 • 2 1 logarytm x o podstawie b logarytm naturalny x (o podstawie e) podstawa logarytmów naturalnych i naturalnej funkcji wykładniczej funkcja sinus 6 funkcja cosinus 6 reszta dla szeregu Taylora obejmującego wielomian «-tego stopnia.
B IB L IO G R A F IA
•v'* y.
•Î5$)
■■
Abadie J. (ed.), Nonlinear Programming, North-Holland Publishing Company, Amsterdam 1967 (zbiór artykułów dotyczących pewnych teoretycznych i obliczeniowych aspektów programowania nieli niowego; rozdział 2, napisany przez Abadie, dotyczy twierdzenia Kuhna-Tuckera w odniesieniu do kwalifikacji warunków ograniczających). Allen R.G.D., Mathematical Analysis for Economists, Macmillan Co., Ltd., Londyn 1938 (jasny wykład rachunku różniczkowego i całkowego; omawiane są wyznaczniki, ale nie macierze; brak teorii zbiorów i programowania matematycznego). Allen R.G.D., Mathematical Economics, wycL 2. St Martin’s Press, Inc., Nowy Jork 1959 (omówiono mnóstwo modeli ekonomii matematycznej, wyjaśniono liniowe równania różniczkowe i różnicowe oraz algebrę macierzową). Almon C., Matrix Methods in Economics, Addison-Wesley Publishing Company, Inc., Reading, Mass. 1967 (omówiono metody macierzowe w odniesieniu do układów równań liniowych, modele nakładów i wyników, programowanie liniowe i programowanie nieliniowe. Omówiono również wartości własne i wektory własne). Baumol W.J., Economic Dynamics: An Introduction, wyd. 3, The Macmillan Company, Nowy Jork 1970 (część IV zawiera jasne wyjaśnienie prostych równań różnicowych; część V dotyczy układów równań różnicowych; równania różniczkowe są tylko krótko omówione). Braun M., Differential Equations and Their Applications: An Introduction to Applied Mathematics, wyd. 2, Springer-Verlag, Nowy Jork 1978 (zawiera interesujące zastosowania równań różniczkowych, takie jak wykrywanie fałszerstw sztuki, rozprzestrzenianie epidemii, wyścig zbrojeń i rozpad substancji radioaktywnych). Burmeister E., Dobell A.R., Mathematical Theories of Economic Growth, The Macmillan Company, Nowy Jork 1970 (obszerny wykład modeli wzrostu o różnym stopniu złożoności). Coddington E.A., Levinson N., Theory o f Ordinary Differential Equations, MacGraw-Hill Book Company, Nowy Jork 1955 (podstawowy tekst matematyczny dotyczący równań różniczkowych). Courant R., Differential and Integral Calculus (przekład E.J. McShane’a), wyd. 2, Interscience Publishers, Inc., Nowy Jork 1937 (t. I), 1936 (t. Et) (klasyczny traktat dotyczący rachunku różniczkowego i całkowego). Courant R., John F., Introduction to Calculus and Analysis, Interscience Publishers, Inc., Nowy Jork 1965 (t. I), 1974 (t. II) (uwspółcześniona wersja poprzedniej książki).
756 BIBLIOGRAFIA Dorfman R., Samuelson P.A., Solow R.M., Linear Programming and Economic Analysis, McGraw-Hill Book Company, Nowy Jork 1958 (szczegółowo omówiono programowanie liniowe, teorię gier, analizę nakładów i wyników). Franklin J., Methods o f Mathematical Economics: Linear and Nonlinear Programming, Fixed-Point Theorems, Springer-Verlag, Nowy Jork 1980 (wspaniałe omówienie programowania liniowego). Frisch R. (we współpracy z A. Nataf), Maxima and Minima: Theory and Economic Applications, Rand McNally & Company, Chicago 1966 (obszerne omówienie zagadnień ekstremów, przeprowadzone w duchu tradycji klasycznej). Goldberg S., Introduction to Difference Equations, John Wiley & Sons, Inc., Nowy Jork 1958 (z zastosowaniami ekonomicznymi). . '• Hadley G., Linear Algebra, Addison-Wesley Publishing Company, Inc., Reading, Mass. 1961 (obejmuje macierze, wyznaczniki, zbiory wypukłe itd.). Hadley G., Linear Programming, Addison-Wesley Publishing Company, Inc., Reading Mass. 1962 (jasno napisane rozważania o nastawieniu matematycznym). Hadley G., Nonlinear and Dynamie Programming, Addison-Wesley Publishing Company Inc., Reading, Mass. 1964 (dotyczy programowania nieliniowego, stochastycznego, całkowitoliczbowego i pro gramowania dynamicznego; podkreślono aspekty obliczeniowe). Halmos P.R., Naive Set Theory, D. Van Nostrand Company, Inc., Princeton, N J. 1960 (nieformalne i łatwe w czytaniu wprowadzenie w podstawy teorii zbiorów). Henderson J.M., Quandt E.R., Microeconomic Theory: A Mathematical Approach, Wyd. 3, McGraw-Hill Book Company, Nowy Jork 1980 (zrozumiałe matematyczne omówienie zagadnień mikro ekonomicznych). Intriligator M.D., Mathematical Optimization and Economic Theory, Prentice-Hall, Inc., Englewood Cliffs, N.J. 1971 (obszerne omówienie metod optymalizacji obejmujące metody klasyczne, programowanie liniowe i nieliniowe, optymalizację dynamiczną, a także zastosowania do teorii konsumenta i firmy, równowagi ogólnej, ekonomii dobrobytu oraz teorii wzrostu). Kemeny J.G., Snell J.L., Thompson G.L., Introduction to Finite Mathematics, wyd, 3, Prentice-Hall, Inc., Englewood Cliffs-NJ. 1974 (obejmuje takie tematy, jak: zbiory, macierze, prawdopodobieństwo i programowanie liniowe). Koo D., Elements of Optimization: With Applications in Economics and Business, Springer-Verlag, Nowy Jork 1977 (jasne omówienie klasycznych metod optymalizacji programowania matematycznego oraz teorii optymalnej kontroli). Koopmans T.C. ( e d Activity Analysis o f Production and Allocation, John Wiley & Sons., Inc. Nowy Jork 1951, reprinted by Yale University Press, 1972 (zawiera wiele ważnych artykułów dotyczących programowania liniowego i analizy aktywności). Koopmans T.C., Three Essays on the State o f Economic Science, McGraw-Hill Book Company, Nowy Jork 1957 (pierwszy esej zawiera rozważania o zbiorach wypukłych; w trzecim omówiono współzależność narzędzi i zagadnień w ekonomii). Leontief W.W., The Structure o f American Economy, 1919-1939, wyd. 2, Oxford University Press, Fair Lawn, N.J. 1951 (pionierska praca z zakresu modeli nakładów i wyników). Samuelson P.A., Foundations o f Economic Analysis, Harvard University Press, Cambridge, Mass. 1947 (klasyka ekonomii matematycznej, podana w bardzo trudnej formie). Takayama A., Mathematical Economics, The Dryden Press, Hinsdale, IE. 1974 (obszerne omówienie teorii ekonomicznej w terminach matematycznych, koncentrujące się na dwóch konkretnych tematach: równowagi konkurencyjnej i wzrostu ekonomicznego). Thomas G.B., Finney R.L., Calculus and Analytic Geometry, wyd. 5, Addison-Wesley Publishing Company, Inc., Reading, Mass, 1979 (jasno napisane wprowadzenie do rachunku różniczkowego).
O D P O W IE D Z I
D O
W Y B R A N Y C H
Ć W IC Z E Ń
Ćwiczenie 2.3 1.
(a) {jc: * > 27}.
3.
(a) {2, 4, 6, 7};
8.
Jest 16 podzbiorów.
(c) {2, 6};
(e) {2}.
9.
Wskazówka: należy odróżniać symbole £ i <£.
-
Ćwiczenie 2.4 1.
(a) {(3, a), (3, b), (6, a), (6, b), (9, a), (9,,&)}.
3.
Nie.
5.
Zbiór wartości = { y : 8 ^ y ^ 17}.
Ćwiczenie 2.5 2.
(a) i (b) różnią się znakiem miary nachylenia; przecięcia z osią pionową,
4.
Gdy dopuszczalne są wartości ujemne, należy uwzględnić również III ćwiartkę układu współrzędnych.
5.
(a) x19.
6.
(a) x6.
Ćwiczenie 3.2
(a) i (c) różnią się wartością punktu
758 ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ
Uwaga: w 2(a) c - 10 (a nie 6).
5.
Wskazówka:
b + d -
0 implikuje
Ć w icze n ie 4 3 d
=
1.
Ćwiczenie 3 3 1.
(a) X! = 5,
^2 = 2.
3.
(a) Pi = 1,
P2 = -5 ;
5.
(a )P = l,
(c)
Xi =
6
<2 = 2.
■ 7 Qi = l l — 17
P2 = 317
17
7 02 = 8 — . ^ 17
Ćwiczenie 3.5
i.
Wskazówka: po podstawieniu ostatnich dwu równań do pierwszego potraktować otrzy mane równanie jako kwadratowe względem zmiennej w = Y172. Tylko jeden z jego pierwiastków wx = 11 można zaakceptować. Otrzymujemy dla niego 7 = 121 i ¿7 = 91. Dla drugiego pierwiastka wartość Ć jest ujemna.
(c) xx' =
X3X l
X3X2
x2
3 _
(g) u'u = 38. (b) P • Q lub F Q lub Q'P.
3.
(a) I P , a ; i=i
5.
(a) 2v =
7.
(a) ¿ = V27.
9.
(c)
"o" 6
,d(v0) = (v -v ),/2.
Elementy kolumnowego wektora wyrazów wolnych są następujące: 0, a, - c .
Ćwiczenie 4.2 4 (a)
9
2 (c)
7
1.
(a) r _11
171. 17
2.
Nie; powinno być: A - B = -B + A .
4.
(ą) &(A + B) = k[ay+ by] = [kay+kby] = [kay] + [kby] = k[ay] + k[by\ = kA + kB; czy Czy telnik może uzasadmć każde przejście?
5.
Wskazówka: zastosować kolejno dwa wzory z reguły rozdzielności.
Ćwiczenie 4.5
Ćwiczenie 4.1
1.
X2X3
(b) F = ( a - ^ + / 0+G0) / [ i - ^ ( i - O L Ć = [ a - ^ + ^ ( l - i ) ( / 0+G o )]/[l-^(l-i)]*
1.
Xi X3
X 22
Ćwiczenie 4.4
' r = [ j ( i - ^ + i ( ^ + / o + G 0) ] / [ i - ^ ( i - i ) ] , 3.
Xi X2
X2Xi
f x 2
45" 18 ; 27.
II > 1 ¡3 . o
Pi = 3
5 2 3
4, *2 = 1, *3 = 2.
Ćwiczenie 3.4 3.
"15 6 _9 (e) u'v = 44; (a) uv' =
1 to 1....
3.
ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ 759
12
-3
18
27
1.
(a) AI3 = r 1 8 0 -2
3.
(a) 4 x 3 ;
4.
Wskazówka: -pomnożyć podaną macierz diagonalną przez nią samą i sprawdzić, czy
7 4_
(c)
I2X =
(c) 4 x 1 .
otrzymana macierz spełnia warunki dla macierzy idempotentnych. ćwiczenie 4.6
0
4.
(b)
49
5
12 1
(c)
3x+2y
(a) x 2+x 3 +x 4+ x 5 ;
6.
(b) £
1.
'3
1
1.
A' =
3.
Wskazówka: zdefiniować D = AB i zastosować (4.11).
5.
Wskazówka: zdefiniować D - A B i zastosować (4.14).
4
3_
i
B' =
4 x + 2 y -!z
(2x2)’
5.
0
"2 -l"
oo
1 0 0 W tym szczególnym przypadku AB jest równe BA = 0 1 0
r O
3.
(2x1)
Ćwiczenie 5.1 (C )
b { X i + X 2 + X 3 + X 4).
(d) wskazówka: x° = l dla x ^ 0.
1.
(a) 5,2;
(c) 5,3;
3.
(a) tak;
(d) nie.
(e) 5,3.
760 ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ
ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ
Ćwiczenie 5.2 1.
(a) -6 ;
3.
Im J =
(e) 3a b c - a 3- b 3-c*.
(c) 0; d f
(b) |A| = 1 - b + b ty |A2| = a -b d + b (l-t)(Io + G o ),
;
d f
ICfel = -
g
761
IAi| =Io+Go*~bd+a, [A3| = d ( l- b ) + t( a + I 0+G0).
Ćwiczenie 5.7
*
4.
8 * (a) wskazówka: rozwinąć względem trzeciej kolumny.
5.
20 (nie -2 0 ).
1.
Jći = 69,53;
3.
(a) A =
x 2 = 57,03
"0,10
0,50"
0,60
0
i
x3= 42,58.
równanie macierzowe jest następujące: Ćwiczenie 5.3
" 0,90
-0,50" *1 1,00 _x2
3.
(a) własność IV;
(b) własność ID (zastosowana do obu wierszy).
_-0,60
4.
(a) nieosobliwa;
(c) osobliwa.
(b) ^ = 3 3 3 3 -,
5. 7.
(a) rząd = 3; (c) rząd < 3 (dokładnie = 2). A jest nieosobliwa, gdyż |A| = 1 - b & 0.
5.
"1000" 2000 ’
x 2 = 4000.
|A| = 0,62, |A i|=1916,16, |A2| = 1015,70, |A3|= 1310,47. Zatem (w przybUżeniu): xi = 3090,58, x2- 1638,23 i x 3 = 2113,66 (odpowiedzi mogą się różnić z powodu różnej liczby operacji zaokrąglania).
Ćwiczenie 5.4 Ćwiczenie 6.2 1*
3.
4.
X <2*3 I C,-2 I ,
X Cl j | C4j | .
1=1
;=1
2
(a) zamienić miejscami dwa elementy A na głównej przekątnej; pomnożyć dwa elemen ty A leżące poza główną przekątną przez - 1 . (b) Podzielić przez |A|. ' 3 -1 -6
(a) E"1=
2 2 -4
'1 (c) G l = 0 0
-9" -5 ; 26.
0 0" 0 1 1 0.
1.
(a) Ay/Ax = &x+4Ax\
(b) dy/dbc = 8*;
3.
(a) Ay/Ax = 5, funkcja stała.
( c ) /'( 3 ) = 24, /'(4 ) = 32.
Ćwiczenie 6.4 1.
Granica lewostronna = granica prawostronna = 15;
3.
(a) 5;
granica = 15.
(b) 5.
Ćwiczenie 6.5 Ćwiczenie 5.5 (c) Jćx = 1 i x 2 = 2.
1.
(a) Jći = 5 i *2 = 2;
2.
( a )A -'= l
3.
(a)
4.
Wskazówka: zastosować (5.8) i (5.10).
X=
"5"
^3 = 0;)
2
;
1
(0 A -> 4 V, II
xi = 2, X2 = l,
,
II p
3_
/—\ n,
1 2 -2
i
-\ ,
8
,
x=
1.
(a) -3 /4 <*;
3.
(a) - 7 < x < 5;
(c)
jc<
1/2.
(c) - 4 ^ x ^ 1.
"l‘ _2_
f =4,
Ćwiczenie 6.6 1.
(a) 8;
3.
(a) 2 I ;
(c) 18. (c) 2.
Ćwiczenie 5.6 Ćwiczenie 6.7
1.
(a) A
=
1 b (l-t) l- b + b t t 1
1 1 t
-b ' -b > 1- b .
C T
1 l-b + b t
I q+ G o +a —bd b(l —t) (/o + Go) + a —bd t(Io + Go) + a t + d ( l —b) _
2.
(a) N 2- l N - 3 ;
(b) tak; (b) tak;
(c) tak.
3.
(a) (V+2)/(V2+2);
6.
Tak: każda funkcja jest ciągła i gładka.
(c) ciągła w dziedzinie.
762 ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ
ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ 763
Ć w icze n ie 8.2
Ćwiczenie 7.1 1. 3.
(a) dy/d* = 13jc12; (a) f ' ( x ) = W
(c) dy/dx = 42*5;
(c) dw/du = -2u~ m .
/ (1) = / ,(2) = 18;
(c) /'(* ) = 10x~3,
/'(1 ) = 10,
/'(2 )'= 1
1.
(a) dz = (6x + y)dx + (x -ó y ^ d y .
2.
(a) dy =
+ x 2 ) 2] ć x 1
- \ x l!(xl + x ł)2]dx2.
3.
€qP = 2bP 2l(a + bP 2 + R m).
5.
E ^ - 2 / ( Y f P 2 + 1).
Ćwiczenie 7.2 1.
VC = 0 3- 5 0 2 + 1 4 g ;
3.
(a) 3(27x* + 6x - 2);
4.
(b) M R = 6 0 - 6 f i .
7.
(a) (*2 - 3)/*2;
8.
(a) a;
Ćwiczenie 8 3
dVC —— = 3 g 2 - lOg + 14 jest funkcją MC. dQ (c) 12jc(jc+ 1);
(a) dy = 3[(2x2 - 1)(*3 + 5)0*! + 2xl(x3 + 5)dxj + x lQx 2 - l)d*3]; (c) dy/d:Cj = 3(2x2 - 1) (*3 + 5).
4.
Wskazówka: zastosować definicje różniczki i różniczki zupełnej.
(c) 20/(* + 5)2. Ćwiczenie 8.4
;(c) -a l(a x + b)2.
Ćwiczenie 7.3 1.
- 6 x ( 5 - x 2)2.
3.
(a) 18*(3*2 - 13)2;
5.
- l ' ‘ x = - y - 3,
(c) 4a(ax + b ) \
' 1 r d*/dy = - .
1. (a) dyldxl = 6x 2 - 22x tx 2 i (c) dy/dxl = 2(x2- 2) i
1.
(a) dzjdy = x+ lOy + 6y2 = lOy f 9y2;
3.
dQ/dt = [aaAJK + bfiA/L + A'(t)]KaLP.
4.
(b) §W/§w = 10w/i + /2,
■ *
dy/dx2 = -1 lx 2 + 6*2; dy/dx2 - 2 x l + 3.
2.
(a) zdefiniowane, dy/d* = -{3A2 - 4ry + 3y2)/(-2x2 + 6*y) = -9/8; (b) zdefiniowane, dy/d* = -{4* + 4y)/(4x - 4 / ) = 2/13.
4.
W punkcie (0, 0) naruszony jest warunek Fy * 0.
5.
Iloczyn pochodnych cząstkowych jest równy -1 .
Ćwiczenie 8.6
i
1.
U2 = 3(xx + 2)2(*2 + 3)2.
3. Ćwiczenie 7.5 1. dQ/da = d/(b + d)> 0, dQ/dc = -b/(b + d )< 0 , .
5.
dQ/db = -d(a + c)/(b + d )2 < 0, dQ/dd = b(a + c)/(b + d)2 > 0.
(a) |J| = 0,
funkcje są zależne;
(b) |J| = -20*2,
(c) (dP/dG0) = l/(5 , + r - / ' ) > 0 . (dP/dY0) = DYq/(S p - DP) > 0,
(dQ/dY0) = DYqSp/(Sp - DP) > 0,
(dP/dTJ = - S To/(SP - DP) > 0,
(dQ/dT0) = - S T DP/(SP - DP) < 0.
(dY/dMs0) = - ( / ' ,- Ą)/| J| > 0,
(di/dMs0) = ~{SY + M')Ą J| < 0.
Ćwiczenie 9.2
aF/a/0= a ? / a a = i / ( i - ^ + ^ ) > o .
1.
(a) gdy x - 1, y = 11 (maksimum względne); (c) gdy x = 0, y = 3 (względne minimum).
2.
(a) wartość krytyczna x = -1 nie należy do dziedziny, dla wartości x = l otrzymujemy y = 3 (względne minimum).
4.
(d) elastyczność jest równa 1.
Ćwiczenie 7.6 1«
§W§v = 3/i-12v% .
(c) 10/9.
5. (a) Ul = 2(xl + 2 )(x 2 + 3 f
2
(c) dz/dy = -15* + 3y = 108y- 3 0 .
Ćwiczenie 8.5 ,
Ćwiczenie 7.4
3. (a) 12;
3.
(e) -x(9 x + 14).
funkcje są niezależne.
*
Ćwiczenie 8.1 1. (a) dy = - 3 (x 2 + l)dx; 3. (a) dC/dY = b
i
Ćwiczenie 9 3
(c) dy = [(1 - x 2)l(x 2 + l) 2]djc. C /Y= (a + bY)/Y.
_
_
1.
(a) f" ( x ) = 2a, /"'(*) = 0;
(c) f" (x ) = 4(1 -* )" 3, /'" (r) = 12(1-jc)-4.
ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ 765
764 ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ 3.
(b) linia prosta.
; ^ i. '
>T
5.
Każdy punkt na f( x ) jest punktem stacjonarnym, a dla g(x) jedynym znanym nam punktem stacjonarnym jest x = 3. :
Ćwiczenie 10.3 1.
(a) 4;
2.
(a) 2;
(c) -3;
Ćwiczenie 9.4
3.
(a) 28;
( (c) ln 3 - In B;
!•
(a) /(2 ) = 33 stanowi maksimum;
Ćwiczenie 10.4
(c)
1.
Wymaganie to zapobiega przekształcaniu się funkcji w funkcję stałą.
3.
Wskazówka: obliczyć logarytmy o podstawie b.
/ ( l ) = 5 “ jest maksimum, / ( 5 ) - “ 5^- jest minimum.
(c) 4. (e) 6. (f) 3.
2.
Wskazówka: zapisać pole powierzchni A jako funkcję jednej jedynej zmiennej (D lub S).
3.
(d) 2 = 1 1 ;
(e) maksymalny zysk = 111^.
4. (a) y = e(31n8)V czyli y = e6’2385'; (c) y = 5ean5)i, czyli y = 5e1’6095'.
5.
(a) £ < 0 ;
(b) h < 0 ;
5. (a) t = (ln y)/(ln 7), czyli t = 0,5139 ln y ; (c) i = (31n9y)/(lnl5), czyli t = 1,1078 ln9y.
7.
(b) S przyjmuje maksymalną wartość dla poziomu produkcji równego 20,37 (w przy bliżeniu). . c - '
(c) j > 0.
6.
(a) r = lnl,05;
(c) r = 21nl,03.
Ćwiczenie 10.5 Ćwiczenie 9.5 (e) (n + 2)(n + 1).
1.
(a) 2e*+4; (a) 5/t;
(c) 2ie^+1;
(e) (2ox + b)eax2+bx+c. .
(a) 120;
2.
(a) 1 + x + x 2 + x 3 + x 4.
5.
Wskazówka: wykorzystać (10.21) i zastosować wzór na pochodną funkcji złożonej.
(b) - 6 3 - 9 8 x - 6 2 x 2 - 18x3 - 2 x 4 + R4.
7.
(a) 3(8 -
3.
(c) 4;
3.
1.
(c) l/(i+ 9 ); jc2)/[( jc-ł- 2)2(jc-f-
Ćwiczenie 9.6
Ćwiczenie 10.6
1.
1.
7= 1/r2.
2.
tfA ldt 2 = -A(ln 2)/4>/? < 0.
(a) /(O) = 0 jest punktem przegięcia; (c) /(O) = 5 jest względnym minimum.
(e) l/[ x ( l+ x ) l
2. (b) f ( 2) = 0 jest względnym minimum. Ćwiczenie 10.7 Ćwiczenie 10.1 1. (a) tak; 3. (a) 5e5'; 5.
1.
(a) 2!t\
(b) tak.
3.
ry = krx.
(c) -12e~2'.
6
(a) krzywa dla a = -1 jest odbiciem krzywej dla a = 1 względem osi poziomej.
.
10.
(c) M b ;
(e) l / i - l n 3 .
\ed\ = n .
rQ- eQK rK+ £ql rv
Ćwiczenie 11.2
Ćwiczenie 10.2 1.
(a) 7,388;
(b) 1,649.
2.
(c) 1
+ 2x + Jy(2x)2 + Ż (2 x )3+ ...
3.
(a) 10eW5$;
(b) 690e°'08$.
. .
.
1.
z - 3 jest minimum.
3.
z - c , które jest minimum w przypadku (a), maksimum w przypadku (b) i punktem siodłowym w przypadku (c).
5.
(a) każda para (x, y) różna od (2, 3) daje dodatnią wartość z. (b) tak; (c) nie; (d) tak (d2z = 0).
ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ
766 ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ Ć w icze n ie 12.2
Ćwiczenie 113 1. (a) q = 4 u2+ 4wv + 3v2;
(c) q = 5xz + 6xy.
3. (a) dodatnio określona;
(c) żadna z nich.
5.
(c) ujemnie określona;
(a) dodatnio określona;
(e) dodatnio określona.
6. (a) r l9 r2- ^(7 ± V l7), u D u jest dodatnio określona; (c) rv r2 = - ( 5 ± ^6l), u T u jest nieokreślona. 2/V5 .1/V5 .
V2 ~
2/V5.
.
(a) z = 1/2, osiągane dla 1/2, (c) f = -19, osiągane dla X = ~4,
4.
Zx = - G (x ,y ) = 0,
5.
Wskazówka: odróżnić tożsamość od równości warunkowej.
Jć = 1 ;ć = l
Zx = /x - XGx = 0,
i y = 1/2; i y = 5.
Zy = fy - M J y = 0.
Ćwiczenie 12.3 1.
-1/V5 »
1. 1
(a) |H| = 4, £ jest maksimum;
(c) |H | = -2 , z jest minimum.
Ćwiczenie 12.4
Ćwiczenie 11.4
2.
(a) ąuasi-wklęsła, ale nie ściśle;
1.
z = 0 (minimum).
4.
(a) żadna;
3.
z = -11/40 (minimum).
5.
Wskazówka: przejrzeć podrozdz. 9.4.
5.
z = 2 - e (minimum) osiągane w punkcie (x, y, w) = (0, 0, 1).
7.
Wsteow&a: zastosować (12.21) albo (12.25').
6.
(b) wskazówka: porównaj (11.6).
7.
(a) = 2,
Ćwiczenie 11.5 (a) ściśle wypukła;
(c) ściśle wypukła.
(a) ściśle wklęsła;
(c) ani taka, ani taka.
Nie. (a) koło;
7.
(a) wypukła kombinacja, 0= 0,5;
1.
(b) X = 3,
3.
Qx/dB) = 1/2Px > 0,
jć=
16, y = 11;
(c) |H | = 48, warunek jest spełniony.
(OxldPJ = -( B + Py)/2P2x < 0,
0 x/dPy) = 1/2Px > 0 " itd.
5. Nie obowiązuje.
1. 2. 3.
(c) ąuasi-wypukła, ale nie quasi-wklęsła.
Ćwiczenie 12.5
r2 = 4 + ^ 6, r3 = 4 - -\/6.
5.
(c) ściśle quasi-wklęsła.
7.
Nie dla obu punktów (a) i (b) — zob. (12.32) i (12.33').
Ćwiczenie 12.6
(b) tak.
\
.
(c) wypukła kombinacja, 0 = 0,2.
1.
(a) jednorodna stopnia 1;
(c) niejednorodna;
* (e) jednorodna stopnia 2.
4. Są prawdziwe.
Ćwiczenie 11.6
7. Jednorodna stopnia a + b + c. 1.
(a) nie;
Q2 = P 20f4.
(b) g ^ P ^ / 4 i l^ral
8.
2’
3*
\£di\ = ^ ^
5.
(a) /r= P o Q ( a , b) { 1 + \«o)“ aPa0-
(a) j 2Q = g(jK , jL); (b) wskazówka: niech j = 1/L; (d) jednorodna stopnia 1 względem K i L .
‘
Ćwiczenie 12.7 w. 1.
Ćwiczenie 11.7
(a) 1 :2 :3 ;
(b) 1 :4 :9 .
2. Wskazówka: porównać rys. 8.2 i 8.3.
1.
(dä/dPa0) = P 0Qbb^ / \ J \ < Q i
(db/dPa0) = - P 0Qabe~rt/\J \< 0 .
2.
(a) cztery; (b)_ O ^ P 0) = (QtQat ~ QaQ t t W + h)~2A J\ > 0; (c) (afiO y = (QaQbb- Q bQ J P 20(l + i0T 3/1J| < 0.
4. Wskazówka: jest to pochodna zupełna. 6. (a) linie proste o ujemnym nachyleniu; 8. (a) 7;
(c) In 5 - 1.
(b)
przy p —> - 1.
767
768 ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ
ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ 769
Ć w iczen ie 13.2
1.
(a)
- 8 x ~ 2
^ >
+c
2.
(a) 13ex + c;(c)
3.
(a) 31n|x| + c
4-
3.
(a) >'«) = 4 ( 1 - e - ) ; (e) y(t) =8e7' - 1.
(c) y(/) = 6e5';
■ . •,
(c) \ x 6- \ x L+ c.
(* * 0 );
S ^ - S ^ + (cx * 0 ). (x 0#);
( a ) r ( * + 1) 3/2(x + 3 ) - ^ (
x
+ 1)5/2 +
.v
v ’ •,
Ćwiczenie 14.2
(c) In(j^ + 3) + c.
c.
1.
Krzywa D powinna być bardziej stroma.
3.
Mechanizm dostosowania cen generuje równanie różniczkowe.
5.
( 8+5} (a) P( f ) =Aexp( ^—
a ® ^
Ć w iczen ie 13.3
1-
(a) 4 p
2.
(a) ¿ ( e - ^ - e - 4);
3.
(b) 3^;
Ćwiczenie 1 4 3
(e) 2 ^ + c j
1.
y(t)=A&~5t + 3.
3.
y(t) = er'2 + 1 .
(c) e ^ - e 4 - ~ . e 2 + e - l ]
(b) niedoszacowane;
(f) f{x ) jest całkowalna w sensie Riemanna.
5. y(r)=e*-le'.
Ć w iczen ie 13.4
6. 1.
Żadne.
2.
(a), (c), (d) i (e).
3.
(a), (c) i (d) zbieżne;
7 (e) rozbieżna.
Ć w iczenie 13.5
Wskazówka: porównać przykład 17 z podrozdz. 13.2.
Ćwiczenie 14.4 1.
(a) y(t) = (c//3)172;
(c) yt + y 2t = c.
-
Ćwiczenie 1 4 3
1.
(a) J ? (e )= 1 4 e 2- y e ° - 32 + j ;
3.
(a) K(t) = 9tm + 25.
5.
(a) 29 000.
(b)
1.
(c) 3.
Ć w iczenie 13.6
1 + - y = 0; at t o zmiennych rozdzielonych, sprowadzalne do równania Bernoulliego.
(a) o zmiennych rozdzielonych, liniowe gdy się je zapisze jako
dy
y(t) = (A - 12)112.
Ćwiczenie 14.6
1.
Rozważany jest jedynie kapitał. Ponieważ do produkcji potrzebna jest również praca, więc milczącym założeniem jest, że K i L są zawsze używane w ustalonej proporcji.
1.
(a) linia fazowa wznosi się ku górze, dynamicznie niestabilnepołożenie równowagi; (c) linia fazowa obniża się, dynamicznie stabilne położenie równowagi.
3.
Wskazówka: zastosować (6.8).
3.
Znak pochodnej mierzy nachylenie linii fazowej.
4.
Wskazówka: ln u - In v = ln -.
Ćwiczenie 14.1 1.
(a) y(0 = - e ^ '+ 3 ;
(c) y(/) = | ( 1 _ e- 10‘).
Ćwiczenie 14.7 1-
rk ~ rK ~ rL
3.
rQ= p + X.
5.
(por. (10.25)).
(a) narysować osobno wykresy dla ( 3 - y ) i dla lny, apotem odjąć; istnieje jedno położenie równowagi (dla wartości y pomiędzy 1 i 3) i jest dynamicznie stabilne.
49 — Podstawy...
ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ 771
770 ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ Ćwiczenie 15.1 1.
Ćwiczenie 15.6
(a) >„ = 2/5;
(e) yp = 6t
(c) ^ = 3;
3.
(a) y(t) = 6e* + ę-4*- 3;
6.
Wskazówka: zastosować regułę L’Hopitala.
2.
(c) y(i) = e' + ie' + 3. Ćwiczenie 15.7
Ćwiczenie 15.2 1* (a) l± x V 3 / ; 2
3.
(c) ~ ± ^ V 7 i . 4 4
V
(b) wskazówka: dla 0 = tt/4 linia OP jest linią 45°.
5# 7.
2
^ sin/ ( ^ ) = / /(^)cos/(^);
I-
(a) yp =4;
3.
(a) rozbieżne;
T (c) >> = 7 i+ 18 . (c) zbieżne.
Ćwiczenie 16.2
(b )-^ -co s03 = - 3 0 2sin63.
dc/
(a) V 3 + /;
1 (c) y ^ ^ e ' . 4
(a) yp = t - 2;
dc/
1-
(a) y(+1 =y, + 7,
3.
(a) y,= 10 + i;
(c) yI+1= 3 y ,- 9 . y, = y 0a ! - p ( \ + a + 0? + . . . + a '-1).
(c)
(c) 1 - / . Ćwiczenie 16.3
Ćwiczenie 1 53 1.
y(0 = e2/|3 c o s2 i + ^ sin 2tj.
3.
y(i) = e-3^ - c o s ^ / + y s i n ^ / j + 3 .
5.
2 1 y(0 = - c o s 3 i+ sin3i + - .
1.
(a) bez oscylacji, rozbieżne;
3.
(a) yt = -8(1/3)' + 9;
(c) oscylujące, zbieżne.
(c) y, = - 2 ( - l/4 ) '+ 4.
Ćwiczenie 16.4 1.
Qt = a - P ( P 0 - P H - m - p P .
3.
(a) P = 3, eksplodujące oscylacje;
5.
Opóźnienie w funkcji podaży.
(c) P = 2, jednostajne oscylacje. \
Ćwiczenie 15.4 Ćwiczenie 16.5 (a )f. . + 2 Z V _ 5 ± i , - i i I n —w n —w n -w
1.
a —- \ .
3.
Pr= (P0 - 3) ( -1 ,4)?+ 3, z eksplodującymi oscylacjami.
Ćwiczenie 16.6 3.
(a) P(0 = e ^ 2 c o s ^ i+ 2 s in ^ iJ + 2 .
1.
Nie.
2.
(b) nieoscylujący, eksplodujący ruch ku dołowi; (d) wygasający, stabilny ruch w dół ku P.
4.
(a) najpierw skierowany w dół, potem poziomy.
Ćwiczenie 155 1-
d;r (a) — + 7(1 - h ) = j ( a - T - pU )\ fluktuacji; (d) h * l .
(c) oba są równaniami różniczkowymi pierwszego rzędu; f
4.
(a)
(b) nie ma pierwiastków zespolonych, nie ma
r-
i— \
4 ^ 6sm—A r. + m; 7t{i) = e_
4
(c
1 2 ) P = m ,U = -- — m. ■- l o
y
Ćwiczenie 17.1 1.
1 1 (a) - ± - , ;
3.
(a) 4 (stacjonarne);
(c)
1
-i. (c) 5 (stacjonarne).
.
7 7 2 ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ
4.
(b) y t = (V 2 )^ 2 cos
+ sin
ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ 7 7 3
A
j + 1.
4.
(a)
2 3 -V l9 3 A
Ć w ic ze n ie 17.2
33 - VI93
33 + V l9 3 )
23 + Vl93
64
48
•
1.
(a) przy p ad ek 1/?;
3.
Wskazówka: zastosow ać (17.16).
64
m 1-m
(c) przypadek I Z
Ćwiczenie 18J 1.
Pojedyncze równanie można przekształcić do postaci dwu równan pierwszego rzędu.
Ć w ic ze n ie 17.3
2.
Tak.
3.
4.
(a) punkt siodłowy.
4.
M ożliw ości
V, Vm, X i XI
stają się dostępne.
(a) Pt+2 - [ 2 - j ( l - h ) - fik ]p t+l + [1 - j ( l - A) - £ * ( 1 (c)
=
Ćwiczenie 18.6
= 4.
1.
(a) |J£| = 1 i (c) I = 5 i
2.
(a) lokalnie punkt siodłowy;
4.
(a) krzywe xf = 0 i y = 0 pokrywają się i tworzą całą linię złożoną z punktów równowagi.
Ć w ic ze n ie 17.4
i;
1.
(a)
(ć) 3 t2 + 3 t + l .
3-
(a) ^ =
5.
(a) 1/2,
(c) lokalnie stabilny węzeł lub stabilne ognisko.
(c) yp = 2 - t + t2. -1
i
Ćwiczenie 19.1
1.
1.
Ć w ic ze n ie 18.2 2.
tr J£ = 2, lokalnie niestabilny węzeł; tr J£ = - l , lokalnie stabilne ognisko.
b 3 + b2 - 3 b + 2 = 0.
3.
(a)
= - ( 3 / + 4 ( - 2 ) r + 7,
y, = 2 • 3 ' + 2 (- 2 )/ + 5.
4.
(a) x{t) = 4e~2' - 3e~3i + 12,
y(t) = - e _2/ + e"*3' + 4.
(a)
(Ą,Ą) = (2,3); (b)(x
i)
3.
(x„ x2) = (0,4, 0,6).
5.
(a) wykresem funkcji celu będzie rodzina poziomych prostych; runek w postaci równania axt + bx2 = c.
7.
Bez wpływu.
(c) wynika stąd wa
Ć w ic ze n ie 18.3
Ćwiczenie 19.2 3.
p = ( ^ I - A ) - 1u. (c) p = ( ^ I + I - A ) - 1X.
5.
(c) x l(t) = 4e-4,/1° +
2.
(c)
Tak.
3.
Wskazówka: zob. ćwiczenie 19,1-3, część (c).
2e~n,no +— e"10, 6
At2(i) = Se-4"10-
1.
2e~lmo + 6
Ćwiczenie 19.4
— e"10. 3.
(a) (0 ,0 ,4 , 3, 8),
5.
(b), (c), (d) i (e).
(0, 3 ,4 , 0, 2),
(2, 3, 2, 0, 0),
Ć w ic ze n ie 18.4
V U,,
=
A3e~' + A 4tt~ł + m
Ćwiczenie 19.5
1 A 3eTt + A je~t + 4 8_
1.
(?f, *„ żj, i„ ś2) = (14, 2 ,2 , 0, 0).
3.
(A *!, x7, x3, Śj, ś2, śj) = (34, 4, 0, 2, 0, 0, 5).
(4, 2, 0, 1, 0),
(4 ,0 , 0, 3, 4).
774 ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ Ćwiczenie 19.6
.
_t '
• ’
2.
(Ć , x l9 x 2, ś l9 s2) = (8, 8, 0, 0, 12).
4.
(C, Xj, x 29 Si, s2y s^) —^45, 2, —, 0, 0, — •
ODPOWIEDZI DO WYBRANYCH ĆWICZEŃ
3.; (*1, X2) = (3, P). : - \:r ; 5. Piono\vo ustawiony kubeczek do lodów w kształcie stożka.
-
(a) (y„ % Jl912,13) = (2, 3, 2, 0, 0)
'
(b)
(t .
V
(a) tak;
6.
(a) s r = 0 9 s2 - 12,
7.
( x l9 x2, x3, ś l9 ś2) = (0, 1, 2, 0, 0);
Ć* = Ć = 19.
5.
(e)
i
' T /. ■
Ćwiczenie 21.2
Ćwiczenie 20.1 4.
ę
775
3. 5. 6.
Warunki XjQZIdxj) = 0 i warunki y,-(3ZJdyd = 0 można skondensować. Zgodne. (b) dZfdyu dZJdy2 i dZ/dy 3 są ujemne dla rozwiązania optymalnego, zatem y i= y 2= y 3 = 0; (d) tak. .
Ćwiczenie 21.3
(c) dwa. Ć=8;
(c)
y2 = 0;
(
Ć* = Ć = 8 .
(a) wskazówka: p o ró w n a ć ćw iczenie 19.2—3;
(b) niekoniecznie;
(c) obow iązuje.
1. Nie można znaleźć kwalifikującego luku dla wektora testowego (dxif ck2) = (1,0). 3. (xl9 x2) = (0, 0) jest punktem, w którym stykają się krzywe. Kwalifikacja warunku jest spełniona (wszystkie wektory testowe są poziome i skierowane na wschód); warunki Kuhna-Tuckera są również spełnione. 5. Wszystkie warunki będą spełnione, jeśli wybierzemy jo = 0 i )7i ^ 0 .
Ć w ic ze n ie 2 0 .2
Ćwiczenie 21.4 1.
n * o zn acza lic z b ę p o ten c jaln y ch klien tó w (w tysiącach osób lub w innych jed n o stk ach );
reprezentuje kalkulowaną liczbę potencjalnych klientów przypadającą na jednego dolara wydatków na reklamę itd. Ćwiczenie 20.3 2.
1. (a) zmaksymalizować - C = -F (x), przy warunkach - G l(x) ^ rf (i= 1, 2, ..., m) oraz x 2* 0; (c) F(x) jest wypukłe, a G \x) wklęsłe dla wszystkich i, w nieujemnym ortancie. 3. Zastąpić nieostre nierówności ostrymi. 4. (a) ma zastosowanie.
Nie, jest dominowana.
4. (a) przestrzeńJrójwymiarowa; (b) tak; (c) piramida. 6* (01» 02, 03 , 04) = (4, 0, 0, 0). W przeciwieństwie do K0y L 0 nie będzie w pełni wy korzystane.
Ćwiczenie 21.5 2. Dostateczny, ale nie konieczny. 3. Funkcja w (b) jest do przyjęcia, jest ona ąuasi-wklęsła. 4. (a) tak.
Ćwiczenie 20.4 Ćwiczenie 21.6
n
1-
3.
X
a 0 jX j
^ L 0,
A 'Qx ^ L 0.
Stożek składa się ze wszystkich punktów leżących na lub pod półprostą nad półprostą
4.
c z y li
1. Dla Z = U(xi , x2, ..., xn) + y (B -P iX i- . . . -P „ x n): 0 i oraz na lub
[>
(a) wskazówka: przypomnieć sobie rozważania dotyczące konstrukcji izokwanty na rys. 20.3 i zastosować tę zasadę do rys. 20.6(b).
Ćwiczenie 21.1
dZJdxj = U j - y P j ^ 0,
d Z /d y - B - P \ X i ~ . . . - P nxn 2* 0
oraz warunki nieujemności i wzajemnego uzupełniania. 3. (b) R jest wklęsłe, C wypukłe. (c) R jest quasi-wklęsłe, C (Q )+ A -R (Q 9 A) quasi-wypukłe. 4. (b) x 2= x2 = 1. 5. 3 = ^ 2 .
INDEKS — SŁOWNICZEK 777
INDEKS
SŁOWNICZEK
A Addytywność (additivity) 451 Akcelerator (accelerator) 583 Algebra macierzy (matrix algebra) 65, 99 Algorytm (algorithm) 683 Amplituda {amplitude) 515 Analiza aktywności (działalności) (activity analysis) 699, 707 — dynamiczna (dynamie analysis) 135 — lokalnej stabilności (local stability analysis) 635, 638-42 — okresowa (period analysis) 547 — równowagi (equilibrium analysis) 47 — statyczna (static analysis) 47 Arganda diagram (Argand diagram) 510, 518 Argument (argument) 33 Arrow K.J. 396, 426, 741, 743 Asymptota (asymptote) 36
B Baumol W.J. 746 Baza (basis) 670 Bazowe rozwiązanie dopuszczalne (basic feasible solution) 670-1 Bezrobocie a inflacja (Unemployment and inflation) 533-8, 588-92, 620-4 — i polityka monetarną (— — monetary policy) 534-5 Bieżąca (natychmiastowa) stopa Wzrostu (instantaneous rate o f growth) 283-4, 306
Całka (integral) 437, 469 — dolna i górna (lower and upper integral) 449 — iloczynu (integral o f a multiple) 441 — nieoznaczona (indefinite integral) 437-44, 452 — niewłaściwa (improper integral) 453-5 — oznaczona (definite integral) 445-52 — Riemanna (Riemann integral) 449 — sumy (integral ó f a sum) 440 — szczególna i międzyokresowe położenie równowagi (particular integral and intertemporal equilibrium) 476, 502, 552, 574 równania różnicowego o zmiennym wyrazie wolnym (o f variable-term difference equation) 593-6 pierwszego rzędu (------------first-order difference equation) 551-2 wyższego rzędu ( -------- — higher-order difference equation) 574-5, 596 ------------ różniczkowego o zmiennym wyrazie wolnym (— — — variable-term differential equation) 539-40 ---------- - pierwszego rzędu (------- — first-order differential equation) 471-2 -------------— wyższego rzędu (— — — higher-order differentialequation) 502-3, 542-3 układu równań różnicowych (------------ simultaneous difference equations) 604, 606 -------- różniczkowych (--------— differentialequations) 609 Całkowanie (integration) 436 — , granica całkowania (limit o f integration) 446 — przez części (integration by parts) 444 — , reguła dla funkcji wykładniczej (exponential rule o f integration) 439, 440 —, logarytmów (log rule o f integration) 439, 440 —, potęg (power rule o f integration) 438 — , — podstawiania (substitution rule) 442 — , reguły całkowania (rules o f integration) 438-44 — , stała całkowania (constant o f integration) 438 Cena dualna (shadow price) 694, 724-5 — księgowa (accounting price) 694 — równowagi (equilibrium price) 475 Chenery H.B. 426 Chipman J.S. 598 Ciągła kapitalizacja odsetek (continuous interest compounding) 282 Ciągłość (continuity) 158-9 — , jej związek z różniczkowalnością (— in relation to differentiability) 160-3 — , twierdzenie (— theorem) 159 Cosinus, funkcja (cosine function) 512 — , — , jej pochodna (----- , derivative o f) 516 — , — , — wartości (— — , values o f) 514 — , — , — własności (-----, properties of) 514-16 Courant R. 271
INDEKS — SŁOWNICZEK 77 9
778 INDEKS — SŁOWNICZEK
Czas ciągły (continuous time) 435 — dyskretny (discrete time) 435, 547 Czynnik całkujący (integrating factor) 485
d
.
r v.v-\.-o ¡- -
i
-
Dantzig G.B. 665 Degeneracja (degeneracy) 682-3 ; Diagonalizacja macierzy (diagonalization o f matrix) 333 Diagram Arganda (Argand diagram) 510 — fazowy dla równania różnicowego (phase diagram fo r difference equation) 567-72 -------------------różniczkowego-(------------differential equation) 492-5, 497-8 — — — układu równań różniczkowych (----------- differential-equation system) 625-34 — Venna (Venn diagram) 27 Długookresowa zależność Phillipsa (long-run Phillips relation) 592 Dobro Giffena (Giffen good) 409 — gorszej jakości (inferior good) 407 Dochód konsumenta (income o f consumer) 406 Dodatnia określoność (positive definiteness) 324 — -—, warunki (conditions fo r positive definiteness) 329, 334 — półokreśloność (positive semidefiniteness) 324 — — , warunki (conditions fo r positive semidefiniteness) 334 Dokładnie określone rozwiązanie (definite solution) 470 Domar E.D. 464 Dopełnienie algebraiczne (cofactor) 106 obce (alien cofactor) 114 — zbioru (complement set) 26 Dorfman R. 62 Druga pochodna (second derivative) 245, 247-9 V Dualna tablica optymalna (dual optimal tableau) 691 > Duesenberry J.S. 18 iV Dynamiczna niestabilność (dynamic instability) 494 — stabilność równowagi (— stability o f equilibrium) 475-6, 494, 509, 527 -----------a diagram fazowy (----------------- and phase diagram) 492-3, 567-9, 629-31 ;------ , twierdzenie Routha (----------------- , Routh theorem) 544-5 ------------ , — Schura ( , Schur theorem) 598-9 w czasie ciągłym (------------------------------ with continuous time) 509, 524-7 — dyskretnym (— — discrete time) 555-7, 579-81 ;i: Dynamika (dynamics) 435 . .-V'H''•■■■ V-"— ceny rynkowej (— o f market price) 474-8, 527-32, 559-62, 563-7, 570-2 — dochodu narodowego (-------- national income) 582-8 — ekonomiczna (economic dynamics) 234 — inflacji i bezrobocia (dynamics o f inflation and unemployment) 533-8, 588-92, 620-4 ------------ reguł monetarnych (----------------- monetary rule) 631-4, 641-2 — inwestycji i kapitału ( investment and capital) 464-8, 495-9 — modeli nakładów i wyników ( input-output models) 612-18
Dyskontowanie; zob. wartość bieżąca Dyskryminacja cenowa (price discriminatioń) 359-62 \ Dziedzina funkcji (domain o f tke function) 33
e
■:
Efekt dochodowy (income effect) 407-8 — odbicia (mirror effect) 557 Sr — skali (scale effect) 557 — substytucyjny (substitution effect) 408 Ekonometria (econometrics) 17 Ekonomia matematyczna (mathematical economics) 15, 17 Ekstremum (extremum) 238 — absolutne a względne (relative versus absolute extremum) 239-40, 268, 343, 399 — globalne a lokalne (global versus local extremum) 239-40 — mocne a słabe (strong versus weak extremum) 341 — ograniczone a bezwarunkowe (constrained versus free extremum) 371 — , test wyznacznikowy dla ekstremum bezwarunkowego (determinantal test fo r free extremum) 387 —v ----------- ------ warunkowego (--------------constrained extremum) 340 — w odniesieniu do ąuasi-wklęsłości i quasi-wypukłości (extremum in relation to quasiconcavity and quasiconvexity) 399 ----------- - .— wklęsłości i wypukłości ( concavity and convexity) 342-3 Elastyczność (elasticity) 205, 308-9 — cząstkowa (— partial) 204 — , graficzne wyznaczanie elastyczności (—, graphical reading of) 201-2 — optymalnego nakładu (— o f optimal input) 424 — popytu ( demand) 205, 359-60 — produktu (— — output) 416-17 — , reguła łańcuchowa (— , chain rule of) 309 — substytucji (— o f substitution) 425-6 dla funkcji CES ó f CES function) 428 -----------------Cobba-Douglasa (— ---------- - Cobb—Douglas function) 426-7 Elementy macierzy (elements o f matrix) 67 Element zbioru (element o f set) 23 Eliminacja zmiennych (elimination o f variables) 50-1 a algebra macierzowa ( — — versus matrix algebra) 125-6, 131 Enthoven A .C 396, 741-3 exp 277
F Faza (phase) 515 Fluktuacja, wahania (fluctuation) 525-6
780 INDEKS — SŁOWNICZEK INDEKS — SŁOWNICZEK 781
algebraiczna a niealgebraiczna (algebraic versus nonalgebraic function) 36 celu (objective function) 238, 648, 715 ciągła a nieciągła (continuous versus discontinuous function) 158-9 czasu (function o f time) 474 jawna a uwikłana (explicit versus implicit Junction) 213 jawnie quasi-wklęsła (explicitly quasiconcave function) 400, 405 jednokladna (homoihetic function) 423-5 jednorodna (homogeneous function) 410, 411, 417 kołowa (circular function) 512-13 konsumpcji (consumption function) 63, 190, 582 kosztu (cost function) 21 sześcienna ( cubic) 255-7 , zależność między funkcją kosztu krańcowego i całkowitego (— — , relation between marginal and total) 142-4, 171
,— przeciętnego ( , -----------— kwadratowa (quadratic function) 35, 41 — Lagrange’a (Lagrangian function) 374-5, 379 i punkt siodłowy ( and saddle point) 739-40
average)177-8
w programowaniu nieliniowym (in nonlinear programming) 123-4, 725 — liniowa (linear function) 35, 42 — liniowo jednorodna (linearly homogeneous function) 412-14, 417 — logarytmiczna (logarithmic function) 286, 291-5 , podstawa (base o f logarithmic function) 286-8 -, reguła całkowania (log-function rule o f integration) 439-40 — ,—, — różniczkowania (--------------- - differentiation) 296-7, 299-300 — malejąca a rosnąca (decreasing versus increasing function) 181 — monotoniczna (monotonic function) 181, 183 — monotonicznie malejąca (monotonically decreasing function) 181 rosnąca (— increasing function) 181 — odwrotna (inverse function) 181-3, 291 — ogólna a konkretna (general versus specific function) 42-3 — oszczędności (saving function) 203, 458 — pierwotna (antiderivative) 431 — płynności (liquidity function) 229 — podcałkowa (integrand) 431 — , postać graficzna (graphical form o f a function) 31
Funkcja potęgowa (power function) 165 , całkowanie (— — , rule o f integration) 438-9v ------ , różniczkowanie (— — ‘s------- differentiation) 166-9 — produkcji (production function) 186 CES (CES production function) 426-29, 431 — — — w odniesieniu do funkcji produkcji Cobba-Douglasa (----------- - in relation to Cobb-Douglas production function) 429-30 Cobba-Douglasa (Cobb-Douglas production function) 415-18 — — — , ścieżka ekspansji (- ----- — — , expansion path o f ) 423 ----------------- w odniesieniu do funkcji produkcji CES (—- — — — in relation to CES production function) 429-30 — — ----- —, zastosowania (—• — — —, applications o f) 422, 498-9 — — liniowo jednorodna (linearly homogeneous production function) 412-14 — :— w programowaniu liniowym (production function in linear programming) 700-4 — ąuasi-wklęsła a quasi-wypukla (quasiconcave versus quasiconvex function) 389-98, 427 — w programowaniu nieliniowym (— function in nonlinear programming) 741-3 — quasi-wypukla (quasiconvex function) 389-98 -------------- w programowaniu nieliniowym (— — in nonlinear programming) 741-3 — schodkowa (step function) 145, 556 — sinusoidalna (sinusoidal function) 513 — stała (constant function) 35 , reguła ( , rule) 165 — sześcienna (cubic function) 35, 256-8 - a równania trzeciego stopnia (— — versus cubic equation) 53 — ściśle quasi-wklęsła (strictly quasiconcave function) 389-91, 415-16 ------------------, kryteria sprawdzania (— —- — , criteria fo r checking) 392-8 zastosowana do funkcji produkcji (— — applied to productionfunction) 422 — — ■— — użyteczności (— —- utility function) 405, 421 quasi-wypukla (strictly quasiconvex function) 389-91, 415-16 -, kryteria sprawdzania (— — — , criteria fo r checking) 392-8 wklęsła (— concave function) 248-9, 341-4 ----------- , kryteria sprawdzania (—— — , criteria fo r checking) 344-51 zastosowana do funkcji produkcji (—------------------------ applied to production function) 365 — wypukła (■— convex function) 248-49, 341-4 — , kryteria sprawdzania ( — , criteria fo r checking) 344-51 — zastosowana do izokwant (-----— — applied to isoquants) 364-5 krzywych obojętności (— —----- — — indifference curves) 404-5 — transcendentalna (transcendental function) 38 — trygonometryczna (trigonometric function) 513 — uwikłana (niejawna) (implicit function) 212 , reguła różniczkowania (implicit-function rule) 216, 221 , zastosowania (applications o f the implicit function) 415, 627-8 — uzupełniająca a dynamiczna stabilność równowagi (complementary junction and dynamic stability o f equilibrium) 476, 555 — równania różnicowego pierwszego rzędu (----- o f first-order difference equation) 552 t wyższego rzędu (-------------higher-order difference equation) 574-9, 596-7
-
— — — — — — — — — — —
;
-
Forma {form) 323 — kwadratowa {quadratic form) 322-3, 326, 329 określoność (sign definiteness o f quadratic form) 324 — liniowa {linear form ) 323 — zredukowana (reduced form) 188 Formby J.P. 257 Friedman M. 6, 18, 533 Funkcja (function) 32-3
INDEKS ~ SŁOWNICZEK 783
78 2 INDEKS— SŁOWNICZEK
Funkcja uzupełniająca równania różniczkowego o zmiennych współczynnikach (complemen tary function o f variable-coefficient differential equation) 48 , • v „ ^. --------' pierwszego rzędu (— — - first-order differential equation) 471, 472 ----------------- wyższego rzędu (--------------higher-order differential equation) 503-8, 522-3, 542-4 /. -v : I ? ■■■&. x : . 'Z'l "O układu równań różnicowych (— — ;■— simultaneous difference equations) 604-5, 606-7 ' . . . :4 4 -. ■ różniczkowych (------- -— — differential equations) 609-10 — wielomianowa (polynomial function) 35,260 4 H .' 4 , jej ciągłość (continuity o f a polynomial function) 159 : , — granica (limit o f a polynomial function) 157-8 — wklęsła (concave function) 248-9, 341-3 ... • a wypukła (— versus convex function) 248 — — , kryteria sprawdzania (— function, criteria fo r checking) 344-8 — — w programowaniu nieliniowym ( in nonlinear programming) 136-1 — wykładnicza (exponential function) 274-8 a dyskontowanie (— — and discounting) 285 — kapitalizacja odsetek (-— - — interest compounding) 281-2 ------------ wzrost ( - growth) 283-4, 286 naturalna (natural exponential function) 277 , pochodna (derivative o f exponential function) 297, 299-300 , reguła całkowania (exponential-function rule o f integration) 4 3 9 4 0 , — różniczkowania (— ------------ differentiation) 297, 299 , zmiana podstawy (base conversion o f exponential function) 293-5 — wymierna (rational function) 36 -» jej ciągłość (continuity o f rational function) 158-60 — wypukła (convex function) 248-9, 341-2 a zbiór wypukły (— versus convex set) 351-5 , kryteria sprawdzania (—— criteria fo r checking) 344-8 — w programowaniu nieliniowym ( in nonlinear programming) 736-7
Hiperbola prostokątna (rectangular hyperbola) 36, 565, 586 Hiperpłaszczyzna (hyperplane) 661 y — podpierająca (supporting hyperplane) 664-5 Hiperpowierzchnia (hypersurface) 43, 335
G
j
Gładkość funkcji (smoothness o f function) 172 Główna przekątna (principal diagonal) 73 Goldsmith R. 18 Granica (limit) 144-51 — funkcji wielomianowej (— o f a polynomial function) 157-8 — lewostronna i prawostronna (left-side limit and right-side limit) 144-5 — , obliczanie (evaluation o f a limit) 147-8 —, twierdzenia (limit theorems) 155-7 :
Jacobi K.G.J. 193 ' Jakobian (Jacobian determinant) 1 9 3 4 — dla zmiennych endogenicznych (endogenous-variable Jacobian) 221,225-6,229, 368-9, 377-8 — w odniesieniu do hesjanu (Jacobian in relation to Hessian) 368-9 — ------ obrzeżonego hesjanu (—*- — - — bordered Hessian) 385 Jednorodny układ równań (homogeneous-equation system) 121-2, 133, 604
h
■
(Hessian determimnt) 326, 331 — obrzeżony (bordered Hessian) 383-8, 398
.
. ■
1
4
'
Inflacja (inflation) 533 . — i bezrobocie (— and unemployment) 533-8, 588-92, 6 2 0 4 — reguły monetarne (------- monetaryrule) 631-3, 642 Iloczyn kartezjański (Cartesian product) 30, 31 — skalamy (scalar product) 78 — — i kąt pomiędzy wektorami (— and angle between two vectors) 85 — wewnętrzny (inner product) 72 — zbiorów (intersection set) 25 Iloraz różnicowy (difference quotient) 140-1, 197 — wyjścia (displacement quotient) 675 Iluzja pieniądza (money illusion) 410 Indeks (subscript) 57 — sumowania (summation index) 15 Inwestycje (investment) 228, 464-5 — a tworzenie kapitału (— and capital formation) 458-60 — brutto (gross investment) 459 — netto (net investment) 459 Iteracja (pivot step) 674-8 Izokwanta (isoquant) 219, 363-5, 420 % — w programowaniu liniowym (— in linear programming) 7 0 0 4
K Kapitalizacja odsetek (interest compounding) 281-2 — , wzór (capitalization formula) 463
784 INDEKS — SŁOWNICZEK
-
-
Kartezjański układ współrzędnych (Cartesian coordinates) 29, 519 Keynes J.M. 18, 63, 582 f Kombinacja liniowa wektorów (linear combination o f vectors) 81 — minimalnego kosztu {least-cost combination) 419-20, 745-6 Koopmąns T.C. 665 Koszt krańcowy w odniesieniu do kosztu całkowitego {marginal cost in relation to total cost) 177-9 ---------------przeciętnego (------- — — — average cost) 143-4, 171-2, 457-8 — , minimalizacja {cost, minimalization) 419-21, 745-6 — przeciętny w odniesieniu do kosztu krańcowego {average cost in relation to marginal cost) 177-8 — utraconych możliwości {opportunity-cost) 303, 694 Krańcowa fizyczna produktywność pracy {marginal physical product o f labor) 181 — skłonność do importowania {marginal propensity o f import) 230 — konsumpcji (--------- —consume) 64, 191, 550 — — oszczędzania ( save) 230, 458 — stopa substytucji (— rate o f substitution) 403 technicznej substytucji (---------- r technical substitution) 218, 420 - a elastyczność substytucji (— -------------------------------- and elasticity o f substitution) 426 — użyteczność (— utility) 204, 401 pieniądza (— — o f money) 402 Krańcowy produkt w ujęciu fizycznym (— physical product) 181, 186, 217 — , malejący {diminishing marginal physical product) 364, 496 — przychód produktywności pracy {marginal revenue product o f labor) 180-1 Kryterium drugiej pochodnej {second-derivative test) 250, 270 — pierwszej pochodnej (first-derivative test) 241 Krzywa obojętności {indifference curve) 403, 404 Krzywe podziału (demarcation curves) 626-8 Kuhn H.W. 720, 737 Kuznets S. 17, 18 Kwadratowe przybliżenie {quadratic approximation) 263
L Lagrange J.L. 141 Lagrangian; zob. funkcja Lagrange’a Lancaster K. 659 Layson S. 257 Leibniz G.W, 141 Leontiew W.W. {Leontief W.W.) 126 Linearyzacja; zob. liniowe przybliżenie Linia 45° {45° line) 568-9 — fazowa {phase line) 492, 567 — stałego kosztu (isocost) 420, 650, 651 zysku (isoprofit) 654
INDEKS — SŁOWNICZEK 785
Linie krawędziowe {ridge lines) 363 — prądu, trajektorie {streamlines) 628-9 V Liniowa zależność; zob. zależność Liniowe przybliżenie {linear approximation) 2f>3 t Liczba całkowita {integer) 21 — e (e, the number) 279-81 — i (/, the number) 510 — naturalna {positive integer) 21 — niewymierna {irrational number) 22 — rzeczywista {real number) 22 — urojona {imaginary number) 510 — wymierna (rational number) 22 Liczby ujemne całkowite (negative integers) 21 — zespolone (complex numbers) 510-12 , alternatywny zapis (------- , alternative expressions for) 518-20 sprzężone ( conjugate) 511 Logarytm (logarithm) 286 — dziesiętny i naturalny (common log and natural log) 287-8 — i elastyczność (logarithm and elasticity) 308-9 — , reguły dla logarytmow (rules o f logarithms) 288-90 — , zmiana podstawy (conversion o f log base) 289 Lustrzane (zwierciadlane) odbicia dla funkcji odwrotnych (mirror images in inverse function) 182
Ł
\
Łączność dodawania (associative law o f addition) 86 — działań na macierzach (— matrix operations) 87-8 zbiorach (------------ set operations) 27-8, 86 — mnożenia (----multiplication) 86 r Łuk kwalifikujący (qualifying arc) 732
M Machlup F. 47, 435 Macierz (matrix) 67 — charakterystyczna (characteristic matrix) 330 — diagonalna (diagonal matrix) 92 — , dodawanie i odejmowanie (matrix, addition and subtraction) 69, 87 7— dołączona (adjoint) 115-16 — dopełnień algebraicznych (cofactor matrix) 115 — hesjanu (Hessian matrix) 337 — idempotentna (idempotent matrix) 90, 92, 98 — jednostkowa (identity matrix) 73, 89 — kwadratowa (square matrix) 68
786 INDEKS — SŁOWNICZEK
Macierz, mnożenie (multiplication o f matrices) 71-4, 76, 87-9 — , — przez skalar {scalar multiplication o f matrix) 70 — nieosobliwa (nonsingular matrix) 94, 100-2, 111-12 — , odwracanie (matrix inversion) 114-18 —--odwrotna (inverse matrix) 94-7 i rozwiązanie układu równań liniowych (------- and solution o f linear-equation system) 96-7 , ; i , przybliżenie (------- , approximation) 131 — — , znajdowanie (-------9finding the) 114—18 _ — osobliwa (singular matrix) 92, 94 — , równość macierzy (matrix, equality) 69 — symetryczna (symmetric matrix) 93 — transponowana (transpose matrix) 93-4 — „wiodąca” i „zamykająca” („lead” matrix and „lag” matrix) 71 — współczynników (coefficient matrix) 67 nakładów (input-coefficient matrix) 128 technologicznych (technology matrix) 129 — , wyłączanie czynników (factoring o f matrix) 110 — zerowa (null matrix) 91 , . Maksimum; zob. ekstremum — globalne (global maximum) 739 Maksymalizacja użyteczności (maximization o f utility) 401-10, 744-5 — zysku (profit maximalization) 252-5 Maksymalizowanie (maximizing) 238 Mapa wpływów (channel map) 208, 210, 228, 231 McShane E J. 271 Metoda iteracyjna dla programowania liniowego (iterative method fo r linear programming) 672-3 , ------------ równania różnicowego (~—— — difference equation) 549—51 — simpleks (simplex method) 652, 667-78 — współczynników nieoznaczonych (method o f undetermined coefficients) 539—41, 593-5, 614, 617 Metody estymacji (methods o f estimation) 17 Miejsca zerowe funkcji (zeros o f a function) 53 Minhas B.S. 426 Minimalizowanie (minimizing) 238 Minimum; zob. ekstremum Minor (minor) 106 — główny (principal minor) 325, 327, 328, 337 obrzeżony (bordered principal minor) 386, 387, 388 Mnożnik (multiplicative) 1 1 1 ,582 — eksportu (export multiplier) 231 — Lagrange’a (Lagrange multiplier) 374 i dualna zmienna decyzyjna ( and dual choice variable) 696-7 , interpretacja ekonomiczna (— —, economic interpretation) 377-8, 402, 419-20 — podatków innych niż od dochodu (nonincome-tax multiplier) 191 — stopy podatku dochodowego (income-tax-rate multiplier) 191
INDEKS — SŁOWNICZEK 787
Mnożnik wydatków rządowych (govemment-expenditure multiplier) 191 Model częściowej równowagi (partial-equilibrium model) 48 —: dochodu narodowego (national-income model) 63-4, 124-5, 228-31 — --------, dynamika (dynamics o f national-income model) 582-8 — — — , statyka porównawcza (comparative statics o f national-income model) 190-2, 221-2,229-31 — ekonomiczny (economic model) 19-21 —. liniowy (linear model) 48 — matematyczny (mathematical model) 19-21 — nakładów i wyników (input-output model) 126-34 — ------ - --- dynamiczny (dynamie input-output model) 612-18 — ------------ - otwarty (open input-output model) 128-9 ----------------- statyczny (static input-output model) 126-31 — -------- —-, statyka porównawcza (comparative statics o f input-output model ) 192-3 — — — w odniesieniu do programowania liniowego (input-output model in relation to linear programming) 707-9 — —- — — zamknięty (closed input-output model) 133—4 — nieliniowy (nonlinear model) 52 — pajęczyny (cobweb model) 559-62 — tynku (market model) 48-54, 57-63, 124, 223-5 , dynamika (dynamics o f market model) 474-8, 527-30, 559-62, 570-2 -, statyka porównawcza (comparative statics o f market model) 188-90, 223-7 — współzależności Samuelsona (Samuelson*s interaction model) 582 — wzrostu Domara (Domar growth model ) 464 — — Solowa (Solow growth model) 495 —- zamknięty (closed model) 133 Moduł (modulus) 153, 511 — liczby zespolonej (— o f complex number) 511
N
' "
'
■
■
Nachylenie (slope) 36 Nakład pierwotny (primary input) 128, 707 — pośredni (intermediate input) 707 Naturalna funkcja wykładnicza (natural exponential function) 293 — stopa bezrobocia (natural rate o f unemployment) 538, 592 Natychmiastowa stopa wzrostu (instantaneous rate o f growth) 283 Nerlove M. 563 Neyman J. 720 Niejednorodne liniowe równanie różniczkowe (nonhomogeneous linear differential equation) 471 Nienasycenie (nonsatiation) 744 Nieosobliwość (nonsingularity) 94 — , warunki (conditions fo r nonsingularity) 100-2, 111-12 Nierówność (inequality) 151—2 — , rozwiązanie (solution o f an inequality) 154-5
INDEKS — SŁOWNICZEK 789
788 INDEKS — SŁOWNICZEK
Nierówność trójkąta (triangular inequality) 84 Niezależność; zob. zależność Normalizacja równania różniczkowego (normalization o f differential equation) 469 — układu równań różniczkowych (— —- differential-equation system) 609 — wektora charakterystycznego (— — characteristic vector) 330 Norma macierzy (norm o f matrix) 132 n-tka uporządkowana (ordered n-tuple) 68, 79
o
■
Obraz (image) 33 Obst N P. 631, 641 Oczekiwania adaptacyjne (adaptive expectations) 534, 565, 589 -— cenowe (price expectations) 527-8 — inflacyjne (inflation expectations) 534, 589 Odchylenie od równowagi (deviation from equilibrium) A l 6 r Odcięta (abscissa) 53 Odległość (distance) 84 Odwracanie podstawy logarytmu (inversion o f log base) 290 Odwrotność liczby (reciprocal o f number) 75 Odwzorowanie (mapping) 32 Ognisko (focus) 629, 631, 638-9 Ograniczenie (constraint) 371-3 — budżetowe (— budget) 372, 402-3 —, granice (— , borders) 648, 652 — , kwalifikacja (— , qualification) 731-5 — w programowaniu liniowym (— in linear programming) 657-8 -------------- nieliniowym (— — nonlinear programming) 714-15 Okrąg jednostkowy (unit circle) 522 Okres funkcji (period o f function) 515 Opóźnienie podaży (lag in supply) 560 — w konsumpcji (— — consumption) 582 produkcji (— — production) 613-15 Optymalizacja (optimalization) 238, 704-7 —- warunkowa; zob. ekstremum Optymalna ścieżka czasowa (optimal time path) 751 — teoria sterowania (—- control theory) 751 Optymalne rozwiązanie dopuszczalne (— feasible solution) 650 Optymalny wybór momentu działania (optimum timing) 302-5 Ortant (orthant) 396 Ortogonalne wektory (orthogonal vectors) 332 Ortonormalne wektory (orthonormal vectors) 332 Oscylacje; zob. ścieżka czasowa Ostrze (cusp) 729, 730 — noża (razor's edge) 466-8 .... Otoczenie (neighborhood) 148, 149, 6 6 4
p Parabola (parabola) 36 Parametr (parameter) 20 — efektywności (efficiency parameter) 417, 426 — podziału (distribution parameter) 427 — substytucji (substitution parameter) 427 Para nieuporządkowana (unordered pair) 29 — uporządkowana (ordered pair) 29, 41 Phillips A.W. 533 Pierwiastek dominujący (dominant root) 580 Pierwiastki (roots) 53 — charakterystyczne a określoność formy kwadratowej (characteristic roots and sign definiteness o f quadratic form) 329-34 i dynamiczna stabilność równowagi (— — dynamic stability o f equilibrium) 509, 527, 579-81 równania różnicowego ( difference equation) 575-8, 595 -------------- różniczkowego-(----------- differential equation) 504-8 układu równań różnicowych (------------ difference equation system) 605 różniczkowych ( differential equation system) 610 — równania kwadratowego (roots o f quadratic equation) 54, 504 wielomianowego (— — polynomial equation) 56, 543, 596-7 — wielokrotne (multiple roots) 506 — zespolone a rzeczywiste (complex roots versus real roots) 505-8, 511 Pochodna (derivative) 141-2 — a funkcja krańcowa (— and marginal function) 143-4 — , ciągłość (—, continuity of) 172 — cząstkowa (partial derivative) 184-5, 207, 219 — —- drugiego rzędu (second-order partial derivative) 316-17 , interpretacja ekonomiczna (economic interpretation o f partial derivative) 186-7 mieszana (cross partial derivative) 317 zupełna ( total) 211, 230-1 — , druga (derivative, second) 245, 247-9 — funkcji złożonej, wzór (chain rule) 179-80, 212 — i nachylenie krzywej (derivative and slope o f curve) 143-5 — , pierwsza (—, first) 240 — statyki porównawczej (— comparative static) 188-90 — zupełna (total derivative) 197, 207-12 zastosowana do statyki porównawczej (----- —applied to comparative statics) 221- 8, 230-1 Podaż (supply) 48, 52 — opóźniona (lagged supply) 560 — z oczekiwaniami cenowymi (supply with price expectations) 527-8 Podstawa logarytmu (base o f logarithm) 286 Podwyznacznik (subdeteminant) 106, 325 Podzbiór (subset) 24
790 INDEKS — SŁOWNICZEK Pole pod krzywą (area under a curve) 447-50 Polityka monetarna (monetary policy) 229, 534, 589 Popyt (demand) 4 8 ,5 2 ,5 2 8 : — a średni przychód (— and average revenue) 357-8 — , elastyczność (— , elasticity of) 204, 360-1 ^ — końcowy (final demand) 128 * ; — nadwyżkowy (excess demand) 48, 57 a dostosowanie cen ( and price adjustment) 475 ------------------ produkcji-(----------- output adjustment) 615-16 w odniesieniu do zapasów ( in relation to inventory) 564 — na pieniądz (demand fo r money) 229 — spekulacyjny (speculative detnand) 230 — transakcyjny (transactions demand) 230 — z oczekiwaniami cenowymi (demand with price expectations) 527 Postać biegunowa (polar form) 519 — kartezjańska (cartesian form) 518 — wykładnicza (exponential form) 518 Potęga ujemna (negative power) 38 Powierzchnia (surface) 41, 390-1 — produkcji (production surface) 186-7 — użyteczności (utility surface) 405 Półokreśloność (semidefiniteness) 324 Półprosta aktywności (activity ray) 701 ■ Półprzestrzeń (halfspace) 662 Prawo malejących przychodów (law o f diminishing returns) 256, 496 Programowanie całkowitoliczbowe (integer programming) 751 — dynamiczne (dynamic programming) 751 — liniowe (linear programming) 647-8, 652-3, 657-9 w odniesieniu do modelu nakładów i wyników (— — in relation to input-output model) 707-9 ---------programowania nieliniowego (— — — —- — nonlinear programming) 718-19 , 740 — matematyczne (mathematical programming) 647 — nieliniowe (nonlinear programming) 714-15, 744 w odniesieniu do klasycznej optymalizacji (—- — in relation to classical optimization) 715 ----------------------- programowania liniowego (--------— — — linear programming) 718-19, 740 \ -V, ' — ąuasi-wklęsłe (quasiconcave programming) 741 — wklęsłe (concave progratnming) 737 Prosta rzeczywista (real line) 22 Prostokątny układ współrzędnych (rectangular coordinate plane) 31 Przechodniość (transitivity) 152 Przeciętny przychód w odniesieniu do popytu (average revenue in relation to demand) 357—8 ----------------------przychodu krańcowego (------------— marginal revenue) 174—6 Przeciwdziedzina funkcji (range o f the fimction) 33 ^,
INDEKS — SŁOWNICZEK
791
Przedział jednostronniedomknięty (half-closed interval) 149 ;> — —- otwarty (half-open interval) 149 > ?: Przekształcenie (transformation) 32 .i, .. . .. •' r 1 Przemienność działań na macierzach (commutative law o f matrix operations) 87 — — . zbiorach (— — — set operations) 27 Przepływ, strumień (flow) 229, 283, 459 Przestrzeń euklidesowa (euclidean space) 84 — fazowa (phase space) 626 — metryczna (metric space) 84 ■:i — n-wymiarowa (n-space) 79 — produktu (output space) 669 , — rozwiązań (solution space) 669 — wektorowa (vector space) 82-4 — zapotrzebowań (requirement space) 670 Przybliżenie liniowe dla funkcji (linear approximation to function) 263-5 ~ — układu równań różniczkowych (— differential-equation system) 635^40 Przybliżona odwrotność (approximation inverse) 131 * Przychód krańcowy (marginal revenue) 174 - w odniesieniu do przychodu przeciętnego ( —in relation to average revenue) 174—6 v wznosząca się krzywa (upward-sloping marginal revenue curve) 257-8 Pułap cenowy (price ceiling) 570-2 Punkt brzegowy (boundary point) 664 — kontaktu (point o f contact) 651 — przecięcia z osią pionową (vertical intercept) 35 poziomą (horizontal intercept) 293 — przegięcia (inflection point) 241, 249, 270, 315 : — rozwinięcia (point o f expansion) 259 — siodłowy funkcji (saddle point o f function) 315, 321 i dualność ( and duality) 739-40 układu dynamicznego ( o f dynamic system) 630 , — stacjonarny (stationary point) 241 ,■ — wewnętrzny (interior point) 664 ‘ — wierzchołkowy, ekstremalny (extreme point) 650, 664
r
■
'
;
Rachunek całkowy (integral calculus) 435-6 — różniczkowy (differential calculus) 140 — ..wariacyjny (calculus o f variations) 751 t . . Radian (radian) 513 t Reguła funkcji złożonej (composite-fimction rule) 180, 212 — L’Hopitala (UHopitaVs rule) 429-30 — łańcuchowa (wzór na pochodną funkcji złożonej) (chain rule) 179-80, 212 — — dla elastyczności ( o f elasticity) 309 — podstawiania (substitution rule) 442-3
792 INDEKS — SŁOWNICZEK
Reguła rozdzielności dla działań na macierzach (distributive law o f matrix operations) 89 --------------------— zbiorach (— set operations) 28 — różniczkowania funkcji złożonej (composite-function rule) 180 ; Relacja (relation) 31-2 Relacje Eulera (Euler relations) 516 Reszta (remainder) 263 — w postaci Lagrange’a (Lagrange form o f the remainder) 265-7, 280, 517 Rozdzielność mnożenia względem dodawania (distributive law) 86 Rozkład na czynniki funkcji podcałkowej (factoring o f integrand) 441 ------------------wielomianowej (-------- polynomial function) 56 wyznacznika względem macierzy ( determinant versus matrix) 110-11 Rozwiązanie (solution) 50 — brzegowe i wewnętrzne (boundary and interior solution) 721 — dopuszczalne (feasible solution) 650 — optymalne dopuszczalne (optimal feasible solution) 650 — trywialne (trivial solution) 121 — układu równań liniowych (solution outcomes fo r linear-equation system) 122 — wewnętrzne (interior solution) 111 Rozwinięcie Laplace ’a (Laplace expansion) 106-8 względem obcych dopełnień algebraicznych ( by alien cofactors) 114-15 — Taylora (Taylor expansion) 268, 636 Równanie behawioralne (behavioral equation) 21 kwadratowe (------- quadratic) 54 wykładnicze (------ exponential) 290 — Bemoulliego (Bernoulli equation) 490, 499 — całkowite (complete equation) 471 — charakterystyczne (characteristic equation) 609, 611-12 macierzy ( o f matrix) 330 równania różnicowego (----------- difference equation) 515 --------------różniczkowego-(----------- differential eguatiori) 504 układu równań różnicowych (----------- difference equation system) 605, 608 -- — różniczkowych (-----------------------differential equation system) 609 — definicyjne (definitional equation) 20 — jednorodne (homogeneous equation) 470, 502 — kwadratowe a funkcja kwadratowa (quadratic equation versus quadratic function) 52-3 — niejednorodne (nonhomogeneous equation) 502 — pomocnicze (auxiliary equation) 504 — różnicowe (difference equation) 548 , analiza diagramu fazowego (—- —, phase-diagram analysis of) 567-8 , klasyfikacja (------- , classification of) 548-9, 574, 593, 596-7 , określone i ogólne rozwiązanie (------- , definite versus general solution o f) 552-3 , szczególne rozwiązania (------- , particular solution of) 551 — różniczkowe (differential equation) 437 , analiza diagramu fazowego (------- , phase-diagram analysis of) 492-5 autonomiczne ( autonomous) 492 , klasyfikacja (------- , classification of) 469-73, 479-81, 482, 488, 501, 539, 542
INDEKS — SŁOWNICZEK 793
Równanie różniczkowe, określone i ogólne rozwiązanie (differential equation, definite versus general solution of) 470-1 , 0 zmiennych rozdzielonych (— — with separable variables) 488-90 — — , szczególne rozwiązanie (------- , particular solution o f) 470 — zupełnej— — exact) 482-5 — Słuckiego (Slutsky equation) 408 — wykładnicze (exponential equation) 290 — zredukowane (reduced equation) 411 Równoległobok (parallelogram) 80 Równowaga (equilibrium) 47 — , analiza równowagi globalnej (general-equilibrium ^analysis) 60 — celu (goal equilibrium) 48, 237 — , dynamiczna stabilność; zob. dynamiczna stabilność równowagi — niestabilna (unstable equilibrium) 135, 631 — ruchoma (moving equilibrium) 553 — rynkowa (market equilibrium) 52, 57 — stacjonarna (stationary equilibrium) 476 — zmieniająca się (moving equilibrium) 416 Różnica, druga (
INDEKS — SŁOWNICZEK 795
794 INDEKS — SŁOWNICZEK
Samuelson P.A. 62, 544, 582 X, zapis (X notation) 75-6, 657 Silnia (factorial) 260 Simpleks (simplex) 665-6 Sinus, funkcja (sine function) 512 — jej pochodna (— — , derivative of) 516 — — , — wartości (—- — , values of) 514 , — własności (— — , properties of) 514-16 Skala półlogarytmiczna (śemilog scale) 306 Skalar (scalar) 70, 78 Składnik (summand) 75 Smith W.J. 257 Solow R.M. 62, 426, 495 Stabilne i niestabilne gałęzie punktu siodłowego (stable and unstable branches o f saddle point) 630, 639, 640 Stała (constant) 20 — addytywna (additive constant) 185 — całkowania (constant o f integration) 438 — multiplikatywna (multiplicative constant) 185 — parametryczna (parametric constant) 20 Stałe przychody skali (CRTS — constant returns o f scale) 699 Stan stacjonarny (stationary state) 498 — wzrostu zrównoważonego (steady state) 498 Statyka (statics) 48 — porównawcza (comparative statics) 135, 139 firmy produkującej wiele wyrobów ( o f multiproduct firm) 366-7 modeli dochodu narodowego (-------- — national-income models) 190-91, 221-2, 228-31 -------------- rynku-(----------- market models) 188-90, 223-5 modelu decyzji o nakładach (— — — input decision model) 367-70 ------------ maksymalizacji użyteczności (utility-maximization model) 405—10 — najmniejszej kombinacji kosztów (------ — least-cost-combination m odel) 422-6 — nakładów i wyników (— ------- input-output model) 192-3 programowania liniowego (------------ linear programming) 651-2 Stopa inflacji (rate o f inflation) 533 — procentowa, efektywna (effective interest rate) 281 nominalna (nominal interest rate) 281 — rozpadu (rate o f decay) 285 — wzrostu (— — growth) 283-^4, 306-8 — zmian (— — change) 140 natychmiastowa (instantaneous rate o f change) 141 — — względna (proportional rate o f change) 306 Stopień funkcji wielomianowej (degree o f polynomial function) 35 — równania różniczkowego ( differential equation) 469
Stożek wypukły (convex cone) 704 Substytuty (substitutes) 59, 357, 409 Suma kwadratów (sum o f squares) 79 — — ważoiia (weighted sum o f squares) 88 — zbiorów (union set) 25 Szereg Maclaurina (Maclaurin series) 260-1 dla funkcji cosinus (— — o f cosine function) 517-18 ------------------- sinus-(-------- — sine function) 517 wykładniczej (— exponential function) 280 zbieżny (convergent) 280 z resztą (— — with remainder) 264 — nieskończony (infinite series) 280, 516-18 — potęgowy (power series) 260 — Taylora (Taylor series) 261-2, 636 a ekstremum względne (------ - and relative extremum) 267-70 zbieżny (convergent Taylor series) 267 — z resztą (— -— with remainder) 263
ś Ściany (face, facet) 710 Ścieżka czasowa (time path) 475, 524, 535, 564, 566, 569, 590 — rozbieżna (nonconvergent time path) 526 stabilna (steady time path) 475-6, 535-7, 555-7, 590 zbieżna (convergent time pathj 526 ze schodkowymi fluktuacjami (time path with stepped fluctuation) 581, 586,587, 591 z fluktuacjami (------------ fluctuation) 524-6, 535-8, 585-6 - z oscylacjami (— oscillation) 555-7, 560-2, 564-6, 570-2 — ekspansji (expansion path) 422-3 — fazowa (phase paths) 628 Ślad (trace) 638 Średnia ważona (weighted average) 352
T Tablica simpleksowa (simplex tableau) 673, 681 , kolumna wiodąca ( , pivot column) 674 , element wiodący (--------, — element) 675 Takayama A. 324 Tangens, funkcja (tangent function) 513 Test kwalifikacji ograniczeń (constraint-qualification test) 743 ------------ , zastosowanie ( , application o f) 745-6 — n-tej pochodnej (nth-derivative test) 271 Testowanie hipotez (hypothesis testing) 17
796 INDEKS — SŁOWNICZEK
Test wartości własnych dla określoności znaków (characteristic-root testfor Sign definiteness) 329-34 — wyznacznikowy dla ekstremum względnego (
u Ujemna określoność (negative definiteness) 324 -, warunki (conditions fo r negative definiteness) 329, 334 — półokreśloność (negative semidefiniteness) 324 , warunki (conditions fo r négative semidefiniteness) 334 Ujemne pole (negative area) 450 Układ autonomiczny równań różniczkowych (autonomous differential équations system) 625
INDEKS — SŁOWNICZEK 7 97
Układ równań (simultaneous equations) 56 t , jednorodny (------- , homogeneous) 121-2, 133,604 liniowych (linear-equation system) 66-7, 96 — — różnicowych (simultaneous difference equations) 604-8 — --------, zastosowanie (— — —, applications) 613-18, 623-4 różniczkowych (— differential equations) 608-10 — -------, zastosowanie (— — —, applications) 615-18, 620-3 — —, zgodność i niezależność (equation system, consistency and independence) 61-2,
101-2 Ułamek (fraction) 22 Uzupełnienie kwadratu (completing the square) 54, 257, 324, 327
w Walras L. 60, 62 Wartości ekstremalne (extreme values) 237-8 — optymalne (optimum values) 237-8 — rozwiązań (solution values) 20 — równowagi (equilibrium values) 50 — własne macierzy (characteristic roots o f matrix) 329 Wartość bezwzględna, moduł (absolute value) 153 — bieżąca (present value) 285 strumienia gotówki ( o f cash flow) 461-3 wiecznego strumienia (------------ perpetual flow) 463 — funkcji (value o f function) 33 — krytyczna (critical value) 241 — produktu krańcowego (value o f marginal product) 363 — siodłowa (saddle value) 739 — stacjonarna (stationary value) 241 Warunek brzegowy (boundary condition) 436 — drugiego rzędu (second-order condition) 252, 312, 319-22, 336-9, 404, 421 ------------ , forma zawierająca różniczki a forma zawierająca pochodne (derivative versus differential form o f condition) 312-13 ------------ , jego rola w statyce porównawczej (role o f second-order condition in comparative statics) 369-70 konieczny i dostateczny (necessary condition and sufficient condition) 251-2,320, 382-3 — w odniesieniu do quasi-wklęsłości i quasi-wypukłości (second-order condition in relation to quasiconcavity and quasiconvexity) 389-400 wklęsłości i wypukłości (----------- —-------- concavity and convexity) 341-4 — komplementamości (complementary slackness) 688, 724-6 — konieczny (necessary condition) 99, 736 — nieujemności (nonnegativity restriction) 648, 721-2
INDEKS — SŁOWNICZEK 799
7 98 INDEKS — SŁOWNICZEK
-
Warunek pierwszego rzędu (first-order condition) 251, 312, 314-16, 335, 721 — początkowy (initial condition) 436 — równowagi (equilibrium condition) 21 Warunki Kuhna-Tuckera (Kuhn-Tucker conditions) 720, 724, 726-7 — ------ - , ich rola obliczeniowa (computational role o f Kuhn-Tucker conditions) 749-50 —, interpretacja ekonomiczna (economic interpretation o f the Kuhn-Tucker conditions) 724-5 Waugh F.V. 132 Ważona suma kwadratów (weighted sum o f squares) 88 Wektor (vector) 68 -— aktywności (activity vector) 698, 708 — , dodawanie ( a c t io n o f vectors) 80-1 — » interpretacja geometryczna (geometric interpretation o f vector) 79-82 — jednostkowy (unit vector) 83 — kolumnowy (column vector) 68, 74 — , mnożenie (multiplication o f vectors) 78-9 — n-elementowy (n-vector) 79 — testujący (test vector) 732 — wierszowy (row vector) 68 -— własny (characteristic vector) 329 — wodzący (radius vector) 79 — zerowy (null vector) 80, 81 Węzeł (node) 629, 631, 638, 639 Wir (vortex) 629, 631, 639, 640 Własność addytywności (additivity property) 451 — niezmienniczości (invariance property) 410 Współczynnik (coefficient) 20 — akceleracji (acceleration coefficient) 584 — dopasowania cen w zależności od zapasów (stock-induced-price-adjustment coefficient) 564 — dostosowania (adjustment coefficient) 475 Współczynniki nieoznaczone (undetermined coefficients) 614, 616, 617 Współczynnik nakładów (input coefficient) 127 — użytkowania (coefficient o f utilization) 467 Współrzędne biegunowe (polar coordinates) 519 Wykładnicze prawo wzrostu (exponential law o f growth) 273 Wykładnik (exponent) 35, 38, 274, 286 Wymiar macierzy (dimension o f matrix) 68 Wypukła kombinacja (convex combination) 352-3, 703 wektorów ( o f vectors) 345 Wypukły stożek wielościenny (— polyhedral cone) 710, 711 Wyrażenie maksymalizowane (maximand) 657 — minimalizowane (minimand) 658 Wyróżnik (discriminant) 325 — obrzeżony (— bordered) 385 Wyznacznik (determinant) 65, 103
Wyznacznik Jacobiego (Jacobian determinant) 62 -— macierzy współczynników (determinant o f coefficient matrix) 325 — , rozkład na czynniki (— , factoring of) 110 — , rozwinięcie Laplace’a (— , Laplace expansion o f) 106-8 — , własności (— , properties o f) 109-11 — zerowy (znikający) (— vanishing) 104 Wzajemnie jednoznaczna odpowiedniość (one-to-one correspondence) 31, 78, 181 Wzór Cramera (Cramer*s rule) 119-21, 226 Wzrost ciągły a dyskretny (continuous versus discrete growth) 284 — negatywny (negative growth) 285 — wykładniczy (exponential growth) 283
Z Zagadnienie dualne (dual program) 685 , interpretacja ekonomiczna (------- , economic interpretation of) 694-8 w odniesieniu do zagadnienia prymalnego ( in relation to primal program) ■ 686-7,690 — prymalne (primal program) 685 w odniesieniu do zagadnienia dualnego ( in relation to dual program) 686-7, 690 Zależność kolumn lub wierszy macierzy (dependence among columns or rows o f matrix)
100-2, 111-12 — Phillipsa (Phillips relation) 533 poszerzona o oczekiwania (expectations augmented Phillips relation) 533-4, 589 długookresowa (long run Phillips relation) 538, 592-3 Zapasy (inventory) 563 Zasób (stock) 229, 283, 459 Zbieżność całki niewłaściwej (convergence o f improper integral) 453-6 — szeregu (— o f series) 267, 279 — ścieżki czasowej; zob. dynamiczna stabilność równowagi Zbiory (sets) 23 , — , iloczyn; przecięcie (intersection o f sets) 25-6 — , prawa działań na zbiorach (laws o f set operations) 27-8 — przeliczalne i nieprzeliczalne (denumerable sets and nondenumerable sets) 23 — rozłączne (disjoint) 25 — , równość (equality o f sets) 24 — skończone i nieskończone (finite sets and infinite sets) 23 — , suma (union o f sets) 25-6 — uniwersalne (universal sets) 26 Zbiór domknięty (dosed set) 650 — , dopełnienie (compement o f set) 25 — liczb rzeczywistych (real number system) 22 — pusty (null set) 24
800 INDEKS — SŁOWNICZEK
Zbiór rozwiązań dopuszczalnych (feasible region) 650 — uniwersalny (universal set) 26 — uporządkowany (ordered set) 29 — wartości funkcji (range o f the function) 33 — wypukły (convex set) 351, 353 — a funkcja wypukła (-----— versus convex function) 351-5 domknięty ( closed) 661 i programowanie liniowe ( and linear programming) 661-3 Zdegenerowane zagadnienie programowania liniowego (degenerate linear programming) 683 Zmienna (variable) 20, 323 — ciągła a dyskretna (continuous versus discrete variable) 435, 547 — decyzyjna (decision variable) 238, 328 — dodatkowa (dummy variable) 668 — egzogeniczna (exogenous variable) 20, 211 — endogeniczna (endogenous variable) 20 — niedoboru a nadmiaru (slack versus surplus variable) 668, 698 — polityki (policy variable) 328 — sztuczna (artificial variable) 679, 682 — wyboru (choice variable) 238 — zależna a niezależna (dependent versus independent variable) 33, 49 Znak sumy (summation sign) 75-6 Zredukowana linearyzacja (reduced linearization) 637 Zupełne równania różniczkowe (exact differential equation) 482-5