PODSTAWOWE WZORY W CZĘŚCI I Zapis (rozdział 2)
(zmierzona wartość x) = x
n p
+ 8x.
(s. 28)
Sx Niepewność względna
(s. 41) i-^npl
Przenoszenie niepewności (rozdział 3) Jeżeli mierzymy szereg wielkości x,... ,w z niewielkimi niepewnościami 8x,...8w, a następ nie korzystamy ze zmierzonych wartości, aby obliczyć pewną wielkość q, to niepewności x,...,w pociągają za sobą powstanie niepewności q, którą można wyznaczyć na podstawie następujących reguł: Jeżeli q ma postać sumy i różnicy, q = x+ ... +z— (u+ ... +w), to « Sx + ... +
8Z
+
SM
+ ... +5w
(s. 58)
(jest to zarazem górne ograniczenie niepewności 8q); 5
9 j
=
7
2
2
2
(§x) + • •. + (5z) + (S«) + ... + (5w)
2
(s. 70)
(dla błędów niezależnych i przypadkowych). Jeżeli q ma postać iloczynu i ilorazu, q = 8x
~ 1*1
"'
x ••• z , to Sz
Su
|z|
|u|
8w "'
(s. 62)
|w|
(jest to zarazem górne ograniczenie niepewności 8q); 8^ \q\
(s. 71) (dla błędów niezależnych i przypadkowych).
Jeżeli q = Bx, gdzie B nie jest obarczone niepewnością, to 8
(s. 63)
Jeżeli q jest funkcją jednej zmiennej q (x), to dx
8x.
(s. 75)
Jeżeli q jest funkcją potęgową, q = x", to
ii
|n|-
ó.\-
(s. 77)
l4l Jeżeli g jest funkcją wielu zmiennych x , . . . , z , to (s. 87) (dla błędów niezależnych i przypadkowych).
Definicje pojęć statystycznych (rozdział 4) Jeżeli x ,...,x zdefiniować 1
N
są wynikami N niezależnych pomiarów pewnej wielkości x, to możemy N
1 x = — Y X, = średnia;
a = x
2
J-j^-jZ&i-*)
(s. 99)
(s. 101)
= odchylenie standardowe;
o\p = —7=r = odchylenie standardowe średniej.
(s. 104)
Rozkład normalny (rozdział 5) Dla dowolnego rozkładu granicznego f(x) zmiennej ciągłej x: f(x) dx = prawdopodobieństwo, że dowolny pomiar da wynik w przedziale pomiędzy x a x + dx;
(s. 122)
b
\f(x) Ax = prawdopodobieństwo, że dowolny pomiar da wynik w przedziale a
pomiędzy x = a a x = b;
(s. 121)
a)
J f(x)dx
= 1 jest warunkiem normalizacji.
(s. 122)
- oo
Rozkład normalny opisany jest funkcją
/,.„(*) = —l— -^*^°\ e
(s. 128)
gdzie X = = = IT = =
środek rozkładu wartość prawdziwa x średnia dużej liczby pomiarów, szerokość rozkładu odchylenie standardowe dla dużej liczby pomiarów.
Prawdopodobieństwo, że zmierzona wartość znajdzie się w promieniu t odchyleń standar dowych od X wynosi 1 ' _ P(w promieniu ta) = — - = J e d z = funkcja błędu; 2
z
/2
w szczególności P(w promieniu la) = 68%.
(s. 132)
John R. Taylor
WSTĘP do ANALIZY BŁĘDU POMIAROWEGO Z angielskiego tłumaczyli:
Adam Babiński Rafał Bożek
Wydawnictwo Naukowe PWN Warszawa 1995
Dane oryginału: John R. Taylor An Introduction to Error Analysis The Study of Uncertainties in Physical Measurements Oxford University Press
Copyright © 1982 by University Science Books
Okładkę i strony tytułowe projektowała Romana
Freudenreich-Slubowska
Redaktor Anna
Bogdanienko
Redaktor techniczny Beata
Stelęgowska
Tytuł dotowany przez Ministra Edukacji Narodowej
Copyright © for the Polish edition by Wydawnictwo Naukowe P W N Sp. z o.o. Warszawa 1995
ISBN 83-01-11820-2
Zdjęcie na okładce przedstawia wypadek na dworcu Montparnasse, 22 października 1845 r. (ND 2896 Paris), opublikowane za zgodą ROGER-VIOLLET, 6, rue de Seine 75006 Paris. © NO-VIOLLET A
B-ko G?G
BIBLIOTEKA GŁOWNA POLITECHNIKI GDAŃSKIEJ II
210128-00-00/01
SPIS TREŚCI
Przedmowa
9
CZĘŚĆ I Rozdział 1. W s t ę p n e r o z w a ż a n i a o r a c h u n k u b ł ę d ó w 1.1. 1.2. 1.3. 1.4. 1.5. 1.6.
Błędy czyli niepewności Nieuchronność niepewności Znaczenie poznania niepewności Dalsze przykłady Oszacowanie niepewności przy odczycie skali Szacowanie niepewności pomiarów wielokrotnych
Rozdział 2. J a k p r z e d s t a w i a ć niepewności p o m i a r o w e i j a k z nich korzystać 2.1. Najlepsze przybliżenie + niepewność 2.2. Cyfry znaczące 2.3. Rozbieżność 2.4. Porównanie wartości zmierzonych i wartości uznanych 2.5. Porównanie dwu wartości zmierzonych 2.6. Graficzne sprawdzanie proporcjonalności 2.7. Niepewności względne 2.8. Cyfry znaczące i niepewności względne 2.9. Mnożenie dwu wartości zmierzonych Zadania
15 15 16 17 19 21 24
27 27 29 31 32 34 37 41 43 44 47 5
Rozdział 3. Przenoszenie niepewności
53
3.1. Niepewności w pomiarach bezpośrednich 3.2. Sumy i różnice; iloczyny i ilorazy 3.3. Niezależne niepewności w sumie 3.4. Więcej o niepewnościach niezależnych 3.5. Dowolna funkcja jednej zmiennej 3.6. Przenoszenie błędów krok po kroku 3.7. Przykłady 3.8. Przykład bardziej skomplikowany 3.9. Ogólna reguła przenoszenia błędów Zadania
Rozdział 4. Analiza statystyczna niepewności p r z y p a d k o w y c h
54 57 66 70 73 77 78 81 84 88
...
95
4.1. Błędy przypadkowe i systematyczne 4.2. Średnia i odchylenie standardowe 4.3. Odchylenie standardowe jako niepewność pojedynczego pomiaru . . . 4.4. Odchylenie standardowe średniej 4.5. Przykłady 4.6. Błędy systematyczne Zadania
96 98 102 104 106 108 111
Rozdział 5. R o z k ł a d n o r m a l n y
114
5.1. Histogramy i rozkłady 115 5.2. Rozkłady graniczne 120 5.3. Rozkład normalny 124 5.4. Odchylenie standardowe jako granica przedziału 68-procentowej ufności 131 5.5. Uzasadnienie wyboru średniej jako najlepszego przybliżenia 134 5.6. Uzasadnienie reguły kwadratowego przenoszenia błędów 138 5.7. Odchylenie standardowe średniej 145 5.8. Ufność 147 Zadania 151
CZĘŚĆ II Rozdział 6. O d r z u c a n i e d a n y c h
159
6.1. Problem odrzucania danych 6.2. Kryterium Chauveneta
159 161
6
6.3. Przykład Zadania
Rozdział 7. Średnie w a ż o n e 7.1. Zagadnienie łączenia osobnych pomiarów 7.2. Średnia ważona 7.3. Przykład Zadania
Rozdział 8. M e t o d a najmniejszych k w a d r a t ó w 8.1. Punkty pomiarowe, które powinny układać się na prostej 8.2. Obliczenie stałych A i B 8.3. Niepewność pomiarów y 8.4. Niepewność stałych A i B 8.5. Przykład 8.6. Dopasowanie innych krzywych metodą najmniejszych kwadratów Zadania
Rozdział 9. K o w a r i a n c j a i korelacja 9.1. Przegląd zasad przenoszenia błędów 9.2. Kowariancja a przenoszenie błędów 9.3. Współczynnik korelacji liniowej 9.4. Ilościowe znaczenie współczynnika r 9.5. Przykłady Zadania
Rozdział 10. R o z k ł a d d w u m i a n o w y 10.1. Rozkłady wyników doświadczalnych 10.2. Prawdopodobieństwo w rzutach kośćmi 10.3. Definicja rozkładu dwumianowego 10.4. Własności rozkładu dwumianowego 10.5. Rozkład Gaussa dla niepewności przypadkowych 10.6. Zastosowania: testowanie hipotez Zadania
163 164
166 166 167 170 170
172 172 174 176 178 179 . . 182 188
193 193 195 199 203 205 206
209 209 210 212 215 219 221 226
7
Rozdział 11. R o z k ł a d P o i s s o n a
230
11.1. Definicja rozkładu Poissona 11.2. Własności rozkładu Poissona 11.3. Przykłady Zadania
2
Rozdział 12. Test x
230 232 236 238
zgodności r o z k ł a d ó w
242
2
242 247 252 255 258 263
12.1. Wprowadzenie do testu j 12.2. Ogólna definicja testu y 12.3. Stopnie swobody i zredukowany test x 12.4. Prawdopodobieństwa związane z testem y 12.5. Przykłady Zadania 2
2
2
D o d a t e k A. F u n k c j a błędu, I
269
D o d a t e k B. F u n k c j a błędu, II D o d a t e k C. P r a w d o p o d o b i e ń s t w a dla w s p ó ł c z y n n i k ó w korelacji 2
D o d a t e k D . P r a w d o p o d o b i e ń s t w a dla testu x Bibliografia Odpowiedzi do wybranych zadań Skorowidz
Mojej żonie
PRZEDMOWA
Wszystkie pomiary, jakkolwiek staranne i naukowe, są narażone na wy stępowanie różnych niepewności. Rachunek błędów polega na badaniu i określaniu rozmiaru tych niepewności, a jego dwa podstawowe zadania to uświadomienie eksperymentatorowi, jak duże są niepewności, i wskazanie sposobu ich zmniejszenia, gdy jest to niezbędne. Analizowanie niepewności, nazywanych także „błędami", jest niezwykle istotnym etapem każdego z eks perymentów naukowych i dlatego rachunek błędów stanowi ważny element programu studiów w ramach każdej związanej z eksperymentem specjalno ści. Rachunek błędów ma dużą szansę stać się jednym z najciekawszych punktów programu. Wyzwanie w postaci szacowania niepewności i ograni czania ich do poziomu pozwalającego wyciągać rzeczowe wnioski może zmienić nudny i wykonywany bezmyślnie ciąg pomiarów w prawdziwie interesujące ćwiczenie. Niniejsza książka stanowi wprowadzenie do rachunku błędów i jest prze znaczona do wykorzystania w ramach kursu fizyki doświadczalnej dla studen tów pierwszego i drugiego roku politechnik oraz wydziałów przyrodniczych uniwersytetów. Nie twierdzę oczywiście, że rachunek błędów jest najważniej szym (to znaczy jedynym ważnym) elementem takiego kursu, ale przekonałem się, że częstokroć jest to element lekceważony i zaniedbywany. W wielu przypadkach „nauka" rachunku błędów sprowadza się do wręczenia kilku zapełnionych notatkami kartek ze sporą liczbą wzorów i oczekiwania, że student sam da sobie z tym radę. W rezultacie rachunek błędów staje się nic nie znaczącą procedurą, która polega na dodania kilku linijek z obliczeniami w końcowej części sprawozdania z wykonania ćwiczenia, z tego tylko powodu, że takie było polecenie asystenta.
9
Napisałem tę książkę z przekonaniem, że każdy student, nawet ten, który nigdy nie spotkał się z zagadnieniem, powinien mieć szansę poznania, czym jest rachunek błędów, dlaczego jest interesujący i ważny oraz jak wykorzystać jego podstawowe metody przy sporządzaniu sprawozdań laboratoryjnych. Część I książki (zawierająca rozdziały od 1 do 5) próbuje wypełnić to zadanie, opierając się na przykładach wielu doświadczeń spotykanych w ramach wstępnej pracowni fizycznej. Student, który zdoła opanować zawarty tam materiał, powinien znać i rozumieć większość zagadnień rachunku błędów, jakie może spotkać wykonując ćwiczenia objęte programem wstępnej pra cowni fizycznej: przenoszenie błędów, posługiwanie się najprostszymi elemen tami statystyki i ich uzasadnienie na podstawie rozkładu normalnego. Część II zawiera wybór pewnych bardziej złożonych zagadnień: dopasowy wanie metodą najmniejszych kwadratów, test x i inne. Nie wchodzą one jawnie w zakres wstępnej pracowni fizycznej, chociaż spora grupa studentów może się niektórymi z nich zainteresować. Część z tych zagadnień okaże się niezbędna w ramach dalszych zajęć na pracowni fizycznej i głównie z tego powodu zdecydowałem się je przedstawić. Jestem w pełni świadomy, że wszędzie poświęca się rachunkowi błędów zbyt mało czasu w ramach zajęć na pracowni fizycznej. W University of Colorado prowadzimy godzinny wykład w czasie pierwszych sześciu tygodni zajęć na wstępnej pracowni fizycznej. Wykłady te połączone z pracami domo wymi, na które składają się zadania zamieszczone na końcu każdego z roz działów, obejmują w pełni tematykę rozdziałów od 1 do 4 i skrótowo rozdział 5. Daje to studentom praktyczną wiedzę na temat przenoszenia błędów i elementarnej statystyki jak również pewne pojęcie o znajdującym się u pod staw teorii rozkładzie normalnym. Z opinii wyrażanych przez część studentów wynika, że wykłady stanowiły zbyteczny luksus, przynajmniej dla niektórych studentów, którzy byli w stanie opanować materiał na podstawie lektury skryptu i wykonując zalecane zadania. Głęboko wierzę, że książkę można czytać bez jakiejkolwiek pomocy ze strony wykładowcy. 2
Część II książki można przedstawić w ramach kilku wykładów przeprowa dzonych w pierwszych tygodniach zajęć na pracowni fizycznej przeznaczonej dla studentów drugiego roku (podobnie jak i poprzednio wzbogaconych odpowiednią liczbą zadań). Ale jeszcze w większym stopniu niż część I jest ona przeznaczona do samodzielnego czytania przez studentów w chwili uzależ nionej od ich własnych potrzeb i zainteresowań. Każdy z siedmiu rozdziałów składających się na część II jest niemal zupełnie niezależny od pozostałych właśnie po to, by zachęcić do takiej lektury. N a końcu każdego z rozdziałów przedstawiłem stosowny zestaw zadań; Czytelnik powinien rozwiązać niektóre z nich, aby w pełni opanować omawia-
10
ne zagadnienia. Większość obliczeń dotyczących błędów jest całkiem prosta. Student, który wykonuje wiele skomplikowanych rachunków czy to w zadaniach, czy w sprawozdaniach, prawie na pewno robi coś w sposób niepotrzebnie złożony. Chcąc umożliwić wykładowcom i studentom wybór, przedstawiłem znacznie więcej zadań niż przeciętny Czytelnik spróbuje rozwiązać. Czytelnik, który rozwiąże jedną trzecią spośród nich, nie powinien mieć dalszych kłopotów. Wewnętrzne strony okładki zawierają streszczenie najważniejszych wzo rów. Mam nadzieję, że będzie to stanowiło pomoc zarówno w trakcie czytania książki jak i później. Streszczenia mają układ rozdziałów i, jak wierzę, mogą pełnić funkcję krótkich podsumowań, do których można zajrzeć po prze czytaniu każdego rozdziału. W samym tekście pewna liczba stwierdzeń równań i reguł postępowania została wyróżniona poprzez cieniowanie tła. Ten sposób wyróżnienia jest zarezerwowany dla ostatecznej (czyli takiej, która już później nie ulegnie zmianom) postaci ważnych stwierdzeń. Czytelnik powinien zapamiętać te stwierdzenia i właśnie w tym celu zostały one wyróżnione. Poziom znajomości matematyki, który jest wymagany od Czytelnika, wzrasta nieznacznie w kolejnych fragmentach. W pierwszych dwóch rozdzia łach wymagana jest tylko algebra; rozdział 3 wymaga obliczania pochodnych (i pochodnych cząstkowych w paragrafie 3.9, który jednak można pominąć); w rozdziale 5 niezbędna jest umiejętność całkowania i znajomość funkcji wykładniczej. W części II zakładam, że Czytelnik jest dobrze obeznany ze wszystkimi wymienionymi pojęciami. Książka zawiera liczne przykłady doświadczeń z zakresu fizyki, ale zro zumienie ich teoretycznych podstaw nie jest niezbędne. Ponadto większość przykładów zaczerpnięto z elementarnej mechaniki i optyki, aby zwiększyć szansę, że Czytelnik poznał już odpowiedni dział fizyki. Student, który od czuwa taką potrzebę, może znaleźć podstawy teoretyczne, zaglądając do indeksu dowolnego podręcznika fizyki ogólnej. Rachunek błędów jest tematem, wokół którego toczy się wiele sporów, i żaden z możliwych sposobów prowadzenia wykładu nie jest w stanie zadowolić wszystkich. W moim osobistym przekonaniu zawsze wtedy, gdy konieczny jest wybór pomiędzy łatwością zrozumienia a rygorystycznym formalizmem, wykładowca fizyki powinien wybierać pierwszą możliwość. N a przykład, w budzącej kontrowersje kwestii, czy niepewności należy dodawać w postaci pierwiastka z sumy kwadratów czy bezpośrednio, zdecydowałem się omówić najpierw dodawanie bezpośrednie, ponieważ student łatwiej zrozumie argumenty, które do niego prowadzą. W ciągu ostatnich kilkunastu lat, w studenckich pracowniach zaszły dramatyczne zmiany związane z pojawieniem się kalkulatorów. Spowodowało
11
to wprawdzie kilka niezbyt szczęśliwych następstw - najłatwiej zauważyć okropny nawyk podawania absurdalnej liczby cyfr nie znaczących tylko dlatego, że znalazły się na wyświetlaczu kalkulatora - ale prawie w każdym przypadku, a szczególnie w rachunku błędów pojawienie się kalkulatora przyniosło ogromne korzyści. Kalkulator pozwala obliczyć w kilka sekund wartości średnich i odchyleń standardowych, których znalezienie trwałoby inaczej godzinami. Czyni także zbędnymi wiele tablic, ponieważ można obec nie szybciej obliczyć wartość funkcji, takiej jak funkcja Gaussa, niż znaleźć wynik w tablicach. Starałem się wykorzystać to wspaniałe narzędzie wszędzie, gdzie tylko było to możliwe. Z przyjemnością chciałem podziękować wielu osobom za ich pomocne uwagi i sugestie. Wydanie skryptowe niniejszej książki było wykorzystywane w wielu uczelniach i wdzięczny jestem zarówno studentom, jak i moim kolegom wykładowcom za ich krytycyzm. Szczególnie pomocne okazały się uwagi poczynione przez Johna Morrisona i Davida Nesbitta z University of Colorado, profesorów Pratta i Schroedera z Michigan State University, profe sora Shugarta z University of California w Berkeley oraz profesora Semona z Bates College. Diane Casparian, Linda Frueh i Connie Gurule przygotowy wały maszynopisy starannie i bardzo szybko. Bez mojej teściowej, Frances Kretschmann, korekty nigdy nie byłyby ukończone na czas. Wszystkim wy mienionym osobom jestem wdzięczny za ich pomoc; chociaż przede wszystkim chciałem podziękować mojej żonie, której cierpliwa i nieustanna praca redak torska w nieoceniony sposób ulepszyła tę książkę. J. R Taylor 1 listopada 1981 Boulder, Colorado
Część I 1. Wstępne rozważania o rachunku błędów 2. Jak przedstawiać niepewności pomiarowe i jak z nich korzystać 3. Przenoszenie niepewności 4. Analiza statystyczna niepewności przypadkowych 5. Rozkład normalny
Część I poświęcona jest wprowadzeniu podstawowych pojęć rachunku błędów, niezbędnych w ramach typowych zajęć na wstępnej pracowni fizycznej przeznaczonej dla studentów pierwszego roku. Pierwsze dwa rozdziały odpowiadają na pytania, czym jest rachunek błędów, dlaczego jest on ważny i w jaki sposób należy go włączyć w sprawozdanie z wykonanego ćwiczenia. W rozdziale 3 mowa jest o przenoszeniu (propagacji) błędów, w przypadku gdy dane pochodzące z pierwotnych pomiarów są wykorzystywane w obliczeniach i zachodzi konieczność wyznaczenia niepewności wyniku końcowego. Rozdziały 4 i 5 zawierają wprowadzenie do metod statystycznych, umożliwiających oszacowanie tak zwanych niepewności przypadkowych.
R O Z D Z I A Ł
1
WSTĘPNE ROZWAŻANIA O RACHUNKU BŁĘDÓW
Zadaniem rachunku błędów jest analiza i ocena niepewności pomiarowych. Jak wykazuje praktyka, żaden z pomiarów, niezależnie od włożonej weń staranności, nie daje całkowicie dokładnego wyniku. W sytuacji gdy konstruk cja i stosowalność nauk przyrodniczych oparte są na wynikach pomiarów, podstawowe znaczenie ma możliwość określania odpowiadających im niepew ności i ograniczania ich do minimalnego poziomu. W tym rozdziale podamy przykłady nieskomplikowanych pomiarów, które wykażą nieuchronność występowania niepewności eksperymentalnych i uzasa dnią podstawowe znaczenie wiedzy na temat ich wielkości. W dalszym ciągu wyjaśnimy, w jaki sposób (przynajmniej w najprostszych przypadkach) można realistycznie oszacować rozmiary niepewności eksperymentalnych, posługując się metodami niewiele bardziej złożonymi od tych, które podsuwa zdrowy rozsądek.
1.1. Błędy czyli niepewności W naukach przyrodniczych „błąd" nie jest synonimem „pomyłki" lub „gafy". „Błąd" występujący w pomiarze naukowym oznacza niemożliwą do uniknięcia niepewność nierozerwalnie związaną z istotą pomiaru. W tym sensie błędy nie oznaczają pomyłek; nie sposób uniknąć ich zachowując większą staranność. Wszystko co można osiągnąć, to spowodować, by były możliwie najmniejsze, i znaleźć sposób na oszacowanie ich wielkości. Większość podręczników wprowadza pewne szczególne definicje „błędu". Kilka z nich rozważymy nieco
15
później. Teraz będziemy używać słowa „błąd" wyłącznie w znaczeniu „niepew ności", traktując obydwa wyrazy w sposób całkowicie wymienny.
1.2. Nieuchronność niepewności Aby lepiej zrozumieć zjawisko nieuchronnego występowania niepewności, wystarczy przyjrzeć się nieco staranniej dowolnemu z wykonywanych na co dzień pomiarów. Zastanówmy się nad postępowaniem stolarza, który musi zmierzyć wysokość framugi, chcąc dopasować do niej drzwi. Pierw szym, zgrubnym pomiarem może być rzut oka na framugę, który pozwoli oszacować jej wysokość na 210 cm. Taki „pomiar" wiąże się oczywiście ze sporą niepewnością. Indagowany stolarz prawdopodobnie wyrazi tę niepew ność, przyznając, że wysokość framugi równie dobrze może wynosić 205 jak i 215 cm. Jeżeli stolarz będzie potrzebował bardziej dokładnego pomiaru, może skorzystać z taśmy mierniczej i stwierdzić, że wysokość framugi wynosi 211,3 cm. Nie ulega wątpliwości, że ten pomiar jest bardziej precyzyjny od pierwo tnego szacunku, ale oczywiście wciąż obarczony pewną niedokładnością, gdyż nie można odpowiedzieć, czy wysokość framugi wynosi dokładnie 211,3000 cm czy może 211,3001 cm. Jest wiele przyczyn obecnej wciąż niepewności. Kilka z nich rozważymy w dalszym ciągu naszego wykładu. Są wśród nich takie, które stolarz mógłby łatwo wyeliminować czyniąc w tym kierunku pewne starania. Należy do nich złe oświetlenie utrudniające właściwy odczyt taśmy; ten problem można rozwiązać zwiększając po prostu oświetlenie. Z drugiej strony pewne źródła niepewności są ściśle związane z samym zjawiskiem pomiaru i niemożliwe jest ich całkowite usunięcie. Wyobraźmy sobie, że działki na taśmie używanej przez stolarza rozmieszczone są w od stępach pólcentymetrowych. Z dużą dozą prawdopodobieństwa można przy jąć, że górna krawędź drzwi nie pokryje się z żadną z kresek oznaczających odcinki półcentymetrowe, skąd wniosek, że stolarz będzie musiał sam określić, w którym miejscu pomiędzy dwiema kreskami znajduje się krawędź. Nawet gdyby pokryła się ona z odpowiednią działką, to i tak szerokość oznaczeń na taśmie jest zbliżona do milimetra; tak więc stolarz musiałby podać położenie krawędzi w obrębie kreski. W każdym z przypadków musi on podjąć się określenia położenia krawędzi drzwi względem oznaczeń znajdujących się na taśmie, co zawsze spowoduje pojawienie się pewnej niepewności w podanym przez niego wyniku.
16
Kupując lepszą taśmę z gęstszą, bardziej precyzyjną podziałką, stolarz może zmniejszyć tę niepewność, ale nigdy nie będzie w stanie całkowicie jej wyeliminować. Jeżeli popadłby w obsesję na punkcie zmierzenia wysokości framugi drzwi z największą możliwą dokładnością, na jaką pozwala stan techniki, mógłby zakupić kosztowny interferometr laserowy. Ale nawet do kładność interferometru laserowego jest ograniczona do odległości porówny walnych z długością fali świetlnej (około 0 , 5 - 1 0 " metra). Stolarz, wykonując pomiary z fantastyczną wprost dokładnością, w dalszym ciągu nie znałby dokładnej wysokości framugi. 6
Co więcej, zwiększając coraz to bardziej precyzję, napotkałby problem o pod stawowym znaczeniu. Przekonałby się, że wysokość framugi zmienia się od miejsca do miejsca. Nawet w jednym i tym samym miejscu wysokość może ulegać zmianom wskutek wahań temperatury i wilgotności powietrza, a nawet przypad kowego starcia cienkiej warstwy brudu. Innymi słowy stolarz odkryłby, że nie istnieje coś takiego, jak ściśle określona wysokość framugi. Tego rodzaju problem nosi miano zagadnienia definicji (wysokość framugi nie należy do dobrze zdefinio wanych wielkości) i odgrywa istotną rolę w wielu pomiarach naukowych. Obserwacje stolarza ilustrują pewną powszechnie uznawaną prawdę. Żad nej z wielkości fizycznych (długość, czas, temperatura itd.) nie można zmierzyć z absolutną dokładnością. Postępując z należytą uwagą, możemy zmniejszać występujące niepewności, aż staną się one bardzo małe, ale całkowite ich usunięcie nie jest możliwe. W wykonywanych na co dzień pomiarach z reguły nie przejmujemy się analizą błędów. Wl wielu sytuacjach niepewności nie są wcale interesujące. Jeżeli mówimy, że odległość z domu do szkoły wynosi 3 kilometry, to (w większości przypadków) nie jest istotne, czy oznacza to „coś pomiędzy 2,5 a 3,5 kilometra" czy może „coś pomiędzy 2,99 a 3,01 kilometra". Często niepew ności są ważne, ale uwzględniamy je podświadomie, nie prowadząc w tym celu jawnych rozważań. Stolarz przystępując do dopasowywania drzwi powinien znać ich wysokość z dokładnością zbliżoną lub większą niż 1 mm. Dopóki jednak niepewność pozostaje na tym poziomie, dopóty drzwi (praktycznie pod każdym względem) będzie można uznać za idealnie dopasowane, co zakończy zainteresowanie stolarza rachunkiem błędów.
1.3. Znaczenie poznania niepewności Przykład stolarza mierzącego wysokość framugi drzwi pokazał istnienie ścisłego związku niepewności z pomiarami. Rozważymy teraz inny przykład, który wyraźniej zilustruje podstawowe znaczenie wiedzy o rozmiarach niepewności.
17
Wyobraźmy sobie, że stajemy wobec zadania podobnego do tego, któregi rozwiązanie przypisuje się Archimedesowi. Poproszono nas, abyśmy stwier dzili, czy korona jest wykonana, tak jak się twierdzi, z 18-karatowego złota cz może z mniej cennego stopu. Naśladując Archimedesa, postanawiamy zbada gęstość materiału, z którego wykonano koronę, wiedząc, że gęstości 18-karato wego złota i podejrzanego stopu wynoszą Pztota
= 15,5 g/cm
3
i Pstopu
3
= 13,8 g/cm .
Jeżeli potrafilibyśmy zmierzyć gęstość /> korony, dałoby to możliwoś (zgodnie z pomysłem Archimedesa) przekonania się, czy korona rzeczywiści wykonana jest ze złota, przez porównanie p z gęstościami p i p . Przypuśćmy, że wykonanie pomiarów gęstości powierzyliśmy dwóm eks pertom. Pierwszy z nich, nazwijmy go A, szybko przeprowadził pomiar p i w swoim sprawozdaniu napisał, że zgodnie z jego najlepszą wiedzą p wynosi 15, a niemal z całkowitą pewnością zawiera się w przedziale od 13,5 di 16,5 g/cm . Pomiary prowadzone przez eksperta B trwały nieco dłużę a w swoim sprawozdaniu podał on wynik 13,9 z zakresem prawdopodobień stwa od 13,7 do 14,1 g/cm . Rezultaty uzyskane przez ekspertów zawier tabela 1.1. korony
k o r o n y
złota
s t o p u
k o r o i
k o r o i
3
3
Tabela 1.1. Otrzymany wynik Wartość oczekiwana p Zakres prawdopodobieństwa p korony
korony
3
Gęstość korony (w g/cm ) Ekspert A
Ekspert B
15 od 13,5 do 16,5
13,9 od 13,7 do 14,1
Zapoznawszy się z wynikami zawartymi w tabeli, stwierdzimy najpierw, ż pomimo znacznie większej dokładności osiągniętej przez eksperta B, pomiar wykonane przez A są prawdopodobnie także poprawne. Każdy z eksperymer tatorów określił przedział wartości, w którym zgodnie z jego oceną zawiera si p . Przedziały te przekrywają się; jest więc możliwe (a nawet całkier prawdopodobne), że obydwa zestawy wyników są poprawne. W toku dalszych rozważań zauważymy, że duża niepewność związan z pomiarami eksperta A czyni je całkowicie bezużytecznymi. Zarówno gęstoś k o r o n y
18
18-karatowego złota, jak i gęstość stopu leżą w podanym przez niego przedziale od 13,5 do 16,5 g/cm . Nie jest więc możliwe wyciągnięcie jakiegokolwiek wniosku z pomiarów eksperta A. Przeciwnie, pomiary B wykazują jasno, że korona nie została wykonana z 18-karatowego złota; gęstość podejrzewanego przez nas stopu, 13,8 g/cm , leży zdecydownie wewnątrz przedziału określonego przez eksperta B (od 13,7 do 14,1 g/cm ), podczas gdy gęstość 18-karatowego złota, która wynosi 15,5 g/cm , znajduje się z dala od granic przedziału. Jest oczywiste, że o ile pomiary mają pozwolić na wyciągnięcie pewnych wniosków, związane z nimi niepewności nie powinny być zbyt duże. Jednakże nie jest wcale niezbędne, aby były one krańcowo małe. Pod tym względem przedstawiony przez nas przykład jest typowy dla wielu pomiarów naukowych, w których niepewności powinny być wystarczająco małe (z reguły kilka procent mierzonej wielkości), ale dalsze zwiększanie dokładności mija się z celem. 3
3
3
3
Ponieważ nasza decyzja opiera się na wypowiedzianym przez eksperta B stwierdzeniu, że p zawiera się w przedziale pomiędzy 13,7 i 14,1 g/cm , jest niezwykle ważne, aby ekspert B podał przekonujące uzasadnienie swojego stwierdzenia. Innymi słowy, każdy eksperymentator musi uzasadnić granice ustalonego przez siebie zakresu prawdopodobieństwa. Tego wymagania nie dostrzegają często początkujący studenci, którzy podają, że niepewność wyno si po prostu 1 milimetr, 2 sekundy itd., pomijając jakiekolwiek uzasadnienie. Bez krótkiego wyjaśnienia sposobu szacowania niepewności takie stwierdzenia są nieomal bezużyteczne. 3
k o r o n y
N a koniec najważniejsza uwaga na temat pomiarów wykonanych przez zaangażowanych przez nas ekspertów; podobnie jak większość pomiarów naukowych, byłyby one bezużyteczne, gdyby nie podano wraz z nimi wiarygo dnego oszacowania niepewności. Zauważmy, że mając do dyspozycji wiado mości zawarte w górnym wierszu tabeli 1.1, nie tylko nie bylibyśmy w stanie rozstrzygnąć o prawdziwości korony, ale co gorsza moglibyśmy zostać wpro wadzeni w błąd, ponieważ wynik podany przez eksperta A (15) pozwalał sądzić, że korona jest prawdziwa.
1.4. Dalsze przykłady Przykłady podane w poprzednich paragrafach zostały wybrane, ponieważ dobrze ilustrują pewne podstawowe elementy rachunku błędów. Same w sobie nie mają zbyt wielkiej wagi, a Czytelnik może uznać je za nieco wydumane. Nietrudno jednak znaleźć przykłady o znaczeniu podstawowym dla każdej z dziedzin badań podstawowych i stosowanych.
19
Zacznijmy od nauk stosowanych; projektant elektrowni jądrowej musi znać własności wszystkich materiałów i paliw, które zamierza wykorzystać. Wytwórca kalkulatorów musi znać dane techniczne różnych podzespołów elektronicznych. W każdym z przypadków ktoś wcześniej musi zmierzyć żądane parametry, a po zakończeniu pomiarów oszacować ich wiarygodność, co wymaga zastosowania rachunku błędów. Inżynierowie zajmujący się zagad nieniami bezpieczeństwa w transporcie lotniczym, kolejowym czy samochodo wym muszą mieć na uwadze niepewności związane z czasem reakcji obsługi środków lokomocji, drogami hamowania i całą masą innych zmiennych; każde niedopatrzenie w prowadzonym rachunku błędów może doprowadzić do poważnych wypadków, jak ten pokazany na okładce książki. Nawet w dziedzi nie mniej związanej z nauką, jaką jest produkcja odzieży, rachunek błędów w postaci kontroli jakości odgrywa istotną rolę. W badaniach podstawowych rola rachunku błędów jest jeszcze większa. Po przedstawieniu nowej teorii należy skonfrontować ją z teorią starszą, wykorzy stując jeden lub kilka eksperymentów, w stosunku do których nowa i stara teoria przewidują różne wyniki. W zasadzie należałoby ograniczyć się do przeprowadzenia doświadczenia i pozwolić wynikom rozstrzygnąć pomiędzy rywalizującymi teoriami. W praktyce sytuację komplikują nieuniknione niepe wności eksperymentalne. Należy je uważnie analizować i dążyć do zmniej szenia ich roli aż do chwili, gdy eksperyment będzie w stanie jednoznacznie wskazać na właściwą teorię. Oznacza to, że wyniki pomiarów muszą być zgodne z przewidywaniami jednej z teorii, a sprzeczne ze wszystkimi, znanymi teoriami konkurencyjnymi. Jest oczywiste, że powodzenie takiej procedury zależy w sposób krytyczny od zrozumienia przez badacza rachunku błędów i zdolności do przekonania o tym fakcie innych. Znanym przykładem testowania teorii naukowej, które opierało się na opisanych zasadach, jest pomiar ugięcia promieni świetlnych przechodzących w pobliżu Słońca. Po ogłoszeniu w 1916 r. ogólnej teorii względności Einstein przewidział, że światło docierające od gwiazd, przechodząc w pobliżu Słońca zostanie ugięte o kąt a = 1,8". Najprostsza z klasycznych teorii przewidywała brak ugięcia (a = 0), a bardziej złożona, klasyczna analiza przepowiadała (jak zresztą wykazał to sam Einstein w 1911 r.) ugięcie o kąt a = 0,9". W zasadzie wystarczało jedynie przeprowadzić obserwacje gwiazd pokrywających się z kra wędzią tarczy słonecznej i zmierzyć kąt ugięcia a. Jeżeli w wyniku otrzymano by a. = 1,8", ogólna teoria względności zwyciężyłaby (przynajmniej w odniesieniu do tego zjawiska); gdyby jednak a było równe 0 lub 0,9", wówczas ogólna teoria względności byłaby fałszywa, a jedna z klasycznych teorii prawdziwa. W rzeczywistości pomiary ugięcia promieni świetlnych przez Słońce są niezwykle trudne i możliwe do wykonania jedynie podczas zaćmienia Słońca.
20
Pomimo wszystko, zostały one przeprowadzone w 1919 r. przez Dysona, Eddingtona i Davidsona, którzy podali wynik a. = 2,0" z przedziałem 9 5 % wiarygodności od 1,7" do 2,3". Wynik ten w sposób oczywisty był zgodny z ogólną teorią względności i sprzeczny z przewidywaniami teorii klasycznych. Stanowił więc silny argument na rzecz stworzonej przez Einsteina ogólnej teorii względności. W tamtym czasie był to wynik kontrowersyjny. Wielu badaczy podej rzewało, że niepewności oszacowano z niedomiarem i tym samym całe do świadczenie nie było rozstrzygające. Kolejne eksperymenty zmierzały do po twierdzenia przewidywań Einsteina i broniły stanowiska Dysona, Eddingtona i Davidsona. W tym miejscu warto podkreślić, że cały problem opierał się na zdolności eksperymentatorów do wiarygodnego oszacowania niepewności i przekonania pozostałych, że zostało to uczynione. 1
Student odbywający zajęcia w ramach pierwszej pracowni fizycznej nie będzie miał okazji do wykonywania doświadczeń rozstrzygających o praw dziwości nowych teorii. Z drugiej jednak strony wiele z doświadczeń zostało pomyślanych jako testy teorii już uznanych. Na przykład, prawo powszech nego ciążenia Newtona przewiduje, że wszystkie ciała spadają ze stałym przyspieszeniem g (w odpowiednich warunkach) i zadaniem studenta jest przeprowadzenie doświadczeń w celu ustalenia, czy jest to przewidywanie prawdziwe. N a pierwszy rzut oka, doświadczenia tego typu mogą wydawać się sztuczne i bezcelowe, ponieważ te same teorie już wielokrotnie sprawdzono i to z dokładnością niemożliwą do osiągnięcia w pracowniach dydaktycznych. Pomimo to, jeżeli student rozumie zasadnicze znaczenie rachunku błędów i gotów jest podjąć wyzwanie polegające na możliwie dokładnym przeprowa dzeniu testów z wykorzystaniem dostępnych przyrządów, wspomniane do świadczenia mogą stać się niezwykle interesujące i kształcące.
1.5. Oszacowanie niepewności przy odczycie skali Jak dotąd rozważaliśmy pewne przykłady ilustrujące, dlaczego każdy pomiar obarczony jest niepewnością i dlaczego istotna jest wiedza o jej wielkości. Z drugiej strony nie rozważaliśmy jeszcze, jak skutecznie obliczyć wielkość niepewności. W istocie takie oszacowanie może być bardzo skomplikowane 1
Ten uproszczony opis doświadczenia został oparty na oryginalnej pracy Dysona, Eddin gtona i Davidsona Philos. Trans. R. Soc, 220A, 291 (1920). Dokonałem zamiany prawdopodobnego błędu, jaki występuje w oryginalnej pracy, na przedział 9 5 % wiarygodności. Ścisłe znaczenie takiego przedziału wiarygodności zostanie zdefiniowane w rozdziale 5.
21
i będzie ono głównym tematem dalszej części tej książki. N a szczęście istnieją pewne proste pomiary, dla których można dokonać rozsądnej oceny niepew ności, często posługując się jedynie zdrowym rozsądkiem. W tym miejscu i w paragrafie 1.6 podamy dwa przykłady takich nieskomplikowanych pomia rów. Ich zrozumienie pozwoli Czytelnikowi rozpocząć stosowanie rachunku błędów w jego eksperymentach i stworzy podstawy naszych dalszych roz ważań. milimetry
0
10
20
30
40
50
Rysunek 1.1. Pomiar długości za pomocą miarki
wolty
5
Rysunek 1.2. Odczyt napięcia
Pierwszym przykładem jest pomiar wykorzystujący skalę z podzialką, jak miarka na rys. 1.1 czy woltomierz na rys. 1.2. Aby zmierzyć długość ołówka przedstawionego na rys. 1.1, musimy najpierw umieścić jego koniec naprzeciw początku skali, a następnie zdecydować, któremu miejscu miarki odpowiada czubek ołówka. Aby zmierzyć napięcie na skali przedstawionej na rys. 1.2, musimy zdecydować, jakie miejsce na skali woltomierza pokazuje jego wska zówka. Jeśli założymy, że miarka i woltomierz są wiarygodne, to w obu przypadkach głównym problemem jest decyzja, gdzie w stosunku do podziałki na skali leży pewien punkt. (Oczywiście, gdy istnieje jakakolwiek wątpliwość, że miarka i woltomierz nie są wiarygodne, wówczas będziemy zmuszeni wziąć ten fakt pod uwagę.) Znaczniki podziałki na rys. 1.1 leżą całkiem blisko siebie (są odległe o 1 mm). Eksperymentator mógłby sensownie uznać, że pokazana długość jest
bez wątpienia bliższa wartości 36 mm niż 35 czy 37 mm oraz że bardziej precyzyjny odczyt nie jest możliwy. Sformułowałby zatem następujący wnio sek: najlepsze oszacowanie długości = 36 mm, (1.1) prawdopodobny zakres od 35,5 do 36,5 mm i powiedziałby, że zmierzył długość z dokładnością do najbliższej działki milimetrowej. Taki typ konkluzji - że pewna wielkość jest bliższa jednej z działek skali niż każdej innej - jest dosyć powszechny. Z tego powodu wielu naukowców stosuje konwencję, że przez wyrażenie / = 36 mm bez żadnego zastrzeżenia rozumie się, iż / jest bliższe 36 mm niż 35 mm czy 37 mm, czyli że / = 36 mm znaczy 35,5 mm < Z ^ 36,5 mm. W ten sam sposób odpowiedź x = 1,27, bez podania niepewności, powin na być rozumiana jako stwierdzenie, że x leży pomiędzy 1,265 i 1,275. W niniejszej książce nie będziemy stosować tej konwencji, podając zawsze niepewność pomiarową explicite. Niemniej jednak ważne jest, aby Czytelnik tę konwencję rozumiał i wiedział, jak ją stosować w odniesieniu do dowolnej liczby, dla której nie podano niepewności. Jej znajomość jest szczególnie istotna w dobie kalkulatorów o wielocyfrowych wyświetlaczach. Jeśli student ślepo przepisuje ze swojego kalkulatora liczbę, taką jak 123,456, bez dodania jakiegokolwiek zastrzeżenia, to patrzący na tę wartość ma prawo wierzyć w jej sześć cyfr znaczących. W rzeczywistości jest to bardzo mało praw dopodobne. Podziałka na woltomierzu pokazanym na rys. 1.2 jest rzadsza niż ta na miarce. W tym przypadku większość obserwatorów zgodzi się, że można zrobić więcej niż po prostu określić, która działka jest najbliżej wskazówki. Ponieważ odstęp jest większy, można realistycznie ocenić, gdzie pomiędzy dwiema działkami znajduje się wskazówka. Tak więc rozsądne podsumowanie pomiaru napięcia mogłoby brzmieć: najlepsze oszacowanie napięcia = 5,3 wolta, (1.2) prawdopodobny zakres od 5,2 do 5,4 wolta.
23 i
Proces oceny położenia punktu pomiędzy działkami na skali zwany jest interpolacją. Jest to ważna technika, którą można udoskonalać przez stosowa nie w praktyce. Inni obserwatorzy mogliby się nie zgodzić z ostrożną oceną podaną w równaniach (1.1) i (1.2). W szczególności mogliby równie dobrze zdecydo wać, że na rys 1.1 możliwa byłaby interpolacja długości i jej pomiar z mniejszą niepewnością niż dana w równaniu (1.1). Niemniej jednak niewielu zaprze czyłoby, że równania (1.1) oraz (1.2) są rozsądnymi oszacowaniami wielkości, o jakich mowa, i ich prawdopodobnej niepewności. Tak więc widzimy, że kiedy jedynym problemem jest zlokalizowanie punktu na skali z podziałką, wówczas przybliżona ocena niepewności jest całkiem prosta.
1.6. Szacowanie niepewności pomiarów wielokrotnych Wiele pomiarów obarczonych jest niepewnością, którą o wiele trudniej ocenić niż tę związaną z podziałką skali pomiarowej. Kiedy, na przykład, używamy stopera do pomiaru czasu, głównym źródłem niepewności nie jest trudność w określeniu położenia wskazówki, ale raczej nasz nieznany czas reakcji na początek i koniec pomiaru. Błędy takiego rodzaju mogą być czasem wiarygod nie ocenione, jeśli pomiar można powtarzać wiele razy. Przypuśćmy na przykład, że dokonaliśmy pojedynczego pomiaru okresu długiego wahadła i otrzymaliśmy rezultat 2,3 sekundy. Po jednym pomiarze nie potrafimy powiedzieć zbyt wiele o niepewności pomiaru. Jeśli jednak powtórzyliśmy pomiar i otrzymaliśmy wynik 2,4 sekundy, możemy natychmiast stwierdzić, że błąd pomiarowy jest prawdopodobnie rzędu 0,1 sekundy. Jeśli sekwencja czterech pomiarów daje rezultaty (w sekundach): 2,3; 2,4; 2,5; 2,4,
(1.3]
możemy zacząć wykonywać pewne zupełnie sensowne oszacowania. Po pierwsze, naturalne jest założenie, że najlepszym przybliżeniem okresu jest wartość średnia, 2,4 sekundy. Po wtóre, całkiem bezpieczne wydaje się przyjęcie, że właściwy okres mieść się gdzieś pomiędzy wartością najmniejszą 2,3 oraz największą 2,5. W ter sposób możemy stwierdzić, że: 2
2
W rozdziale 5 udowodnimy, że najlepsze oszacowanie oparte na wynikach wielu pomiarów pewnej wielkości jest prawie zawsze średnią z wyników pomiarów.
24
najlepsze przybliżenie = średnia = 2,4 sekundy, (1.4)
prawdopodobny zakres od 2,3 do 2,5 sekundy. Ilekroć możemy wielokrotnie powtórzyć ten sam pomiar, tylekroć rozrzut otrzymanych wyników daje cenną wskazówkę na temat jego niepewności pomiarowej. W rozdziałach 4 i 5 przedyskutujemy statystyczne metody obrób ki takich wielokrotnych pomiarów. W odpowiednich warunkach metody te dają bardziej dokładne oszacowanie błędu niż to, które określiliśmy w rów naniu (1.4), posługując się jedynie zdrowym rozsądkiem. Odpowiednia analiza statystyczna danych ma również walor obiektywnej oceny błędu pomiarowe go, niezależnej od indywidualnej opinii obserwatora . Mimo to przybliżenie (1.4) stanowi prosty i rozsądny wynik dający się wysnuć z czterech pomiarów (1.3). 3
Nie zawsze można jednak polegać na tym, że wielokrotne pomiary, jak (1.3), ujawniają niepewność pomiaru. Po pierwsze, musimy być pewni, że wielkość, jaką mierzymy, jest za każdym razem rzeczywiście tą samą wielkoś cią. Przypuśćmy na przykład, że mierzymy wytrzymałość na rozerwanie dwóch rzekomo identycznych drutów przez ich przerywanie (czasem nie można zrobić tego więcej niż raz na każdym drucie). Jeśli dostajemy dwa różne wyniki, różnica ta może sugerować niepewność naszych pomiarów lub oznaczać, iż druty nie były naprawdę identyczne. Swoją drogą różnica między takimi dwoma wynikami nie rzuca żadnego światła na kwestię wiarygodności naszych pomiarów. Wielokrotne pomiary nie zawsze ujawniają błąd pomiarowy nawet wów czas, gdy możemy być pewni, że za każdym razem mierzymy tę samą wielkość. Przypuśćmy na przykład, że zegar, który dał wynik (1.3), spieszył się stale 5%. Wówczas wszystkie czasy zmierzone za jego pomocą będą o 5% za długie i dowolna liczba powtórzeń tego pomiaru (tym samym stoperem) nie ujawni tego faktu. Błędy tego rodzaju, którymi obarczone są w taki sam sposób wszystkie pomiary, nazywamy błędami systematycznymi i, jak przedyskutuje my w rozdziale 4, potrafią być trudne do wykrycia. W naszym przykładzie rozwiązaniem byłoby sprawdzenie naszego stopera za pomocą innego, bardziej wiarygodnego. Ogólniej, powinno być jasne, że jeśli są powody, aby wątpić
3
Właściwa obróbka statystyczna daje także zwykle mniejszy błąd niż cały zakres od najmniej szej do największej zaobserwowanej wartości. Tak więc, patrząc na cztery czasy (1.3), osądziliśmy, że okres jest „prawdopodobnie" gdzieś pomiędzy 2,3 s a 2,4 s; metody statystyczne z rozdziałów 4 i 5 pozwalają nam stwierdzić, że z 70% ufnością okres ten leży w mniejszym zakresie, od 2,36 s do 2,44 s.
25
w wiarygodność jakiegokolwiek urządzenia pomiarowego (zegara, taśmy mier niczej, woltomierza), powinno się spróbować je sprawdzić za pomocą innego, o którym wiadomo, że jest bardziej wiarygodne. Przykłady dyskutowane w tym i poprzednim paragrafie pokazują, że błędy pomiarowe można czasem łatwo oszacować. Z drugiej jednak strony jest wiele pomiarów, których błędy nie są tak proste do oceny. Tak więc ostatecznie będziemy potrzebować bardziej precyzyjnych wartości błędu pomiarowego, niż mogą nam dać proste - właśnie przedyskutowane - szacunki. Zagadnienia te zajmą nas począwszy od rozdziału 3. W rozdziale 2 założymy, że wiemy, jak oceniać błąd wszystkich wielkości, które mierzymy, tak więc możemy przedys kutować, jak najlepiej podawać błędy pomiarowe i jak z nich korzystać przy wyciąganiu wniosków z eksperymentu.
R O Z D Z I A Ł
2
JAK PRZEDSTAWIAĆ NIEPEWNOŚCI POMIAROWE I JAK Z NICH KORZYSTAĆ
Mamy już jakieś wyobrażenie o tym, jak istotne są niepewności pomiarowe i skąd się one biorą. Wiemy także, jak w niektórych nieskomplikowanych sytuacjach można je szacować. W niniejszym rozdziale przedstawimy niektóre podstawowe pojęcia i reguły z dziedziny rachunku błędów oraz damy parę przykładów ich zastosowania w kilku doświadczeniach, typowych dla pra cowni wstępnej. Naszym głównym celem jest zapoznanie Czytelnika z pod stawowym słownictwem z dziedziny rachunku błędów i ze sposobami jego wykorzystania w trakcie ćwiczeń na pracowni. Następnie, począwszy od rozdziału 3, będziemy gotowi, aby poznać, jak w praktyce obliczać niepewno ści eksperymentalne. W paragrafach od 2.1 do 2.3 zdefiniujemy niektóre podstawowe pojęcia rachunku błędów i przedyskutujemy pewne ogólne reguły prezentacji niepew ności. W paragrafach od 2.4 do 2.6 rozważać będziemy, jak zastosować owe pojęcia w kilku typowych doświadczeniach na wstępnej pracowni fizycznej. Wreszcie w paragrafach od 2.7 do 2.9 wprowadzimy jeszcze jedną podstawową definicję - niepewności względnej i przedyskutujemy jej znaczenie.
2.1. Najlepsze przybliżenie + niepewność Zobaczyliśmy już, że właściwym sposobem prezentacji wyników doświadczeń jest podawanie najlepszego przybliżenia wielkości mierzonej oraz zakresu, w którym owa wielkość leży. N a przykład wynik pomiaru czasu, o którym była mowa w paragrafie 1.6, wyglądał następująco:
27
-\
najlepsze przybliżenie czasu = 2,4 s, (2.1 prawdopodobny zakres od 2,3 s do 2,5 s. W tym przypadku, tak jak we wszystkich naszych przykładach, najlepsz przybliżenie, 2,4 s, leży pośrodku szacowanego zakresu wartości prawdopo dobnych od 2,3 s do 2,5 s. Fakt ten wydaje się całkiem naturalny i odnosi si do prawie wszystkich pomiarów. Umożliwia on wyrażanie wyników pomiaro wych w bardzo zwartej formie. Na przykład wynik pomiaru czasu, tak ja w przykładzie (2.1), zwykle zapisywany jest następująco: (2.:
mierzona wartość czasu = 2,4 + 0,1 s.
Równanie to jest dokładnie równoważne dwóm stwierdzeniom (2.1). W ogólności wynik jakiegokolwiek pomiaru wielkości x podawany jes w następujący sposób:
(wartość zmierzona x) = x
n p
(2.;
+ 8x.
Stwierdzenie to oznacza, po pierwsze, że najlepszym przybliżeniem wartoś mierzonej jest według eksperymentatora liczba x , i po wtóre, że z rozsądny prawdopodobieństwem szukana wielkość znajduje się gdzieś pomięd; x —Sx i x + Sx. Liczba Sx zwana jest niepewnością lub błędem pomiaru Wygodnie jest zawsze definiować 8x jako wielkość dodatnią, tak aby x + c było zawsze największą prawdopodobną wartością wielkości mierzom a x —8x było jej wartością najmniejszą. n p
n p
n p
n p
n p
Celowo nie sprecyzowaliśmy znaczenia zakresu od x — 8x do x + c Czasami potrafimy wyrazić to bardziej dokładnie. W tak prostym doświadczeń jak pomiar wysokości futryny łatwo można określić zakres od x —8x < x + Sx, w którym na pewno mieści się szukana wartość. Niestety w większo: pomiarów naukowych bardzo trudno sformułować taki wniosek. W szczególn ści, jeśli pragniemy być zupełnie pewni, że mierzona wielkość leży pomięd x —8x i x + 8x, musimy wybrać zwykle taką wartość 8x, że staje się o całkiem bezużyteczna. Aby tego uniknąć, wybieramy czasami taką wartość < żeby powiedzmy w 70% być pewnym, że szukana wielkość jest gdzieś mięc x —8x i x + 8x. Jasne jest jednak, że nie możemy tego zrobić bez szczegóło\ znajomości praw statystyki, rządzących procesem pomiaru. Powrócimy do te zagadnienia w rozdziale 4. Na razie zadowólmy się zdefiniowaniem niepewno Sx jako takiej, dla której z „rozsądnym prawdopodobieństem" można powiedzi że mierzona przez nas wielkość leży gdzieś pomiędzy x —8x i x + 8x. n p
n p
n p
n p
n p
n p
n p
n p
n p
28 *
n p
2.2. Cyfry znaczące Warto podkreślić pewne podstawowe zasady podawania niepewności pomia rowych. Po pierwsze, ponieważ 8x jest szacunkową niepewnością, zatem nie powinno się jej podawać ze zbyt wielką dokładnością. Jeśli mierzymy przy spieszenie ziemskie g, byłoby absurdem podawanie odpowiedzi w postaci: 2
(zmierzone g) = 9,82 + 0,02385 m / s .
(2.4)
Trudno sobie wyobrazić, aby niepewność pomiarowa mogła być znana z do kładnością czterech cyfr znaczących. Przy bardzo dokładnych pomiarach można czasem podawać niepewności z dwiema cyframi znaczącymi, jednak na potrzeby pracowni wstępnej możemy przyjąć następującą regułę : 1
Reguła podawania niepewności N a pracowni wstępnej niepewności eksperymentalne powinny być zwykle zaokrąglane do jednej cyfry znaczącej.
(2.5)
2
Tak więc, jeśli z jakichś rachunków otrzymujemy niepewność 8g = 0,02385 m/s , wynik ten powinien być zaokrąglony do dg = 0,02 m/s , rezultat pomiaru zaś należy przepisać w postaci 2
2
(zmierzone g) = 9,82 + 0,02 m / s .
(2.6)
Ważną praktyczną konsekwencją tej reguły jest fakt, iż wielokroć obliczenia błędów można wykonywać w pamięci, bez pomocy kalkulatora czy nawet ołówka i papieru. Od reguły (2.5) jest tylko jeden istotny wyjątek. Otóż jeśli pierwszą cyfrą znaczącą niepewności 8x jest 1, to lepiej zachować w 8x dwie cyfry znaczące zamiast jednej. Przypuśćmy na przykład, że nasze obliczenia dają niepewność bx = 0,14. Zaokrąglenie tej wartości do 8x = 0,1 prowadziłoby do 40% zmniejszenia niepewności, można zatem dowodzić, że mniej mylące byłoby pozostawienie dwóch cyfr znaczących, czyli Sx = 0,14. Ten sam argument można by ewentualnie zastosować, kiedy pierwszą cyfrą znaczącą jest 2, nie działa ona jednak dla cyfr większych.
1
Dla wygody Czytelnika reguły te będą numerowane tak jak równania. Niektóre z nich będą
zawierały równania, inne zaś nie.
29
Kiedy już oceniliśmy niepewność pomiaru, należałoby się zastanowić, któi z cyfr wartości zmierzonej są znaczące. Wynik zapisany jako zmierzona prędkość = 6051,78 + 30 m/s
(2.'
jest wprost niedorzeczny. Niepewność 30 oznacza, że cyfra na trzecim miejsc liczby 6051,78 (a więc 5) mogłaby być w rzeczywistości równa 2 lub 8. Jasr jest zatem, że ostatnie cyfry 1, 7 oraz 8 nie mają zupełnie znaczenia i powinri zniknąć po zaokrągleniu. Poprawny zapis wyniku (2.7) powinien zatem w; glądać następująco: zmierzona prędkość = 6050 + 30 m/s.
{2..
Ogólna reguła może przyjąć następującą formę:
Reguła podawania odpowiedzi Ostatnia cyfra znacząca w każdym wyniku powinna zwykle być tego samego rzędu (stać na tym samym miejscu dziesiętnym) co niepewność
(2.
N a przykład wynik 92,81 z niepewnością 0,3 powinien być zaokrąglony do 92,8 + 0,3. Jeśli niepewność równa jest 3, to ten sam rezultat należałoby zapisać jako 93 ± 3 , jeśli zaś niepewność wynosi 30, to odpowiedź powinna brzmieć 90 ± 3 0 . Liczby używane w obliczeniach powinny mieć jednak generalnie jed, cyfrę znaczącą więcej niż te podawane ostatecznie. Zmniejsza to niedokładn ści wprowadzane podczas zaokrąglania liczb. Końcowy wynik powinien b zaokrąglony tak, aby usunąć tę dodatkową (i nieznaczącą) cyfrę. 2
2
Jest jeszcze jeden wyjątek od reguły (2.9). Jeśli pierwsza cyfra niepewności jest mala (1 1 być może 2), to mogłoby być właściwe pozostawienie w odpowiedzi jeszcze jednej cyfry znacząi Przykładowo, wynik taki jak zmierzona długość = 27,6 + 1 cm jest zupełnie rozsądny. W tym przypadku należałoby się zgodzić, że jego zaokrąglenie do 28 powodowałoby utratę informacji.
30
*
Zwróćmy uwagę, że wymiar niepewności jakiejkolwiek mierzonej wielkości est taki sam jak wymiar owej wielkości. Zapis, w którym jednostki (m/s , c m itd.) pojawiają się tylko na końcu wyniku (po najlepszym przybliżeniu i niepe wności, tak jak w równaniach (2.6) i (2.7)), będzie zatem bardziej czytelny : ekonomiczny. W ten sam sposób, jeśli mierzona wartość jest tak duża bądź mała, że wymaga zastosowania zapisu wykładniczego (tj. użycia formy 3 • 10 zamiast 3000), to prościej i czytelniej jest podać odpowiedź i niepewność w tej samej formie. Przykładowo wynik 2
2
3
zmierzony ładunek = (1,61 ± 0 , 0 5 ) - 1 0 "
19
C
jest o wiele prostszy do odczytania i zrozumienia, niż gdyby był zapisany w następującej postaci:
1 9
2 1
zmierzony ładunek = 1,61 • 1 0 " + 5 • 1 0 " C .
2.3. Rozbieżność Zanim zapytamy, jak używać niepewności w sprawozdaniach na pracowni, należy wprowadzić i zdefiniować kilka ważnych pojęć. Po pierwsze, jeśli dwa pomiary tej samej wielkości nie zgadzają się ze sobą, mówimy o rozbieżności. Liczbowo zdefiniujemy rozbieżność pomiędzy wynikami dwóch pomiarów jako ich różnicę rozbieżność = różnica pomiędzy dwoma wynikami pomiarów tej samej wielkości.
Istotne jest rozróżnienie sytuacji, gdy rozbieżność jest lub nie jest znacząca. Jeśli dwóch studentów mierzy ten sam opór i dostaje wyniki odpowiednio 40 + 5 omów i 42 + 8 omów, to rozbieżność 2 omów jest mniejsza niż ich niepewność pomiarowa, tak więc widać, że pomiary są spójne. Powiedzielibyśmy, iż w tym przypadku rozbieżność nie jest znacząca. Z drugiej strony, jeśli otrzymane wyniki wynosiłyby
31
35 + 2 omów i 45 + 1 omów, to oba pomiary byłyby w oczywisty sposób niespójne, a rozbieżność 10 omóv byłaby znacząca. W takim przypadku należałoby nieco uwagi poświęcił zbadaniu źródeł tej rozbieżności. N a pracowni wstępnej mierzy się często wielkości, które były przedten wielokrotnie precyzyjnie mierzone (jak prędkość światła c, czy ładunek elek tronu e) i których bardzo dokładne wartości uznane można znaleźć w podręcz nikach. Wartości te, będąc wynikami pomiarów, nie są oczywiście pozbawion niepewności. Niemniej jednak w wielu przypadkach wartość uznana jes o wiele bardziej dokładna, niż mogłaby być wyznaczona przez samego studen ta. Przykładowo aktualnie uznana wartość prędkości światła c równa jest (uznana wartość c) = 299 792 458 + 1 m/s.
(2.11
Jak tego oczekiwaliśmy, wartość ta jest obarczona niepewnością, choć niepewnoś ta jest - jak na warunki większości pracowni studenckich - ekstremalnie mała. Chociaż istnieje wiele eksperymentów, polegających na pomiarze wielkość której wartość akceptowana jest znana, jest także pewna, bardzo niewielka, klas doświadczeń o znanej prawdziwej odpowiedzi. W rzeczywistości prawdziwa wai tość wielkości mierzonej prawie nigdy nie jest znana dokładnie i prawdę mówią jest ona trudna do zdefiniowania. Mimo to, czasem korzystnie jest dyskutowa różnicę pomiędzy pewną wartością mierzoną i odpowiednią wartością prawdziw; niektórzy autorzy zaś różnicę tę nazywają błędem prawdziwym. 3
4
2.4. Porównanie wartości zmierzonych i wartości uznanych Przeprowadzanie doświadczenia, z którego nie wyciągałoby się pewnego wni< sku jest mało celowe. Tylko bardzo niewiele eksperymentów daje główn jakościowe wyniki. Jest tak w przypadku obserwacji wzorów interferencyjnyc 3
Nie zawsze tak jest. Jeśli ktoś na przykład szuka w tablicach współczynika załamania świa: dla szkła, znajdzie wartości z zakresu od 1,5 do 1,9. Odpowiadają one różnym rodzajom szk Jeśli w doświadczeniu mamy zmierzyć współczynnik załamania szkła o nieznanym składz wartość „uznana" będzie tylko bardzo zgrubnie wskazywać na wielkość szukanego wyniku. Ponieważ Czytelnik mógłby mieć pewne kłopoty z wymyśleniem takiego eksperymen podamy jeden przykład. Jeśli mierzy się stosunek długości obwodu koła do jego średnicy, prawdziwym wynikiem jest dokładnie %. Jest jasne, że doświadczenia tego typu są nieco wyduma: 4
32
Tworzonych przez fale na powierzchni wody czy też badania barwy światła przechodzącego przez pewien układ optyczny. Olbrzymia większość doświad czeń prowadzi do wyników ilościowych, a więc do ustalenia pewnych liczb. Należy podkreślić, że podanie pojedynczej wartości zmierzonej wcale nie jest interesujące. Fakt, że gęstość pewnego metalu została określona jako 9.3 + 0,2g/cm , czy też, że pęd wózka wynosił 0,051+0,004 kg m/s, same w sobie nie mają znaczenia. Formułowany wniosek musi zawierać porów nanie dwu lub więcej liczb: wyniku pomiaru z wartością uznaną, wyniku pomiaru z wartością przewidywaną teoretycznie, czy też wyników wielu pomiarów, aby sprawdzić ich związek z pewnym prawem fizycznym. W trak cie dokonywania porównań dużą rolę odgrywa rachunek błędów. W tym i w następnych dwóch paragrafach omówimy trzy typowe doświadczenia, które zilustrują, jak oszacowane niepewności są wykorzystywane do for mułowania wniosków. 3
Najprostszym typem doświadczenia jest pomiar wielkości, której uznaną wartość znamy. Jak już powiedzieliśmy, jest to nieco sztuczny eksperyment, szczególnie w ramach pracowni wstępnej. W takim doświadczniu mierzy się pewną wielkość, ocenia jej niepewność pomiarową, a następnie porównuje się je z wartością uznaną. Tak więc doświadczenie polegające na pomiarze prędkości dźwięku w powietrzu (w warunkach normalnych) mogłoby dopro wadzić do stwierdzenia, że zmierzona prędkość = 329 + 5 m/s,
(2.12)
uznana wartość prędkości = 331 m/s.
(2.13)
podczas gdy
Prawdopodobnie student skomentowałby ten wynik liczbowy stwierdzeniem, że uznana wartość prędkości mieści się w zakresie oszacowanym na podstawie pomiaru, zatem jego wynik można uznać za zadowalający. Wyczerpywałoby to opis jego doświadczenia. Niepewność 8x oznacza tyle, że właściwa wartość x „prawdopodobnie" zawiera się w zakresie od x —Sx do x + Sx. Jest jednak możliwe, że wartość ta leży nieco poza tym zakresem. Tak więc wynik eksperymentu można by uznać za zadowalający nawet wówczas, gdyby wartość uznana leżała odrobinę poza oszacowanym zakresem wartości zmierzonej. Przykładowo zmierzoną wartość 325 + 5 m/s można by przyjąć jako zgodną z wartością uznaną 331 m/s. Z drugiej strony, jeśli wartość uznana jest sporo poza oszacowanym zakresem (czyli rozbieżność jest dużo większa niż podwojona niepewność), to istnieją uzasadnione obawy, aby sądzić, że coś się nie udało. Tak więc niefortunny eksperymentator, który znalazł n p
n p
33
zmierzoną prędkość = 345 ± 2 m/s,
(2.14
uznana wartość = 331 m/s,
(2.15
w sytuacji gdy
będzie musiał szukając źródeł omyłki, sprawdzić swoje pomiary i obliczenia. Niestety tropienie własnego błędu potrafi być zajęciem dość nudnym, gdy istnieje wiele możliwych przyczyn jego powstania. Mógł on wystąpić n poziomie pomiaru lub obliczeń, które doprowadziły do wartości 345 m/i Niewłaściwie mogła zostać oszacowana niepewność pomiarowa. (Wyni 345 + 1 0 m/s można by już zaakceptować.) Wynik pomiaru mógł wreszcie by porównywany z niewłaściwą wartością uznaną. N a przykład wartość 331 m, jest tablicową prędkością dźwięku w warunkach normalnych. Oznacza t temperaturę 0°C i ciśnienie 760 mm Hg. Istnieje więc możliwość, że pomić (2.14) nie został przeprowadzony w takiej temperaturze. Istotnie, jeśli pomi; wykonano w 20°C (a więc w normalnej temperaturze pokojowej), to właściw wartość uznana prędkości dźwięku byłaby równa 343 m/s i wynik pomiai byłby w zupełności zadowalający. W końcu (i być może najprawdopodobniej) rozbieżność taka, jak ta pomięd; rezultatami (2.14) i (2.15), może wskazywać na pewne nie wykryte źródło błędć systematycznych (jak stale późniący się zegar z rozdziału 1). Wykrycie takii systematycznych błędów (błędów, które konsekwentnie wpływają na wyni w taki sam sposób) będzie wymagać uważnego sprawdzenia kalibracji wszystki instrumentów i dokładnego przeglądu wszystkich stosowanych procedur.
2.5. Porównanie dwu wartości zmierzonych W wielu doświadczeniach mierzy się dwie wartości, które zgodnie z teo: powinny być sobie równe. Zasada zachowania pędu, na przykład, mówi, całkowity pęd układu izolowanego jest stały. Aby to sprawdzić, moglibyśi przeprowadzić serię eksperymentów, w których zderzałyby się dwa wó: poruszające się bez tarcia na torze powietrznym. Moglibyśmy mierzyć c kowity pęd wózków przed zderzeniem (p) oraz ich pęd po zderzeniu ( i sprawdzać, czy z dokładnością do niepewności pomiarowej p = p'. Dla jed pary pomiarów nasz wynik mógłby wyglądać następująco: pęd początkowy p = 1,49 + 0,04 kg-m/s oraz pęd końcowy p' = 1,56 + 0,06 kg-m/s.
34
W tym przypadku zakresy, w których prawdopodobnie mieszczą się wartości p (od 1,45 do 1,53) i p' (od 1,50 do 1,62), przekrywają się. Tak więc ten wynik pomiaru jest zgodny z zasadą zachowania pędu. Z drugiej strony, jeśli dwa prawdopodobne zakresy nie byłyby nawet bliskie przekrycia, to nasz wynik byłby niezgodny z zasadą zachowania pędu. W takim przypadku musielibyś my szukać błędu w naszym pomiarze lub obliczeniach, możliwych błędów systematycznych bądź zbadać możliwość wpływu sił zewnętrznych (siły ciężko ści lub tarcia) na zmianę pędu naszego układu. Przypuśćmy, że powtarzamy pomiary wielokrotnie. W jaki sposób naj lepiej przedstawić wyniki? Po pierwsze, prawie zawsze najlepiej notować wyniki szeregu podobnych pomiarów w tabeli, a nie jako osobne zapisy. Po drugie, często niepewność pomiarowa nie zmienia się zbytnio od pomiaru do pomiaru. Możemy przykładowo uznać, że we wszystkich pomiarach począt kowego pędu p niepewność pomiarowa równa jest m 0,04 kg • m/s, w po miarach zaś pędu końcowego p' niepewność równa jest 8p' « 0,06 kg-m/s. Jeśli tak zrobimy, to dobrą metodą prezentacji wyników byłaby tabela 2.1. Dla każdej pary pomiarów, prawdopodobny zakres wartości p przekrywa się (lub jest bliski przekrycia) z zakresem wartości p'. Jeśli będzie to prawdą dla wszystkich pomiarów, możemy nasze wyniki uznać za zgodne z zasadą zachowania pędu. Tabela 2.1. Zmierzone pędy (wszystkie w kg-m/s) Pęd początkowy p (wszystkie ±0,04)
Pęd końcowy p' (wszystkie ±0,06)
1,49 2,10 1,16 itd.
1,56 2,12 1,05 itd.
Po chwili namysłu możemy nasze wyniki zaprezentować tak, aby uczynić ten wniosek jeszcze bardziej czytelnym. W naszym przykładzie zasada za chowania pędu wymaga, aby różnica p—p' była równa zeru. Jeśli dodamy do tabeli kolumnę pokazującą p—p', to wszystkie pozycje w tej kolumnie powin ny mieć wartości w pobliżu zera. Jedyną trudnością jest konieczność wy znaczenia niepewności różnicy p — p'. Można to jednak z łatwością uczynić. Przypuśćmy, że wykonaliśmy pomiary (mierzona wartość p) = p ± o p n p
oraz (mierzona wartość p') =
p' ±dp'. np
35
Wartości p i p' są naszymi najlepszymi przybliżeniami p i p'. Tak wię najlepszym przybliżeniem różnicy p—p' jest p —p' Aby znaleźć niepewnoś wartości p—p', musimy zdecydować się, jaka jest największa i najmniejsz możliwa wartość p—p'. Największa możliwa wartość p — p' byłaby osiągnięte gdyby p miało swą największą prawdopodobną wartość p + bp, a p' miałi wartość najmniejszą, czyli p ' — bp'. Zatem największa możliwa wartość p —; równa jest: n p
nv
np
nv
np
np
największa możliwa wartość = (p — p' ) + ( bp + bp'). np
np
(2.16
Podobnie najmniejsza możliwa wartość powstaje wtedy, kiedy p jest najmniej sze (pn — bp), a p' największe (p' + bp'). Daje to P
np
najmniejszą możliwą wartość = ( p — p'n ) — {bp + bp'). n p
V
(2.11
Wiążąc wyniki (2.16) i (2.17) widzimy, że niepewność różnicy p—p' jest sum bp + bp' pierwotnych niepewności. Na przykład jeśli p = 1,49 + 0,04 kg-m/s oraz p' = 1,56 + 0,06 kg-m/s to p-p'
= - 0 , 0 7 + 0,1 kg-m/s.
Możemy teraz do tabeli 2.1 dodać jeszcze, jedną kolumnę z wrtosciarc (V ~ v'\ tworząc tym samym tabelę 2.2. Teraz na pierwszy rzut oka widać, cz nasze wyniki są spójne z zasadą zachowania pędu. Można to sprawdzi patrząc, czy liczby w ostatniej kolumnie są w przybliżeniu równe zeru (czy czy są mniejsze lub porównywalne z niepewnością 0,1). Inną metodą osiąj nięcia takiego samego efektu byłoby umieszczenie w tabeli stosunków p'/\ które musiałyby być zgodne z wartością p'/p = 1. ( W tym przypadku musiel byśmy umieć obliczyć niepewność ilorazu p'/p, z czym zapoznamy się w ro; dziale 3). Tabela 2.2. Zmierzone pędy (wszystkie w kg • m/s)
36
Pęd początkowy p (wszystkie +0,04)
Pęd końcowy p' (wszystkie ±0,06)
Różnica p — p' (wszystkie ±0,1)
1,49 2,10 1,16 itd.
1,56 2,12 1,05 itd.
-0,07 -0,02 0,11 itd.
Nasze rozważania o niepewności p — p' stosują się w oczywisty sposób do różnicy dowolnych wartości zmierzonych. Możemy zatem ustalić następującą : g o l n ą regułę:
Niepewność różnicy Jeśli wielkości x i y są zmierzone z niepewnościami 5x i by, i jeśli zmierzone wartości x i y używane są do wyznaczenia różnicy
Lżyliśmy znaku przybliżonej równości, aby uwypuklić dwa problemy. Po pierwsze, nie mamy jeszcze precyzyjnej definicji niepewności o jakich mowa; ryłoby zatem absurdalne stwierdzenie, że bq jest dokładnie równe bx + by. Po rrugie, jak zobaczymy w paragrafie 3.4, niepewność bq jest często nieco mniejsza niż określona w równaniu (2.18); lepszym jej przybliżeniem jest pierwiastek z sumy kwadratów bx i by (patrz równanie (3.13)). Tak więc znak „ « " w regule (2.18) ma służyć jako przypomnienie, że później zastąpimy ją innym, lepszym przybliżeniem. Wynik (2.18) jest pierwszym z szeregu reguł dotyczących przenoszenia rłędu. Kiedy obliczamy wielkość q, używając do tego mierzonych wartości x i y, musimy wiedzieć, w jaki sposób niepewności x i y „przenoszą się" na niepewność wartości q. Pełną dyskusję zagadnienia przenoszenia błędu przed stawimy w rozdziale 3.
2.6. Graficzne sprawdzanie proporcjonalności Wiele praw fizycznych zakłada, że jedna wielkość powinna być proporcjonalna i : innej. Prawo Hooke'a mówi, że wydłużenie sprężyny jest proporcjonalne do -iieiągającej ją siły; druga zasada dynamiki Newtona głosi, że przyspieszenie rriła jest proporcjonalne do działającej nań siły; to tylko dwa spośród niezliczonej liczby przykładów. Wiele doświadczeń na pracowni wstępnej :iprojektowano po to, aby sprawdzić tego rodzaju proporcjonalności. Jeżeli pewna wielkość y jest proporcjonalną do innej wielkości x, to •iresem zależności y(x) jest linia prosta przechodząca przez początek układu mołrzędnych. Tak więc proporcjonalność y do x można sprawdzić rysując -ykres zmierzonych wartości y jako funkcję zmierzonych wartości x i badając,
37
czy punkty te leżą na prostej przechodzącej przez początek układu współrzęd nych. Ponieważ linię prostą daje się bez trudu rozpoznać, tak więc jest to łatwj i skuteczny sposób potwierdzania proporcjonalności. Chcąc zilustrować sposób takiego użycia wykresu, wyobraźmy sobie do świadczenie sprawdzające prawo Hooke'a. Prawo to zwykle zapisywane w po staci F = kx głosi, że wydłużenie sprężyny x jest proporcjonalne do siły F która ją rozciąga, x = F/k, gdzie k jest współczynnikiem sprężystości. Prostyn sposobem sprawdzenia tej zależności jest zawieszanie obciążników o różnycl masach m. W takim przypadku siła F jest ciężarem mg obciążnika: tak wię< wydłużenie sprężyny powinno być równe (2.19 Wydłużenie powinno być proporcjonalne do masy obciążnika m, a wykre zależności x od m powinien być prostą przechodzącą przez początek układi współrzędnych. Jeśli mierzymy x dla różnych obciążników m i zaznaczamy punkt; 0 współrzędnych równych zmierzonym wartościom x i m, jest bardzo mał< prawdopodobne, że będą one leżały dokładnie na prostej. Przypuśćmy n; przykład, że mierzymy wydłużenie sprężyny dla ośmiu różnych obciążei 1 dostajemy wyniki zebrane w tabeli 2.3. Punkty o współrzędnych odpowiada jących tym wartościom przedstawiono są na rys. 2.la, gdzie pokazano takż prostą przecinającą początek układu współrzędznych i przechodzącą stosun kowo blisko wszystkich ośmiu punktów. Jak powinniśmy się tego spodziewać nasze punkty nie leżą dokładnie na żadnej prostej. Problem polega na tym, cz jest to wynik niepewności pomiarowych (na co mamy nadzieję), naszej omyłk czy też może faktu, że wydłużenie x nie jest proporcjonalne do m. Aby ti rozstrzygnąć, musimy wziąć pod uwagę nasze niepewności. Tabela 2.3. Obciążenie i wydłużenie Obciążenie m (g) (8m zaniedbywalne) Wydłużenie x (cm) (wszystkie ±0,3)
200
300
400
500
600
700
800
900
1,1
1,5
1,9
2,8
3,4
3,5
4,6
5,4
Jak zwykle wartości zmierzone: wydłużenia x i masy m są obarczon pewnymi niepewnościami. Dla prostoty załóżmy na początek, że użyte masy s znane bardzo dokładnie, tak więc niepewność m jest pomijalnie mała. Przypi śćmy także, że wszystkie pomiary x mają niepewność około 0,3 cm ( ja pokazuje to tabela 2.3). N a przykład po zawieszeniu obciążnika o masie 200
38
jej wydłużenie prawdopodobnie będzie równe 1,1 ±0,3 cm. Zatem nasz pierw szy punkt pomiarowy leży na linii pionowej m = 200 g, gdzieś pomiędzy x = 0,8 i x = 1,4 cm. Pokazano to na rys. 2.1b, gdzie zaznaczyliśmy pionową kreską granicę błędu, która dla każdego punktu wskazuje zakres, w jakim prawdopodobnie mieści się wartość zmierzona. Oczywiście powinniśmy ocze kiwać, że możliwe będzie przeprowadzenie linii prostej przecinającej początek układu współrzędnych, która przechodzi przez wszystkie zaznaczone granice błędów lub leży blisko nich. N a rysunku 2.1b jest taka prosta, zatem możemy stwierdzić, że dane, na podstawie których narysowano pokazany tu wykres, są zgodne z założeniem, iż x jest proporcjonalne do m.
Rysunek 2.1. Trzy wykresy zależności wydłużenia sprężyny od obciążenia m. a) Dane z tabeli 2.3 bez oznaczonych granic błędu, b) Te same dane z granicami błędu wskazującymi na niepewności •wyznaczenia x. (Przyjęto, że niepewności wyznaczenia m są zaniedbywalne.) Przedstawione dane ;ą zgodne ze spodziewaną proporcjonalnością x do m. c) Inny zestaw wyników, który nie zgadza się z założeniem o proporcjonalności x do m
39
Jak wynika z równania (2.19), tangens kąta nachylenia prostej, będącej wy kresem funkcji x(m) jest równy g/k. Mierząc nachylenie prostej z rys. 2.Ib, możemy zatem znaleźć współczynnik sprężystości k. Rysując proste o najwięk szym i najmniejszym nachyleniu, które w miarę dobrze pasują do zaznaczonych punktów, moglibyśmy także określić niepewność wartości k (patrz zadanie 2.8). Jeśli najlepiej dopasowana prosta omija dużą część zaznaczonych granic błędów lub mija jakąkolwiek z nich w dużej odległości (w porównaniu z granicą błędu), oznacza to, że wyniki nasze są niespójne z twierdzeniem o proporcjonalności x do m. Sytuację taką ilustruje rysunek 2.1c. N a pod stawie wyników tam przedstawionych musielibyśmy powtórnie sprawdzić nasze doświadczenie i rachunki (włączając obliczenia niepewności), i rozważyć, czy istnieje jakaś przyczyna, dla której x nie jest proporcjonalne do m. Jak dotąd przyjmowaliśmy, że niepewność wyznaczenia masy (zaznaczanej na osi odciętych) jest pomijalnie mała, niepewnościami zaś obarczone są jedynie pomiary x, co pokazują pionowe kreski granic błędów. Jeśli zarówno x jak i m obarczone są liczącymi się niepewnościami, jest wiele sposobów, aby to pokazać. Najprostszym jest narysowanie dla każdego punktu zarównc pionowej, jak i poziomej kreski o długości odpowiadającej danej niepewności. Pokazano to na rys. 2.2. Każdy krzyżyk na przedstawionym tam wykresie odpowiada jednemu pomiarowi x oraz m i oznacza, że x prawdopodobnie leży w granicach wyznaczonych przez ramię pionowe, m zaś znajduje się wewnątrz przedziału oznaczonego przez ramię poziome.
Rysunek 2.2. Pomiary x i m z niepewnościami można przedstawić rysując dla każdego punkti krzyżyk pokazujący granicę błędu dla x i dla m
Kiedy spodziewamy się, że jedna wielkość fizyczna jest proporcjonalna dc pewnej potęgi innej wielkości, wówczas powstaje nieco bardziej skomplikowa na sytuacja. Weźmy pod uwagę drogę x przebytą przez ciało w czasie t podczas swobodnego spadku. Droga ta równa x = j.gt jest proporcjonalm do kwadratu czasu t. Jeśli narysujemy wykres zależności x od t, to punkt] doświadczalne będą leżeć na paraboli. Jednak trudno na oko ocenić, czy zbiói punktów leży na paraboli ( lub na innej krzywej poza prostą). O wiele lepie 2
40
2
2
zauważyć, że jeśli xoct , to wykres zależności x od t powinien być linią prostą przechodzącą przez początek układu współrzędnych. Taki wykres umożliwi nam sprawdzenie, czy nasze dane leżą na prostej czy też nie, dokładnie w taki sam sposób jak w poprzednim przypadku. Podobnie, gdy x jest proporcjonalne do funkcji wykładniczej e (gdzie A jest pewną stałą), wtedy linią prostą powinien być wykres zależności ln(x) od t. Taki wykres pozwoli nam łatwo sprawdzić czy x oc e . (Omówimy tę sprawę dokładniej •v rozdziale 8.) At
At
Istnieją też inne niż graficzne metody sprawdzania proporcjonalności dwóch wielkości. N a przykład jeśli x ~ m, to stosunek x/m powinien być stały. Do tabeli z wartościami x i m można by dodać po prostu jeszcze jedną kolumnę lub wiersz, pokazującą stosunki x/m. Łatwo w taki sposób sprawdzić, czy stosunki te są stałe w granicach ich szacowanych niepewności. Ponadto można odpowiednio zaprogramować kalkulator, który natychmiast sprawdzi, czy do danego zbioru punktów daje się dopasować linię prostą. Jednak nawet wtedy, kiedy używamy jakichś innych metod sprawdzenia proporcjonalności x do m, warto dodatkowo narysować wykres. Wykresy, jak te przedstawione na rysunkach 2.1b i c, jasno pokazują, w jakim stopniu pomiary weryfikują nasze przewidywania, rysowanie zaś takich wykresów pomaga w zrozumieniu doświadczenia i praw fizycznych rządzących badanymi zjawiskami.
2.7. Niepewności względne Niepewność 8x w pomiarze, (zmierzona wartość x) = x ± 5 x , n p
wskazuje na wiarygodność lub dokładność pomiaru. Jednak niepewność 5x sama w sobie nie mówi wszystkiego. Niepewność jednego centymetra na dystansie jednego kilometra sugeruje niezwykle precyzyjny pomiar, podczas gdy niepewność jednego centymetra na dystansie trzech centymetrów wskazy wałaby na bardzo grube przybliżenie. Jest jasne, że o jakości pomiaru nie decyduje sama tylko niepewność 8x, ale także stosunek 5x do x . Prowadzi to nas do pojęcia niepewności względnej np
niepewność względna =
.
(2.20)
41 -
(Niepewność względna zwana jest także dokładnością.) W powyższej definicji symbol | x | oznacza wartość bezwzględną x . W odróżnieniu od niepewności względnej samą niepewność pomiarową 8x nazywa się niekiedy niepewnością bezwzględną. W większości poważnych eksperymentów niepewność 5x jest dużo mniej sza niż zmierzona wartość x . Ponieważ niepewność względna 5 x / | x | jest zwykle małą liczbą, więc często jest wygodnie pomnożyć ją przez 100 i wyrazić jako niepewność procentową. N a przykład pomiar 5
n p
n p
n p
n p
długość / = 5 0 + 1 cm
(2.21)
ma niepewność względną 5 / 1
i niepewność procentową równą 2%. Tak więc wynik (2.21) mógłby być przedstawiony w postaci długość l = 50 c m + 2 % . Zauważmy, że o ile niepewność bezwzględna U ma takie same jednostki jak l 0 tyle niepewność względna 8 / / | / | jest wielkością niemianowaną i nie mi żadnych jednostek. Zapamiętanie tej różnicy pomoże Czytelnikowi unikną< powszechnego błędu mylenia niepewności względnej z niepewnością bezwzglę dną. Niepewność względna jest przybliżoną wskazówką jakości pomiaru, be: względu na wartość wielkości mierzonej. Niepewności względne rzędu 10% s; zwykle charakterystyczne dla zgrubnych pomiarów. (Zgrubny pomiar 10 cn mógłby mieć niepewność 1 cm, zgrubny pomiar 10 km mógłby mieć niepew ność 1 km.) Niepewności względne 1 czy 2 procent charakteryzują pomiar dość dokładne. Takie właśnie niepewności są zwykle najlepszymi, na jaki można liczyć w wielu eksperymentach na wstępnej pracowni fizycznej. Niepe wności względne dużo mniejsze niż 1% są zwykle trudne do osiągnięci np
1 rzadkie na pracowni wstępnej.
5
Wartość bezwzględna \x\ liczby x jest równa x dla x dodatniego i — x dla x ujemneg Użyliśmy w definicji (2.20) wartości bezwzględnej, aby być pewnym, że niepewność względr podobnie jak sama niepewność Sx, będzie zawsze dodatnia. W praktyce zwykle postępuje się t£ aby wartości zmierzone były dodatnie i w takim przypadku znak wartości bezwzględnej w defini (2.20) może być pominięty.
42
Oczywiście podział ten ma wielce przybliżony charakter. Kilku bardzo prostych pomiarów można dokonać bez większych kłopotów z niepewnością względną 0,1% czy nawet mniej. Mając do dyspozycji dobrą taśmę mierniczą, możemy zmierzyć odległość 1 m z niepewnością 1 mm, czyli 0,1%. Dobry stoper pozwoli na pomiar jednej godziny z niepewnością mniejszą niż jedna sekunda, czyli 0,03%. Z drugiej jednak strony, w przypadku wielu trudnych do zmierzenia wielkości, niepewność 10% byłaby traktowana jako duży ekspery mentalny sukces. Tak więc duża niepewność procentowa nie znaczy, że pomiar jest bezwartościowy z naukowego punktu widzenia. W rzeczywistości wiele istotnych pomiarów w historii fizyki było obarczonych niepewnościami rzędu 10%. Z pewnością na pracowni wstępnej wiele można się nauczyć, korzystając z urządzeń, których minimalne niepewności są rzędu kilku procent.
2.8. Cyfry znaczące i niepewności względne Pojęcie niepewności względnej jest ściśle związane ze znanym pojęciem cyfry znaczącej. W istocie, liczba cyfr znaczących danej wielkości jest przybliżonym wskaźnikiem jej niepewności względnej. Weźmy na przykład dwie liczby 510
i
0,51,
z których obie zostały podane z dokładnością do dwu cyfr znaczących. Ponieważ 510 (z dwiema cyframi znaczącymi) oznacza 510 + 5
lub
510+1%,
0,51 zaś oznacza 0,51 + 0,005
lub
0,51 + 1%,
widzimy, że obie są obarczone niepewnością 1%. Innymi słowy stwierdzenie, że liczby 510 i 0,51 mają dwie cyfry znaczące jest równoważne zdaniu, iż obie mają niepewność równą 1%. W ten sam sposób 510 z trzema cyframi znaczącymi miałoby niepewność 0 , 1 % i tak dalej. Niestety ten użyteczny związek jest jedynie przybliżony. Liczba 110, poda na z dwiema cyframi znaczącymi, znaczy 110 + 5
lub
110 + 5%,
podczas gdy 910 ( dalej z dwiema cyframi znaczącymi) oznacza 910 + 5
lub
910 + 0,5%.
43
•
Widzimy, że niepewność względna związana z dwiema cyframi znaczącymi zmienia się od 0,5% do 5% w zależności od pierwszej cyfry danej liczby. W tabeli 2.4 podsumowano powyższe spostrzeżenia. Tabela 2.4. Przybliżony związek pomiędzy cyframi znaczącymi i niepewnością względną Odpowiednia niepewność względna
Liczba cyfr znaczących
1 2 3
zawiera się w zakresie
lub równa się w przybliżeniu
5%-50% 0,5%-5% 0,05%-0,5%
10% 1% 0,1%
2.9. Mnożenie dwu wartości zmierzonych Kiedy zaczynamy mnożyć przez siebie wartości zmierzone, wówczas ujaw nia się być może najbardziej znacząca cecha niepewności względnych. Na przykład, aby znaleźć pęd ciała, musielibyśmy zmierzyć jego masę m i pręd kość v, a następnie pomnożyć te wielkości, by dostać p = mv. Zarówno m jak i v są obarczone niepewnościami pomiarowymi, które będziemy musieli osza cować. Powstaje pytanie, jak znaleźć niepewność p, wynikającą z niepewność: pomiarowych m i v. Najpierw przepiszmy dla wygody standardowy wynik (zmierzona wartość x) = x
n p
+ 8x
w języku niepewności względnej, a więc jako (zmierzona wartość x) = x ( 1 + ——- ). n p
P
(2.22
K p i /
V
Na przykład jeśli niepewność względna równa jest 3 % , to z równania (2.27 widzimy, że (zmierzona wartość x) = x
nv
I1+
Taka niepewność oznacza, że x prawdopodobnie leży w zakresie pomiędzy x, razy 0,97 i x razy 1,03; n p
0 , 9 7 - x < x ^ 1,03-x . n p
44 »
np
Znaleźliśmy tym samym prosty sposób traktowania wartości, które chcemy mnożyć. Powróćmy do naszego zadania obliczenia p = mv, jeśli m i v zostały zmierzone jako (zmierzona wartość m) = m
n p
(1 + 7 — - r ]
V
(2.23)
Nnpl/
oraz 8v
( (zmierzona wartość v) = v \
\
1 + -—— .
ap
V
(2.24)
K p i /
Ponieważ m oraz v są najlepszymi przybliżeniami m i v, zatem najlepszym przybliżeniem p = mv jest P n = ( najlepsze przybliżenie p) = mv. n p
up
P
np
np
Największe prawdopodobne wartości m i v dane są w równaniach (2.23) i (2.24) ze znakiem „ + ". Tak więc największa prawdopodobna wartość p — mv równa jest (największa wartość p) — m
np
v „( 1 + ~-—/\ ( 1 + 7—-7 Y D
V
Nnpl/ V
(2.25)
Kpi/
Najmniejsza prawdopodobna wartość p dana jest przez podobne wyrażenie z dwoma znakami „ —". Teraz możemy wymnożyć wyrażenia w obu nawia sach w równaniu (2.25) 8m \ / \m \J np
\
bv \
8m
8v
5m
Ifnpl/
Nnpl
|Unpl
\m \
dv \V \
np
np
Ponieważ obie niepewności względne 8 m / | m | oraz 5łj/|t> | są małymi licz bami (być może kilka procent), więc ich iloczyn jest bardzo mały. Możemy zatem zaniedbać ostatni składnik sumy w równaniu (2.26). Wracając do (2.25), znajdujemy np
/
•
• ,
x
(największa wartość p) = m
n p
v
np
np
/. Sm I1+
8v +:—•
Najmniejsza prawdopodobna wartość dana będzie przez podobne wyrażenie z dwoma znakami „—". Tak więc nasz pomiar m i v prowadzi do wartości p — mv danej przez (wartość p) = m
n p
v
np
1±
8m ;
8v :+ ;
;
45
Porównując to z ogólną postacią (wartość p) = p l 1 + np
\
IPnpl/
widzimy, że najlepszym przybliżeniem wartości p jest m « (o czym już wiedzieliśmy) oraz że niepewność względna p jest sumą niepewności względnych m iv bp bm bv n p
IPnpl
|m |
+•
np
n p
n p
Kp|
Jeśli na przykład przeprowadzilibyśmy następujące pomiary m i v: m = 0,53 + 0,01 kg oraz v = 9,1 + 0,3 m/s, to najlepsze przybliżenie p = mv równe jest Pn = m P
np
v
np
= (0,53)-(9,1) = 4,82 kg-m/s.
Aby obliczyć niepewność p, najpierw obliczylibyśmy niepewności względne *L_ m
M _ 0,02
np
0,53
= 2%
oraz
^. = M = o,03 =
3%.
9,1
fnp
Niepewność względna p jest więc równa sumie — = 2 % + 3 % = 5%. Pnp
Jeśli chcemy znać bezwzględną wartość niepewności p, musimy pomnoży przez p : n p
5p =
•p
n p
= 0,05 • 4,82 = 0,241.
Pnp
Po zaokrągleniu bp i p
n p
otrzymujemy ostateczny wynik
(wartość p) = 4,8 + 0,2 kg • m/s.
46
Powyższe rozważania stosują się do dowolnego iloczynu dwóch wartości zmierzonych. Możemy zatem odkryć drugą ogólną regułę przenoszenia błę dów. Jeśli mierzymy dwie wielkości i tworzymy ich iloczyn, to niepewności pierwotnych dwóch wartości „przenoszą się" powodując powstanie niepewno ści ich iloczynu. Niepewność ta określona jest następującą regułą:
Niepewność iloczynu Jeśli x i y zmierzono z małymi niepewnościami względ nymi 8 x / j x | i S y / | y | oraz jeśli zmierzonych wartości x i y użyto do obliczenia ich iloczynu q = xy, to niepew ność względna q jest sumą niepewności względnych x i y 8q 8x Sy np
np
knpl
|x | n p
|j
n p
|
W równaniu (2.27) użyliśmy znaku przybliżonej równości „ « ", gdyż podobnie jak w przypadku reguły dla niepewności różnicy zamienimy później równanie (2.27) na inne, bardziej precyzyjne. Warto także podkreślić dwie inne cechy tej reguły. Po pierwsze, obliczenia prowadzące do wyniku (2.27) wymagają, aby obie niepewności względne x i y były na tyle małe, żebyśmy mogli zaniedbać ich iloczyn. W praktyce jest to niemal regułą, tak więc zawsze będziemy to zakładać. Niemniej jednak powinniśmy pamiętać, że jeśli niepewności względ ne nie są o wiele mniejsze niż 1, to reguła (2.27) przestaje być prawdziwa. Po drugie, równanie (2.27) znosi wymiarowość, bo nawet gdy x i y mają różne wymiary, wtedy niepewności względne są niemianowane . W fizyce stale mnożymy przez siebie różne liczby; tak więc reguła (2.27) będzie z pewnością ważnym narzędziem w rachunku błędów. N a razie naszym głównym celem jest podkreślenie, że niepewność dowolnego iloczynu q = xy wyraża się najprościej przez niepewności względne, tak jak w równaniu (2.27).
Zadania Uwaga: Gwiazdka przy zadaniu oznacza, że szkic rozwiązania lub odpowiedź znajduje się na końcu książki. 2.1 (paragraf 2.1). W rozdziale 1 cieśla przedstawia wynik swojego pomiaru wysokości futryny, podając swoje najlepsze przybliżenie 210 cm i wierząc, że wysokość mieści się gdzieś pomiędzy 205 cm i 215 cm. Przepisz ten wynik
47
w standardowej postaci x + 5x. Zrób to samo z wynikami pomiarów przed stawionymi w równaniach (1.1), (1.2) i (1.4). n p
* 2.2 (paragraf 2.2). Przepisz następujące odpowiedzi w najbardziej czytel nej formie z odpowiednią liczbą cyfr znaczących: (Sj) zmierzona wysokość = 5,03 + 0,04329 metra; (Ib])zmierzony czas = 19,5432 ± 1 s; /•ćy zmierzony ładunek = —3,21 • 1 0 " + . 2 , 6 , 7 - 1 0 " kulomba;
zmierzona długość fali = 0,000000563 + 0,00000007 metra; — e) zmierzony pęd = 3,267; 10 + 42 g-cm/s. 19
20
3
© ( p a r a g r a f 2.3). a) Student pięciokrotnie mierzy gęstość cieczy i otrzymuje wyniki (wszyst kie w g/cm ): 1,8; 2,0; 2,0; 1,9; 1,8. Co mógłbyś zasugerować jako najlepsze przybliżenie i niepewność na podstawie tego pomiaru? b) Powiedziano mu, że wartość uznana równa jest 1,85 g/cm . Jaka jest rozbieżność pomiędzy jego najlepszym przybliżeniem i wartością uznaną? Czy myślisz, że jest ona znacząca? 3
3
2.4 (paragraf 2.5). Aby zmierzyć czas dziesięciu obrotów stolika obro towego, użyto zegarka. Czas ten określono odejmując czasy początku i końca pomiaru. Jaka jest niepewność czasu dla dziesięciu obrotów, jeśli czasy początkowy i końcowy określone zostały z niepewnością + 1 s każdy? f 2.5 (paragraf 2.5). W tabeli 2.5 przedstawiono wartości początkowego i końcowego momentu pędu (L i L') pewnego obracającego się układu, otrzymane przez studenta w doświadczeniu sprawdzającym zasadę zachowa nia momentu pędu. Dodaj do tabeli 2.5 jeszcze jedną kolumnę, umieszczając w niej różnicę L — L' i jej niepewność. Czy wyniki studenta są zgodne z zasadą zachowania momentu pędu?
2
Tabela 2.5. Momenty pędu (w kg • m /s) Początkowy moment pędu L
Końcowy moment pędu L'
3,0 + 0,3
2,7 + 0,6
7,4+0,5 A4,3 + l 25 + 2 32±2 37 + 2
48
8,0+1 16,5 + 1 24 + 2 31+2 41+2
2.6 (paragraf 2.5). W doświadczeniu mierzone są masy M i m, wózka i przyczepy. Otrzymany rezultat podany jest w standardowej postaci M + 8 M oraz m ± 5 m . Jakie jest najlepsze przybliżenie całkowitej masy M + ml Biorąc pod uwagę największe i najmniejsze prawdopodobne wartości całkowitej masy, pokaż, że niepewność wyznaczenia masy całkowitej równa jest sumie 5M i Sm. Przedstaw jasno swoje argumenty, nie ograniczając się jedynie do napisania odpowiedzi. n p
np
2.7 (paragraf 2.6). Korzystając z danych z zadania 2.5, narysuj wykres zależności końcowego momentu pędu L'od początkowego momentu pędu L. Zamieść na nim pionowe i poziome kreski granic błędu. (Jak zwykle w przy padku wykonywania takich wykresów, oznacz odpowiednio osie swojego wykresu oraz jednostki na nich. Użyj papieru z właściwą podziałką. Dobierz skalę tak, aby Twój rysunek zajął rozsądną część papieru, pozostawiając jednak na nim początek układu współrzędnych.) N a jakiej krzywej według Ciebie powinny układać się punkty eksperymentalne? Czy z dokładnością do niepewności pomiarowych punkty te leżą na spodziewanej krzywej? * 2.8 (paragraf 2.7). Jeśli rzucimy z prędkością v kamień pionowo do góry, powinien się on wznieść na wysokość h, spełniającą równanie o = 2gh. W szczególności v powinno być proporcjonalne do h. Student zmierzył o i h dla siedmiu różnych rzutów, aby to sprawdzić. Wyniki przedstawione są w tabeli 2.6. 2
2
2
Tabela 2.6. Wysokości i prędkości Wysokość h (w metrach) (wszystkie ± 0,05)
Kwadrat prędkości v (w m / s ) 2
0,4 0,8 1,4 2,0 2,6 3,4 3,8
2
2
7±3 17 + 3 25 + 3 38 + 4 45 + 5 62±5 72 + 6
2
a) Wykonaj wykres zależności o od h, zaznaczając pionowe i poziome granice błędu. (Jak zwykle oznacz o dpowiednio osie wykresu, użyj papieru milimetrowego i rozsądnie wybierz skalę.) Czy Twój wykres jest zgodny z przewidywaną zależnością v cc KI 2
49
*
b) Tangens kąta nachylenia Twojego wykresu powinien być równy 2g. Aby go znaleźć, narysuj najlepszą według Ciebie prostą, przechodzącą przez po czątek układu współrzędnych i punkty eksperymentalne, i zmierz jej nachyle nie. Aby znaleźć niepewność wyznaczenia tego nachylenia, narysuj proste o największym i najmniejszym nachyleniu, które według Ciebie rozsądnie pasują do otrzymanych punktów doświadczalnych. Nachylenia tych prostych dadzą największą i najmniejszą prawdopodobną wartość naszego nachylenia. Czy Twój wynik jest zgodny z wartością uznaną 2g = 19,6 m / s ? 2
(paragraf 2.6). a) Student postanowił w doświadczeniu z wahadłem matematycznym sprawdzić, czy okres Tjest niezależny od amplitudy A (zdefiniowanej jako największy kąt wychylenia wahadła). Otrzymał wyniki przedstawione w tabeli 2.7. Narysuj wykres zależności T od A. (Uważnie dobierz skalę swojego wykresu. Jeśli masz jakieś wątpliwości, narysuj dwa wykresy, jeden zawierają cy początek układu współrzędnych T=0, A = 0 i drugi, zawierający tylko wartości T pomiędzy 1,9 s i 2,2 s.) Czy student może stwierdzić, że okres wahadła jest niezależny od amplitudy? Tabela 2.7. Amplituda i okres wahadła matematycznego Amplituda A (stopnie)
Okres T(s)
5+2 17 + 2 25 + 2 40 + 4 53 + 4 67 + 6
1,932 + 0,005 1,94+0,01 1,96+0,01 2,01+0,01 2,04 + 0,01 2,12+0,02
b) Przedyskutuj, w jaki sposób wnioski z punktu (a) mogłyby się zmienić, jeśli zmierzony okres Tbył obarczony niepewnością ±0,3 s. 2 . 1 0 (paragraf 2.7). Oblicz niepewności procentowe dla pięciu pomiarów wymienionych w zadaniu 2.2. (Nie zapomnij o zaokrągleniu wyniku dc odpowiedniej liczby cyfr znaczących.) 2.11 (paragraf 2.7). Linijka ma działki co 1 mm, suwmiarka zaś co 0,1 mm Przypuśćmy, że chcesz zmierzyć długość 2 cm z dokładnością 1%. Czy możess to zrobić używając linijki? Czy jest to możliwe za pomocą suwmiarki? (*2A^. (paragraf 2.7). Aby znaleźć przyspieszenie wózka, student zmierzy jego początkową i końcową prędkość o i v , a następnie obliczył ich różnica p
50
k
D — D . Wyniki jego doświadczenia dla dwóch prób przedstawione są w tabeli 2.8 (wszystkie prędkości podano w cm/s). Wszystkie jego pomiary miały niepewność 1%. K
P
Tabela 2.8. Początkowe i końcowe prędkości
Pierwsza próba Druga próba
14,0 19,0
18,0 19,6
a) Oblicz niepewność bezwzględną dla wszystkich czterech pomiarów, znajdź różnicę v — v , a także jej niepewność dla obu prób. b) Znajdź niepewność procentową dla każdej z dwóch wartości (o — o ). (Twoje odpowiedzi, szczególnie w przypadku drugiej próby, pokażą katastro falne skutki mierzenia małych liczb będących różnicą liczb o wiele większych.) k
v
k
p
2.13 (paragraf 2.8). a) Kalkulator wyświetla wynik 123,123. Jaka jest niepewność względna i bezwzględna tego wyniku, jeśli student zdecydował, że ma on tylko trzy cyfry znaczące? b) To samo pytanie dla liczby 0,123123. c) To samo pytanie dla liczby 321,321. d) Czy niepewności względne w powyższych przykładach mieszczą się w zakresie przewidywanym dla trzech cyfr znaczących? / f 2 j ) (paragraf 2.9). a) Student mierzy dwie wielkości a i b, otrzymując wyniki a = 11,5 ±0,2 cm i b = 25,4 ±0,2 cm. Następnie oblicza iloczyn q = ab. Znajdź jego odpowiedź, podając zarówno niepewność bezwzględną jak i niepewność procentową. b) Powtórz punkt (a) dla pomiarów a = 1 0 ± l c m i £ > = 27,2 ±0,1 s. c) Powtórz punkt (a) dla pomiarów a = 3,0 m ± 8 % i b = 4,0 k g ± 2 % . • ^ 2 a | (paragraf 2.9). a) Student zmierzył dwie liczby x i y. x=10±l,
y = 20±1.
Jakie jest jego najlepsze przybliżenie ich iloczynu q = xyl Wykorzystując największe prawdopodobne wartości x i y (11 i 21), oblicz największą praw dopodobną wielkość q. Podobnie znajdź najmniejszą prawdopodobną wartość q i na jej podstawie określ zakres, w którym najprawdopodobniej mieści się q. Porównaj swój wynik z wynikiem danym przez regułę (2.27).
51
b) Zrób to samo z pomiarami x = 10±8,
y = 20 + 15.
Pamiętaj, żę regułę (2.27) znaleziono przy założeniu, że niepewności względne są dużo mniejsze od 1. 2.16 (paragraf 2.9). Pewna „dobrze znana zasada" mówi, że kiedy mnoży my przez siebie dwie liczby, wówczas ich iloczyn będzie wiarygodny, jeśli zaokrągli się go do takiej liczby cyfr znaczących, jaką miał mniej dokładny czynnik. a) Sprawdź przybliżoną stosowalność powyższej zasady, stosując regułę (2.27) i fakt, że liczba cyfr znaczących odpowiada mniej więcej niepewności względnej. (W szczególności rozpatrz przypadek, gdy mniej precyzyjna liczba ma dwie cyfry znaczące.) b) Pokaż na przykładzie, że odpowiedź może być nieco mniej precyzyjna, niż sugeruje to „dobrze znana zasada". (Jest to szczególnie istotne, jeśli mnożymy przez siebie wiele liczb.)
R O Z D Z I A Ł
3
PRZENOSZENIE NIEPEWNOŚCI
Większości wielkości fizycznych nie da się określić na podstawie bezpośred niego pomiaru. Wyznacza się je natomiast w dwóch oddzielnych krokach. N a początku wykonuje się pomiar jednej lub kilku wielkości x, y, które można zmierzyć bezpośrednio i które pozwalają obliczyć wielkość szukaną. Następ nie, korzystając ze zmierzonych wartości x, y, oblicza się interesującą nas wielkość. Przykładowo, aby znaleźć powierzchnię prostokąta, trzeba zmierzyć długości jego boków l oraz h, i obliczyć jego powierzchnię A, gdyż A = Ih. Podobnie najbardziej oczywistym sposobem znalezienia prędkości v jakiegoś ciała jest pomiar odległości d, jaką ciało to przebyło w czasie t i obliczenie prędkości v jako v = d/t. Czytelnik, który spędził trochę czasu na pierwszej pracowni, bez trudu wymyśli więcej przykładów. W istocie, po chwili za stanowienia stwierdzimy, że prawie wszystkie interesujące doświadczenia skła dają się z dwóch etapów, bezpośredniego pomiaru i następujących po nim obliczeń. Kiedy pomiar dzieli się na dwa etapy, wówczas ocena niepewności również przebiega dwuetapowo. Po pierwsze należy ocenić niepewności wielkości mierzonych bezpośrednio, następnie zaś stwierdzić, w jaki sposób owe niepew ności „przenoszą się" w trakcie obliczeń na niepewność ostatecznego wyniku. To „przenoszenie błędów" jest głównym tematem niniejszego rozdziału. 1
1
W rozdziale 4 przedyskutujemy inny sposób, w jaki można czasami oszacować niepewność wyniku końcowego. Jeśli wszystkie pomiary można przeprowadzać wielokrotnie i jeśli jest się pewnym, że wszystkie niepewności mają przypadkowy charakter, to niepewność naszego wyniku można ocenić badając rozrzut wyników. Jednak, nawet gdy można zastosować taką metodę, jest ona zwykle stosowana do sprawdzenia rezultatów procedury dwustopniowej, o której mowa w tym rozdziale.
53
Omówiliśmy już kilka przykładów przenoszenia błędów w rozdziale 2. W paragrafie 2.5 rozważaliśmy, co się dzieje, kiedy dwie wartości zmierzone x i y używane są do wyznaczenia różnicy q = x — y. Stwierdziliśmy, że niepew ność q jest po prostu sumą 8q ss 8x + by niepewności x i y. W paragrafie 2.9 mówiliśmy o iloczynie q = xy, w zadaniu 2.6 zaś była mowa o sumie q = x + y. W paragrafie 3.2 dokonamy przeglądu tych przypadków. W dalszej części niniejszego rozdziału przedyskutujemy bardziej ogólne przypadki przenoszenia niepewności i przedstawimy kilka przykładów. Zanim podejmiemy temat przenoszenia niepewności, omówimy krótko w paragrafie 3.1 zasady szacowania niepewności wielkości mierzonych bezpo średnio. Przypomnimy metody omawiane w rozdziale 1, a następnie omówimy kilka dalszych przykładów oceny błędu w pomiarach bezpośrednich. Począwszy od paragrafu 3.2 zajmiemy się zagadnieniem przenoszenia błędów. Stwierdzimy, że prawie wszystkie problemy z dziedziny przenoszenia błędu można rozwiązać stosując jedynie trzy proste reguły. Sformułujemy także jedną bardziej skomplikowaną zasadę, która obejmuje wszystkie przy padki i z której można wyprowadzić owe trzy prostsze reguły. Ten rozdział jest jednym z dłuższych. Czytelnik może jednak pominąć ostatnie dwa paragrafy bez obawy o utratę wątku.
3.1. Niepewności w pomiarach bezpośrednich Prawie wszystkie bezpośrednie pomiary wymagają odczytu skali (na miarce, zegarze czy na przykład woltomierzu) lub odczytu liczby ze wskaźnika cyf rowego (na zegarze cyfrowym bądź woltomierzu). Niektóre problemy związane z odczytem skali omówiono w paragrafie 1.5. Czasami głównym źródłem niepewności jest odczyt skali i konieczność interpolacji pomiędzy podziałkami miarki. W takich sytuacjach łatwo dokonać rozsądnego oszacowania niepewno ści. Jeśli na przykład trzeba zmierzyć pewną dobrze zdefiniowaną długość / za pomocą miarki o podziałce milimetrowej, uzasadniona byłaby decyzja o poda niu wyniku z dokładnością do najbliższej podziałki milimetrowej. W takim przypadku niepewność 8/ byłaby równa 8 / = 0,5 mm. Jeśli podzialka byłaby rzadsza (na przykład co 2 mm), to uzasadnione byłoby odczytanie skali z dokładnością na przykład jednej piątej odległości pomiędzy kolejnymi znacz nikami podziałki. W każdym przypadku jasne jest, że niepewności związane z odczytem skali mogą być oszacowane całkiem prosto i realistycznie. Niestety często występują inne źródła niepewności, o wiele bardziej istotne niż problemy z odczytem skali. Podczas pomiaru odległości pomiędzy dwoma
54
: _nktami głównym problemem może być decyzja, gdzie naprawdę znajdują się irjyjjz^/y. Weźmy flajoizykhd doświadczenie z optyki, w którym chcemy —lerzyć odległość q od środka soczewki do pewnego obrazu, jak na rys. 3.1. W praktyce soczewki mają zwykle kilka milimetrów grubości, a więc znalezieśrodka będzie trudne; jeśli zaś soczewka jest oprawiona, jak to zwykle - ;.-.va. zadanie to staje się jeszcze trudniejsze. Dalej, powstały obraz może dawać się ostry na przestrzeni kilku milimetrów. Nawet gdy zestaw zmon:: wany jest na ławie optycznej z zaznaczoną podziałką milimetrową, niepewn ś ć wyznaczenia odległości powstałego obrazu od soczewki może być rzędu centymetra. Ponieważ niepewność ta powstaje ze względu na nieprecyzyjne kreślenie dwóch punktów, taki rodzaj problemu nazywamy zagadnieniem definicji.
obraz powstały na ekranie
Rysunek 3.1. Na ekranie umieszczonym po lewej stronie powstaje zogniskowany przez soczewkę obraz żarówki, która znajduje się po prawej stronie
Przypadek ten ilustruje poważne niebezpieczeństwo powstające przy szaco waniu niepewności. Jeśli patrzy się tylko na skalę, zapominając o innych źródłach niepewności, można w znaczny sposób zaniżyć szacowaną niepewność. W istocie, najbardziej powszechny błąd początkującego studenta polega na przeoczeniu pewnych źródeł błędu, co prowadzi do niedoszacowania całkowitej niepewności, często o rząd wielkości lub więcej. Jednak równie ważne jest, aby nie przeszacować niepewności. Przesadnie ostrożny eksperymentator szafujący niepewnościami we wszystkich pomiarach może uniknąć kłopotliwych niespój ności, lecz przez to uczynić swój pomiar mało użytecznym dla kogokolwiek. Jest jasne, że ideałem byłoby znalezienie wszystkich możliwych przyczyn powstawa nia niepewności i właściwa ocena ich wpływu na ostateczny wynik; nie jest to zwykle tak skomplikowane, jak można byłoby przypuszczać. Odczyt wskaźnika cyfrowego jest prostszy niż odczyt konwencjonalnej skali. Pokazuje on tylko cyfry znaczące, chyba że jest uszkodzony. Jeśli na 55
zegarze cyfrowym, pokazującym sekundy z dwoma cyframi po przecinku, odczytujemy czas t = 8,03 s, oznacza to, że (w najgorszym razie) t = 8,03 + 0,01 s. W zależności od konstrukcji zegara niepewność ta może być o połowę mniejsza. Tak więc 8,03 może oznaczać 8,03 + 0,005. Wskaźnik cyfrowy, bardziej nawet niż konwencjonalna miarka, może dawać mylne wrażenie dokładności. Wyobraźmy sobie na przykład użycie stopera ze wskaźnikiem cyfrowym do pomiaru czasu spadku na maszynie Atwooda lub w podobnym układzie. Jeśli stoper pokazujący trzy miejsca po przecinku daje wynik 8,036, mogłoby się wydawać, że czas spadku równy jest t = 8,036 + 0,001 s.
(3.1)
Jednak ostrożny student, powtarzający doświadczenie w identycznych, o ile to tylko możliwe warunkach, stwierdzi, że następny pomiar czasu daje wynik t = 8,113 s. Jednym z możliwych wyjaśnienień tej rozbieżności są niepewności w procedu rze startowej zmieniające warunki początkowe i co za tym idzie zmierzony czas spadku. W każdym razie jest jednak jasne, że dokładność deklarowana w odpowiedzi (3.1) jest podejrzanie dobra. Sądząc z dwóch wykonanych dotąd pomiarów, można byłoby sformułować bardziej realistyczny wynik t = 8,07 + 0,05 s. Ten przykład prowadzi nas do innego zagadnienia dyskutowanego w roz dziale 1. Jeżeli tylko jakiś pomiar może być powtarzany, to powinien zostać przeprowadzony wielokrotnie. Rozrzut wyników jest często dobrą wskazówką co do niepewności, ich średnia zaś jest z reguły bardziej wiarygodna niż każdy z poszczególnych wyników. W rozdziałach 4 i 5 omówimy metody obróbki statystycznej wielokrotnych pomiarów. Teraz chcemy jedynie podkreślić, że jeśli doświadczenie jest powtarzalne, to powinno być powtórzone, zarówno w celu osiągnięcia bardziej wiarygodnej odpowiedzi (poprzez uśrednianie) jak też, co może nawet ważniejsze, aby otrzymać jakąś ocenę niepewności. Nie stety, jak już wspominaliśmy w rozdziale 1, powtarzanie pomiaru nie zawsze ujawni niepewności. Jeśli pomiar podlega pewnemu błędowi systematycznemu, który przesuwa wszystkie wyniki w tę samą stronę (jak późniący się zegar), to rozrzut wyników nie będzie odbiciem tego błędu systematycznego. Wyelimino56
wanie takiego błędu systematycznego wymaga uważnego sprawdzenia kalib racji i stosowanych procedur. Jest jeszcze jeden, zupełnie inny rodzaj pomiarów, w których można prosto ocenić niepewność. Istnieją doświadczenia polegające na zliczaniu zdarzeń zachodzących w sposób przypadkowy, lecz ze ściśle określonym średnim prawdopodobieństwem. Przykładowo w próbce materiału promie niotwórczego każde pojedyncze jądro rozpada się w przypadkowym momen cie, lecz istnieje określone średnie prawdopodobieństwo, z jakim możemy spodziewać się obserwacji rozpadu w całej próbce. Możemy próbować mierzyć tę średnią wartość, obserwując, ile rozpadów nastąpiło w okreś lonym przedziale czasu, na przykład w ciągu minuty. (Można to zrobić używając na przykład licznika Geigera, który mierzy naładowane cząstki powstające na skutek rozpadu jądra). Przypuśćmy, że stwierdziliśmy v roz padów w ciągu jednej minuty. Ponieważ poszczególne rozpady zachodzą w przypadkowych momentach, nie możemy być pewni, czy v rzeczywiście jest właściwą średnią liczbą rozpadów, jakiej spodziewalibyśmy się w ciągu jednej minuty. Trzeba zapytać, w jakim stopniu v jest wiarygodne jako miara spodziewanej liczby zdarzeń. Teorię pomiarów związanych z tego rodzaju zliczeniami przedyskutujemy w rozdziale 11, ale odpowiedź na nasze pytanie jest na tyle prosta, że możemy ją przedstawić już teraz. Jeśli liczymy zdarzenia zachodzące w pewnym przedziale czasu T i dostajemy odpowiedź v, to nasz wynik jako miara spodziewanej średniej liczby zdarzeń w czasie T m a niepewność W. Tak więc nasz wynik ( oparty na tej jednej obserwacji) powinien brzmieć (średnia liczba zdarzeń w czasie T) = v± fv. s
(3.2)
N a przykład jeśli w próbce promieniotwórczego uranu zliczamy 15 rozpadów w ciągu minuty, to moglibyśmy stwierdzić, że średnio w naszej próbce zachodzi 15 + ^ 1 5 czy też 1 5 ± 4 rozpadów na minutę.
3.2. Sumy i różnice; iloczyny i ilorazy D o końca tego rozdziału będziemy zakładać, że zmierzyliśmy jedną lub więcej wielkości x, y, ... z odpowiadającymi im niepewnościami 8x, by, i chcemy teraz użyć zmierzonych wartości x, y, ... do obliczenia szukanej wielkości q. Obliczenie q jest zwykle proste; zagadnienie, jakim chcemy się teraz zająć, polega na zbadaniu, jak niepewności 8x, 8 j , ... przenoszą się w rachunkach, prowadząc do niepewności Sq wartości końcowej q. 57
Sumy i różnice W rozdziale 2 mówiliśmy co się dzieje, kiedy mierzy się dwie wielkości x oraz y i oblicza się ich sumę x + y lub różnicę x — y. Aby ocenić niepewność zarówno sumy jak i różnicy, musieliśmy tylko zdecydować, jakie są ich największe i najmniejsze prawdopodobne wartości. Największa i najmniejsza prawdopodobna wartość x jest równa x + Sx, a odpowiednie wartości y są równe y ± 5 y . Stąd największa prawdopodobna wartość x + y równa jest n p
n p
x p + J V + ( 5 x + 8y), n
wartość najmniejsza zaś ^ n + ^ n p - ( 5 x + 5y). P
Tak więc najlepszym przybliżeniem q = x + y jest ^np
-^np + J^np?
niepewnością zaś 6q « Sx + 8u.
(3.3)
Podobny argument (czy potrafisz go powtórzyć?) pokazuje, że niepewność różnicy x — y dana jest tym samym wzorem (3.3). Tak więc niepewność zarówno sumy x + y, jak i różnicy x — y jest sumą 8x + 8y niepewności x i y. Jeśli mamy dodać lub odjąć kilka liczb x, w, to wielokrotnie stosując równanie (3.3) otrzymujemy następującą regułę.
Niepewność sumy i różnicy Jeśli kilka wielkości x, w zostało zmierzonych z niepewnościami 8 x , 8 w , zmierzone zaś wartości są uży wane do obliczenia q = x + ... +z—(u+
... +w),
to niepewność obliczonej wartości q jest sumą 8
... + S Z + SM+ ...
+8w,
wszystkich pierwotnych niepewności.
Innymi słowy, kiedy dodaje się lub odejmuje pewną liczbę wielkości, niepew ności tych wielkości zawsze się dodają. Jak poprzednio, użyliśmy znaku &, aby przypomnieć, że wkrótce poprawimy tę regułę.
58
Przykład Omówimy teraz prosty przykład zastosowania reguły (3.4). Przypuśćmy, że eksperymentator miesza ciecze z dwóch zlewek. Uprzednio zważył zarówno pełne, jak i puste zlewki i otrzymał następujące wyniki: M
= masa pierwszej zlewki z zawartością = 540 + 10 g;
t
m = masa pustej pierwszej zlewki
= 7 2 + 1 g;
M
= 940 + 20 g;
1
2
= masa drugiej zlewki z zawartością
m = masa pustej drugiej zlewki 2
= 9 7 + 1 g.
Następnie znajduje całkowitą masę zmieszanych cieczy jako M = M -m +M -m l
l
2
= (540 - 7 2 + 9 4 0 - 9 7 ) g = 1311 g.
2
Zgodnie z regułą (3.4) niepewność tego wyniku jest sumą wszystkich czterech niepewności, SM « bM + 8m + 5 M + 8m = (10 + 1 + 20 + 1) g = 32 g. 1
1
Tak więc jego ostateczna brzmieć:
2
2
odpowiedź (właściwie zaokrąglona)
powinna
całkowita masa cieczy = 1310 + 30 g. Warto zauważyć, że o wiele mniejsze niepewności wyznaczenia masy pustych zlewek wprowadzają zaniedbywalny wkład w ostateczną niepewność. Jest to ważny efekt, który omówimy później. W miarę nabywania doświad czenia Czytelnik może się nauczyć z góry rozpoznawać, które z niepewności są zaniedbywalne i mogą być od początku pominięte. Często pomaga to wielce uprościć obliczanie niepewności.
Iloczyny i ilorazy W paragrafie 2.9 omawialiśmy niepewność iloczynu q = xy dwóch zmierzo nych wielkości. Przekonaliśmy się, że jeśli niepewności względne są małe, to niepewność względna q = xy jest sumą niepewności względnych x i y. Zamiast wyprowadzenia tego wyniku, omówimy tutaj podobny przypadek ilorazu q = x/y. Jak zobaczymy, niepewność ilorazu dana jest tą samą regułą co w przypadku iloczynu; to znaczy, że niepewność względna q = x/y jest równa sumie niepewności względnych x i y. 59
Ponieważ niepewności iloczynów i ilorazów najlepiej wyrażać przez niepew ności względne, wygodnie jest wprowadzić zapis skrócony, z którego będziemy później korzystać. Przypomnijmy, że jeśli mierzymy pewną wielkość x (zmierzona wartość x) = x
n p
+ 8x,
to niepewność względna x zdefiniowana jest jako Sx
(niepewność względna x) =
l*npl
(Wartość bezwzględna w mianowniku upewnia nas, że niepewność względna jest zawsze dodatnia, nawet gdy x jest ujemne.) Ponieważ niezręcznie jest pisać i czytać symbol 8 x / | x | , odtąd będziemy go skracać, pomijając dolny wskaźnik „np", i pisać n p
np
(niepewność względna x) = |x| Wynik pomiaru jakiejkolwiek wielkości x można wyrazić przez jego niepe wność względną 8x/|x| jako (wartość x) = x ( l + 8x/|x|). n p
Tak więc wartość q = x/y można zapisać jako , , *np l±8x/|x| (wartość ą) = —— y l±8y/|y| t
n p
Naszym zadaniem jest teraz znalezienie ekstremalnych prawdopodobnych wartości drugiego czynnika tego iloczynu. Przykładowo, czynnik ten jest największy, jeśli licznik ma największą wartość l + 8x/|x|, mianownik zaś wartość najmniejszą 1 —5y/|y|. Zatem największa prawdopodobna wartość q = x/y równa jest (największa wartość q) = — y n p
——. l-5y/|y|
(3.5)
Ostatni czynnik w wyrażeniu (3.5) ma formę (l + a)/(l — b), gdzie a i b są małe ( tj. dużo mniejsze niż 1). Można je uprościć stosując dwa przybliżenia. Po pierwsze, ponieważ b jest małe, więc zgodnie z twierdzeniem o dwumianie Newtona 2
2
60
Twierdzenie o dwumianie Newtona pozwala wyrazić 1/(1 -b)
w postaci nieskończonego
Niepewność iloczynu i ilorazu Jeśli pewne wielkości x, w są mierzone z małymi niepewnościami Sx, Sw, zmierzone zaś wartości uży wane są do obliczenia x ••• z
1=
»
u ••• w to niepewność względna obliczonej wartości ą jest sumą So \q\
Sx \x\
Sz \z\
Su \u\
8w j w|
niepewności względnych x,
(3.
w.
Krótko mówiąc, kiedy mnoży się lub dzieli pewne wielkości, wtedy niepewności względne dodają się.
Przykład Zdarza się, że trzeba wyznaczyć długość / niedostępnego przedmiotu (na przykład wysokość dużego drzewa). Mierzy się wówczas trzy inne odległości l l , / . N a ich podstawie oblicza się u
2
3
i =
hk
Przypuśćmy, że przeprowadzamy taki eksperyment i otrzymujemy wyniki ( w metrach): / = 60,0 + 0,5,
l = 1,65 + 0,05,
t
2
/ = 3,0 + 0,15. 3
Najlepsze przybliżenie l równe jest /
np
60 1,65 ^ = ^ = 33 m.
Zgodnie z regułą (3.8) niepewność względna tego wyniku jest sumą niepewnoś ci względnych l l , / , które są równe 1%, 3 % , 5%. Tak więc u
2
8/
62
3
8/,
8/,
8/.
a nasza ostateczna odpowiedź brzmi l = 33 + 3 m.
Iloczyn wartości zmierzonej i stałej liczby N a osobną wzmiankę zasługują dwa ważne szczególne przypadki reguły (3.8). Po pierwsze, przypuśćmy, że mierzymy wielkość x, a następnie używamy jej do obliczenia iloczynu q = Bx, przy czym B nie jest obarczona niepewnością. Przykładowo możemy zmierzyć średnicę koła d i obliczyć jego obwód, c = %d; lub możemy zmierzyć grubość T stu identycznych kartek papieru, a następnie obliczyć grubość pojedynczej kartki jako t = (1/100)' T. Zgodnie z regułą (3.8) niepewność względna q = Bx jest sumą niepewności B i x. Ponieważ 8 5 = 0, więc 5q \q\
8x \x\'
Po pomnożeniu przez \q\ = \Bx\ znajdujemy 6q = \B\bx i otrzymujemy na stępującą użyteczną regułę:
Iloczyn wielkości zmierzonej i dokładnej liczby Jeśli wielkość x została zmierzona z niepewnością Sx i używana jest do obliczenia iloczynu q = Bx, gdzie B nie ma żadnej niepewności, to niepewność q równa jest dokładnie iloczynowi | B | i niepewności x, bq = \B\bx.
(3.9)
Reguła ta jest szczególnie użyteczna, kiedy mamy zmierzyć coś co jest niewygodnie małe, ale może być dostępne w większej ilości, jak grubość kartki papieru czy okres szybko wirującego koła. Jeśli na przykład zmierzymy grubość Tstu kartek papieru i otrzymamy wynik grubość 100 kartek papieru = T= 3,3 + 0,2 cm, 63
to natychmiast dochodzimy do wniosku, że grubość pojedynczej kartki t rów na jest grubość pojedynczej kartki = t =
T= 0,033 + 0,002 cm.
Zauważmy, że technika ta (mierzenie grubości wielu identycznych kartek i dzielenie jej przez ich liczbę) upraszcza istotnie pomiar, który w innym razie wymagałby całkiem skomplikowanej aparatury. Daje ona także nadzwyczajnie małe niepewności. Trzeba oczywiście być pewnym, że wszystkie kartki mają jednakową grubość.
Wyrażenia potęgowe Drugi szczególny przypadek reguły (3.8) dotyczy obliczenia potęgi pewnej zmierzonej wielkości. N a przykład moglibyśmy zmierzyć prędkość ciała v i następnie obliczyć jej kwadrat w celu znalezienia energii kinetycznej { m c . Ponieważ v to po prostu w , zatem jak wynika z reguły (3.8) niepewność względna v jest podwojoną niepewnością względną v. Z reguły (3.8) wynika jasno, że ogólna reguła dotycząca jakiegokolwiek wyrażenia potęgowego brzmi następująco: 2
2
2
Niepewność wyrażenia potęgowego Jeśli wielkość x, zmierzona z niepewnością 5x, jest używana do obliczenia wyrażenia potęgowego q=
n
x,
to niepewność względna q jest n razy większa niż niepe wność x, tj. =
w
rr TTq x
3
10
- )
Sposób, w jaki wyprowadziliśmy tę regułę, wymaga, aby n było dodatnią liczbą całkowitą. W rzeczywistości jednak reguła ta jest słuszna dla dowolnego wykładnika n. (Porównajmy ten wynik z równaniem (3.26).) 64
Przykład Przypuśćmy, że student chce znaleźć przyspieszenie ziemskie g, mierząc czas t, w jakim kamień spada z wysokości h. Po wykonaniu kilku pomiarów tego czasu stwierdził, że t = 1,6 + 0,1 s, a zmierzona wysokość h równa jest h = 13,9 + 0,1 m. 2
Ponieważ h określone jest przez powszechnie znaną zależność h = ^ -gt , 2
student może znaleźć g jako 2h
2-13,9 m (1,6 s)
2
2
= 10,9 m / s . Niepewność tego wyniku można obliczyć dzięki poznanym właśnie regu łom. Aby to zrobić, musimy znać niepewność względną wyznaczenia każdego z czynników w wyrażeniu g = 2h/t , używanym do obliczenia g. Czynnik 2 nie jest obarczony niepewnością. Niepewności względne h i t równe są odpowiednio 2
8^
0,1
i 5 f
T
-
0
4
6 30/
' 2
Zgodnie z regułą (3.10) niepewność względna t jest dwa razy większa niż niepewność względna t. Zatem stosując regułę (3.8) dla iloczynów i ilorazów do wzoru g = 2h/t , znajdujemy niepewność względną 2
— = — + 2 — = 0 , 7 % + 2 (6,3%) = 13,3% g h t
(3.11)
65
oraz niepewność bezwzględną 2
8g = (10,9 m / s ) -
13,3 = 1,44 m / s . 100 2
Ostateczny wynik (po odpowiednim zaokrągleniu) będzie więc wynosić 2
g = 10,9 + 1,5 m / s . Ten przykład pokazuje, jak proste potrafi być czasem oszacowanie niepew ności. Pokazuje on również, w jaki sposób analiza błędu oprócz informacji o jego rozmiarze mówi także co należy zrobić, aby go zredukować. W naszym przykładzie jasno wynika z równania (3.11), że największy wkład do niepewno ści pochodzi z pomiaru czasu. Jeśli chcemy precyzyjniej wyznaczyć g, musimy poprawić pomiar czasu t. Wszelkie wysiłki włożone w dokładniejsze wyznacze nie h będą jedynie stratą czasu.
3.3. Niezależne niepewności w sumie Reguły, które dotąd poznaliśmy, można zwięźle podsumować: kiedy zmierzone wielkości są dodawane lub odejmowane, wówczas dodają się niepewności bezwzględne; jeśli zaś zmierzone wartości mnoży się lub dzieli, to dodają się niepewności względne. W tym i w następnym paragrafie przedyskutujemy, dlaczego pod pewnymi warunkami niepewności obliczone zgodnie z tymi regułami mogą być bez potrzeby zawyżone. W szczególności, okaże się, że jeśli pierwotne niepewności są niezależne i przypadkowe, to można dokonać bar dziej realistycznej (i niższej) oceny niepewności końcowej. W takim przypadku jest ona określona przez podobne reguły, w których jednak całkowitą niepew ność oblicza się jako pierwiastek z sumy kwadratów niepewności (lub niepew ności względnych). Wkrótce omówimy dokładnie tę metodę. Załóżmy najpierw, że obliczamy sumę x i y zmierzonych w standardowy sposób (zmierzona wartość x) = x
q = x +y
n p
dwóch
wielkości
+ 8x,
i podobnie dla y. Argumenty stosowane w poprzednim paragrafie były na stępujące. Po pierwsze, najlepsze przybliżenie q = x + y jest oczywiście równe
np
np
n p
n p
x
ap
66
+y
np
+ dx + 5y.
(3.12)
Podobnie najmniejsza prawdopodobna wartość q dana jest przez Xn +y -S.x-5}>. P
n p
Stwierdziliśmy zatem, że wartość q leży prawdopodobnie pomiędzy tymi dwoma wartościami i, że niepewność 8y równa jest 5q « Sx + Sy. Aby zobaczyć, w jaki sposób wzór ten prowadzi do zbyt wysokiego oszacowania bq, zastanówmy się, w jaki sposób q mogłoby być równe największej wartości ze wzoru (3.12). Oczywiście mogłoby się tak stać, gdybyśmy oszacowali x za nisko o całą wartość 8x i niedoszacowali y o całą wartość 5y. I oczywiście jest całkiem nieprawdopodobne, by mogło się tak zdarzyć. Jeśli x i y mierzone są niezależnie, nasze niepewności zaś mają charakter przypadkowy, istnieje 50% szans, żeby niedoszacowaniu x towarzy szyło przeszacowanie y i odwrotnie. Zatem w sposób oczywisty prawdopodo bieństwo, że niedoszacujemy zarówno x jak i y o całe wartości Sx i 8y jest zupełnie małe. Tak więc wartość 8q « 8x + Sy przeszacowuje nasz prawdopo dobny błąd. Co zatem stanowi lepsze przybliżenie 85? Zależy to od tego, co dokładnie rozumiemy pod pojęciem niepewności (tj. co mamy na myśli mówiąc, że q mieści się „prawdopodobnie" gdzieś pomiędzy q — bq i q + 8q). Zależy to także od tego, jakie prawa statystyczne rządzą błędami w naszym pomiarze. W rozdziale 5 omówimy rozkład normalny (Gaussa), który opisuje pomiary podlegające niepewnościom przypadkowym. Zobaczymy, że jeśli pomiary x i y zostały wykonane niezależnie i obydwa z nich podlegają rozkładowi normalnemu, to niepewność q = x + y dana jest przez np
nv
(3.13) Tak więc reguła określona równaniem (3.13) może być sformułowana w następujący sposób: jeśli pomiary x i y są niezależne i są obarczone jedynie błędami przypadkowymi, to niepewność S
3
W angielskim oryginale procedura ta nazywana jest adding in quadrature lub quadratic sum. W języku polskim nie istnieje odpowiednik tego wyrażenia. W książce tej będziemy ją nazywać metodą kwadratową przenoszenia błędów lub po prostu pierwiastkiem z sumy kwadratów (przyp. tłum.).
67
Ważne jest porównanie nowego wyrażenia (3.13) na niepewność sumy q = x + y z wyrażeniem starym 5q^8x
+ 8y.
(3.14)
Po pierwsze nowa wartość (3.13) jest zawsze mniejsza niż stara (3.14), co można zobaczyć korzystając z prostego argumentu geometrycznego. Dla dowolnych dwóch liczb dodatnich a i b liczby a, b i Ja + b są długościami trzech boków trójkąta prostokątnego (rys. 3.2). Ponieważ długość dowolnego boku trójkąta jest zawsze mniejsza niż suma długości pozostałych dwóch boków, więc sja + b < a + b i stąd wartość (3.13) jest zawsze mniejsza niż wartość (3.14). 2
2
2
2
b
a
Rysunek 3.2. Ponieważ długość każdego boku trójkąta jest mniejsza suma długości pozostałych 2
dwóch boków, więc zawsze jest prawdą, że y/a
2
+b
< a+ b
Ponieważ wyrażenie (3.13) daje zawsze mniejszą wartość niepewności sumy q = x + y niż wyrażenie (3.14), powinno się zawsze stosować wyrażenie (3.13), jeśli tylko można je zastosować. Jednak nie zawsze można to zrobić. Łatwo wymyślić pomiar, w którym wyrażenie to się nie stosuje. Załóżmy na przykład, że q = x + y jest sumą dwóch długości x i y zmierzo nych tą samą stalową taśmą mierniczą. Przypuśćmy dalej, że głównym źród łem niepewności jest nasza obawa, że taśmę tę zaprojektowano do użytku w innej temperaturze niż temperatura, w której my z niej korzystamy. Jeśli nie znamy tej temperatury (i nie mamy wiarygodnego wzorca długości), to musimy uznać, że nasza taśma może być dłuższa lub krótsza niż jej wykalibrowana długość i jej odczyt może dawać wartość mniejszą lub większą niż prawdziwa długość. Niepewność tę można łatwo uwzględnić . Jednak problem polega na 4
4
5
Przypuśćmy na przykład, że współczynnik rozszerzalności taśmy wynosi a — 1 0 " na stopień i uznaliśmy, że różnica pomiędzy temperaturą, w jakiej została wykalibrowana, i tem peraturą naszego pomiaru prawdopodobnie nie jest większa niż 10°C. Tak więc najprawdopodob niej jej prawdziwa długość nie różni się więcej niż 1 0 ~ czy 0,01% od długości pokazywanej. Oznacza to, że niepewność naszego pomiaru równa jest 0,01%. 4
68
tym, że jeśli taśma jest dłuższa, to niedoszacujemy zarówno x jak i y, jeśli zaś taśma jest krótsza, to przeszacujemy zarówno x jak i y. Zatem brak możliwości znoszenia się niepewności, która usprawiedliwia zastosowanie do obliczenia niepewności q = x + y reguły kwadratowego przenoszenia błędów. Sprawdzimy później (w rozdziale 9), że niepewność q = x + y na pewno nie jest większa niż zwykła suma Sx + 8y, bez względu na to czy nasze błędy były niezależne i przypadkowe, czy też nie: 5 q ^ 5 x + 5y.
(3.15)
Oznacza to, że nasze stare wyrażenie (3.14) na bq jest faktycznie górną granicą, która dotyczy wszystkich przypadków. Jeśli mamy jakikolwiek powód, żeby podejrzewać, że błędy x i y nie są niezależne i przypadkowe (jak w przypadku stalowej taśmy mierniczej), to użycie w celu określenia ?>q reguły kwadratowego przenoszenia błędu (3.13) nie jest uzasadnione. Z dru giej strony ograniczenie (3.15) gwarantuje, że ?>q z pewnością nie jest większe niż 5x + 5y i najbezpieczniejszym trybem postępowania będzie użycie starej reguły 5
8q
« 8x + 8y.
Często nie ma istotnej różnicy, czy stosuje się regułę kwadratowego czy liniowego przenoszenia błędów. Załóżmy na przykład, że x i y są długościami zmierzonymi z niepewnością 8x = 8y = 2 mm. Jeśli jesteśmy pewni, że niepew ności te są niezależne i przypadkowe, to możemy ocenić błąd sumy x + y jako pierwiastek z sumy kwadratów, ^ / ( 8 x ) + (8y) = y/4 + 4 mm = 2,8 mm K 3 mm, 2
2
ale jeśli podejrzewamy, że niepewności te mogą nie być niezależne, to musimy użyć zwykłej sumy 8x + 8y
x (2 + 2) mm
= 4 mm.
W wielu eksperymentach ocena niepewności jest na tyle zgrubna, że różnica między tymi dwiema odpowiedziami (3 mm i 4 mm) jest bez znaczenia. Z drugiej strony, czasami pierwiastek z sumy kwadratów jest znacząco mniej szy niż zwykła suma. Tak więc, dość zaskakująco, pierwiastek z sumy kwad-
5
W dalszym ciągu posługiwać się będziemy terminem metody liniowego przenoszenia
błędów (przyp.
tłum.).
69
ratów jest czasem prostszy do policzenia niż zwykła suma. Przykłady takiego efektu poznamy w następnym paragrafie.
3.4. Więcej o niepewnościach niezależnych W poprzednim paragrafie dyskutowaliśmy, w jaki sposób niezależne, przypad kowe niepewności dwóch wielkości x i y przenoszą się na niepewność sumy x + y. Zobaczyliśmy, że dla takiego rodzaju niepewności obydwa błędy powin ny być dodawane zgodnie z regułą kwadratowego przenoszenia błędów. W naturalny sposób można rozważyć analogiczne zagadnienie dla różnic, iloczynów i ilorazów. Można pokazać, jak to udowodnimy wkrótce, że modyfikacja naszych poprzednich reguł (3.4) i (3.8) polega tylko na zamianie sumy błędów (lub błędów względnych) na pierwiastek z sumy kwadratów. Następnie udowodnimy, że stare wyrażenia (3.4) i (3.8) są w istocie górnymi ograniczeniami, które są słuszne bez względu na to, czy niepewności są niezależne i przypadkowe czy też nie. Ostateczne wersje naszych reguł będą więc brzmieć następująco:
Niepewność sumy i różnicy Załóżmy, że kilka wielkości x, ...,w zmierzono z niepewnościami 8x, 8w, zmierzonych zaś wartości użyto do obliczenia q = x+ ... +z— (w+ ... +w). Jeśli wiadomo, że niepewności x, w są niezależne i przypadkowe, to niepewność obliczonej wartości q jest pierwiastkiem z sumy kwadratów: 2
2
2
bq = V(8x) + ... + (5z) + (Su) + ... + (Sw)
2
(3.16)
niepewności początkowych. W żadnym przypadku bq nie jest jednak większe niż zwykła ich suma Sq < 8 x + ... + 8 z + 8 u + ... +8w.
70
(3.17)
Niepewność iloczynu i ilorazu Przypuśćmy, że pewne wielkości x , w mierzone z niepewnościami względnymi 8x, ...,Sw używane są do ob liczenia ilorazu x ••• z q= . u ••• w Jeśli niepewności x,..., w są niezależne i przypadkowe, to niepewność względna obliczonej wartości q jest pierwia stkiem z sumy kwadratów początkowych wartości nie pewności względnych
z
+
M
+
4i~VV*/"v / \ J "\
w
(3
18)
/ ''
W każdym przypadku niepewność ta nie jest większa niż ich zwykła suma 8q
Sx
8z
Su
Sw
\q\
\x\
z
u
w
Zauważmy, że nie uzasadnialiśmy jeszcze reguły kwadratowego przeno szenia błędów dla niepewności niezależnych i przypadkowych. Dowiedliśmy tylko, że jeśli różne niepewności są niezależne i przypadkowe, to jest duża :^nsa na częściowe zniesienie się błędów, i że ostateczna niepewność powin na być mniejsza niż zwykła suma składowych niepewności (lub niepewności zględnych); pierwiastek z sumy kwadratów ma tę własność. Właściwe .zasadnienie użycia tej reguły przedstawimy w rozdziale 5. Wyprowadzenie : graniczeń (3.17) i (3.19) zostanie przedstawione w rozdziale 9.
Przykład Jak już mówiliśmy, czasami nie ma większej różnicy, czy obliczamy niepewno ści używając pierwiastka z sumy kwadratów czy też zwykłej sumy. Z drugiej strony, często istnieje zasadnicza różnica i, dość zaskakująco, pierwiastek z sumy kwadratów jest często o wiele prostszy do obliczenia. Aby zobaczyć, jak to się może dziać, rozważmy następujący przypadek.
71
Załóżmy, że chcemy znaleźć sprawność silnika elektrycznego na prąd stały, używając go do podnoszenia masy m na wysokość h. Praca wykonana przez silnik będzie równa mgh, energia elektryczna zaś dostarczona silnikowi równa jest Vit, gdzie V jest napięciem, I - prądem, t - czasem pracy silnika. Sprawność równa jest więc praca wykonana przez silnik sprawność n - energia dostarczona silnikowi mgh Vit ' Załóżmy, że m, h, Vi I mogą być zmierzone z dokładnością 1%, (niepewność względna m, h, Vi I) — 1%, czas t zaś ma niepewność 5%, (niepewność względna t) = 5%. (Oczywiście g znane jest z zaniedbywalną niepewnością.) Jeśli teraz obliczymy niepewność n, to zgodnie z naszą starą regułą („niepewności względne dodają się") otrzymamy niepewność 8w
bm
— « n
bh
bV
SI
bt
+ — + — + — +—
m h V I t = (1 + 1 + 1 + 1 + 5)% = 9 % .
Z drugiej strony, jeśli ufamy, że różne niepewności są niezależne i przypad kowe, możemy obliczyć bn/n, korzystając z reguły kwadratowego przenoszenia błędów, i otrzymać
br¡
IfbrnV 2
2
íbhY 2
fbVV 2
fblV
2
fbt\
= /l + l + l + l + 5 % 2
N
= / 2 9 ~ % ss 5%. x
Wyraźnie widać, że reguła kwadratowego przenoszenia błędów prowadzi do znacząco mniejszej oceny 8^. Co więcej, widać, że z dokładnością jednej cyfry znaczącej niepewności m, h, Vii nie dają żadnego wkładu do niepewności n obliczonej w ten sposób, a więc z dokładnością do jednej cyfry znaczącej stwierdziliśmy (w tym przykładzie), że bn n
72
bt t
Łatwo zrozumieć to uderzające uproszczenie. Kiedy stosuje się regułę kwad ratowego przenoszenia błędów, wówczas liczby najpierw podnosi się do kwadratu, a następnie sumuje. Podnoszenie do kwadratu wyolbrzymia znacze nie dużych liczb. W ten sposób, jeśli jedna liczba jest 5 razy większa niż każda inna (jak w naszym przykładzie), to jej kwadrat jest 25 razy większy niż każdy inny i zwykle możemy pozostałe kwadraty całkowicie zaniedbać. Przykład ten pokazuje, jak zwykle lepiej i często łatwiej sumować błędy, stosując regułę kwadratowego przenoszenia błędów. Pokazuje on także, w ja kiego rodzaju zadaniach błędy są niezależne i uprawnione jest stosowanie tej reguły. (Na razie przyjmujemy założenie, że błędy są przypadkowe. Omówimy to trudniejsze zagadnienie w rozdziale 4.) Pięć zmierzonych wielkości (m, h, V, I i t) to różne wielkości fizyczne, mające różne jednostki i mierzone całkowicie różnymi sposobami. Zupełnie nieprzekonujące jest, że źródła błędu jakiejkol wiek z tych wielkości są skorelowane ze źródłami błędu którejkolwiek z pozo stałych. Zatem uzasadnione jest traktowanie błędów jako niezależnych i ob liczanie pierwiastka z sumy kwadratów.
3.5. Dowolna funkcja jednej zmiennej Wiemy już jak niepewności, zarówno niezależne jak i zależne, przenoszą się na sumy, różnice, iloczyny i ilorazy. Jednak wiele rachunków wymaga bardziej skomplikowanych operacji, jak obliczenie sinusa, kosinusa czy pierwiastka kwadratowego, i będziemy musieli wiedzieć, jak w tych przypadkach przeno szą się niepewności. Jako przykład wyobraźmy sobie zadanie polegające na znalezieniu współ czynnika załamania światła n szkła poprzez pomiar granicznego kąta załama nia 9. Z elementarnej optyki wiadomo, że n = l/sin 9. Jeśli zmierzymy kąt 9, łatwo obliczymy współczynnik załamania n. Musimy jednak potem zdecydo wać, jaka niepewność 8n rezultatu n = l/sin 0 wynika z niepewności 59 naszego pomiaru 8. Ogólniej, załóżmy, że zmierzyliśmy wielkość x w standardowej formie x + Sx i chcemy obliczyć wartość pewnej znanej funkcji q(x), jak np. q(x) = l/sinx lub q(x) = v x • Jednym z prostszych sposobów wyobrażenia sobie takiego rachunku jest narysowanie wykresu q(x) jak na rys. 3.3. Najlep sze przybliżenie q(x) równe jest oczywiście q = q(x ). (Wartości x i q zaznaczone są na rys. 3.3 grubymi liniami.) Aby określić niepewność <5q, zastosujemy nasze zwykłe rozumowanie. Największa prawdopodobna wartość x równa jest x + 8x; korzystając z wy kresu, znajdziemy natychmiast największą prawdopodobną wartość q, oznan p
np
ap
n p
np
n p
73
Rysunek 3.3. Wykres funkcji q(x). Jeśli x zostało zmierzone jako x ± 8 x , to najlepszym przybliżeniem wartości funkcji q(x) jest q = q(x ). Największa i najmniejsza prawdopodobna wartość funkcji q(x) odpowiada wartościom x równym odpowiednio x + 8x n p
np
np
n p
czoną jako
min
miB
max
nv
ap
8
np
(3.20)
Jednocześnie jedno z podstawowych twierdzeń analizy matematycznej mówi, że dla dowolnej funkcji q(x) i dostatecznie małego przedziału u dq q(x + u)—q(x) = ——u. dx Zatem, pod warunkiem, że niepewność 8x jest mała (jak to zawsze zakładaliś my), możemy przepisać różnicę (3.20) w postaci Sq = ^-dx.
74
(3.21)
8?
— bx
Rysunek 3.4. Jeśli funkcja q(x) jest malejąca, to największa prawdopodobna wartość q od powiada najmniejszej wartości x i odwrotnie
Oznacza to, że aby znaleźć niepewność 8q, wystarczy tylko obliczyć pochodną dq/dx i pomnożyć ją przez niepewność 8x. Równanie (3.21) nie jest ostateczną postacią naszej reguły. Zostało wy prowadzone dla funkcji z rys. 3.3, której pochodna jest dodatnia. N a rysunku 3.4 przedstawiono funkcję o ujemnej pochodnej. W takim przypadku najwięk sza prawdopodobna wartość
np
(3.22) Ponieważ dq/dx jest ujemne, możemy zapisać — dq/dx jako |dq/dx| i otrzymać następującą ogólną regułę:
Niepewność wartości dowolnej funkcji jednej zmiennej Jeśli x jest mierzone z niepewnością 8x i wykorzys tywane do obliczenia wartości funkcji q(x), to niepew ność 8q jest równa &q 8q = 8x.
(3.23)
75
Rozważmy prosty przykład zastosowania tej reguły. Przypuśćmy, że znaleźliś my kąt 9 jako 9 = 20 + 3°, i chcemy obliczyć cos6>. Naszym najlepszym przybliżeniem cos 9 jest oczywiście cos 20° = 0,94 i zgodnie z równaniem (3.23) niepewność równa jest 8(cos0) =
dcos0
80 = | sin #186* (w radianach).
d9
(3.24)
Zaznaczyliśmy, że 80 musi być wyrażone w radianach, ponieważ pochodna cos (9 równa jest — sin0 tylko wtedy, gdy 9 wyrażone jest w radianach. Tak więc przepiszemy 80 = 3° jako 80 = 0,05 rad; wówczas z równania (3.24) otrzymujemy S(cos0) = (sin20°)-0,05 = 0,34-0,05 = 0,02. Zatem ostateczna odpowiedź brzmi: cos0 = 0,94 + 0,02. Jako drugi przykład zastosowania reguły (3.23) obliczymy ponownie (i uogólnimy) wynik otrzymany w paragrafie 3.2. Przypuśćmy, że mierzymy wielkość x, a następnie obliczamy jej potęgę q(x) = x" (gdzie n jest dowolną znaną określoną liczbą dodatnią lub ujemną). Zgodnie z równaniem (3.23) ostateczna niepewność q równa jest 8q =
8q Sx
1
Sx = I nx" 18x.
Jeśli podzielimy obie strony tego równania przez \q \ = \x"\, stwierdzimy, że 8q
8x
(3.25)
co oznacza, że niepewność względna q = x" jest | n | razy większa niż niepew ność x. Jest to wynik identyczny z regułą (3.10), znalezioną wcześniej. Jednak wynik ten jest bardziej ogólny, ponieważ n może być teraz dowolną liczbą. N a przykład jeśli n = \ , to q = .Jx
i 8q
1 8x
co oznacza, że niepewność / x jest połową niepewności x. Podobnie niepew ność względna l/x = x jest taka sama jak niepewność samego x. N
_ 1
76
Wynik (3.25) jest tylko szczególnym przypadkiem reguły (3.23). Jednak jest on dostatecznie istotny, aby zasługiwać na osobne wyrażenie następującej ogólnej reguły:
Niepewność wyrażenia potęgowego Jeśli x jest mierzone z niepewnością 5x i wykorzys tywane do obliczenia potęgi q = x" (gdzie n jest ustaloną znaną liczbą), to niepewność względna ą jest \n\ razy większa niż niepewność x, — = \n\—. \q\ \x\
(3.26)
3.6. Przenoszenie błędów krok po kroku Mamy obecnie wystarczające narzędzia, aby poradzić sobie z prawie wszyst kimi zagadnieniami z dziedziny przenoszenia błędów. Dowolne obliczenia mogą być podzielone na sekwencje kroków, z których każdy zawierać będzie tylko jedną z następujących operacji: 1) dodawanie i odejmowanie, 2) mnoże nie i dzielenie, 3) obliczenie wartości funkcji jednej zmiennej jak x", sinx, e* lub lnx. N a przykład obliczając q = x(y — zńnu)
(3.27)
ze zmierzonych wartości x, y, z i u, robimy to w następujących krokach: liczymy wartość funkcji sin u, następnie iloczyn z i sin u, dalej różnicę y i z sina, i ostatecznie iloczyn x i (y — zsinu). Wiemy jak niepewności przenoszą się w każdej z operacji. Jeżeli wszystkie brane pod uwagę wielkości są niezależne, możemy obliczyć niepew ność wyniku końcowego, przechodząc krokami od niepewności wartości zmierzonych. N a przykład jeśli wielkości x, y, z i u w równaniu (3.27) zostały zmierzone z niepewnościami SX,...,SM, moglibyśmy obliczyć niepewność 6
6
W paragrafie 3.9 przedyskutujemy, dlaczego taka procedura krokowa nie daje czasami zadowalających wyników, kiedy poszczególne wielkości nie są niezależne, jak w przypadku funkcji q = x(y — xsiny), gdzie x i y pojawiają się dwa razy. W takim przypadku obliczenie niepewności 5q metodą krokową może prowadzić czasami do przeszacowania niepewności 5
77
ą w następujący sposób: najpierw znajdujemy niepewność wartości funkcji sinw; znając ją, znajdujemy niepewność iloczynu z sin w, następnie niepewność różnicy y — z sin u; wreszcie znajdujemy całkowitą niepewność iloczynu (3.27). Zanim omówimy kilka przykładów tej krokowej metody obliczania błę dów, podkreślmy dwa ogólne fakty. Po pierwsze, niepewności sum i różnic zawierają niepewności bezwzględne (jak 8x), podczas gdy niepewności iloczy nów i ilorazów zawierają niepewności względne (jak 5x/|x|), zatem nasze obliczenia, jak zobaczymy, wymagają sprawności w przechodzeniu od niepew ności bezwzględnych do niepewności względnych i odwrotnie. Po drugie, ważne uproszczenie wszystkich tych obliczeń (jak wielokrotnie podkreślaliśmy) tkwi w tym, że rzadko potrzebna jest znajomość niepewności z dokładnością większą niż jedna cyfra znacząca. Tak więc większość rachunków można szybko przeprowadzić w pamięci, wiele zaś mniejszych niepewności można całkowicie zaniedbać. W typowym doświadczeniu, które składa się z kilku prób, dla pierwszej z nich można przeprowadzić szczegółowy rachunek, uwzględniając wszystkie niepewności. Kiedy się to uczyni, często okazuje się, że wszystkie wyniki są na tyle podobne, że nie potrzeba dodatkowych obliczeń, lub w najgorszym razie rachunki z pierwszej próby wystarczy odrobinę zmodyfikować.
3.7. Przykłady W tym i w następnym paragrafie omówimy szczegółowo trzy przykłady obliczeń, z jakimi można mieć do czynienia na pracowni wstępnej. Żaden z tych przykładów nie jest szczególnie złożony i w istocie niewiele rzeczywis tych zadań jest bardziej skomplikowanych niż te, o których będzie tutaj mowa.
Pomiar przyspieszenia ziemskiego g za pomocą wahadła matematycznego Jako pierwszy przykład rozważmy pomiar przyspieszenia ziemskiego g przy wykorzystaniu wahadła matematycznego. Okres takiego wahadła jest dany powszechnie znanym wzorem T= 2ny/l/g, gdzie / jest długością wahadła. Tak więc jeśli / i Tsą zmierzone, możemy obliczyć g jako 2
2
g = 4n l/T .
(3.28)
Równanie powyższe przedstawia g jako iloczyn lub iloraz trzech czynników 4TZ , l i T . Jeśli poszczególne niepewności są niezależne i przypadkowe, to 2
78
2
niepewność względna naszego wyniku będzie równa pierwiastkowi z sumy kwadratów niepewności względnych tych czynników. Czynnik 4n nie ma niepewności, niepewność T zaś jest dwa razy większa niż niepewność T 2
2
2
HT ) T
ST
2
~T'
Zatem niepewność względna naszego wyniku g będzie równa
Przypuśćmy, że zmierzyliśmy okres T dla danej długości l i otrzymaliśmy ustępujące wyniki : / = 92,95 + 0,1 cm, T= 1,936 + 0,004 s. 7
Najlepsze przybliżenie g łatwo obliczyć, korzystając z równania (3.28), ako 2
48 -(92,95 cm) (1,936 s)
979 cm/s
2
2
Aby znaleźć niepewność g, korzystając z równania (3.29), musimy znać niepew ności względne / i T. Łatwo je obliczyć (w pamięci) jako 5/ y = 0,1%
i
ST — = 0,2%.
?o podstawieniu do równania (3.29) znajdujemy 2
2
— = V ( 0 , l ) + (2-0,2) % = 0,4%, 9 ; : daje 2
2
Sg = 0,004 • 979 cm/s = 4 cm/s . Zatem nasza ostateczna odpowiedź brzmi 2
g
= 979 + 4 cm/s .
7
Mimo że na pierwszy rzut oka niepewność S T = 0,004 s może wydawać się nierealistycznie ~ ała, może być ona łatwo osiągnięta przez pomiar wielu okresów. Jeśli potrafimy mierzyć czas : dokładnością 0,1 s, co jest z pewnością możliwe za pomocą stopera, to pomiar czasu trwania 25 - ahnięć pozwala znaleźć Tz dokładnością 0,004 s.
79
Jeśli doświadczenie to zostanie teraz powtórzone (jak powinna być po wtarzana większość doświadczeń) z innymi wartościami parametrów, nie będzie konieczne ponowne obliczenie niepewności ze wszystkimi szczegółami. Po chwili zastanowienia można prosto zapisać różne wartości /, T i g oraz odpowiadające im wartości błędów w jednej tabelce (patrz zadanie 3.13).
Wyznaczenie współczynnika załamania światła za pomocą prawa Snelliusa Jeśli promień światła przechodzi z powietrza do szkła, to kąty padania (a) i załamania (/?), zdefiniowane na rys. 3.5, wiążą się ze sobą prawem Snelliusa,
powietrze szkło
Rysunek 3.5. Kąty padania a i i załamania /? przy przejściu promienia świetlnego z powietrza do szkła
sina = mm.fi, gdzie n jest współczynnikiem załamania szkła. Tak więc, jeśli zmierzy się kąty a oraz fi, można obliczyć współczynnik załamania n ze wzoru n = sin a/sin fi.
(3.30)
Niepewność tego wyniku jest prosta do obliczenia. Ponieważ n jest ilorazem sina i sin/?, zatem niepewność względna n będzie równa pierwiastkowi z sumy kwadratów niepewności względnych sina i sin fi 5 sin a n
sina
+
8 sin/? sin/?
(3.31)
Aby znaleźć niepewność względną wartości funkcji sinus dowolnego kąta0, zauważmy, że 8sin0
80
d sin 9
de
09 = | cos 6*| 80 (w radianach).
Zatem niepewność względna równa jest
—~wr = |ctg0|80 ( w radianach). I sin 01
(3.32)
Przypuśćmy, że mierzymy teraz kąt fi dla kilku wartości a i otrzymujemy wyniki przedstawione w pierwszych dwóch kolumnach tabeli 3.1 (ze wszyst kimi niepewnościami ocenionymi na ± 1 ° , czyli 0,02 radiana). Łatwo obliczyć : = sina/sin/?, co przedstawiono w następnych trzech kolumnach; następnie pokazano niepewności względne sina i sin fi obliczone zgodnie z równaniem 3.32) i wreszcie n znalezione z równania (3.31). ;
Tabela 3.1. Wyznaczenie współczynnika załamania światła
a (stopnie)
fi (stopnie)
wszystkie + 1
wszystkie + 1
20 40
13 23,5
sin a
0,342 0,643
sin /J
0,225 0,399
n
1,52 1,61
8 sin a
8 sin/?
Sn
| sin a |
| sinll
n
5% 2%
8% 4%
9% 5%
Przed wykonaniem szeregu pomiarów, jak te przedstawione w tabeli 3.1, należy zastanowić się, w jaki sposób najlepiej zapisać dane i obliczenia. Uporządkowany układ tabeli, jak w tabeli 3.1, ułatwia zapisywanie danych i zmniejsza ryzyko popełnienia omyłki w rachunkach. Łatwiej jest także Czytelnikowi śledzić tok obliczeń i sprawdzać je.
3.8. Przykład bardziej skomplikowany Dwa przedstawione właśnie przykłady są typowe dla wielu doświadczeń na pracowni wstępnej. Jednak są też eksperymenty wymagające bardziej skom plikowanych obliczeń. Jako przykład omówimy pomiar przyspieszenia wózka zjeżdżającego po równi pochyłej. 8
8
Czytelnik może pominąć ten paragraf bez obawy o utratę wątku lub mógłby powrócić do niego w związku z zadaniem 3.15.
81
Przyspieszenie wózka na równi pochyłej Weźmy pod uwagę wózek zjeżdżający z równi pochyłej o nachyleniu 9 jak na rys. 3.6. Spodziewane przyspieszenie równe jest g sin0 i jeśli zmierzymy 9, to bez trudu obliczymy spodziewane przyspieszenie wózka i niepewność tego przyspieszenia (zadanie 3.15). Prawdziwe przyspieszenie a możemy znaleźć mierząc czasy przejazdu wózka naprzeciw dwóch fotokomórek, jak pokazano na rys. 3.6. Jeśli wózek ma długość / i przejeżdża naprzeciw pierwszej fotofotokomórka 1
Rysunek 3.6. Wózek zjeżdżający z równi pochyłej o nachyleniu 9. Obie fotokomórki podłączone są do stoperów mierzących czas, w jakim wózek przejeżdża przed fotokomórką
komórki w czasie t jego prędkość równa jest v = l/t W taki sam sposób v = l/t . (Dokładnie rzecz biorąc, prędkości te są średnimi prędkościami, z jakimi wózek przejeżdża naprzeciw obu fotokomórek. Jeśli tylko / jest małe, różnica pomiędzy prędkością średnią a prędkością chwilową nie jest istotna.) Jeśli odległość pomiędzy fotokomórkami jest równa s, to z dobrze znanego równania v = u + 2 as wynika u
2
1
v
2
2
2
2
(3.33) Używając tego wzoru i zmierzonych wartości /, s, t i t , można łatwo znaleźć obserwowane przyspieszenie i jego niepewność. Zbiór danych uzyskanych w tym doświadczeniu (liczby w nawiasie są odpowiednimi niepewnościami procentowymi, jak to Czytelnik łatwo może sprawdzić) wygląda następująco: 1
l = 5,0 ±0,05 cm (1%), s = 100,0 + 0,2 cm (0,2%), t, = 0,054 + 0,001 s (2%), t = 0,031+0,001 s (3%). 2
82
2
(3.34)
Na ich podstawie możemy natychmiast obliczyć pierwszy czynnik we wzorze (3.33) l /2s = 0,125 cm. Ponieważ niepewności względne / i s są równe 1% i 0,2%, więc niepewność l /2s równa jest 2
2
2
2
y ( 2 - l ) + (0,2) % = 2 % . (Zwróćmy uwagę, że niepewność wyznaczenia s nie wnosi zauważalnego wkładu i może zostać zaniedbana.) Zatem 2
/ / 2 s = 0,125 cm + 2%.
(3.35)
Obliczenie drugiego czynnika we wzorze (3.33) i jego niepewności prze prowadzimy krokami. Ponieważ niepewność względna t jest równa 2 % , więc niepewność względna l / t jest równa 4 % . Zatem, ponieważ t = 0,054 s, Ł
2
x
2
2
l / t = 343 + 14 s~ . 2
Obliczona w ten sam sposób niepewność względna l/r równa jest 6% i l/f
2
2
= 1041 + 62 s " .
Odejmując te wyniki (i obliczając pierwiastek z sumy kwadratów ich niepew ności), znajdujemy 2
- 1 - 1 = 698 + 64 s~ (9%).
(3.36)
Ostatecznie, zgodnie ze wzorem (3.33) szukane przyspieszenie jest iloczy nem wartości (3.35) i (3.36). Mnożąc je (i obliczając pierwiastek z sumy kwadratów ich niepewności względnych), otrzymujemy 2
2
a = (0,125 c m ± 2 % ) '(698 s " + 9%) = 87,3 c m / s + 9% lub 2
a = 87 + 8 cm/s .
(3.37)
Wynik ten moglibyśmy teraz porównać ze spodziewanym przyspieszeniem gsinO, jeśli oczywiście zostało ono policzone. Uważne przestudiowanie rachunków prowadzących do wyniku (3.37) nasu wa kilka interesujących uwag. Po pierwsze, dwuprocentowa niepewność czyn nika Z /2s całkowicie ginie w porównaniu z dziewięcioma procentami niepew ności różnicy (l/f ) — (l/t ). Jeśli do następnych prób potrzebne są kolejne rachunki, to niepewności / i s mogą być całkowicie zaniedbane ( szybki rachunek w pamięci udowadnia, że nadal nie są istotne). 2
2
2
83
Drugą ciekawą cechą naszych obliczeń jest sposób, w jaki dwu- i trzyprocentowe niepewności t i t rosną, kiedy oblicza się l / t i l / t oraz różnicę ( l / t ) — ( l / t ) , dając w efekcie 9% niepewności ostatecznego wyniku. Wzrost ten częściowo wynika z podnoszenia do kwadratu i częściowo z odejmowania dużych liczb. Moglibyśmy sobie wyobrazić rozszerzenie naszego doświadcze nia o sprawdzenie stałości a. Początkowe popchnięcie wózka spowodowałoby wzrost obu prędkości v i v . Jeślibyśmy tak uczynili, to czasy t i t byłyby jeszcze mniejsze, a efekt właśnie opisany dawałby jeszcze gorsze wyniki (patrz zadanie 3.15). 2
1
2
2
2
2
1
2
1
3.9. Ogólna reguła przenoszenia błędów
2
9
Jak dotąd ustaliliśmy trzy główne reguły przenoszenia błędów: dla sum i różnic, dla iloczynów i ilorazów, oraz dla dowolnej funkcji jednej zmiennej. W ostatnich trzech paragrafach zobaczyliśmy, w jaki sposób obliczenie skom plikowanej funkcji może być nierzadko podzielone na kroki, niepewność zaś wyznaczenia wartości tej funkcji obliczona krok po kroku za pomocą naszych trzech podstawowych reguł. W tym końcowym paragrafie przedstawimy jedną ogólną regułę, z której można wyprowadzić wszystkie trzy omówione przez nas wcześniej. Reguła ta pozwala na rozwiązanie wszystkich zagadnień z dziedziny przenoszenia błę dów. Mimo że jest ona zwykle dość niewygodna w użyciu, jest użyteczna z teoretycznego punktu widzenia. Poza tym są problemy, w których lepiej jest od razu zastosować ową ogólną regułę, zamiast obliczać niepewności w kolej nych krokach, jak to omawialiśmy w ostatnich trzech paragrafach. Aby zilustrować, jakiego typu zagadnienia lepiej rozwiązywać metodą jednego kroku, przypuśćmy, że zmierzyliśmy trzy wielkości x, y, z i chcemy obliczyć wartość funkcji x
+
y, q = —— x+z
r(3.38) j*s\
w której jedna zmienna pojawia się więcej niż jeden raz (jak x w naszym przypadku). Jeśli liczylibyśmy niepewność bq W krokach, to najpierw obliczyli byśmy niepewności dwóch sum x + y oraz x + z, potem zaś niepewność ich
9
Czytelnik może odłożyć przeczytanie tego paragrafu bez istotnej utraty ciągłości. Z przed stawionego tu materiału nie będziemy korzystać aż do paragrafu 5.6.
84
ilorazu. Postępując w ten sposób, pominęlibyśmy całkowicie możliwość, że błąd licznika spowodowany niepewnością x może znieść (do pewnego stopnia) błąd mianownika wywołany niepewnością x. Aby zrozumieć, w jaki sposób może to nastąpić, przypuśćmy, że x, y i z są dodatnie i zobaczmy co się stanie, jeśli nasz pomiar x obarczony jest niepewnością. Jeśli przeszacujemy x, to przeszacujemy zarówno x + y, jak i x + z, zatem kiedy policzymy (x + y)/(x + z), owe przeszacowania zniosą się (w dużym stopniu). Podobnie niedoszacowanie x prowadzi do niedoszacowania zarówno x + y, jak i x + z, co także się zniesie, kiedy obliczymy ich iloraz. W każdym wypadku niepewność x ma znacznie mniejszy wpływ na niepewność ilorazu (x + y)/(x + z) niż wynikałoby to z ob liczeń prowadzonych krok po kroku. Zawsze gdy w funkcji ta sama wielkość występuje więcej niż raz, jak w przykładzie (3.38), wówczas niektóre z niepewności mogą się znosić (efekt ten zwany jest czasem kompensacją błędu). Może się wówczas zdarzyć, że obliczenia krok po kroku spowodują przeszacowanie ostatecznej niepewności. Jedynym sposobem, aby tego uniknąć jest obliczenie niepewności w jednym kroku, korzystając z metody, którą teraz omówimy. Załóżmy najpierw, że mierzymy dwie wielkości x oraz y i liczymy wartość pewnej funkcji ą = q(x, y). Funkcja ta może być tak prosta jak ą = x + y lub odrobinę bardziej skomplikowana jak q = ( x + y)sin(xy). Dla funkcji jednej zmiennej q(x) udowodniliśmy, że jeśli najlepsze przybliżenie x jest równe x , to najlepsze przybliżenie q{x) jest równe q{x ). Następnie udowodniliśmy, że ekstremalne (tj. najmniejsza i największa) prawdopodobne wartości x równe są x + 5x, i że odpowiadające im ekstremalne wartości q równe są 10
3
np
nv
n p
(3.39)
Wreszcie, skorzystaliśmy z przybliżenia dq q(x + u) x q(x) + ~ u dx
(3.40)
(dla dowolnego małego przyrostu u), aby przepisać ekstremalne prawdopodob ne wartości (3.39) jako dq 8x. (3.41)
1 0
Funkcje, w której wielokrotnie występuje jedna zmienna, można czasem przepisać w innej formie, gdzie już tak nie będzie. Na przykład, q = xy — xz można przepisać jako q = x(y — z). W tej drugiej postaci niepewność hq może zostać obliczona krok po kroku bez obawy o przeszacowanie ostatecznego wyniku.
85
(Wartość bezwzględna pozwala na uwzględnienie sytuacji, gdy dq/dx jest ujemne.) Wynik (3.41) oznacza, że bq « |dq/dx|5x. Kiedy q jest funkcją dwóch zmiennych q(x, y), argument jest bardzo podobny. Jeśli x i y są najlepszymi przybliżeniami x i y , to spodziewamy się, że najlepsze przybliżenie q równe jest, jak zwykle, n p
n p
q{Xnp,
ynp)-
Aby oszacować niepewność tego wyniku, musimy uogólnić przybliżenie (3.40) na funkcje dwóch zmiennych. Wymaganym uogólnieniem jest q(x + u, y + v)Kq(x,y)
+ ^-u dx
+ -^-v, dy
(3.42)
gdzie u i v są dowolnymi małymi przyrostami x i y , a dq/8x i dq/dy są tak zwanymi pochodnymi cząstkowymi q względem x i y. Oznacza to, że dq/dx jest wynikiem różniczkowania q względem x, przy ustalonym y , a dq/dy to wynik różniczkowania q względem y przy ustalonym x (dalsza dyskusja pochodnych cząstkowych przedstawiona będzie w zadaniach 3.16 i 3.17). Ekstremalne prawdopodobne wartości x i y są równe x + 8x oraz y n p ± 8 y - Jeśli wstawimy je do równania (3.42) i weźmiemy pod uwagę, że dq/dx i dq/dy mogą być dodatnie lub ujemne, znajdziemy ekstremalne wartości q n p
8q_ <ł(x , y ) ± np
n p
dx
bx +
dq
Sy
Oznacza to, że niepewność q(x,y) równa jest bq
dq 8x
5x +
dq dy
by.
(3.43)
Zanim omówimy różne uogólnienia tej nowej reguły, warto zastosować ją do przeliczenia znanych nam już przykładów. Przypuśćmy na przykład, że q(x,y) = x + y,
(3.44)
a więc, że q jest po prostu sumą x i y. Obie pochodne cząstkowe równe są 1, dq dx
dq dy
1,
(3.45)
5x + by.
(3.46)
i zgodnie z równaniem (3.43) bq
86
Jest to dokładnie znana nam reguła, mówiąca, że niepewność sumy x + y równa jest sumie niepewności x i y. Dokładnie tak samo, jeśli q jest iloczynem q = xy, można sprawdzić, że z równania (3.43) wynika znany nam rezultat, że niepewność względna q jest sumą niepewności względnych x i y ( patrz zadanie 3.18). Regułę (3.43) można uogólnić w różny sposób. Czytelnik nie powinien być zaskoczony dowiadując się, że jeśli niepewności 8x i 5y są niezależne i przypad kowe, to suma (3.43) zastępowana jest przez pierwiastek z sumy kwadratów. Jeśli funkcja q zależy od więcej niż dwóch zmiennych, to po prostu dodajemy kolejne wyrażenie odpowiadające każdej następnej zmiennej. Prowadzi to do następującej ogólnej reguły (której dokładne uzasadnienie pojawi się w rozdziałach 5 i 9):
Niepewność wartości funkcji wielu zmiennych Załóżmy, że x, z zmierzone z niepewnościami 5x, 5z służą do obliczenia wartości funkcji q(x, z). Jeśli niepewności wyznaczenia x , z są niezależne i przypa dkowe, to niepewność wyznaczenia wartości funkcji q równa jest
(3.47) W żadnym jednak wypadku nie jest większa niż zwykła suma Sq ^
dq_ 8x+ ... + 5z. dx dz
(3.48)
Najbardziej użyteczną cechą tej ogólnej reguły jest możliwość wyprowa dzenia z niej wszystkich poprzednio poznanych reguł przenoszenia błędu i patrz zadanie 3.18). Bezpośrednie jej użycie jest zwykle dość nieporęczne i prościej jest, jeśli to możliwe, korzystać z naszych poprzednio ustalonych reguł, obliczając błąd krok po kroku. Jednak jeśli w funkcji q(x, z) jakaś zmienna pojawia się więcej niż jeden raz, to może wystąpić efekt kompensacji błędów. Wówczas obliczenia w procedurze krokowej mogą prowadzić do zbyt wysokiego szacowania niepewności końcowej i lepiej jest bezpośrednio ob liczyć niepewność Sq, korzystając z równania (3.47) lub (3.48).
87
Zadania Uwaga: Gwiazdka przy zadaniu oznacza, że szkic rozwiązania lub odpowiedź znajduje się na końcu książki. *3.1y(paragraf 3.1). Dwóch studentów ma zmierzyć prawdopodobieństwo, z jakim z pewnej próbki promieniotwórczej emitowane są cząstki a. Student A zaobserwował 32 rozpady a w ciągu dwóch minut, student B zaś - 786 rozpady a. w ciągu jednej godziny. (Okres połowicznego rozpadu próbki jest na tyle długi, że prędkość rozpadu nie zmienia się w czasie pomiaru.) a) Wykorzystaj równanie (3.2) do obliczenia niepewności wyniku studenta A, który zarejestrował 32 cząstki w ciągu 2 minut. b) Jaka jest niepewność wyniku studenta B, który zaobserwował 786 cząstek w ciągu godziny? c) Aby znaleźć prędkość rozpadu, każdy ze studentów dzieli swój wynik przez czas trwania pomiaru (w minutach). Jakie są wyniki i ich niepewności otrzymane przez obu studentów? (Pomimo że niepewność pomiaru studenta B jest większa niż niepewność pomiaru studenta A, to jednak niepewność prędkości rozpadu określonej przez studenta B jest o wiele mniejsza niż niepewność prędkości znalezionej przez studenta A. Tak więc licząc rozpady przez dłuższy czas, otrzymuje się bardziej dokładną wartość prędkości roz padu. Jest zatem dokładnie tak, jak można byłoby się tego spodziewać.) 3.2 (paragraf 3.2). Student przeprowadza następujące pomiary: a = b = c = t = m=
5 + 1 cm; 18 + 2 cm; 1 2 + 1 cm; 3,0 + 0,5 s; 18 + 1 g.
Wykorzystując reguły (3.4) i (3.8), oblicz następujące wielkości, ich niepewności i niepewności względne: a + b + c, a + b — c, ct, 4 a, b/2 ( gdzie 4 i 2 nie są obarczone żadną niepewnością) oraz mb/1. ^ T T t p a r a g r a f 3.2). Wykorzystując reguły (3.4) i (3.8), wykonaj następujące obliczenia: a) (5 + l) + (8 + 2 ) - ( 1 0 + 4); b) (5 + l)-(8 + 2); c) ( 1 0 ± l ) / ( 2 0 ± 2 ) ; d) 2 n ( 1 0 + l ) . W punkcie (d) liczby 2 i n nie są obarczone żadną niepewnością. 88
j^/p(paragraf 3.2). Mając dobry stoper i odrobinę doświadczenia, można mierzyć czas w zakresie od sekundy do wielu minut z niepewnością rzędu 0,1 s. Przypuśćmy, że chcemy zmierzyć okres % wahadła, jeśli T « 0,5 s. Jeśli zmierzy my czas trwania jednej oscylacji, to niepewność okresu będzie równa około 20%, ale jeśli zmierzymy czas trwania wielu kolejnych oscylacji, to potrafimy zrobić to bardziej dokładnie. Ilustrują to następujące pytania: a) Jaki jest wynik pomiaru T, jego niepewność i niepewność względna, jeśli mierzymy czas trwania pięciu kolejnych wahnięć i otrzymujemy wynik 2,4 + 0,1 s? [Pamiętaj o regule (3.9).] b) Podobne pytanie dla pomiaru czasu trwania 20 oscylacji i wyniku 9,4 + 0,1 s. c) Czy niepewność wyznaczenia z może być w niekończoność poprawiana przez zwiększanie liczby obserwowanych oscylacji? 2
3.5 (paragraf 3.2). Jakie są wartości t , l/t i l / t znalezione t = 8,0 + 0,5 s?
3
i ich niepewności, jeśli
(paragraf 3.2). Turysta zwiedzający średniowieczny zamek chciał zmierzyć głębokość studni, rzucając do niej kamień i mierząc czas upadku. Zmierzony przez niego czas równy był t = 3,0 + 0,5 s. Co może on powiedzieć na temat głębokości studni? 3.7 (paragraf 3.2). Twierdzenie o dwumianie Newtona mówi, że dla dowol nej liczby n i dowolnego x, takiego że |x| < 1, n . v 1, , ( l + x ) = l+nxĄ
2 , n(n-l)(n-2) ——x Ą . , x + ... 1-2 1-2-3 a) Pokaż, że jeśli n jest dodatnią liczbą całkowitą, szereg powyższy ma skończoną liczbę wyrazów. Przepisz go w jawnej postaci dla przypadku n = 2 i n = 3. b) Napisz szereg dwumianowy dla przypadku n = — 1. Otrzymasz wtedy rozwinięcie 1/(1+x) na szereg nieskończony. Dla małego x pozostawienie pierwszych dwóch wyrazów tego szeregu daje dostatecznie dobre przybliżenie, 3
n
L
J
Ą
1/(1+x) » l - x , jak pokazano w równaniu (3.6). Oblicz wartości obydwu wyrażeń dla x = 0,5; 0,1; 0,01, a także dla każdego z x oblicz, o ile procent (1 —x) różni się od 1/(1+x). (paragraf 3.3). Student zmierzył cztery długości: a = 50 + 5, fo = 3 0 ± 3 ,
c = 40 + l,
¿ = 7,8 + 0,3 89
(wszystkie w centymetrach) i obliczył trzy sumy a + b, a + c, a + d. Znajdź niepewności wyników przy założeniu, że błędy zmierzonych wielkości mogą nie być niezależne („dodawanie błędów" jak w regule (3.14)), a także jeśli wiadomo, że niepewności są niezależne i przypadkowe („pierwiastek z sumy kwadratów błędów" jak w regule (3.13)). W którym przypadku można całkowicie zaniedbać niepewność wyznaczenia drugiego składnika sumy (b, c, czy d), jeśli założymy, że chcemy znać niepewności z dokładnością jednej cyfry znaczącej? 3.9 (paragraf 3.4). Rozwiąż zadanie 3.2, zakładając, że wszystkie niepewno ści są niezależne i przypadkowe, tj. obliczając pierwiastek z sumy kwadratów niepewności tak jak w regułach (3.16) i (3.18). 11
iSTlt^ (paragraf 3.5). Istnieje wiele sposobów określania energii cząstek elementarnych w fizyce jądrowej. Jednym z nich jest mierzenie, w jaki sposób cząstka pochłaniana jest przez przeszkodę, taką jak kawałek ołowiu. Wynik porównuje się z publikowanymi wykresami zależności współczynnika absorp cji od energii cząstki. Rysunek 3.7 przedstawia wykres pochłaniania fotonów
>
2
U [cm /g]
Rysunek 3.7. Wykres zależności współczynnika absorpcji ¡1 promieniowania 7 w ołowiu od energii fotonów E
1 1
Obliczanie pierwiastka z sumy kwadratów często można wykonać z wystarczającą dokład nością w pamięci. Warto zwrócić uwagę, że przy przeliczaniu współrzędnych prostokątnych na biegunowe za pomocą kalkulatora dla dowolnego x i y otrzymujemy natychmiast wartość 2
2
s/'x +y .
90
przez ołów. N a osi pionowej przedstawiona jest energia fotonów E w MeV (w milionach elektronowoltów), na osi poziomej zaś odpowiedni współczynnik absorpcji fi w cm /g. (Dokładna definicja tego współczynnika nie jest dla nas teraz istotna; fi jest po prostu wygodną miarą zatrzymywania fotonów przez ołów.) Z tego wykresu natychmiast można odczytać energię fotonu, jeśli tylko znany jest odpowiedni współczynnik absorpcji \x. a) Student bada wiązkę fotonów (wszystkie o tej samej energii) i stwierdza, że współczynnik absorpcji tej wiązki w ołowiu równy jest n = 0,10 + 0,01 cm /g. Korzystając z wykresu, znajdź energię fotonów E i jej niepewność 8E. ( Możesz uznać za pomocne narysowanie na wykresie linii łączących niektóre punkty, tak jak na rys. 3.3.) b) Jakie wnioski wyciągnąłby student, gdyby \i = 0,22 + 0,01 cm /g? I ,/^_* 3.11 (paragraf 3.5). a) Zmierzony kąt 6 równy był 125 + 2°, a wartość ta została wykorzystana do obliczenia sin0. Korzystając z reguły (3.23), oblicz sin0 i jego niepewność. b) Jeśli a zostało zmierzone jako a + 8a, a wartość ta używana jest do obliczenia wartości funkcji f(a) = e" , to jaka jest wartość f i 8 / ? Jeśli a = 3,0 + 0,1, jaka jest wartość e" i niepewność tej wartości? Powtórz punkt (b) dla funkcji / ( a ) = ln a. 2
2
2
n p
np
3.12 (paragraf 3.6). Oblicz następujące wielkości w krokach, jak opisano to w paragrafie 3.6. (Zakładamy, że wszystkie błędy są niezależne i przypadkowe.) a) (12 + 1)-[(25 ± 3 ) - ( 1 0 + 1)]; 3
b) ^ 1 6 + 4 + ( 3 , 0 + 0,1) (2,0 +0,1); c) (20 + 2 ) e - - - . ( 1
0 ± 0
1 )
3.13 (paragraf 3.7). Rozważ dyskusję wahadła matematycznego z paragrafu 3.7. W rzeczywistym eksperymencie powinno zmierzyć się okres T d l a wielu różnych długości / i stąd otrzymać dla porównania różne wartości g. Po chwili namysłu można wygodnie ująć wszystkie dane i obliczenia w pojedynczą tabelę, taką jak tabela 3.2. Wykorzystując tabelę 3.2 (być może zaproponujesz
Tabela 3.2. Wyznaczenie przyspieszenia ziemskiego g za pomocą wahadła matematycznego /(cm) wszystkie +0,1
T(s) wszystkie ±0,001
9 (cm/s )
93,8
1,944
980
70,3 45,7 21,2
1,681 1,358 0,922
2
bl/l
ST/T
89/0
wynik
(%)
(%)
(%)
0 + 8g
0,1
0,05
0,14
980+1,4
91
inną jej postać), oblicz przyspieszenie ziemskie g i jego niepewność 8g dla czterech par przedstawionych danych. Skomentuj zmianę Sg przy zmniej szaniu/. (Odpowiedzi podane w pierwszym wierszu pozwolą ci sprawdzić twoją metodę obliczeń.) ^IJT^paragraf 3.7). Rozważ pomiar współczynnika załamania szkła z paragrafuTf.7. Używając tabeli podobnej do tabeli 3.1, oblicz współczynnik załamania światła n i jego niepewności dla danych z tabeli 3.3. Skomentuj zmianę niepewności. (Wszystkie kąty są mierzone w stopniach; a jest kątem padania, fi - kątem załamania.)
Tabela 3.3. Dane do wyznaczenia współczynnika załamania (w stopniach) a (wszystkie ± 1 ) fi (wszystkie ± 1 )
10 6
20 13
30 19
50 29
70 38
3.15 (paragraf 3.8). Rozważ doświadczenie z paragrafu 3.8, w którym wózek zjeżdża z równi pochyłej o nachyleniu 9. a) Jeśli kółka tego wózka są gładkie i lekkie, to spodziewane przyspieszenie równe jest asinć*. Jeśli 9 zostało zmierzone jako 9 = 5,4 + 0,1°, jakie będzie spodziewane przyspieszenie i jego niepewność? b) Jeśli eksperyment jest powtarzany z innymi warunkami początkowymi (silniejsze pchnięcie na szczycie równi), to jak zwykle dane i wszystkie rachunki mogą zostać zapisane w jednej tabeli, takiej jak tabela 3.4. Z równania (3.33) na przyspieszenie (przyjmując taką samą jak poprzednio wartość l /2s = = 0,125 c m + 2%) oblicz a i 8a. Czy wyniki potwierdzają spodziewaną stałość a i spodziewaną wartość g sin 9 z punktu (a)? Czy w celu sprawdzenia stałości a dla jeszcze większych prędkości warto byłoby mocniej popychać wózek? Wyjaśnij to. 2
Tabela 3.4. Wyznaczanie przyspieszenia a wózka na równi* h (s)
h (s)
1
1
1
1
a
wszystkie +0,001
wszystkie +0,001
~\
2
2
1
(cm/s )
0,054 + 2 % 0,038 0,025
0,031 ± 3 % 0,027 0,020
343 + 14
1040 + 52
698 + 64
2
87±8
* W pierwszym wierszu przedstawiono dane użyte w paragrafie 3.8. W dwóch pierwszych kolumnach przedstawiono zmierzone czasy t i t . Ich niepewność równa jest 0,001 s, co można natychmiast przeliczyć na niepewność względną dla każdego pomiaru. l
92
2
*3.16 (paragraf 3.9). Pochodna cząstkowa dq/dx funkcji q(x, y) otrzymywa na jest poprzez różniczkowanie q względem x przy stałym y. Napisz pochodne cząstkowe dq/dx i dq/dy dla następujących funkcji: a) q(x, y) = x + y, b) q(x, y) = xy, c) q{x, y) = x y . 2
3
'^^7^(paragraf 3.9). Kluczowe przybliżenie wykorzystywane w paragrafie 3.9 wrą"źe wartość funkcji q w punkcie (x + u, y + v) z wartością w sąsiednim punkcie (x, y): dq dq q(x + u, y + v)x q(x, y) + —u + —-v, óx oy
(3.49)
gdy u i v są małe. Sprawdź bezpośrednim rachunkiem poprawność tego przybliżenia dla trzech funkcji z zadania 3.16. Dla każdej z podanych funkcji oblicz obie strony równania (3.49) i pokaż, że są one w przybliżeniu sobie równe, jeśli tylko u i v są małe. Na przykład jeśli q(x, y) = xy, lewa strona równania (3.49) równa jest (x + u)(y + v) = xy + uy + xv + uv. Prawa strona równania (3.49), jak pokażesz, będzie równa xy + yu + xv. Jeśli u i v są małe, to uv może być zaniedbane w pierwszym wyrażeniu i oba wyrażenia będą w przybliżeniu równe. 3.18 (paragraf 3.9). a) Napisz pochodne cząstkowe dq/dx i dq/dy dla funkcji q(x, y) = xy. Przypuśćmy, że mierzymy x i y z niepewnościami 5x i by, a następnie liczymy q{x, y). Znajdź niepewność bq, wykorzystując ogólne reguły (3.47) i (3.48) zarówno dla przypadku, gdy 8x i 8y są przypadkowe i niezależne, jak i wtedy, gdy takie nie są. Podziel wynik przez \q\ = \ xy\ i pokaż, że odtwarzasz proste reguły (3.18) i (3.19) na niepewność względną iloczynu. b) Powtórz punkt (a) dla funkcji q(x, y) = x"y , gdzie n i m są znanymi, ustalonymi liczbami. c) Co stanie się z równaniami (3.47) i (3.48), jeśli q(x) będzie zależeć tylko od jednej zmiennej? m
*3.19 (paragraf 3.9). Jeśli mierzymy trzy niezależne wielkości x, y, z i na stępnie obliczamy wartość funkcji q = (x + y)/(x + z), to - jak to omówiliśmy 93
w paragrafie 3.9 - krokowa procedura obliczenia niepewności q może prowa dzić do zbyt wysokiego oszacowania niepewności 6q. a) Przypuśćmy, że zmierzone wartości równe są x = 20 + 1 , y = 2, z = 0, a także dla uproszczenia załóżmy, że niepewności 8y i 8z są zaniedbywalne. Oblicz poprawnie niepewność 8q, korzystając z reguły (3.47), i porównaj wynik z otrzymanym drogą obliczania 8q krok po kroku. b) Zrób to samo dla wartości x = 2 0 + 1 , y = — 40, z = 0. Wyjaśnij różnice pomiędzy punktami (a) i (b).
R O Z D Z I A Ł
4
ANALIZA STATYSTYCZNA NIEPEWNOŚCI PRZYPADKOWYCH
Stwierdziliśmy, że jedną z najlepszych metod oceny wiarygodności pomiaru jest jego wielokrotne powtarzanie i badanie otrzymanych wyników. W tym i następnym rozdziale opiszemy metody statystyczne służące do takiej analizy pomiaru. Nie wszystkie rodzaje niepewności pomiarowych, jak wspominaliśmy, mo gą być oceniane za pomocą statystycznej analizy wyników wielokrotnych pomiarów. Z tego powodu niepewności pomiarowe dzielą się na dwie grupy: niepewności przypadkowe, które mogą być poddawane obróbce statystycznej i niepewności systematyczne, które takiej obróbce się nie poddają. Różnica między nimi opisana jest w paragrafie 4.1. Pozostałą część tego rozdziału poświęcimy niepewnościom przypadkowym. W paragrafie 4.2 wprowadzimy bez formalnego uzasadnienia dwie istotne definicje odnoszące się do serii pomiarów x ...,x tej samej wielkości x. Po pierwsze, zdefiniujemy średnią x wartości x ...,x . W stosownych warunkach średnia jest najlepszym przy bliżeniem x opartym na zmierzonych wartościach x ...,x . Następnie zdefi niujemy odchylenie standardowe wartości x ,...,x . Jest ono oznaczane przez a i charakteryzuje średnią niepewność pojedynczych zmierzonych wartości x ...,x . W paragrafie 4.3 podamy przykład zastosowania odchylenia stan dardowego. W paragrafie 4.4 wprowadzimy ważne pojęcie odchylenia standardo wego średniej. Oznaczane jest przez a- i charakteryzuje niepewność śre dniej x jako najlepszego przybliżenia x. W paragrafie 4.5 podamy kilka przykładów zastosowania odchylenia standardowego średniej. Wreszcie w paragrafie 4.6 powrócimy do kłopotliwego zagadnienia błędów systematy cznych. v
N
v
N
u
1
N
N
x
v
N
95
Nigdzie w tym rozdziale nie próbujemy w pełni uzasadniać opisywanych metod. Naszym głównym celem jest wprowadzenie podstawowych wzorów i omówienie sposobów ich użycia. Właściwe uzasadnienie, oparte na ważnym pojęciu rozkładu normalnego, zostanie przedstawione w rozdziale 5.
4.1. Błędy przypadkowe i systematyczne Niepewności doświadczalne, które mogą być ujawnione poprzez wielokrotne powtarzanie pomiaru, nazywamy błędami przypadkowymi, te zaś, które nie dadzą się w ten sposób ujawnić, nazywamy błędami systematycznymi. Aby zilustrować tę różnicę, rozważmy kilka przykładów. Przypuśćmy na początek, że mierzymy okres jednostajnie obracającego się stolika obrotowego. Jednym ze źródeł błędu będzie czas naszej reakcji przy włączaniu i wyłączaniu stopera. Gdyby był on zawsze identyczny, wtedy obydwa opóźnienia nawzajem by się znosiły. W praktyce jednak czas naszej reakcji będzie się zmieniał. Możemy bardziej opóźniać włączanie stopera, co prowadziłoby do niedoszacowania okresu, lub bardziej opóźniać jego zatrzymanie, co z kolei powodowałoby przeszacowanie okresu. Ponieważ obydwa zdarzenia są jednakowo prawdopo dobne, więc całkowity efekt ma przypadkowy charakter. Jeśli wielokrotnie powtarzamy nasz pomiar, czasami szacujemy wynik zbyt wysoko, a czasami zbyt nisko. Tak więc zmienność czasu reakcji ujawni się jako zmienność znalezionych odpowiedzi. Analizując metodami statystycznymi rozrzut tych wyników, możemy dostać bardzo wiarygodne oszacowanie tego rodzaju błędu. Z drugiej strony, jeśli nasz stoper systematycznie się późni, to wszystkie zmierzone czasy będą oszacowane zbyt nisko i powtarzanie pomiaru (tym samym stoperem) nigdy nie ujawni tego źródła błędu. Taki rodzaj błędu zwany jest systematycznym, ponieważ zawsze przesuwa nasze wyniki w tę samą stronę. (Jeśli stoper się późni, to zawsze szacujemy wynik zbyt nisko, jeśli zaś się spieszy, to zawsze szacujemy go za wysoko.) Błędów systematycz nych nie można wykryć stosując metody statystyczne, jakie obecnie będzie my rozważać. Jako drugi przykład na pojawienie się błędów przypadkowych i systematy cznych rozważmy pomiar pewnej dobrze określonej długości za pomocą miarki. Jednym ze źródeł niepewności będzie potrzeba interpolacji pomiędzy kreskami podziałki na miarce - ta niepewność będzie prawdopodobnie przy padkowa. (Prawdopodobnie w trakcie interpolacji oszacownie zbyt niskie, jak i zbyt wysokie zdarzyć się może jednakowo często.) Istnieje jednak niebez pieczeństwo, że nasza miarka została zniekształcona i takie źródło niepewności 96
najpewniej ma systematyczny charakter. (Jeśli miarka jest rozciągnięta, nasz wynik zawsze będzie zbyt mały, jeśli jest skurczona, zawsze dostaniemy zbyt duży rezultat.) Prawie wszystkie pomiary, tak samo jak w powyższych przykładach, obarczone są niepewnościami zarówno przypadkowymi, jak i systematycz nymi. Czytelnik powinien bez problemu podać więcej takich przykładów. W szczególności warto zwrócić uwagę, że najpowszechniejszymi źródłami niepewności przypadkowych są drobne błędy popełniane przez obserwatora przy odczycie wyniku (jak podczas interpolacji), niewielkie zakłócenia w funk cjonowaniu przyrządów (powodowane np. przez drgania mechaniczne), zagad nienia definicji i wiele innych. Najbardziej być może oczywistym powodem powstawania niepewności systematycznych jest zła kalibracja instrumentu pomiarowego jak w przypadku późniącego się stopera, rozciągniętej miarki czy niewłaściwie wyzerowanego miernika. Rozróżnienie pomiędzy błędami przypadkowymi i systematycznymi nie zawsze jest bardzo wyraźne. Jeśli na przykład przesuwasz głowę przed skalą typowego miernika (jak w przypadku zwykłego zegara), zmienia się wartość, jaką z niego odczytujesz. Efekt ten, znany jako paralaksa, oznacza, że wskaza nie miernika jest właściwe tylko wtedy, gdy odczytujemy je będąc dokładnie naprzeciw skali. Ale nawet będąc uważnym obserwatorem, nie jesteś w stanie zawsze umieścić swojego oka dokładnie naprzeciw skali miernika. W konsek wencji twój pomiar zawsze będzie obarczony niewielką niepewnością spowo dowaną przez paralaksę i niepewność ta będzie prawdopodobnie przypad kowa. Z drugiej strony nieuważny eksperymentator umieszczający miernik z jednej strony swojego stanowiska i zapominający o paralaksie wprowadzi do wszystkich swoich odczytów błąd systematyczny. Tak więc ten sam efekt paralaksy może powodować raz niepewności przypadkowe, a raz niepewności systematyczne. Analiza błędów przypadkowych różni się całkowicie od obróbki błędów systematycznych. Metody statystyczne opisane w następnych paragrafach dają wiarygodną ocenę niepewności przypadkowych i, jak zobaczymy, poprzez zastosowanie dobrze zdefiniowanej procedury umożliwiają ich redukcję. Z drugiej strony niepewności systematyczne są trudne do oszacowania, a na wet do wykrycia. Doświadczony eksperymentator musi nauczyć się przewidy wania możliwych źródeł błędów systematycznych i upewniania, że błędy systematyczne są dużo mniejsze niż wymagana precyzja pomiaru. Takie postępowanie mogłoby polegać na przykład na sprawdzeniu mierników za r>omocą pewnych ustalonych standardów i ich skorygowaniu, czy też, jeśli to niezbędne, na kupieniu nowych. Niestety na pierwszej pracowni kontrola tego rodzaju rzadko jest możliwa, tak więc opracowanie błędów systematycznych
97
jest często dość nieporadne. Ten problem omówimy w paragrafie 4.6. N a razie będziemy mówić o doświadczeniach, w których wszystkie źródła błędów systematycznych są zidentyfikowane, a same błędy dużo mniejsze niż wymaga na precyzja.
4.2. Średnia i odchylenie standardowe Przypuśćmy, że mamy zmierzyć pewną wielkość x. Wykryliśmy przy tym wszystkie źródła niepewności systematycznych i zredukowaliśmy je do zaniedbywalnego poziomu. Ponieważ wszystkie pozostałe źródła niepewności są przypadkowe, powinniśmy umieć je wykryć powtarzając pomiar wielokrotnie. Moglibyśmy przykładowo pięciokrotnie wykonać pomiar, otrzymując nastę pujące wyniki: 71, 72, 72, 73, 71
(4.1)
(gdzie dla wygody pominęliśmy jednostki). Pierwsze pytanie, jakie stawiamy, brzmi następująco: Jeśli znamy zmierzo ne wartości (4.1), to jakie jest najlepsze przybliżenie x wartości x. Wydaje się uzasadnione, że najlepszym przybliżeniem będzie średnia x pięciu znalezionych wartości. W rozdziale 5 udowodnimy, że zwykle tak jest. Tak więc ap
X
np
=
X
71 + 7 2 + 72 + 73 + 71 ~
5
= 71,8,
(4.2) 1
przy czym drugi wiersz jest po prostu definicją średniej x danych liczb . Ogólniej, przypuśćmy, że przeprowadziliśmy N pomiarów wielkości x (wszystkie tym samym urządzeniem i w identyczny sposób) i znaleźliśmy N wartości: x^
x±,•••)Xjf.
(4-3)
1
W czasach kalkulatorów kieszonkowych warto być może zwrócić uwagę, że średnia jak w równaniu (4.2) może być szybko obliczona w pamięci. Ponieważ wszystkie liczby mają siedem diziesiątek, tak samo musi być ze średnią. Pozostaje zatem obliczyć średnią z liczb 1, 2, 2, 3, 1 stojących na miejscu jedności. Ich średnia to oczywiście — = 1,8 i nasza odpowiedź to x = 71,8.
98
Zwykle najlepszym przybliżeniem x jest średnia x ,...,x . 1
x
Oznacza to, że
N
= x,
np
(4.4)
gdzie
x
N (4.5)
N '
W ostatnim wierszu wprowadziliśmy użyteczną notację skróconą, zgodnie z którą w
X x = ^x i= 1 i i
j
i
= ^x j
= x + x +...+
i
1
x;
2
N
drugie i trzecie wyrażenie są często spotykanymi skrótami, których będziemy używać, gdy nie będzie niebezpieczeństwa pomyłki. Pojęcie średniej jest prawie na pewno dobrze znane większości czytelników. Z następnym terminem - odchyleniem standardowym - pewnie już tak nie jest. Odchylenie standardowe pomiarów x x ,...,x jest miarą średniej niepewności pomiarów x , x ,...,x i dochodzi się do niego w następujący sposób. Zakładając, że średnia x jest najlepszym przybliżeniem wielkości x, natural ne jest rozważenie różnicy x — x — d . Różnica ta zwana często odchyleniem wartości x od x mówi nam, o ile wynik i-tego pomiaru różni się od średniej x. Jeśli odchylenia d = x — x są bardzo małe, to wszystkie wyniki naszych pomiarów są skupione i przypuszczalnie bardzo dokładne. Jeśli jakieś od chylenie jest duże, to w oczywisty sposób znaczy, że nasze pomiary nie są tak precyzyjne. Aby upewnić się, że dobrze rozumiemy koncepcję odchylenia, policzmy odchylenia dla pięciu wyników pomiarów (4.1). Rezultaty takich obliczeń można przedstawić w tabeli, takiej jak tabela 4.1. Zwróćmy uwagę, że po szczególne odchylenia są (oczywiście) różnej wielkości; d jest małe, jeśli wynik i-tego pomiaru x niewiele różni się od x, jeśli zaś wynik x jest daleki od x, to d jest duże. Zwróćmy uwagę, że niektóre d są dodatnie, a niektóre ujemne, ponieważ niektóre z naszych wyników x muszą być większe od średniej x, a inne muszą być mniejsze. Aby oszacować średnią wiarygodność pomiarów x x , . . . , x , moglibyśmy w naturalny sposób uśrednić odchylenia d . Niestety rzut oka na tabelę 4.1 t
1
2
2
N
N
i
{
;
i
i
t
;
;
i
t
;
u
2
5
t
99
mówi nam, że średnie odchylenie równe jest zeru. W istocie będzie tak dla dowolnego zestawu danych pomiarowych x l s x2,...,xJV, ponieważ definicja średniej x zapewnia, że d = x —x jest czasem dodatnie, a czasem ujemne dokładnie w taki sposób, aby średnia d była równa zeru (patrz zadanie 4.3). Zatem jest jasne, że średnia odchyleń nie jest dobrym wskaźnikiem wiarygod ności pomiarów x x ,...,x . i
u
2
i
N
Tabela 4.1. Obliczanie odchyleń Odchylenie d = x — x
Numer pomiaru i
Wartość zmierzona x
1 2 3 4 5
71 72 72 73 71
-0,8 0,2 0,2
3c = 71,8
d = 0,0
{
;
t
1,2 -0,8
Najlepszym sposobem ominięcia tego kłopotu jest podniesienie do kwad ratu wszystkich odchyleń, co stworzy zbiór liczb dodatnich, a następnie znalezienie ich średniej . Jeśli następnie obliczymy pierwiastek z tej średniej, to otrzymamy wartość w takich samych jednostkach jak x. Liczba ta zwana jest odchyleniem standardowym (dyspersją) x x ,...,x i oznaczana jest symbo lem a 2
v
2
N
x
Zgodnie z tą definicją odchylenie standardowe można opisać jako pierwiastek ze średniego kwadratowego odchylenienia pomiarów x , x ,...,x . Okazuje się, że jest ono użyteczną wielkością charakteryzującą wiarygodność pomiarów. (Wkrótce dodamy, że definicja (4.6) jest czasami modyfikowana przez zamianę N w mianowniku na N — 1.) ^ Aby obliczyć odchylenie standardowe a zdefiniowane w równaniu (4.6), musimy obliczyć odchylenia d , podnieść je do kwadratu, obliczyć średnią tych 1
2
N
x
t
2
Innym rozwiązaniem byłoby obliczenie średniej z wartości bezwzględnych \d \, jednak okazuje się, że średnia d jest bardziej użyteczna. Średnia zwana jest czasem (myląco) średnim t
2
odchyleniem (ang. average
100
deviation).
kwadratów i znaleźć pierwiastek tej średniej. Dla pięciu pomiarów z tabeli 4.1 możemy obliczyć o , jak to pokazano w tabeli 4.2. x
Tabela 4.2.
Obliczanie odchyleń standardowych
Numer pomiaru i
Wartość zmierzona x
Odchylenie d = x —x
d]
1 2 3 4 5
71 72 72 73 71
-0,8 0,2 0,2
0,64 0,04 0,04 1,44 0,64
t
t
t
1,2 -0,8
5c = 71,8
YA] = 2,80
Dodając wartości d\ z czwartej kolumny tabeli 4.2 i dzieląc tą sumę przez 5, otrzymujemy wielkość o (często nazywaną wariancją pomiarów), x
^ = ^
7
—
^ = 0,56.
(4.7)
Obliczając jej pierwiastek, otrzymujemy odchylenie standardowe a « 0,7.
(4.8)
x
Tak więc średnia niepewność wyników pięciu pomiarów 71, 72, 72, 73, 71 równa jest około 0,7. Niestety istnieje także inna definicja odchylenia standardowego. Pewne argumenty teoretyczne przemawiają za zamianą czynnika N w mianowniku wyrażenia (4.6) na N — 1 i za zdefiniowaniem odchylenia standardowego a pomiarów x x , x jako x
v
2
N
Nie będziemy próbować udowadniać, że definicja a (4.9) jest lepsza niż definicja (4.6), ograniczając się jedynie do stwierdzenia, że nowa „zmodyfiko wana" definicja daje odrobinę większą wartość niż definicja (4.6) i że koryguje x
101
to tendencję niedoceniania niepewności pomiarów x x ,...,x szczególnie dla małej liczby pomiarów N. Tendencję tę można zauważyć rozważając eks tremalny (i absurdalny) przypadek N = 1 (a więc tylko jednego pomiaru). W takim wypadku średnia x równa jest naszemu jedynemu wynikowi x i jedyne odchylenie automatycznie równe jest zeru. Definicja (4.6) daje zatem bezsensowny wynik o = 0. Z drugiej strony, z definicji (4.9) dostaniemy wynik 0/0, to znaczy że a jest nieokreślone, co dokładnie odzwierciedla naszą całkowitą niewiedzę na temat niepewności pojedynczego pomiaru . Różnica pomiędzy odchyleniami standardowymi policzonymi za pomocą definicji (4.6) i (4.9) jest liczbowo prawie zawsze nieznacząca. W każdym przypadku powinno się powtarzać pomiar wielokrotnie (co najmniej pięć razy, a lepiej jeszcze więcej). Nawet jeśli przeprowadzamy tylko pięć pomiarów (N = 5), różnica pomiędzy ^ / N " = 2,2 i y/N—l = 2 nie jest dla większości zastosowań znacząca. N a przykład jeśli przeliczymy odchylenie standardowe znalezione w równaniu (4.8), używając „poprawionej" definicji (4.9), otrzyma my a = 0,8 zamiast 0,7, co nie stanowi istotnej różnicy. Niemniej Czytelnik powinien wiedzieć o istnieniu obu tych definicji. Prawdopodobnie najlepiej zawsze korzystać z bardziej ostrożnej (tj. dającej większy wynik) definicji (4.9), jednak w każdym przypadku opis doświadczenia powinien zawierać informa cję, która z definicji została wykorzystana. Dzięki temu, czytając taki opis, można sprawdzić przedstawione w nim obliczenia. u
2
N
1
x
x
3
x
4.3. Odchylenie standardowe jako niepewność pojedynczego pomiaru Powiedzieliśmy, że odchylenie standardowe a charakteryzuje średnią niepew ność wyników pomiarów x , x ,...,x , na podstawie których została obliczo na. Uzasadnimy to w rozdziale 5, dowodząc bardziej precyzyjne stwierdzenie. Jeśli nasze pomiary podlegałyby rozkładowi normalnemu i jeśli powtarzalibyś my pomiary x bardzo wiele razy (zawsze w tym samym układzie pomiaro wym), to około 70 procent naszych wyników byłoby oddalone od x o mniej niż a , czyli 7 0 % naszych wyników leżałoby w zakresie x + a . x
x
2
N
4
x
3
x
W angielskim oryginale odchylenie standardowe zdefiniowane równaniem (4.6) zwane jest
population
standard
deviation,
a definiowane równaniem (4.9) sample standard
deviation.
W literatu
rze polskiej spotyka się czasami określenia odpowiednio: odchylenie standardowe dużej i małej próby (przyp. 4
tłum).
Jak zobaczymy, dokładną wartością jest 68,27... %, ale jasne jest, że zbyt precyzyjnie podawanie wielkości tego rodzaju jest bezsensowne.
102
Możemy wyrazić ten wynik innymi słowy. Przypuśćmy, jak poprzednio, że otrzymaliśmy wyniki x x , ...,x i obliczyliśmy x oraz a . Jeśli przeprowadzi my teraz następny pomiar (w tym samym układzie eksperymentalnym), istnieje 70% prawdopodobieństwa, że wynik tego pomiaru będzie się różnił od x o mniej niż a . Jeśli liczba pomiarów N jest bardzo duża, to x powinno być bardzo wiarygodnym przybliżeniem właściwej wartości x. Tak więc możemy powiedzieć, że istnieje 70% prawdopodobieństwa, że pojedynczy pomiar (w tym samym układzie eksperymentalnym) będzie się różnił od właściwej wartości x o mniej niż a . W oczywisty sposób a znaczy dokładnie to samo, co rozumieliśmy w poprzednich rozdziałach pod pojęciem „niepewności" . Jeśli przeprowadzimy w tym układzie eksperymentalnym pomiar wartości x, to za niepewność związaną z tym pomiarem można przyjąć 5x = a i w wyniku takiego wyboru mamy 70% ufności, że wynik naszego pomiaru różni się od właściwej wartości o mniej niż bx. 1:
2
N
x
x
x
x
x
Aby zilustrować zastosowanie tych koncepcji, przypuśćmy, że dostaliśmy pudełko pełne podobnych sprężyn i mamy zmierzyć ich współczynniki sprężys tości k. Moglibyśmy mierzyć te stałe, obciążając każdą sprężynę i mierząc jej wydłużenie lub prościej, zawieszając tę samą masę na każdej ze sprężyn i mierząc okres jej drgań. Jakąkolwiek byśmy wybrali metodę, musimy znać k i niepewność 5/c dla każdej sprężyny. Jednak wielokrotne powtarzanie pomia rów dla każdej ze sprężyn byłoby beznadziejnym marnowaniem czasu. Za miast tego rozumujemy w sposób następujący: jeśli kilka (powiedzmy 10 czy 20) razy mierzymy k dla pierwszej sprężyny, to średnia tych pomiarów powinna dać nam dobre przybliżenie k dla tej sprężyny. Co bardziej istotne, odchylenie standardowe a tych 10 czy 20 pomiarów daje nam oszacowanie niepewności wyznaczenia k naszą metodą. Jeśli wszystkie sprężyny są w miarę podobne i używamy do ich pomiaru tej samej metody, uzasadnione jest oczekiwanie w każdym pomiarze takiej samej niepewności . Tak więc dla każdej następnej sprężyny wystarczy wykonać tylko jeden pomiar i natych miast stwierdzić, że niepewność S/c równa jest odchyleniu standardowemu obliczonemu dla pierwszej sprężyny, a co za tym idzie, nasz wynik z 70% ufności różni się od prawdziwej wartości o mniej niż a . k
5
k
Aby zilustrować liczbowo tą koncepcję, wyobraźmy sobie, że przeprowa dziliśmy 10 pomiarów pierwszej sprężyny i otrzymaliśmy następujące zmierzo ne wartości k (w niutonach/metr): 86, 85, 84, 89, 86, 88, 88, 85, 83, 85.
(4.10)
5
Jeśli niektóre sprężyny różnią się bardzo od tej pierwszej, to niepewność przy ich badaniu może być inna. Tak więc, jeśli sprężyny różnią się znacznie, musielibyśmy sprawdzić naszą niepewność, przeprowadzając wielokrotne pomiary na każdej z kilku różniących się sprężyn.
103
Możemy z nich natychmiast obliczyć k = 85,9 N/m, a także, korzystając z definicji (4.9), a = 1,9 N / m
. (4-11)
k
2 N/m.
(4.12)
Tak więc niepewność każdego pojedynczego pomiaru k jest równa około 2 N/m. Jeśli teraz przeprowadzimy pojedynczy pomiar dla drugiej sprężyny i dostaniemy w wyniku k = 71 N/m, to bez zbędnych ceregieli możemy przyjąć 5fc = a = 2 N / m i stwierdzić, że z 70% prawdopodobieństwem k leży w za kresie k
k drugiej sprężyny = 71 + 2 N/m.
(4.13)
4.4. Odchylenie standardowe średniej Jeśli x x , . . . , x są wynikami JV pomiarów tej samej wielkości x, to jak stwierdziliśmy, najlepszym przybliżeniem wartości x jest ich średnia x. Zoba czyliśmy także, że odchylenie standarowe charakteryzuje średnią niepew ność każdego z wyników x x ,...,x . Jednak odpowiedź x = x jest funkcją wszystkich N pomiarów i są wszelkie dane, aby przypuszczać, że jest ona bardziej wiarygodna niż każdy z poszczególnych wyników. W rozdziale 5 udo wodnimy, że jest tak w istocie, niepewność ostatecznego wyniku x = x okazuje się równa odchyleniu standardowemu a podzielonemu przez y/N. Wielkość ta zwana jest odchyleniem standardowym średniej i jest oznaczana symbolem a1?
2
w
v
2
N
np
np
x
(4.14)
(Inne nazwy tej wielkości to błąd standardowy lub błąd standardowy średniej). Zatem opierając się na wynikach iV pomiarów x x ,...,x , możemy sfor mułować ostateczny wynik pomiaru x jako l 5
(wartość x) = x ± 8x, np
104
2
N
gdzie x = x, średnia wartość x , x ,...,x , dowym średniej np
±
2
a 5x jest odchyleniem standar
N
5x = d- = a,//iV.
(4.15)
v
Jako przykład rozważmy dziesięć wartości podanych w przykładzie (4.10). Było to dziesięć wyników pomiarów współczynnika sprężystości k pojedynczej sprężyny. Jak już stwierdziliśmy, średnia tych wartości równa jest k = 85,9 N/m, odchylenie standardowe a = 1,9 N/m. Tak więc odchylenie standardowe średniej równe jest: k
oi =
(4.16)
k
a nasza ostateczna odpowiedź oparta na wynikach tych dziesięciu pomiarów mówi, że współczynnik sprężystości tej sprężyny równy jest
k = 85,9 + 0,6 N/m.
(4.17)
Kiedy podajemy odpowiedź taką jak ta, istotne jest jasne stwierdzenie, że podajemy średnią i odchylenie standardowe średniej. Dzięki temu czytający ten rezultat będzie w stanie ocenić jego znaczenie. Ważną cechą odchylenia standardowego średniej a- = a /^J~N jest yfN~ w mianowniku. Odchylenie standardowe a odpowiada średniej niepe wności wyniku każdego z pomiarów x , x ,...,x . Jeśli przeprowadzalibyśmy więcej pomiarów (używając tej samej techniki), to odchylenie standardowe a nie zmieniłoby się w istotny sposób. Z drugiej strony odchylenie standar dowe średniej Ox/x/n~ zmniejszałoby się powoli ze wzrostem N. Dokładnie tego oczekujemy. Jeśli przeprowadzimy więcej pomiarów przed obliczeniem średniej, to wierzymy w naturalny sposób, że ostateczny wynik będzie bardziej wiarygodny i właśnie to gwarantuje mianownik >/iV~ w równaniu (4.15). Dzięki temu dostajemy jasną metodę poprawiania precyzji naszych pomiarów. x
x
t
2
N
x
Niestety czynnik ^/A^ rośnie dość wolno ze wzrostem N. N a przykład jeśli chcielibyśmy poprawić naszą dokładność o czynnik 10, zwiększając jedynie liczbę pomiarów N, to musielibyśmy zwiększyć N o czynnik 100, co jest delikatnie mówiąc dość zniechęcającą perspektywą. Co więcej, w tym momencie zaniedbujemy błędy systematyczne, a te nie zmniejszają się przy wzroście liczby pomiarów. Tak więc w praktyce, jeśli chcemy w istotny sposób zwiększyć precyzję swoich pomiarów, powinniśmy raczej zmo dyfikować technikę doświadczalną, niż polegać jedynie na wzroście liczby pomiarów.
105
4.5. Przykłady Jako pierwsze proste zastosowanie pojęcia odchylenia standardowego średniej wyobraźmy sobie bardzo dokładny pomiar powierzchni A prostokątnej płytki o bokach równych około 2,5 x 5 cm. Po pierwsze, znajdujemy najbardziej odpowiedni przyrząd, którym może być na przykład suwmiarka, a następnie wykonujemy kilka pomiarów długości / i szerokości b tej płytki. Aby uwzględ nić nieregularności boków, przeprowadzamy nasz pomiar w kilku różnych miejscach, aby zaś uwzględnić drobne defekty naszego instrumentu, korzys tamy z kilku suwmiarek (jeśli to oczywiście możliwe). Moglibyśmy przeprowa dzić po 10 pomiarów zarówno /, jak i b, i otrzymać wyniki przedstawione w tabeli 4.3. Tabela 4.3.
Długość i szerokość płytki ( w milimetrach)
Wartości zmierzone / 24,25; 24,26; 24,25; 24,22; b 50,36; 50,35; 50,32; 50,39;
24,22; 24,26; 50,41; 50,38;
24,28; 24,24; 24,23; 24,24 50,37; 50,36; 50,36; 50,38
Średnia
OS
osś
1 = 24,245
a, = 0,019
aj = 0,006
b = 50,368
ff„ - 0 , 0 2 4
a- = 0,008 b
Korzystając z dziesięciu znalezionych wartości /, możemy szybko obliczyć średnią /, odchylenie standardowe a i odchylenie standardowe średniej
b
b
l
l
b
b
h
l = 24,245 ±0,006 mm (lub 0,025%). (Liczba w nawiasie oznacza niepewność względną.) Podobnie wartość b równa jest b = 50,368 + 0,008 mm (lub 0,016%).
Ostatecznie nasze najlepsze przybliżenie powierzchni A = Ib jest iloczynem tych. vjatVo?.cv x Tuepe^mc&CĄ - ^ T ^ A S Ą d-asĄ. ptisz, cktwiastek z sumy kwad ratów niepewności względnych / i b (zakładamy, że błędy są niezależne): A = (24,245 mm±0,025%)-(50,368 mm±0,016%) 2
= 1221,17 m m ± 0 , 0 3 % 2
= 1221,2±0,4 m m .
(4.18)
Aby dojść do wyniku (4.18), obliczyliśmy średnie I i b, każdą z niepewnoś cią równą odchyleniu standardowemu średniej. Następnie obliczyliśmy powie rzchnię A jako iloczyn 'l i b oraz znaleźliśmy niepewność, korzystając z reguły przenoszenia błędów. Moglibyśmy postąpić inaczej. Moglibyśmy, na przykład, pomnożyć pierwszą zmierzoną wartość / przez pierwszą zmierzoną wartość b, aby otrzymać pierwszą wartość A. Kontunuując taką procedurę, moglibyśmy otrzymać dziesięć wartości A, a następnie poddać te wyniki analizie statystycz nej, obliczając A, a i wreszcie aj. Jednak jeśli błędy l i b są niezależne i przypadkowe oraz jeżeli dokonaliśmy wystarczająco dużo pomiarów, proce dura taka (można to pokazać) doprowadzi nas do tego samego wyniku co poprzednio. W drugim przykładzie rozważymy sytuację, kiedy nie można w prosty sposób zastosować analizy statystycznej do bezpośredniego pomiaru, a daje się ją przeprowadzić w odniesieniu do ostatecznego wyniku. Przypuśćmy, że chcemy zmierzyć współczynnik sprężystości k sprężyny, znajdując okres drgań masy m zawieszonej na jej końcu. Z elementarnej mechaniki dobrze wiadomo, że okres taki równy jest T= 2n y/m/k. Tak więc, mierząc T i m, możemy znaleźć k jako A
6
2
2
fc = 4 7 i m / T .
(4.19)
Najprostszym sposobem znalezienia k jest wykorzystanie dokładnie znanej masy m i przeprowadzenie kilku starannych pomiarów T. Jednak z wielu powodów bardziej interesująca może być znajomość okresu T dla wielu różnych mas m. (W ten sposób moglibyśmy na przykład sprawdzić, że
6
Jest pewien brak logiki w tej drugiej procedurze. Nie ma przecież szczególnego powodu wiązać pierwszego pomiaru l z pierwszym pomiarem b. W istocie moglibyśmy zmierzyć l osiem razy, b zaś 12 razy i wtedy nie udałoby się pogrupować tych wyników w pary. Widać zatem, że pierwsza omówiona przez nas procedura jest logicznie bardziej uzasadniona.
107
T oc y/m, jak również znaleźć k.) Moglibyśmy zatem otrzymać zestaw wyników, takich jak w pierwszych dwóch wierszach tabeli 4.4.
Tabela 4.4. masa m (kg) okres T(s) k = 4TC
2
m/T
2
0,513 1,24 13,17
0,581 1,33 12,97
Pomiary współczynnika sprężystości k 0,634 1,36 itd.
0,691 1,44
0,752 1,50
0,834 1,59
0,901 1,65
0,950 1,69
Uśrednianie różnych mas z pierwszego wiersza jest w oczywisty sposób pozbawione sensu (podobnie jest z czasami z drugiego wiersza). Pojawiające się tam liczby nie są wynikami różnych pomiarów tej samej wielkości. Porów nując różne wartości m, nie dowiemy się także niczego o niepewności naszego pomiaru. Z drugiej strony, możemy powiązać każdą wartość m z odpowiadają cym jej okresem T i obliczyć k, jak w ostatnim wierszu tabeli 4.4. Wszystkie wyniki pomiarów k z dolnego wiersza są wynikami pomiarów tej samej wielkości i jako takie podlegają analizie statystycznej. W szczególności naszym najlepszym przybliżeniem k jest średnia k = 13,16 N/m, niepewnością zaś jest odchylenie standardowe średniej a = 0,06 N / m (patrz zadanie 4.12). Zatem ostateczną odpowiedzią opartą na danych z tabeli 4.4 jest k
współczynnik sprężystości k = 13,16 + 0,06 N/m.
(4.20)
Jeśli dysponujemy wiarygodnymi oszacowaniami niepewności naszych pierwotnych pomiarów m i T, możemy także oszacować niepewność k za pomocą wzorów na przenoszenie błędów, wychodząc od wartości Sm i ST. W takim wypadku warto byłoby porównać ostateczne wartości niepewności k otrzymane tymi dwoma metodami.
4.6. Błędy systematyczne W kilku poprzednich paragrafach przyjmowaliśmy jako pewnik, że wszystkie błędy systematyczne zostały przed rozpoczęciem pomiarów zredukowane do zaniedbywalnego poziomu. W tym miejscu znowu dopuścimy przykrą moż liwość istnienia znaczącego błędu systematycznego. W omówionym właśnie przykładzie mogliśmy ważyć masę m na nieodpowiednio wyskalowanej wadze lub mierzyć czas T spieszącym się lub późniącym stoperem. Żaden z tych błędów systematycznych nie ujawni się poprzez porównanie naszych różnych 108
wyników pomiaru współczynnika k. W wyniku tego odchylenie standardowe średniej a może być traktowane jako 8/c - przypadkowy składnik niepew ności 8/c, ale z pewnością nie jest ono równe całkowitej niepewności 8/c. Naszym zadaniem jest podjęcie decyzji, jak oszacować składnik systematyczny 5k , i dalej jak powiązać 5/c i S/c , aby otrzymać całkowitą niepewność 8/c. Nie istnieje prosta teoria mówiąca co robić z błędami systematycznymi. W istocie jedyna teoria błędu systematycznego mówi, że musi on być rozpo znany i zredukowany do poziomu dużo niższego niż wymagana precyzja. Jednak na pierwszej pracowni często niemożliwe jest sprawdzenie miernika przez porównanie go z innym, lepszym, a jeszcze mniej prawdopodobny jest zakup nowego. Z tego powodu niektóre pracownie ustaliły zasadę, że z braku bardziej szczegółowej informacji powinno się zakładać pewną skończoną wartość niepewności systematycznej. Można by zdecydować na przykład, że wszystkie stopery mają do 0,5% niepewności systematycznej, wszystkie wagi do 1%, wszystkie woltomierze i amperomierze do 3 % itd. k
sys
przyp
przyp
sys
Isnieje wiele możliwych sposobów postępowania z regułami tego rodzaju. Żadnego z nich tak naprawdę nie można ściśle uzasadnić. Opiszemy tutaj tylko jedno z możliwych podejść do tego problemu. W ostatnim przykładzie z paragrafu 4.5 współczynnik sprężystości k = 4 n m / T został obliczony na podstawie wielu zmierzonych wartości m i odpowiadających im wartości T. Jak to już wzmiankowaliśmy, analiza statystyczna różnych wyników k wyraża składnik przypadkowy 8/c jako 2
8/c
przyp
2
= a- = 0,06 N/m.
(4.21)
k
Przypuśćmy teraz, że powiedziano nam, że waga używana do pomiaru m i sto per wykorzystany do pomiaru Tmają niepewności odpowiednio do 1% i do 0,5%. Składnik systematyczny 8/c możemy zatem znaleźć metodą przenoszenia błędów. Trzeba tylko jeszcze zapytać, czy dodać oba błędy bezpośrednio czy też obliczyć pierwiastek z sumy ich kwadratów. Ponieważ błędy m i T są z pewnością niezależne i możliwe jest częściowe ich zniesienie, uzasadnione jest prawdopodobnie obliczenie pierwiastka z sumy kwadratów 7
7
To, czy powinniśmy użyć zwykłej sumy, czy też obliczyć pierwiastek z sumy kwadratów, zależy tak naprawdę od tego, co mamy na myśli mówiąc, że waga ma „do 1% niepewności systematycznej". Jeśli to oznacza, że błąd jest z pewnością nie większy niż 1% (i podobnie dla stopera), to właściwe jest bezpośrednie dodawanie i 5fc jest z pewnością mniejsze niż 2 % . Z drugiej strony może się zdarzyć, że badanie wszystkich wag w laboratorium pokazało, że ich niepewności podlegają rozkładowi normalnemu i 70% z nich ma błąd mniejszy niż 1% (tak samo dla stoperów). W takim przypadku możemy obliczyć pierwiastek z sumy kwadratów jak we wzorze (4.22), gdzie 70% ufności ma swoje zwykłe znaczenie. sys
109
(4.22)
=
+
= 1,4%
(4.23)
i stąd Sfc = (13,16 N/m)-0,014 sys
= 0,18 N/m.
(4.24)
Ponieważ oszacowaliśmy już zarówno przypadkowy, jak i systematyczny składnik 8/c, zostało nam jedynie powiązanie ich w celu obliczenia samego S/t. Można argumentować, że w tym celu powinno się obliczyć pierwiastek z sumy ich kwadratów: 5/c = V(5fe
2
przyp
2
) + (S/c )
2
(4.25)
sys
2
= /(0,06) + (0,18) » 0,2 N/m. x
(4.26)
W tym przykładzie niepewności systematyczne całkowicie przesłaniają niepew ności przypadkowe. Wyrażenie (4.25) nie może być w rzeczywistości ściśle uzasadnione. Nie jest także jasne, jak bardzo istotny jest wynik, nie możemy prawdopodobnie zapewnić, że z 70% ufnością prawdziwy wynik leży w zakresie k + bk. Niemniej jednak wyrażenie to co najmniej daje nam uzasadnione oszacowanie cał kowitej niepewności w przypadku, gdy nasza aparatura obarczona jest niemo żliwym do wyeliminowania błędem systematycznym. W szczególności wynik (4.25) jest realistyczny i pouczający pod jednym istotnym względem. Zobaczyliś my w paragrafie 4.4, że odchylenie standardowe średniej a dąży do zera przy zwiększaniu liczby pomiarów N. Wynik ten sugerował, że cierpliwie przeprowa dzając ogromną liczbę eksperymentów, można bez ulepszania urządzeń czy techniki pomiarowej zredukować niepewność do zera. Teraz widzimy, że w rze czywistości tak nie jest. Zwiększając N, redukujemy w sposób nieograniczony składnik przypadkowy 5/c = a . Jednak każdy instrument pomiarowy wnosi pewną niepewność systematyczną, która nie zmniejsza się przy wzroście N. Z wyrażenia (4.25) jasno wynika, że ponieważ już teraz S/c jest mniejsze niż 8/c , więc zysk z dalszej redukcji 8/c będzie niewielki. W szczególności nigdy całkowita niepewność 8/c nie będzie mniejsza niż 8/c . Potwierdza to fakt, który sugerowaliśmy już poprzednio. W praktyce, aby osiągnąć dużą redukcję niepew ności, niezbędne jest modyfikowanie zarówno techniki pomiarowej, jak k
przyp
k
przyp
sys
przyp
sys
110
i aparatury. Jedynie w taki sposób możemy zmniejszyć w pojedynczym eksperymencie zarówno błędy systematyczne, jak i przypadkowe.
Zadania Uwaga: Gwiazdka przy zadaniu oznacza, że szkic rozwiązania lub odpowiedź znajduje się na końcu książki. * 4 . 1 (paragraf 4.2). Student pięciokrotnie mierzy wielkość x, otrzymując następujące wyniki: 5, 7, 9, 7, 8. Oblicz średnią x i odchylenie standardowe a . (Wykonaj sam te obliczenia, nie posługując się odpowiednimi funkcjami Twojego kalkulatora. Podaj, z której definicji a skorzystałeś.) x
x
4.2 (paragraf 4.2). Oblicz średnią i odchylenie standardowe dziesięciu wartości przedstawionych w (4.10). (Odpowiedź podana jest w tekście, jednak jest istotne, abyś sam przeprowadził te rachunki. Wybierz właściwą postać prezentacji swych wyników, jedną z możliwości jest tabela, taka jak tabela 4.2.) •f4^3\ (paragraf 4.2). Średnia x z J V wartości x x zdefiniowana jest jako ich suma podzielona przez N, czyli x = (^X;)/N. Odchylenie x jest różnicą .i = x — x. Udowodnij bezpośrednim rachunkiem, że średnia odchyleń d1,...,dN automatycznie równa jest zeru. Jeśli nie jesteś przyzwyczajony do notacji skróconej, mogłoby Ci pomóc rozwiązanie tego zadania dwiema metodami, raz z jej zastosowaniem, a raz bez. Przepisz sumę X(x —x) jako (x —x) + (x — x)+ ... +(x — x) i odpowie dnio pogrupuj składniki. v
N
t
i
i
;
1
2
N
(|^4^)(paragraf 4.2). Aby obliczyć odchylenie standardowe a z N pomia rów x" ,...,x potrzebna jest suma ^ ( x —x) . Sprawdź, że tę sumę można przepisać jako — x
2
1
N
;
2
2
2
- x ) ] = CZ(x ) ]-iVx . i
\
(4.27)
Będzie to dobre ćwiczenie w stosowaniu notacji skróconej. Wynik jest bardzo użyteczny w praktyce i jest stosowany do obliczania a przez wszystkie •:alkulatory.) x
4.5 (paragraf 4.2). Przelicz odchylenie standardowe z zadania 4.1, wyko rzystując równanie (4.27). 111
4.6 (paragraf 4.3). Student trzy razy zmierzył okres wahadła, otrzymując wyniki 1,6; 1,8; 1,7 (wszystkie w sekundach). Jaka jest średnia i odchylenie standardowe? (Skorzystaj z definicji (4.9) odchylenia standardowego a .) Jakie jest prawdopodobieństwo, że jeśli student przeprowadzi czwarty pomiar, to jego wynik będzie leżał poza zakresem 1,6 s ... 1,8 s? (Oczywiście liczby są tak dobrane, aby „dobrze wyszło". W rozdziale 5 zobaczymy, jak rozwiązywać tego typu zadania, nawet jeśli liczby nie są tak dobrane.) t
!(paragraf 4.3). a^Dblicz średnią t i odchylenie standardowe a następujących 30 pomiarów czasu t (wszystkie w sekundach). Będziesz potrzebował kalkulatora, ale oszczę dzisz sobie naciskania wielu klawiszy, jeśli zauważysz, że jedynie ostatnie dwie cyfry wymagają średniowania, i przed obliczeniami przesuniesz przecinek o dwa miejsca w prawo. Jeśli Twój kalkulator nie oblicza automatycznie odchylenia standardowego, powinieneś pewnie skorzystać ze wzoru (4.27). t
( g l | ( 8 , 1 4 ; 8,12; 8,16; 8,18; 8,10; 8,18; 8,18; 8,18; 8,24; 8,16; 8,14; 8,17;; 8,18; 8,21; 8,12; 8,12;'@;(|,06; 8,10; 8,12; 8,10; 8,14; 8,09; 8,16; 8,16;'8,21; 8,14; 8,16; 8,13; b) Stwierdziliśmy, że po wielu pomiarach możemy się spodziewać, że 70% wszystkich wartości leży w promieniu a od t (to znaczy, że leży w zakresie t±a ). W rozdziale 5 pokażemy, że można oczekiwać, iż 9 5 % wszystkich wartości leży w promieniu 2a od t (to znaczy, że leży w zakresie t±2a ). Sprawdź dla wyników z punktu (a), ile wartości spodziewałbyś się znaleźć poza zakresem t±a l Ile wartości rzeczywiście jest poza tym zakresem? Odpowiedz na te same pytania dla zakresu t±2a . t
t
t
t
t
t
4.8 (paragraf 4.4). Oblicz odchylenie standardowe średniej pięciu pomia rów z zadania 4.1. Jaki powinien być ostateczny wynik podany przez studenta (wraz z niepewnością)? * 4 . 9 (paragraf 4.4). Opierając się na 30 wynikach z zadania 4.7, podaj swoje najlepsze przybliżenie mierzonego czasu i jego niepewność, zakładając, że wszystkie niepewności mają charakter przypadkowy. 4.10 (paragraf 4.4). Po wielokrotnym pomiarze prędkości dźwięku u stu dent stwierdza, że odchylenie standardowe a w jego pomiarach równe jest a = 10 m/s. Jeśli założymy, że wszystkie błędy są przypadkowe, student może poprzez wystarczająco dużą liczbę pomiarów i ich uśrednianie osiągnąć dowo lną wymaganą dokładność swego pomiaru. Ile pomiarów trzeba wykonać, żeby ostateczna niepewność była równa ± 3 m/s? A ile jeśli chcemy mieć tylko + 0,5 m/s niepewności? u
u
112
R O Z D Z I A Ł
5
ROZKŁAD NORMALNY
W tym rozdziale będziemy kontynuować rozważania poświęcone analizie statystycznej powtarzanych wielokrotnie pomiarów. W rozdziale 4 wprowadzi liśmy tak ważne pojęcia, jak średnia, odchylenie standardowe i odchylenie standardowe średniej; poznaliśmy ich znaczenie oraz część zastosowań. Obec nie uzupełnimy teoretyczne podstawy wspomnianych pojęć statystycznych oraz udowodnimy niektóre ze stwierdzeń podanych uprzednio bez dowodu. Podstawowym zagadnieniem związanym z analizą powtarzanych wielokro tnie pomiarów jest znalezienie sposobu posługiwania się licznym zbiorem wyników. Jedną z dogodnych metod jest wykorzystanie rozkładu lub histo gramu zgodnie z receptą podaną w paragrafie 5.1. W paragrafie 5.2 wprowa dzimy pojęcie rozkładu granicznego, czyli rozkładu wyników, który wystąpiłby w przypadku nieskończonej liczby pomiarów. W paragrafie 5.3 zdefiniujemy rozkład normalny, nazywany też rozkładem Gaussa, który jest rozkładem granicznym wyników dowolnego pomiaru narażonego na wiele małych i przy padkowych błędów. Zrozumiawszy podstawy matematyczne rozkładu normalnego, z łatwością udowodnimy szereg ważnych stwierdzeń. W paragrafie 5.4 wykażemy, że zgodnie z tym co podaliśmy już w rozdziale 4, około 70 procent wszystkich pomiarów (tej samej wielkości i wykonanych tą samą techniką) powinno leżeć nie dalej niż jedno odchylenie standardowe od wartości prawdziwej. W para grafie 5.5 udowodnimy stwierdzenie, którym posługujemy się począwszy od rozdziału 1, mówiące, że najlepszym przybliżeniem x pewnej wielkości x, jakie można podać na podstawie N zmierzonych wartości x ,x ,...,x , jest średnia arytmetyczna x = Y^^JN. W paragrafie 5.6 uzasadnimy zastosowanie pierwiastka z sumy kwadratów przy przenoszeniu błędów niezależnych i przynp
1
114
2
N
padkowych. W paragrafie 5.7 udowodnimy, że niepewność wartości średniej x, uznawanej za najlepsze oszacowanie x, jest dana przez odchylenie standar dowe średniej a = aJ^/W, jak wspomniano już w rozdziale 4. N a koniec, w paragrafie 5.8, zastanowimy się, w jaki sposób określić liczbowo poziom x
ufności
w wyniki
eksperymentalne.
Rachunki w tym rozdziale są nieco bardziej złożone od stosowanych dotychczas. Jednakże Czytelnik, który z uwagą prześledzi rozważania n a temat rozkładu normalnego w paragrafo 5 3 ^Yowxy^c, 0&o\aŚ&fc mTfjSJflàa czenia, o ile będzie to niezbędne), powinien bez większych trudności nadążać za tokiem wykładu.
5.1. Histogramy i rozkłady Powinno być oczywiste, że poważna analiza statystyczna eksperymentu wyma ga wykonania wielu pomiarów. Tym samym pierwszym zadaniem jest opraco wanie metod rejestrowania i prezentowania dużej liczby zmierzonych wartości. Załóżmy, że dziesięciokrotnie powtarzamy pomiar pewnej długości x. Może to być odległość pomiędzy soczewką a utworzonym przez nią obrazem. Niech przykładowymi wynikami będą (w centymetrach) 26, 24, 26, 28, 23, 24, 25, 24, 26, 25.
(5.1)
Liczby zapisane w tej formie nie dają zbyt bogatej informacji. Gdyby przyszło nam zapisać jeszcze więcej wyników w ten sam sposób, powstałby zagmat wany gąszcz liczb. Niewątpliwie należałoby coś udoskonalić. N a początek możemy uporządkować rosnąco liczby (5.1), 23, 24, 24, 24, 25, 25, 26, 26, 26, 28.
(5.2)
Następnie zamiast trzy razy pisać 24, 24, 24, możemy po prostu zanotować, że wartość 24 wystąpiła trzykrotnie. Mówiąc krótko, dobrze jest wymienić różne uzyskane wartości x łącznie z liczbą określającą, ile razy wystąpiła dana wartość, tak jak w tabeli 5.1. Wprowadziliśmy w tym miejscu notację x (k = 1,2,...) dla oznaczenia różnych otrzymanych wartości: x = 23, x = 24, x = 25 itd. oraz n (k = 1,2,...) dla oznaczenia liczebności powtórzeń odpowiednich wartości x : n = 1, n = 3 itd. k
2
1
3
k
k
t
2
Tabela 5.1 Różne wartości x Krotności ich występowania n k
k
23 1
24 3
25 2
26 3
27 0
28 1
115
Zapisując wyniki pomiarów tak jak w tabeli 5.1, możemy przepisać definicję średniej x w nieco bardziej wygodnej postaci. Z pierwotnej definicji wiemy, że Z * x
= (5-3) 23 + 24 + 24 + 24 + 2 5 + ... + 2 8 10
Jest to dokładnie to samo co 23 + (24-3) + (25-2)+ ... + 2 8 x =
10
lub w ogólnym przypadku
_k
(5.4)
N
W pierwotnym wzorze (5.3) sumujemy po wszystkich wykonanych pomiarach; we wzorze (5.4) sumujemy po wszystkich różnych wartościach, mnożąc każdą z nich przez jej liczebność. Jest oczywiste, że obydwie sumy są identyczne, ale postać (5.4) jest wygodniejsza w użyciu w przypadku dużej liczby pomiarów. Suma w postaci (5.4) jest czasami nazywana sumą ważoną, gdyż każda z wartości x jest ważona przez jej liczebność n . Zauważmy na przyszłość, że dodając wszystkie liczebności n , uzyskamy całkowitą liczbę przeprowadzo nych pomiarów N. To jest k
k
k
£n
k
= N.
(5.5)
k
(W przypadku tabeli 5.1 równanie to stwierdza, że suma wszystkich liczb w dolnym wierszu jest równa 10.) Wnioski z poprzednich dwóch akapitów można sformułować w sposób, który często bywa wygodniejszy. Zamiast mówić, że wynik x = 24 został uzyskany trzykrotnie, możemy powiedzieć, że x = 24 uzyskano w — spośród wszystkich pomiarów. Innymi słowy zamiast używać n , liczebności wyniku x , wprowadzamy częstość k
k
(5.6)
116
która mówi, jaka część spośród ogólnej liczby pomiarów N dała wynik x . Mówimy, że częstość F określa rozkład wyników, ponieważ opisuje, w jaki sposób wyniki pomiarów rozkładały się pomiędzy różne możliwe wartości. Korzystając z częstości F , możemy zapisać wzór (5.4) na średnią x w zwię złej formie k
k
k
x
= H k kF
x
5
( -7)
k Oznacza to, że średnia x jest sumą ważoną różnych wartości x z wagami : Kreślonymi przez częstości F ich występowania. Równanie (5.5) pociąga za sobą k
k
1^=1.
(5-8)
k Jeżeli dodamy do siebie częstości F wszystkich możliwych wartości x , —usimy otrzymać w wyniku 1. Dowolny zbiór liczb, których suma jest równa 1 nazywamy znormalizowanym i dlatego relacja (5.8) nosi miano warunku • mnalizacji. Rozkład wyników pomiarów można przedstawić graficznie za pomocą •-.ogromu, tak jak na rysunku 5.1. Jest nim wykres zależności F od x , przy :rvm poszczególne zmierzone wartości x są zaznaczone na osi poziomej, k
k
k
k
k
0,3 0,2 0
,
l
-
1 0
22
i
I
1 23
1 24
1 25
1 26
1 27
1 28
x
k
- • s u n e k 5.1. Histogram dziesięciu pomiarów długości x. Oś pionowa przedstawia częstości F występowania poszczególnych wartości x
k
k
117
a odpowiadające im częstości występowania wartości x są reprezentowane przez wysokość pionowego słupka narysowanego nad x . (Można również rysować wykres zależności n od x , ale dla naszych celów wykres zależności F od x jest bardziej odpowiedni.) Dane prezentowane za pomocą histo gramów są szybko i łatwo przyswajalne, czego świadomi są autorzy artykułów prasowych. Histogram podobny do tego, który znajduje się na rysunku 5.1, możemy nazwać histogramem słupkowym, ponieważ rozkład wyników jest przedstawio ny za pomocą pionowego słupka bezpośrednio nad wartością x . Ten rodzaj histogramów jest stosowany zawsze wtedy, gdy wartości x są równo oddalone i przyjmują wartości całkowite. (Na przykład oceny uzyskane przez studentów z egzaminu są z reguły liczbami całkowitymi i bardzo dobrze nadają się do przedstawienia za pomocą histogramu słupkowego.) Jednakże z reguły pomia ry nie dają przejrzystego zbioru wartości całkowitych, ponieważ większość wielkości fizycznych zmienia się w sposób ciągły. Jest niemal pewne, że zamiast dziesięciu długości danych równaniem (5.1) otrzymamy wyniki podobne do k
k
k
k
k
k
k
k
26,4; 23,9; 25,1; 24,6; 22,7; 23,8; 25,1; 23,9; 25,3; 25,4.
(5.9)
Histogram słupkowy wykonany na podstawie podanego zbioru wartości miałby postać dziesięciu słupków o tej samej wysokości i nie byłby zbyt bogaty w treść. Otrzymawszy wyniki, takie jak te z równania (5.9), najlepiej jest podzielić zakres wartości na przedziały, czyli „komórki", i policzyć ile wyni ków przypada na każdą z „komórek". N a przykład, moglibyśmy zliczać wyniki pomiędzy x = 22 a x = 23, pomiędzy x = 23 a x = 24 itd. Rezultat takiego zliczania przedstawia tabela 5.2. (Jeżeli zdarzy się, że wartość leży dokładnie na granicy pomiędzy dwiema komórkami, należy zdecydować, do której z nich ją zaliczyć. Prostym i rozsądnym sposobem jest przypisanie 1
Tabela 5.2 Przedział Liczba pomiarów w przedziale
22-23 1
23-24 3
24-25 1
25-26 4
26-27 1
27-28 0
Wyniki z tabeli 5.2 można przedstawić za pomocą histogramu komór kowego, tak jak na rysunku 5.2. Na tym wykresie częstość dla danego 1
Zakres wartości, czyli różnica pomiędzy największą i najmniejszą wartością jest nazywana
rozstępem (przyp. tłum,).
118
fk
A
0,4 0,3 0,2 0,1 22
25
26
szerokość przedziału A
27
28
k
Rysunek 5.2. Histogram komórkowy przedstawiający częstości pomiarów w „komórkach" 22-23, 23-24 itd. Powierzchnia prostokąta, którego podstawą jest rozpiętość komórki reprezen tuje częstość pomiarów w danej komórce. Pole zacieniowanego prostokąta wynosi 0,3, co oznacza, że 3/10 wszystkich pomiarów znajduje się w przedziale pomiędzy 23 i 24
przedziału jest reprezentowana przez powierzchnię prostokąta wykreślonego nad odpowiednią komórką. W ten sposób zacieniowany prostokąt odpowia dający przedziałowi od x = 23 do x = 24 ma powierzchnię 0,3 • 1 = 0,3, wska zując, że ~ spośród wszystkich pomiarów leży w obrębie danej komórki. N a ogół szerokość fc-tej komórki oznaczamy przez A . (Zazwyczaj wszystkie szerokości są równe, chociaż nie jest to konieczne). Wysokość f prostokąta wykreślonego nad przedziałem jest tak dobrana, żeby powierzchnia fA spełniała warunek k
k
k
fA k
k
k
= częstość pomiarów w fc-tej przegródce.
Innymi słowy, w przypadku histogramu komórkowego pole powierzchni f A fc-tego prostokąta ma to samo znaczenie co wysokość F fe-tego słupka w histogramie słupkowym. Przy dobieraniu szerokości komórek A dla potrzeb histogramu niezbędna jest pewna ostrożność. Jeżeli komórki będą zbyt szerokie, to wszystkie (lub prawie wszystkie) odczyty znajdą się w jednej komórce i histogram będzie miał mało interesującą postać pojedynczego prostokąta. Jeżeli z kolei komórki będą zbyt wąskie, to tylko niewielka ich część będzie zawierać więcej niż jeden odczyt i histogram przyjmie postać szeregu wąskich prostokątów, z których większość będzie miała tę samą wysokość. Jak widać, szerokość komórki musi być tak dobrana, by każda z komórek mieściła w sobie po kilka odczytów. Tym samym, jeżeli liczba pomiarów N jest niewielka, należy wybierać relatywnie szerokie przedziały; w miarę jak N będzie wzrastać, należy tę szerokość zmniejszać. k
k
k
k
119
5.2. Rozkłady graniczne W większości przypadków zwiększanie liczby pomiarów powoduje, że histo gram przyjmuje pewien prosty, określony kształt. Widać to wyraźnie na rysunkach 5.3 i 5.4, które przedstawiają wyniki 100 i 1000 pomiarów tej samej A
n
I
0,4 0,3 _ 0,2 -
I
0,1 22
23
24
25
26
27
28
x
Rysunek 5.3. Histogram przedstawiający wyniki 100 pomiarów wielkości tej samej co na ry sunku 5.2
wielkości co na rysunku 5.2. Po stu pomiarach histogram przybrał kształt pojedynczego, z grubsza symetrycznego piku. Dysponując tysiącem pomiarów mogliśmy dwukrotnie zmniejszyć szerokość przedziałów, dzięki czemu histo gram stał się dość gładki i regularny. Trzy kolejne wykresy ilustrują ważną /i
22
23
24
25
26
27
28
x
R y s u n e k 5.4. Histogram przedstawiający wyniki 1000 pomiarów wielkości tej samej co na rysunku 5.3. Linią przerywaną zaznaczono rozkład graniczny
własność większości pomiarów. W miarę jak liczba wykonanych pomiarów dąży do nieskończoności, ich rozkład zbliża się do pewnej określonej ciągłej krzywej. Otrzymana w ten sposób ciągła krzywa nosi nazwę rozkładu granicz-
120
2
nego . Rozkład graniczny dla pomiarów przedstawionych na rysunkach od 5.2 do 5.4 przyjmuje postać symetrycznej i przypominającej kształtem dzwon krzywej, którą nałożono na histogram - rysunek 5.4. Należy podkreślić, że rozkład graniczny jest konstrukcją, teoretyczną, której nie można nigdy dokładnie wyznaczyć. Im więcej pomiarów wykonuje my, tym bardziej histogram zbliża się do rozkładu granicznego. Ale tylko wykonując nieskończenie wiele pomiarów i wybierając nieskończenie wąskie przedziały, moglibyśmy naprawdę osiągnąć sam rozkład graniczny. Pomimo to, istnieją przekonujące dowody, że dla niemal wszystkich pomiarów istnieje pewien rozkład graniczny, do którego histogramy zbliżają się coraz bardziej wraz ze wzrostem liczby pomiarów. Rozkład graniczny, taki jak gładka krzywa na rysunku 5.4, określa funkcję, którą oznaczymy f(x). Znaczenie tej funkcji ilustruje rysunek 5.5. W miarę jak wykonujemy coraz więcej pomiarów pewnej wielkości x, nasz histogram stanie
Rysunek 5.5. Rozkład graniczny f(x). a) Po wykonaniu wielu pomiarów, częstość w przedziale od x do x + dx odpowiada powierzchni wąskiego paska f(x) dx. b) Częstość pomiarów w przedziale od x = a do x — b odpowiada powierzchni zacieniowango obszaru
się w końcu nieodróżnialny od granicznej krzywej f(x). Tym samym częstość pomiarów w dowolnie małym przedziale od x do x + dx będzie równa powierzchni f(x) dx paska zacieniowanego na rysunku 5.5a f(x)dx
= częstość pomiarów w przedziale od x do x + dx.
(5.10)
Ogólniej, częstość pomiarów w przedziale pomiędzy dwiema dowolnymi war tościami a i b, równa jest polu powierzchni pod wykresem pomiędzy x — a i x = b (rysunek 5.5b). Wspomniana powierzchnia równa jest całce określonej z funkcji f(x). Otrzymaliśmy ważny wynik, który mówi, że b
\f{x)dx
2
= częstość pomiarów w przedziale od x = a do x = b.
(5.11)
Rozkład graniczny jest także nazywany rozkładem asymptotycznym.
121
Niezmiernie ważne jest zrozumienie sensu stwierdzeń zawartych we wzorach (5.10) i (5.11). Obydwa podają częstość pomiarów w pewnym przedziale po wykonaniu bardzo dużej liczby pomiarów. Innym, bardzo wygodnym sposobem wyrażenia tej. samej treści jest stwierdzenie, że f(x)dx wyraża prawdopodobieńst wo, że pojedynczy pomiar wielkości x da wynik zawarty pomiędzy x a x + dx,
f{x)dx
= prawdopodobieństwo, że wynik dowolnego pomiaru znajdzie się w przedziale od x do x + dx.
(5.12)
b
Podobnie całka j f(x)dx
informuje o prawdopodobieństwie uzyskania w do
IŁ
wolnym pomiarze wyniku z przedziału od x = a do x = b. Doszliśmy do następującego ważnego wniosku: Jeżeli znalibyśmy rozkład graniczny f(x) dla pomiarów pewnej wielkości x realizowanych przy użyciu określonych przy rządów, to znalibyśmy prawdopodobieństwo uzyskania wyniku w dowolnym przedziale a ^ x ^ b. Ponieważ całkowite prawdopodobieństwo uzyskania wyniku o jakiejkol wiek wartości pomiędzy — o o i + o o jest równe 1, rozkład graniczny f(x) musi spełniać warunek
+ =0
J f(x)dx
= 1.
analogią
warunku normalizacji sum (5.8),
Ta tożsamość jest naturalną Y k F
J
=
t a
1» k
w
i?
c
0
funkcji f(x)
(5.13)
spełniającej (5.13) mówimy, że jest znor-
k
malizowana. Czytelnik może być zaskoczony granicami całkowania + o o w całce (5.13). Nie oznacza to wcale, że spodziewamy się wyników z całego zakresu od — c o do + o o . Wprost przeciwnie. W każdym rzeczywistym eksperymencie wyniki rozkładają się wewnątrz pewnego, niewielkiego przedziału. N a przykład, wyni ki wszystkich pomiarów na rysunku 5.4 leżą pomiędzy X = 21 a x = 29. Nawet po przeprowadzeniu nieskończenie wielu pomiarów częstość wyników poza przedziałem od x = 21 do x = 29 będzie w zupełności zaniedbywalna. Innymi 1
122
słowy funkcja f(x) jest faktycznie równa zeru na zewnątrz wspomnianego przedziału i nie ma znaczenia, czy we wzorze (5.13) będziemy całkować od — O O do + 0 0 czy też od 21 do 29. Ponieważ z reguły nie wiemy, gdzie leżą właściwe skończone granice całkowania, wygodniej jest przyjąć je jako rów ne + Jeżeli rozważane pomiary zostały wykonane z dużą precyzją, to wszystkie wyniki znajdą się w pobliżu wartości rzeczywistej x; tak więc histogram i tym samym rozkład graniczny będą tworzyły wąski pik, tak jak krzywa narysowa na linią ciągłą na rysunku 5.6. Jeżeli precyzja pomiarów jest niewielka, to uzyskane wyniki są rozłożone w szerokim zakresie, czemu odpowiada szeroka i niska krzywa, jak ta narysowana linią przerywaną na rysunku 5.6. C O .
/
W
' I
X
R y s u n e k 5.6. Dwa przykładowe rozkłady graniczne. Pierwszy odpowiada pomiarom o dużej dokładności, drugi pomiarom o małej dokładności
Rozkład graniczny f(x) pomiarów pewnej wielkości x zrealizowanych w określonym układzie pomiarowym mówi, w jaki sposób p o wielokrotnym powtórzeniu pomiarów byłyby rozłożone wyniki. Tym samym, jeżeli znalibyś my funkcję f{x), moglibyśmy obliczyć średnią x, która zostałaby uzyskana w wyniku wielu pomiarów. Przekonaliśmy się już, patrz równanie (5.7), że średnia dowolnej liczby pomiarów jest sumą po wszystkich różnych uzys kanych wartościach wziętych z wagami określonymi przez częstości pomiarów x = ZF x . k
k
(5.14)
k
W obecnym przypadku dysponujemy olbrzymią liczbą pomiarów opisanych przez rozkład f(x). Jeżeli zakres wyników podzielimy na niewielkie przedziały x do x + dx , to częstości wyników w każdym z przedziałów będą równe k
k
k
123
F = f(x )dx , a w granicy, gdy wielkość przedziałów dąży do zera, równanie (5.14) przyjmie postać k
k
k
+ oo
x = j
xf(x)dx.
(5.15)
Pamiętajmy, że podany właśnie wzór wyraża oczekiwaną wartość średniej x po wykonaniu nieskończenie wielu pomiarów. W podobny sposób możemy obliczyć odchylenie standardowe a uzyskane w wyniku dużej liczby pomiarów. Ponieważ interesuje nas granica N -* o o , nie ma znaczenia, którą z definicji a wykorzystamy, pierwotną - wyrażoną równaniem (4.6) - czy „ulepszoną" ze wzoru (4.9), gdzie N zastąpiliśmy przez N — L W każdym z przypadków, przy ]V->GO, a jest średnią kwadratów odchyleń (x — x) . Wykorzystując tę samą argumentację co w przypadku wzoru (5.15), otrzymujemy dla dużej liczby pomiarów x
x
x
2
2
2
(x-x) f(x)dx.
(5.16)
— oo
5.3. Rozkład normalny Różnym pomiarom odpowiadają różne rozkłady graniczne. Nie wszystkie spośród nich mają kształt symetrycznej krzywej dzwonowej, o której wspo mnieliśmy w paragrafie 5.2. (Na przykład rozkład dwumianowy i rozkład Poissona, którym poświęcimy rozdziały 1 0 i 1 1 , nie są zazwyczaj symetryczne.) Pomimo to dla olbrzymiej grupy pomiarów opisem rozkładu granicznego jest symetryczna krzywa dzwonowa. W rozdziale 1 0 udowodnimy, że w sytuacji gdy wynik pomiaru jest narażony na wpływ wielu źródeł niewielkich i przypa dkowych błędów, a błędy systematyczne są zaniedbywalne, uzyskiwane warto ści będą układać się na krzywej dzwonowej wyśrodkowanej wokół wartości prawdziwej zmiennej x, podobnie jak na rysunku 5.7. Do końca niniejszego rozdziału ograniczymy nasze zainteresowania wyłącznie do pomiarów wyka zujących tę własność. Jeżeli w trakcie pomiarów istotną rolę odgrywają błędy systematyczne, nie należy spodziewać się, że rozkład graniczny będzie wyśrodkowany wokół
124
Rysunek 5.7. Rozkład graniczny odpowiadający pomiarom narażonym na wystąpienie wielu małych i przypadkowych zaburzeń. Rozkład przybrał kształt krzywej dzwonowej, wyśrodkowanej wokół wartości prawdziwej x
wartości prawdziwej. Błędy przypadkowe z równym prawdopodobieństwem zaniżają i zawyżają otrzymywane wartości. Jeżeli wszystkie błędy są przypad kowe, to po wielu pomiarach powinniśmy uzyskać tyle samo wyników poniżej jak i powyżej wartości prawdziwej i rozkład graniczny będzie wyśrodkowany wokół wartości prawdziwej. Błędy systematyczne (takie jak rozciągnięta taśma miernicza lub późniący się zegar) przesuwają wszystkie mierzone wartości w jednym kierunku i powodują, że środek rozkładu oddala się od wartości prawdziwej. W tym rozdziale będziemy zakładać, że rozkład jest wyśrod kowany wokół wartości prawdziwej. Założenie to jest równoważne stwier dzeniu, że wszystkie błędy systematyczne zostały ograniczone do zaniedbywalnego poziomu. Obecnie musimy poświęcić trochę czasu pytaniu, którego do tej pory skrzętnie unikaliśmy: Co to jest „wartość prawdziwa" wielkości fizycznej? To trudne pytanie, na które brak zadowalającej, prostej odpowiedzi. Ponieważ oczywiste jest, że żaden pomiar nie pozwala określić wartości prawdziwej jakiejkolwiek zmiennej ciągłej (takiej jak długość, czas itp.), nie jest wcale jasne, czy taka wartość istnieje. Pomimo to, wygodnie jest przyjąć, że każda wielkość fizyczna ma wartość prawdziwą i takie właśnie założenie przyjmiemy. Można wyobrażać sobie wartość prawdziwą pewnej wielkości jako tę wartość, do której zbliżamy się coraz bardziej, wykonując coraz więcej pomia rów z coraz większą dokładnością. W takim obrazie „wartość prawdziwa" stanowi idealizację podobną do pozbawionego wymiarów matematycznego punktu czy linii nie mającej szerokości i tak jak każdy z tych obiektów jest pojęciem niezwykle użytecznym. Często wartości prawdziwe mierzonych wiel kości x,y,... będziemy oznaczać przez odpowiadające im wielkie litery X, Y,... Jeżeli pomiary wielkości x są zależne od wielu drobnych błędów przypad kowych, a błędy systematyczne są zaniedbywalne, to odpowiadający im roz kład będzie miał kształt symetrycznej krzywej dzwonowej, wyśrodkowanej wokół wielkości prawdziwej X.
125
Funkcja matematyczna, która opisuje krzywą dzwonową nosi nazwę funk cji rozkładu normalnego lub funkcji Gaussa i ma postać 3
e~*
2/2<12
,
(5.17)
gdzie a jest ustaloną wielkością, którą będziemy nazywać szerokością rozkładu. Czytelnik powinien uważnie zapoznać się z własnościami tej funkcji. Gdy x — 0, funkcja Gaussa (5.17) przyjmuje wartość jeden. Funkcja jest symetryczna względem x = 0, ponieważ jej wartości są identyczne dla x i — x. W miarę jak x oddala się od zera w jednym z kierunków, wartość x /2a wzrasta: szybciej, jeżeli
1-^
/
/
/
s
/
s
2
mała wartość a
1
\/
1 1 1
s
/ duża wartość a
\ ^
I
\
\
J
0
\ s
•x
R y s u n e k 5.8. Funkcja Gaussa (5.17) ma kształt dzwonowy i jest wyśrodkowana wokół x = 0. Krzywa jest szeroka, jeżeli parametr a ma dużą wartość, i wąska, jeżeli cr ma małą wartość
Funkcja Gaussa (5.17) opisuje krzywą dzwonową wyśrodkowaną wo kół x = 0. Chcąc uzyskać krzywą wyśrodkowaną względem dowolne go punktu x = X, należy we wzorze (5.17) zastąpić x przez x — X. I tak funkcja
ma maksimum w punkcie x — X i maleje symetrycznie po obydwu stronach x = X, co widać na rysunku 5.9.
3
Funkcja Gaussa jest niekiedy nazywana funkcją gaussowską (lub krótko „gaussem"), normalną funkcją gęstości lub normalną funkcją błędu. Ostatnia z podanych nazw nie jest zbyt szczęśliwa, ponieważ jest ona także stosowana do całki z funkcji Gaussa (porównaj paragraf 5.4).
126
x= X
R y s u n e k 5 . 9 . Funkcja Gaussa (5.18) ma kształt dzwonowy i jest wyśrodkowana wokół x = X
Funkcja (5.18) nie daje wciąż ostatecznego opisu rozkładu granicznego, gdyż każdy rozkład musi być znormalizowany, czyli spełniać warunek
1 f(x)dx
(5.19)
= l.
Zmierzając w tym kierunku, zapiszmy funkcję w postaci f(x) =
x
2
2
Ne-^- > ^ .
(5.20)
(Mnożenie przez czynnik N nie powoduje zmiany kształtu, ani nie przesuwa maksimum z x = X). Wartość „współczynnika normalizacji" musimy tak do brać, by funkcja f(x) była znormalizowana zgodnie z warunkiem (5.19). Wymaga to wykonania kilku elementarnych przekształceń całek, które częś ciowo opiszemy: J f(x)dx
x X)2/2a
= J
Ne-( - >dx.
(5.21)
Chcąc uprościć całkowanie, wygodnie jest dokonać zamiany zmiennych, przyj mując x — X = y (w tym przypadku dx = dy). W ten sposób otrzymujemy N J
2
-J> /2
2
dy.
(5.22)
Następnie dokonujemy podstawienia y/a = z (w tym przypadku dy = cdz), co prowadzi do Na J
e"
z 2 / 2
dz.
(5.23)
Całka, którą otrzymaliśmy jest jedną ze standardowych całek spotykanych w fizyce matematycznej. Można ją łatwo obliczyć, ale szczegóły nie są dla nas
127
szczególnie kształcące; ograniczymy się więc do podania wyniku
4
+ GO
j e"
z 2 / 2
d z = ^2% .
(5.24)
— 00
Wstawiając ten wynik do równań (5.21) i (5.23), stwierdzamy, że + co
J f(x)dx
=
Nosili.
— CO
Ponieważ całka musi być równa jedności, dobieramy stałą normalizacji N ró /
wną N — l/(ffy 2n"). Dochodzimy do wniosku, że poprawnie znormalizowana funkcja opisująca rozkład Gaussa (czyli rozkład normalny) dana jest wzorem
fj
x x)
= —L -i*-xW.
(5.25)
=rS
a\/27t
Zauważmy, że wprowadziliśmy indeksy X i a, które wskazują na środek i szerokość rozkładu. Funkcja f , ( ) opisuje rozkład graniczny wyników pomiarów wielkości x, której wartość prawdziwa jest równa X, pod warun kiem, że pomiary są narażone jedynie na wpływ błędów przypadkowych. O dowolnych pomiarach, których rozkładem granicznym jest funkcja Gaussa (5.25), mówimy, że mają one rozkład normalny. Zastanowimy się krótko nad znaczeniem szerokości rozkładu a. Wiemy już, że mała wartość a oznacza rozkład o ostrym maksimum, odpowiadający pomiarom o dużej dokładności; duża wartość a daje rozkład o rozmytym maksimum i oznacza małą dokładność pomiarów. N a rysunku 5.10 przed stawiliśmy dwa przykłady rozkładu Gaussa o różnych położeniach środka X i szerokości a. Warto zwrócić uwagę na rolę współczynnika a występujące go w mianowniku wzoru (5.25), który zapewnia, że węższemu (mniejsze a) rozkładowi towarzyszy automatycznie większa wartość w maksimum, co x
x a
4
Wyprowadzenie można znaleźć na przykład w podręczniku: Hugh D. Young Statistical Treatment of Experimental Data (McGraw-Hill, 1962) Dodatek D. [Innym podręcznikiem, w któ rym podano sposób obliczenia całki, jest: R.P. Feynman, R.B. Leighton, M. Sands Feynmana wykłady
128
z fizyki
(PWN,
1974), t. I, cz. 2, § 40-4, s. 226) - przyp.
tłum.']
: : zostaje w zgodzie z żądaniem, aby całkowite pole powierzchni pod krzywą było równe 1.
/
u
R y s u n e k 5.10. Dwa przykłady rozkładu normalnego (Gaussa)
W paragrafie 5.2 przekonaliśmy się, że znajomość rozkładu granicznego rJJa pewnej serii pomiarów pozwala obliczyć oczekiwaną wartość średniej x dla aardzo dużej liczby powtórzeń. Zgodnie ze wzorem (5.15) spodziewmy się, że średnia dla długiej serii pomiarowej jest równa + CO
x =
j* x / ( x ) d x .
(5.26)
— CO
x
Jeżeli rozkładem granicznym jest rozkład Gaussa f , ( ) wyśrodkowany wokół wartości prawdziwej X, całkę tę potrafimy obliczyć. Zanim przy stąpimy do rachunków, zauważmy, że jest niemal oczywiste, że wartość średnia x dla dużej liczby pomiarów będzie równa X, ponieważ syme tria funkcji Gaussa oznacza, że taka sama część wyników znajdzie się w tej samej odległości powyżej i poniżej X. Tak więc średnia powinna być rów na X. Całkę (5.26) w przypadku rozkładu Gaussa obliczamy następująco: x a
+ 0O
* =
I
x
fx,o(x)dx
— 00
i = — - =
+00 J xe- *-* / (
)2
(5.27) 2ff2
dx.
-00
Dokonując zamiany zmiennych y = x — X, otrzymujemy x = y + X. Całka (5.27) rozpada się więc na dwa składniki
dx = dy
oraz
129
f 00
+ 00 2a2
-^ dy
J
+ X J e-^
ye
- co
— co
\ /2ff2
dj;).
(5.28) /
Pierwsza z całek jest równa zeru, ponieważ przyczynek od dowolnego punktu y znosi się z przyczynkiem pochodzącym od punktu — y. Druga z całek to po prostu całka normalizacji, którą spotkaliśmy już we wzorze (5.22) i której wartość wynosi G^/IJK. Uwzględniając czynnik O ^ / I K obecny w mianowniku, otrzymujemy odpowiedź zgodną z wcześniejszymi przewidywaniami, że dla dużej liczby pomiarów x = X.
(5.29) t o
Innymi słowy, jeżeli wyniki pomiarów podlegają rozkładowi Gaussa f „{x), wartość przeciętna obliczona na podstawie bardzo długiej serii pomiarów jest równa wartości prawdziwej, wokół której funkcja Gaussa jest wyśrodkowana. Wynik zapisany w równaniu (5.29) byłby zupełnie ścisły jedynie wtedy, gdy pomiar zostałby powtórzony nieskończenie wiele razy. Praktyczna korzyść wynikająca z otrzymanego rezultatu polega na stwierdzeniu, że w wyniku dużej (chociaż skończonej) liczby powtórzeń uzyskana średnia będzie bliska X. Inną interesującą wielkością, którą warto obliczyć, jest odchylenie standar dowe a dla długiej serii pomiarów. Zgodnie z definicją (5.16) jest ono dane wzorem Xt
x
+ C0 2
a = J (x-x) f Jx)dx. 2
(5.30i
x
x
- CO
Całkę tę można łatwo obliczyć. Zastępujemy x przez X, dokonujemy pod stawień x — X = y oraz y/a = z i na koniec całkujemy przez części uzyskując wynik (patrz zadanie 5.6) 2
al = a ,
(5.31
ważny dla dużej liczby pomiarów. Innymi słowy, szerokość a funkcji Gauss; J dokładnie równa odchyleniu standardowemu, które otrzymujem; powtarzając wielokrotnie pomiar. Stanowi to oczywiście przyczynę wykorzys tania litery a do oznaczenia szerokości rozkładu i wyjaśnia, dlaczego a jes często nazywana odchyleniem standardowym rozkładu Gaussa f ,A )nakże, ściśle mówiąc, a jest wartością odchylenia standardowego, któr< spodziewalibyśmy się dla nieskończenie wielu pomiarów. Jeżeli pomiar x pc wtarzamy skończoną liczbę razy (powiedzmy 1 0 lub 20), to odchylenie stai dardowe, jakie obserwujemy, powinno być jedynie w przybliżeniu równe i nie ma powodów sądzić, że będzie ono dokładnie równe a. W paragrafie 5 x
fx,A )
E S T
x
x
130
zastanowimy się, co można powiedzieć na temat średniej i odchylenia standar dowego w przypadku realnej, skończonej liczby pomiarów.
5.4. Odchylenie standardowe jako granica przedziału 68-procentowej ufności Rozkład graniczny f(x) pomiarów pewnej wielkości x zawiera informację o prawdopodobieństwie uzyskania dowolnej określonej wartości x. W szcze gólności całka }f(x)dx a
wyraża prawdopodobieństwo, że wynik pojedynczego pomiaru leży w prze dziale a ^ x < b. Jeżeli rozkładem granicznym jest funkcja Gaussa f , (x), to wartość odpowiedniej całki potrafimy obliczyć. W szczególności, możemy : becnie znaleźć prawdopodobieństwo (o którym mówiliśmy w rozdziale 4), że wynik pojedynczego pomiaru leży w promieniu jednego standardowego od pylenia o od wartości prawdziwej X. To prawdopodobieństwo jest równe x a
X + o-
P(w promieniu
J f (x)dx
(5.32)
Xa
= —^=/jV<*-*> / 2
2
d;c.
(5.33)
Tiłka ta jest zaznaczona na rysunku 5.11. Można ją uprościć w znany nam już sposób, wprowadzając podstawienie (x — X)/a = z, które pociąga za sobą
X-c
X
X+cr
• :unek 5.11. Zacieniowany obszar, którego granice znajdują się w X±a, wyraża prawdopodoaenstwo otrzymania wyniku pomiaru w promieniu jednego odchylenia standardowego od wartości prawdziwej X
131
dx = adz oraz zmianę granic całkowania do z = + 1 . Całka przyjmuje więc postać 1 + i P(w promieniu er) = —-== ) e y/ln -1
z 2 / 2
dz.
(5.34)
Zanim zbadamy własności całki (5.34), podkreślimy tylko, że równie dob rze moglibyśmy szukać prawdopodobieństwa uzyskania wyniku w promieniu 2a lub l,5er od X. Mówiąc ogólnie, moglibyśmy obliczyć P (w promieniu ter), co oznacza „prawdopodobieństwo uzyskania wyniku w promieniu ta od X", gdzie t jest dowolną dodatnią liczbą. Takie prawdopodobieństwo jest równe polu zaznaczonemu na rysunku 5.12, a obliczenia identyczne jak w przypadku (5.34) prowadzą do całki (porównaj zadanie 5.7)
Rysunek 5.12. Zacieniowany obszar, którego granice znajdują się w X±ta, wyraża prawdopodo bieństwo uzyskania pomiaru z wynikiem w promieniu t odchyleń standardowych od wartości prawdziwej X
P(w promieniu ta) = — j = | e y/In -
z 2 / 2
dz.
(5.35)
t
Całka (5.35) jest jedną ze standardowych całek fizyki matematycznej i jest często nazywana funkcją błędu, i oznaczana jako erf(f), lub też normalną całką błędu. Nie można obliczyć jej analitycznie, ale wartość można łatwo znaleźć korzystając z kalkulatora. Jej wykres w zależności od zmiennej t wraz z poda nymi kilkoma wartościami zawiera rysunek 5.13. Tabelę wartości funkcji błędu można znaleźć w dodatku A, znajdującym się na końcu książki. (Patrz także dodatek B, który dotyczy innych, ale ściśle z nią związanych całek.) Korzystając z rysunku 5.13, możemy przekonać się, że prawdopodobieńst wo uzyskania wyniku w promieniu jednego odchylenia standardowego od wartości prawdziwej wynosi 68 procent, tak jak podaliśmy w rozdziale 4 (w którym określono je jako bliskie „70 procent"). Jeżeli podamy odchylenie standardowe jako niepewność pomiarową (tj. napiszemy x = x ± 5 x , przyjn p
132
\
99,7%
100%
99,9%
V 1 1 1 /
¡95,4%
1 1
/
f\
'
1
,
1
i i 1 1
f
\
0
0,674
t
0
0,25
p [%]
0
20
1 1 i l
i 2
i
i
0,5 0,75
1,0
1,25
1,5
1,75
38
68
79
87
92
55
2,0
i
•
3
4 (
2,5
3,0
3,5
4,0
95,4 98,8 99,7 99,95 99,99
Rysunek 5.13. Prawdopodobieństwo P(w promieniu ta), że pomiar wielkości x da wynik promieniu t odchyleń standardowych od wartości prawdziwej X. Funkcja ta jest najczęściej nazywana
funkcją
błędu erf(t) lub normalną
całką
błędu
~ując 5x = a), możemy być w 68 procentach przekonani, że znajdujemy się w promieniu a od prawdziwego wyniku. Z rysunku 5.13 wynika też, że prawdopodobieństwo P (w promieniu ta) szybko zbliża się do 100 procent ze wzrostem t. Prawdopodobieństwo, że wynik pomiaru znajdzie się w promieniu 2a jest równe 95,4 procent; od powiednia wartość dla 3a wynosi 99,7 procent. Inaczej można wyrazić to tak: prawdopodobieństwo uzyskania wyniku na zewnątrz otoczenia wartości praw dziwej o promieniu jednego odchylenia standardowego jest znaczące (32 procent), na zewnątrz otoczenia o promieniu 2cr jest już znacznie mniejsze (4,6 procent), a otrzymanie wyniku na zewnątrz otoczenia o promieniu 3a jest już bardzo mało prawdopodobne (0,3 procent). Nie ma oczywiście nic szczególnego w liczbie 68 procent; przypadkowo wyraża ona wiarygodność związaną z odchyleniem standardowym a. Wielkoś cią alternatywną do odchylenia standardowego jest tak zwany błąd praw dopodobny B.P., zdefiniowany jako odległość, dla której prawdopodobieństwo otrzymania wyniku w granicach X + B.P. wynosi 50 procent. N a podstawie rysunku 5.13 można się przekonać, że (dla pomiarów opisywanych rozkładem normalnym) błąd prawdopodobny wynosi B.P. w 0,67o\
133
Niektórzy eksperymentatorzy jako miarę swoich niepewności pomiarowych podają błąd prawdopodobny. Pomimo to, odchylenie standardowe a, dzięki swoim prostym własnościom, jest najczęściej używaną miarą niepewności.
5.5. Uzasadnienie wyboru średniej jako najlepszego przybliżenia W poprzednich trzech paragrafach zajmowaliśmy się rozkładem granicznym f(x), czyli takim rozkładem, który byłby rezultatem nieskończonie wielu pomiarów wielkości x. Znając f(x) potrafilibyśmy obliczyć średnią x oraz odchylenie standardowe a dla nieskończenie długiej serii pomiarów i (przynaj mniej w przypadku rozkładu normalnego) poznalibyśmy wartość prawdziwą X. Niestety, nigdy nie znamy rozkładu granicznego. W praktyce dysponujemy pewnym skończonym zbiorem zmierzonych wartości (liczy on 5, 10, a być może 50 elementów), X, X
2
, • • • , Xjy,
a naszym zadaniem jest znalezienie najlepszych przybliżeń dla X i a na podstawie tych N zmierzonych wartości. Jeżeli wyniki pomiarów podlegałyby rozkładowi normalnemu f , ( ) i " libyśmy wartości parametrów X i a, moglibyśmy obliczyć prawdopodobieńst wa uzyskania wartości x ,x ,...,x które faktycznie otrzymaliśmy. Prawdo podobieństwo otrzymania wyniku w pobliżu x , mieszczącego się w małym przedziale d x jest równe x
z n a
x a
1
2
N
t
1 ;
P(x w przedziale od x do x +dx ) 1
1
1
( x
= —^-=Q~ ^
W praktyce nie interesuje nas wielkość przedziału d x stosujemy więc zapis skrócony ( x
P(x )oc-e- 'a 1
X ) 2 / 2 f f 2
x
X ) 2 l 2
, 2
' dx . i
(ani czynnik
.
(5.36)
y/2n);
(5.37)
Będziemy się powoływać na wzór (5.37), mówiąc o prawdopodobieństwie uzyskania wartości x , chociaż - wyrażając się ściśle - jest to prawdopodo bieństwo otrzymania wyniku w małym przedziale w pobliżu x jak zapisaliś my to w równaniu (5.36). x
l 5
134
Prawdopodobieństwo uzyskania kolejnego wyniku x jest równe 2
(
P(x )oc-e- ^-*
) 2 / 2 f f
2
\
(5.38)
: podobnie dla wszystkich pozostałych prawdopodobieństw kończąc na P{x )oc— N
2
a
e^»-*> /
2ff2
.
(5.39)
Równania (5.37)—(5.39) informują o prawdopodobieństwie uzyskania każdego z wyników x ,x ,...,x , obliczonym przy założeniu, że rozkładem granicznym jest f , ( )Prawdopodobieństwo, że otrzymamy cały zbiór N wartości jest iloczynem poszczególnych prawdopodobieństw , 1
2
N
x
x a
5
p
x , A
x
1 ' - '
x
n )
p x
=
x
x
( i)-P( 2)---P( n)>
czyli x
P J x
X
,...,x )^j^c-^- ^\
l
(5.40)
N
Dużą wagę ma zrozumienie znaczenia różnych wielkości występujących we wzorze (5.40). Wartości x ,x ,...,x są rzeczywistymi wynikami N pomiarów; tak więc x ,x ,...,x są to znane, ustalone liczby. Wielkość P {x ,...,x ) jest prawdopodobieństwem uzyskania N wyników x ,x ,...,x , obliczonym przy założeniu pewnych wartości X i er, wartości prawdziwej x i szerokości rozkładu. Liczby X i er nie są znane; chcemy znaleźć najbardziej wiarygodne wartości X i er, opierając się na znanych wynikach pomiarów x ,x ,...,x . Prawdopodobieństwo (5.40) wyposażyliśmy w indeksy X i a, , chcąc podkreś lić, że jego wartość zależy od (nieznanych) parametrów X i a. x
1
2
2
N
N
X
1
2
a
1
N
N
1
2
N
Ponieważ rzeczywiste wartości X i er nie są znane, moglibyśmy wyobrazić sobie, że zgadujemy wartości X' oraz er' i korzystamy z nich obliczając prawdopodobieństwo P - (x ,...,x ). Jeżeli z kolei odgadlibyśmy nowe licz by X" oraz er" i stwierdzili, że odpowiadająca im wartość prawdopodobieństX
5
a
1
N
Korzystamy ze znanej reguły, która mówi, że prawdopodobieństwo wystąpienia kilku
niezależnych zdarzeń jest określone przez iloczyn poszczególnych prawdopodobieństw. N a przy kład, prawdopodobieństwo otrzymania „orła" przy rzucie monetą wynosi —, a prawdopodobień stwo wyrzucenia „szóstki" w rzucie kostką do gry jest równe —. Tym samym prawdopodobieństwo otrzymania w rzucie „orła" i „szóstki" wynosi
135
wa P " „» (x ,...,x ) jest większa niż obliczona poprzednio, to w naturalny sposób przyjęlibyśmy, że X" i a" są lepszym przybliżeniem X i er. Postępując w ten sposób, moglibyśmy prowadzić polowanie na takie liczby X i
i
N
Xa
1
1
2
2
1
N
N
N
P , {x„...,x )o:^z-^-x^°\ x a
(5.41)
N
Posługując się tą zasadą można z łatwością znaleźć najlepsze przybliżenie wartości prawdziwej X. Jest oczywiste, że prawdopodobieństwo (5.41) osiąga maksimum wtedy, gdy wykładnik jest najmniejszy. Tak więc najbardziej wiary godnym oszacowaniem X jest taka wartość X, dla której 2
I
2
(xt-X) /o
(5.42)
i= 1
ma wartość minimalną. Chcąc znaleźć minimum, obliczamy pochodną wzglę dem X, a następnie przyrównujemy ją do zera i otrzymujemy £ (x-X)
= 0,
i=l
czyli X = =jj'
(najlepsze przybliżenie).
(5.43)
Oznacza to, że najlepszym przybliżeniem wartości prawdziwej X jest średnia z N pomiarów, x = '£x /N, wynik, który bez dowodu przyjmowaliśmy za prawdziwy począwszy od rozdziału 1. Znalezienia najlepszego przybliżenia dla szerokości rozkładu granicznego a jest zadaniem nieco trudniejszym, ponieważ prawdopodobieństwo (5.41) jest bardziej złożoną funkcją a. Musimy obliczyć pochodną (5.41) względem a i
136
i przyrównać ją do zera. (Szczegółowe rachunki pozostawiamy Czytelnikowi; patrz zadanie 5.10.) W ten sposób otrzymujemy wartość a, która zapewnia maksimum prawdopodobieństwa (5.41) i jest najlepszym przybliżeniem a
a =
X
2
/ — £ ( i — X)
(najlepsze przybliżenie).
(5.44)
i= i
Wartość prawdziwa X jest nieznana. Tak więc w praktyce jesteśmy zmuszeni zastąpić wartość prawdziwą X ze wzoru (5.44) jej najlepszym przybliżeniem czyli średnią x. Prowadzi to do wyrażenia
(5.45)
Mówiąc inaczej, naszym najlepszym przybliżeniem szerokości rozkładu grani::nego a jest odchylenie standardowe dla N zmierzonych wartości x ,x ,...,x , tak jak zdefiniowaliśmy we wzorze (4.6). Czytelnik może się dziwić, dlaczego wynik (5.45) jest identyczny z pierwo:r.ą definicją odchylenia standardowego (4.6) z mianownikiem N, a nie z definirą ..poprawioną", w której mianownik jest równy N — l. W rzeczywistości rrzechodząc od najlepszego przybliżenia (5.44) do wyrażenia (5.45) pominęliś my pewien istotny szczegół. Najlepsze przybliżenie (5.44) zawiera wartość rrawdziwą X, podczas gdy w (5.45) zastąpiliśmy X przez x (nasze najlepsze rrzybliżenie dla X). Obydwie te liczby nie są sobie na ogół równe i można o się przekonać, że wartość wyrażenia (5.45) jest zawsze mniejsza lub co -i;wyżej równa wartości (5.44) . Tym samym, przechodząc od (5.44) do (5.45), - -. doszacowaliśmy szerokości a. Oszacowanie różnicy, o którą (5.45) jest ~-.iejsze od (5.44), jest całkiem proste, ale nie będziemy się teraz tym ża rn :wać. W wyniku otrzymalibyśmy, że najlepszym przybliżeniem a nie jest wyrażenie (5.45), ale jego iloczyn przez czynnik równy około .V —1). Ostateczny wniosek mówi, że najlepszym przybliżeniem szeroko. - jest „poprawione" odchylenie standardowe zmierzonych wartości t
2
N
7
6
(najlepsze przybliżenie).
(5.46)
r
Jeżeli spojrzymy na (5.44) jak na funkcję zmiennej X, zauważymy, że (jak niedawno .". ismy) jej minimum występuje w punkcie x = X. Tym samym (5.45) jest zawsze mniejsze tur : : * n e (5.44).
137
Nadszedł chyba właściwy moment, aby zatrzymać się na chwilę i przyjrzeć dość skomplikowanej konstrukcji, którą do tej pory wznieśliśmy. Po pierwsze, jeżeli pomiary wielkości x są narażone na występowanie jedynie błędów przypadkowych, to ich rozkład graniczny powinien być opisany przez funkcję Gaussa f , (x), wyśrodkowaną wokół wartości prawdziwej X i mającą szero kość a. Szerokość a określa granice przedziału 68-procentowej ufności, co znaczy, że istnieje 68-procentowe prawdopodobieństwo otrzymania wyniku pomiaru w odległości nie większej niż a od wartości prawdziwej X. W prak tyce zarówno X jak i a nie są znane. Zamiast tego dysponujemy zbiorem N zmierzonych wartości x ,x ,...,x , gdzie N jest ograniczone jedynie przez czas i cierpliwość eksperymentatora. Opierając się na N posiadanych wyni kach pomiarów, możemy znaleźć najlepsze przybliżenie wartości prawdziwej X, którym - jak wykazaliśmy - jest średnia x — £ xJN oraz najlepsze przybliżenie szerokości a, którym jest odchylenie standardowe a pomiarów x ,x ,...,x zdefiniowane we wzorze (5.46). W paragrafie 5.7 zastanowimy się nad kwestią wiarygodności średniej x jako najlepszego oszacowania X; w po dobny sposób moglibyśmy rozważać wiarygodność a jako najlepszego osza cowania <7, ale nie będziemy się tym zajmować. x a
1
2
N
x
1
2
N
x
Wszystkie wyniki z ostatnich dwóch paragrafów opierają się na za łożeniu, że nasze pomiary podlegają rozkładowi normalnemu . Chociaż jest to rozsądne założenie, to jednak w praktyce trudno je sprawdzić, a w niektórych przypadkach może okazać się nie całkiem prawdziwe. Pa miętając o tym, powinniśmy podkreślić, że nawet wtedy, gdy rozkład pomia rów nie jest rozkładem normalnym, prawie zawsze jest on w przybliżeniu rozkładem normalnym i można bezpiecznie korzystać z wyników przedsta wionych w niniejszym rozdziale, uważając je przynajmniej za dobre przy bliżenia. 7
5.6. Uzasadnienie reguły kwadratowego przenoszenia błędów Nadszedł czas, aby powrócić do zagadnienia, które poruszyliśmy w rozdziale 3, jakim jest przenoszenie błędów. Stwierdziliśmy wówczas, pomijając formalny dowód, że w przypadku gdy błędy są przypadkowe i wzajemnie niezależne, można je dodawać w kwadratach, opierając się na pewnych standardowych zasadach, podanych dla szczególnych przypadków w równaniach (3.16) i (3.18)
7
138
A także, że błędy systematyczne zostały zredukowane do zaniedbywalnego poziomu.
oraz w formie ogólnej w (3.47). Jesteśmy obecnie przygotowani do udowod nienia reguły kwadratowego przenoszenia błędów. Problem przenoszenia błędów pojawia się, gdy mierzymy jedną lub kilka wielkości x,...,z, wszystkie obarczone niepewnościami, a następnie korzystamy ze zmierzonych wartości obliczając pewną wielkość q(x, ...,z). Podstawowym zagadnieniem jest określenie niepewności związanej z obliczoną wartością q. Jeżeli wielkości x,...,z są obarczone jedynie błędami przypadkowymi, to podlegają rozkładom normalnym z szerokościami a ,...,a , które przyjmuje my jako niepewności związane z pojedynczymi pomiarami odpowiednich wielkości. Pytanie, na które mamy udzielić odpowiedzi, brzmi następująco: Co można powiedzieć o rozkładzie wartości q, jeżeli znane są rozkłady dla x,...,z? A w szczególności, jaka będzie szerokość rozkładu wartości q? 8
x
z
Suma zmierzonej wielkości i stałej Zacznijmy od rozważenia dwóch bardzo prostych przypadków szczególnych. Na początek wyobraźmy sobie, że wykonaliśmy pomiary pewnej wielkości x, a następnie chcemy obliczyć wielkość q = x + A,
(5.47)
gdzie A jest pewną stałą pozbawioną niepewności (na przykład A = 1 lub rc). Załóżmy, że pomiary x podlegają rozkładowi normalnemu wokół wartości
(zmierzone)
= x + A 1
X
+
d
(obliczone)
Rysunek 5.14. Jeżeli zmierzone wartości x podlegają rozkładowi normalnemu ze środkiem w x = X i szerokością
x
8
W przypadku gdy zajmujemy się różnymi mierzonymi wielkościami x,...,z, korzystamy z indeksów x , . . . , z w celu rozróżnienia szerokości odpowiadających im rozkładów granicznych. I tak a oznacza szerokość rozkładu Gaussa f ,„ (x) opisującego pomiary x itd. x
x
x
139
prawdziwej X z szerokością a , tak jak na rysunku 5.14a. Prawdopodobieńst wo uzyskania dowolnej wartości x (w małym przedziale dx) jest równe f Jx)dx, czyli x
Xi
2
2CT
(prawdopodobieństwo uzyskania wartości x) cc -(*-x) / *.
(5.48)
e
Naszym zadaniem jest określenie prawdopodobieństwa uzyskania dowolnej wartości q zdefiniowanej w równaniu (5.47). Z równania (5.47) wynika wprost, że x = q — A i tym samym (prawdopodobieństwo uzyskania wartości q) = (prawdopodobieństwo uzyska nia x = q — A). Drugie z prawdopodobieństw dane jest wzorem (5.48), a więc (prawdopodobieństwo uzyskania wartości q)
cc
4
2
2
e-K?-- )-^] / ^
= -[«-(x+^)] /2o2
2
e
(5.49) Wynik (5.49) dowodzi, że rozkład obliczonych wartości q jest rozkładem normalnym wyśrodkowanym wokół wartości X + A, którego szerokość jest rów na a , tak jak przedstawia to wykres 5.14b. W szczególności niepewność q ma tę samą wartość (równą a ) co niepewność x zgodnie z przewidywaniami reguł (3.16). x
x
Iloczyn zmierzonej wielkości i stałej Weźmy teraz inny prosty przykład. Załóżmy, że przeprowadziliśmy pomiar wielkości x, a następnie obliczamy wielkość q = Bx, gdzie B jest pewną stałą (jak na przykład B = 2 lub B = n). Jeżeli pomiary x opisane są przez rozkład normalny, to rozumując dokładnie tak samo jak w poprzednim przypadku stwierdzamy, że (prawdopodobieństwo uzyskania wartości q) cc (prawdopodobieństwo uzyskania x = q/B) 9
2
ocexp
-(^-xJJ2a 2
2
x 2
= exp[-(q-5X) /2B o- ]. 9
z
(5.50)
Obecnie skorzystaliśmy z innego oznaczenia exp(z) funkcji wykładniczej, exp(z) = e . W sytuacji gdy wykładnik z staje się bardziej złożony, zapis „exp" jest wygodniejszy.
140
/N
s z e r o k o ś ć a~
X
BX
q=Bx
Rysunek 5.15. Jeżeli zmierzone wartości x podlegają rozkładowi normalnemu ze środkiem w x = X i szerokością a , to obliczone wartości ą = Bx (gdzie B jest znaną stałą) będą podlegać rozkładowi normalnemu ze środkiem w BX i szerokością Ba x
x
Innymi słowy wartości q = Bx są opisane rozkładem normalnym wyśrod kowanym wokół q = Bx i z szerokością Ba , zgodnie z rysunkiem 5.15. W szczególności niepewność q = Bx różni się B razy od niepewności x, zgodnie z przewidywaniami reguł (3.18). x
Suma dwóch zmierzonych wielkości Jako pierwszy nietrywialny przykład przenoszenia błędów rozpatrzymy sumę x+y dwóch niezależnych, mierzonych wielkości x i y. Założymy, że pomiary x i y podlegają rozkładom normalnym wokół wartości prawdziwych X i Y, ich szerokości są odpowiednio równe a i a , tak jak na rysunkach 5.16 x
X+
y
¥
• x + y
Rysunek 5.16. Jeżeli pomiary x i y są wzajemnie niezależne i podlegają rozkładom normalnym ze irodkami w X oraz F i szerokościami o oraz a , to obliczone wartości x + y będą podlegać rozkładowi normalnemu ze środkiem w X+ 7 i szerokością yjal + a* x
141
drugiego ze składników po prawej stronie równania (5.54), gdyż nie jest on dla nas interesujący. Jeżeli podstawimy (5.55) do (5.53), zastępując jednocześnie A przez a oraz B przez er , otrzymamy 2
x
2
2
(x+y) 2{ol + o )
P{x,y) cc exp
(5.56)
2
y
Wzór ten wyraża w równym stopniu prawdopodobieństwo uzyskania dowol nych wartości x i y, jak i dowolnych wartości x + y oraz z. Możemy więc przepisać (5.56) w postaci "
2
P{x + y,z) oc exp
(x+y)
exp
2(0Ì + 0 y). 2
2
z' 2_
(5.57)
Na koniec, chcielibyśmy poznać prawdopodobieństwo uzyskania pewnej wartości x + y niezależnie od wartości z. Możemy to osiągnąć sumując, a raczej całkując (5.57) po wszystkich możliwych wartościach z, tj. P(x + y) =
| P(x + y,z)dz.
(5.58)
2
Całkując występujący w (5.57) czynnik exp( —z /2), otrzymamy ~J2% i przeko namy się, że 2
P(x + y) cc exp
(x+y) 2( - + - ) . 2
0
2
(5.59)
0
To dowodzi, że wartości x + y podlegają rozkładowi normalnemu z szeroko-
'al + al , jak przewidywaliśmy. Nasz dowód jest pełny, o ile wartości prawdziwe x i y są równe zeru, X = 7 = 0 . Jeżeli X i Y są różne od zera, możemy postąpić tak: Po pierwsze, zapiszmy scią
y
x + y = (x-X)
+ (y-Y)
+
(X+Y).
(5.60)
Pierwsze dwa składniki są wyśrodkowane wokół zera, a ich szerokości wyno szą a i a zgodnie z (5.49). Suma dwóch pierwszych składników podlega więc rozkładowi normalnemu o szerokości y/al + af. Trzeci człon w równaniu (5.60) jest liczbą stałą. Zatem, na mocy (5.49), przesuwa on środek rozkładu do (X+ Y), nie zmieniając przy tym jego szerokości. Innymi słowy wartości (x + y) zapisane tak jak w równości (5.60) podlegają rozkładowi normalnemu wokół (X+ Y) z szerokością Jo\ + u . Jest to wynik, do którego dążyliśmy. x
2
143
Przypadek ogólny Udowodniwszy regułę przenoszenia błędów dla sumy x + y, zaskakująco łatwo damy sobie radę z przypadkiem ogólnym. Załóżmy, że mierzymy dwie wzaje mnie niezależne wielkości x i y podlegające rozkładowi normalnemu, a następ nie obliczamy pewną wielkość q(x,y), która jest funkcją x i y. Rozkład wartości q(x,y) można znaleźć bez trudu, korzystając z uzyskanych wcześniej wyników. Po pierwsze, szerokości a i o (niepewności x i y) muszą być niewielkie. Oznacza to, że będą nas interesować wartości x bliskie X, wartości y bliskie Yoraz, że będziemy mogli skorzystać z przybliżenia (3.42) i zapisać x
q(x,y) * q(X, Y)+(^^(x-X)+(^J^(y-
Y).
(5.61)
Przybliżenie to jest uzasadnione, ponieważ ze znaczącą częstością występują tylko te wartości x i y, które są bliskie X i Y. Obydwie pochodne cząstkowe występują z indeksami X, Y, które mają podkreślić, że obliczono je w punkcie X, Yi są liczbami stałymi. Przybliżenie (5.61) pozwala wyrazić wielkość q(x,y) w postaci sumy trzech składników. Pierwszy człon q{X, Y) jest liczbą stałą; jego rola ograni cza się do przesunięcia obliczanego rozkładu. Drugi człon jest iloczynem stałej dq/dx przez czynnik (x — X), którego rozkład ma szerokość cr ; rozkład wartości drugiego z członów jest wyśrodkowany wokół zera, a jego szerokość wynosi x
dq dx
Cv
Podobnie rozkład wartości trzeciego z członów jest wyśrodkowany wokół zera, a jego szerokość rozkładu wynosi 8q dyj
'
Zbierając wszystkie trzy człony i korzystając z wcześniej ustalonych reguł, dochodzimy do wniosku, że wartości q(x,y) podlegają rozkładowi normal nemu wokół wartości prawdziwej q(X, Y) z szerokością daną przez
dx
144
X
J
\ 8y
Jeżeli uznamy odchylenia standardowe a i a za niepewności x i y, to wyrażenie (5.62) stanie się identyczne z regułą (3.47) przenoszenia błędów przypadkowych dla funkcji dwóch zmiennych q(x,y). Jeżeli wielkość q jest zależna od kilku zmiennych q(x,y,...,z), to przedstawioną przed chwilą ar gumentację można z łatwością uogólnić na przypadek funkcji wielu zmiennych tak jak we wzorze (3.47). Ponieważ wszystkie reguły (związane z przenosze niem niepewności przypadkowych) wynikają ze wzoru (3.47), można uznać je za udowodnione. x
y
5.7. Odchylenie standardowe średniej Musimy jeszcze udowodnić jedno z ważnych, podanych w rozdziale 4 stwier dzeń. Dotyczy ono odchylenia standardowego średniej c . Wykazaliśmy już (w paragrafie 5.5), że w przypadku gdy wykonujemy N pomiarów x ...,x wielkości x (podlegającej rozkładowi normalnemu), najlepszym przybliżeniem wartości prawdziwej X jest średnia W rozdziale 4 stwierdziliśmy, że niepewność związana z tym przybliżeniem jest równa odchyleniu standar dowemu średniej x
i;
% = oJy/N
.
N
(5.63)
Jesteśmy już gotowi, aby to udowodnić. Dowód jest na tyle krótki, że trzeba go śledzić z najwyższą uwagą. Przyjęliśmy, że wyniki pomiarów x są opisane przez rozkład normalny z wartością prawdziwą X i szerokością a . Chcielibyśmy teraz określić wiary godność średniej N pomiarów. W tym celu wyobrażamy sobie, że wielokrotnie powtarzamy serię N pomiarów, to znaczy że przeprowadzamy cały ciąg doświadczeń, z których każde polega na wykonaniu N pomiarów, i obliczeniu na ich podstawie średniej. Chcemy znaleźć rozkład, któremu podlega zbiór otrzymanych wartości średniej N pomiarów. Okazuje się, że nie jest to trudne. W każdym z eksperymentów mierzymy N wielkości x ,...,x , a następnie obliczamy wartość funkcji x
1
x =
X
l
+
~
+
X
N
\
(5.64)
Obliczona wielkość x jest prostą funkcją zmierzonych wielkości x ,...,x , tak więc można łatwo znaleźć rozkład wartości x, korzystając z reguł przenoszenia błędów. Jedyną niezwykłą cechą funkcji (5.64) jest to, że wszystkie pomiary 1
N
145
x ,...,x są pomiarami tej samej wielkości z tą samą wartością prawdziwą X i tą samą szerokością a . 1
N
x
Zauważmy najpierw, źe każda, ze mierzonych wielkości x ,...,x podlega rozkładowi normalnemu, a więc tak samo jest w przypadku funkcji x danej wzorem (5.64). Po drugie, wartość prawdziwa każdej z wielkości x ,...,x jest równa X; tak więc wartość prawdziwa funkcji x zdefiniowanej wzorem (5.64) jest równa 1
N
1
X+
...
+X
N
X.
N
Pokazaliśmy, że rozkład wartości średnich x obliczonych na podstawie N po miarów w każdym z wielu wykonanych eksperymentów będzie rozkładem normalnym z wartością prawdziwą X. Jedyne pytanie (w rzeczywistości naj ważniejsze), które pozostaje w dalszym ciągu bez odpowiedzi, dotyczy szeroko ści rozkładu wyników. Zgodnie ze wzorem (5.62) zapisanym dla N zmiennych szerokość ta wynosi dx
+
+
dx
(5.65)
K
Ponieważ x , . . . , x są wynikami pomiarów tej samej wielkości x, odpowiada jące im szerokości są identyczne i równe o , 1
i¥
x
<7
=
V
...
=
o
= o. x
Z definicji (5.64) wynika także, że wszystkie pochodne cząstkowe we wzorze (5.65) są sobie równe: dx
5 x 1 <3x.
dx
t
=
l v '
Tym samym (5.65) sprowadza się do
+
N
=
NN
co chcieliśmy udowodnić. Wynik (5.66) osiągnęliśmy
146
2
N (5.66.
tak szybko, że warto na chwilę zatrzymać się
i zastanowić nad jego znaczeniem. Wyobrażaliśmy sobie dużą liczbę eks perymentów, z których każdy polegał na wykonaniu N pomiarów wielkości x i obliczeniu na podstawie N uzyskanych w ten sposób wyników średniej x. Pokazaliśmy, że otrzymane w wyniku wielokrotnego powtarzania takiego eksperymentu wartości średniej będą podlegać rozkładowi normalnemu z war tością prawdziwą X i szerokością a = oJyfN, tak jak przedstawiono to na rysunku 5.17 dla N = 10. Szerokość o\j wyznacza granice 68-procentowego x
x Rysunek 5.17. Pojedyncze pomiary wielkości x podlegają rozkładowi normalnemu wokół X z szerokością a (krzywa przerywana). Jeżeli korzystając z tych samych przyrządów wielokrot nie określimy średnią 10 pomiarów, to wartości x będą opisane przez rozkład normalny wokół X z szerokością <7 =
r
X
x
przedziału ufności w wynik naszego eksperymentu. Jeżeli jednokrotnie wy znaczymy średnią na podstawie N pomiarów, to możemy być w 68 procentach przekonani, że uzyskany wynik znajduje się w odległości nie większej niż a? °d wartości prawdziwej X. Dokładnie to chcemy wyrazić przez niepewność śred niej. Wyjaśnia to także powód, dla którego niepewność ta nosi nazwę od chylenia standardowego średniej. Tym prostym i eleganckim dowodem zakończyliśmy uzasadnianie wszyst kich podanych wcześniej reguł dotyczących niepewności przypadkowych.
5.8. Ufność Możemy teraz powrócić do dwóch pytań, które po raz pierwszy sformułowali śmy w rozdziale 2, nie udzielając wówczas pełnej odpowiedzi. Po pierwsze, co rozumiemy przez znane nam już stwierdzenie, że „jesteśmy nieomal przekona ni", że pewna zmierzona wielkość leży w przedziale x ± 8 x ? Lub ogólniej, jak ilościowo wyrazić naszą ufność w wyniki eksperymentu? n p
147
Odpowiedź na pierwsze pytanie powinna być teraz oczywista. Jeżeli kilka krotnie powtarzamy pomiar wielkości x (co zazwyczaj czynimy), najlepszym przybliżeniem wartości x jest średnia x, a odchylenie standardowe średniej m stanowi najlepszą miarę niepewności. Nasz wynik podalibyśmy w postaci (wartość x) = x + o , x
co znaczyłoby, że n a podstawie wykonanych pomiarów spodziewamy się, że 6 ? procent spośród dalszych pomiarów x, wykonanych z taką samą precyzją znajdzie się w przedziale x + a . Istnieją różne inne sposoby określenia niepewności. N a przykład moglibys my podać wynik w postaci x
(wartość x) =
x±2a , x
określając przedział, w którym w naszym przekonaniu powinno znaleźć się 9: procent spośród wykonanych podobnie pomiarów. Jak widać, zasadniczyn elementem podawanego wyniku pomiaru jest określenie jego zakresu (czyi niepewności) oraz poziomu ufności związanej z tym zakresem. Najczęście podaje się odchylenie standardowe wyniku, określającego granice przedział". 68-procentowej ufności. Jak podkreślaliśmy w rozdziale 2, prawie wszystkie wyciągane na poci stawie eksperymentów wnioski sprowadzają się do porównania dwóch lul więcej liczb. Dysponując sformułowaną przez nas teorią statystyczną, po trafimy już ilościowo określić znaczenie wielu takich porównań. Obecnii zajmiemy się jednym z rodzajów eksperymentu, polegającym na wyznaczeni; pewnej wielkości i porównaniu otrzymanego wyniku ze znaną, przewidywa ną wartością. Zauważmy, że ten ogólny przypadek odpowiada wielu ważnyn eksperymentom. N a przykład w doświadczeniu, którego celem jest spraw dzenie zasady zachowania pędu, możemy zmierzyć pęd początkowy i koń cowy, p i p', by następnie zbadać czy p = p' (w granicach niepewności), al równie dobrze możemy porównać obliczoną różnicę (p—p') z przewidywa nym wynikiem czyli zerem. Mówiąc ogólnie, zawsze wtedy, gdy chcem porównać ze sobą wyniki dwóch pomiarów, które jak sądzimy powinny by równe, możemy obliczyć ich różnicę, a następnie porównać ją z przewidywa nym wynikiem, którym jest zero. D o tej samej grupy należy także dowoln eksperyment polegający na zmierzeniu wielkości (takiej jak przyspieszeni ziemskie g), której dokładna, ogólnie przyjęta wartość jest znana. W tyi przypadku rolę przewidywanej wartości spełnia wartość akceptowana mk rzonej wielkości. Załóżmy, że student wykonał pomiary pewnej wielkości x (na przykła
148
różnicy dwóch pędów, która, jak sądzimy, jest równa zeru) i podał wynik w postaci (wartość x) = x + o", np
gdzie a oznacza odchylenie standardowe wyniku (które jest odchyleniem standardowym średniej, jeżeli x jest średnią obliczoną na podstawie kilku pomiarów). Następnie postanawia on porównać otrzymany wynik z przewidy waną wartością x . W rozdziale 2 twierdziliśmy, że jeżeli różnica | x — x | jest mniejsza (lub niewiele większa) niż a, to zgodność wyników jest zadowalająca, ale jeżeli |x —x | znacząco przewyższa a, to wyniki nie są zgodne. Wspomniane kryterium jest samo w sobie prawdziwe, ale nie daje ilościowej miary zgodno ści lub niezgodności wyników. Nie wyznacza także granicy akceptacji wyni ków. Czy rozbieżność rzędu l,5o" jest jeszcze możliwa do przyjęcia? A co z 2cr? Potrafimy odpowiedzieć na wymienione pytania, założywszy, że wyniki otrzymane przez studenta podlegają rozkładowi normalnemu (co jest rozsąd nym założeniem). Zaczniemy od sformułowania dwóch roboczych hipotez odnośnie do rozkładu: a) rozkład jest wyśrodkowany wokół wartości przewidywanej x , b) szerokość rozkładu jest równa podanemu przez studenta przybliżeniu a. Hipoteza (a) wyraża oczywiście oczekiwania studenta. Sprowadza się do założenia, że wszystkie błędy systematyczne zostały ograniczone do zaniedbywalnego poziomu (tak, że rozkład jest wyśrodkowany wokół wartości prawdziwej) oraz że wartość prawdziwa jest rzeczywiście równa x (czyli powody przewidywania wyniku x są słuszne). Hipoteza (b) stanowi przy bliżenie, ponieważ er jest w rzeczywistości oszacowaniem odchylenia standar dowego, ale jest to dobre przybliżenie, jeżeli liczba przeprowadzonych pomia rów, która posłużyła do obliczenia a, jest d u ż a . Podsumowując, nasze dwie hipotezy sprowadzają się do założenia, że metody postępowania oraz ob liczenia wykonane przez studenta były zasadniczo poprawne. np
przew
np
np
przew
przew
przew
przew
przew
10
1 0
Zamierzamy określić wiarygodność uzyskanego w pomiarach x przez porównanie x —x | z er, naszym oszacowaniem szerokości odpowiedniego rozkładu normalnego. Liczba pomiarów, które posłużyły do obliczenia a, byłaby niewielka, wówczas nasze oszacowanie mogłoby być niezbyt pewne i odpowiadające mu poziomy wiarygodności byłyby mało precyzyjne aczkolwiek wciąż stanowiłyby użyteczny, zgrubny wskaźnik). W przypadku, w którym dys ponujemy niewielką liczbą pomiarów, dokładne określenie granic przedziałów wiarygodności wymaga posłużenia się tak zwanym „rozkładem Studenta", który uwzględnia możliwe zmiany "v naszym oszacowaniu szerokości a. Patrz H.L. Alder i E.B. Roessler, Introduction to Probability .md Statistics (W.H. Freeman, wyd. 6, 1977) rozdział 10. [Podręcznikiem dostępnym w języku eolskim jest na przykład: H. Szydłowski (red.) Teoria pomiarów (PWN, 1981), § 6.3 - przyp. tłum.] n?
np
p r z e w
149
Musimy obecnie zdecydować, czy podana przez studenta wartość x była tą, której spodziewaliśmy się przyjąwszy, że nasze hipotezy są słuszne. Jeżeli odpowiedź brzmi tak, to nie ma żadnego powodu, aby wątpić w hipotezy i wszystko jest w porządku; jeżeli odpowiedź jest negatywna, to należy zakwestionować słuszność hipotez, a student powinien zbadać możliwość wystąpienia w pomiarach lub obliczeniach grubych błędów lub niezauważo nych błędów systematycznych, a także słuszność przewidywanego wyniku np
•^przew •
Najpierw obliczymy różnicę | x — x np
t =
| X n p
~
przew
| , a następnie
X p r z e w l
a
,
(5.67)
czyli różnicę pomiędzy x i x w jednostkach odchylenia standardowego. Następnie korzystając z tablicy normalnych całek błędu, znajdującej się w do datku A, możemy określić prawdopodobieństwo (przymując słuszność hipotez) uzyskania wyniku różniącego się od x o t lub więcej odchyleń standar dowych. To znaczy np
przew
przew
P(poza ta) = 1 — P(w promieniu ta).
(5.68)
Jeżeli prawdopodobieństwo to jest duże, to możemy uznać, że różnica |x —x | ma rozsądną wartość, a wynik x jest możliwy do przyjęcia; jeżeli prawdopodobieństwo (5.68) jest „podejrzanie małe", to występującą rozbież ność musimy UZNAĆ ZA ZNACZĄCĄ (CZYLI NIEMOŻLIWĄ DO PRZYJĘCIA), student musi stwierdzić, gdzie tkwi błąd. Przyjmijmy, że różnica | x — x | jest równa jednemu odchyleniu stan dardowemu. Prawdopodobieństwo, że rozbieżność wyników jest równa lub większa od tej wartości to znane nam już 32 procent. Jest oczywiste, że wystąpienie takiej rozbieżności jest całkiem prawdopodobne, a więc i mało istotne. Wprost przeciwnie, prawdopodobieństwo P(poza 3cr) wynosi zaledwie 0,3 procent, a więc - o ile nasze hipotezy są prawdziwe - uzyskanie rozbieżno ści 3cr jest mało prawdopodobne. Mówiąc inaczej, jeżeli student uzyskuje rozbieżność 3cr, to jest mało prawdopodobne, aby wysunięte hipotezy były prawdziwe. Granice dzielące wyniki na możliwe i niemożliwe do przyjęcia są zależne od poziomu, od którego począwszy rozbieżność będziemy uznawać za nie prawdopodobnie dużą. Określenie tego poziomu należy do eksperymentatora. Jednakże wielu spośród nich uznaje 5 procent jako dobrą granicę tego co można nazwać „dość nieprawdopodobnym". Jeżeli uznamy ten wybór, to rozbieżność równa 2o znajdzie się prawie na granicy nieprzyjmowalności, np
przew
np
np
150
przew
A PECHOWY
ponieważ P(poza 2a) — 4,6 procent. Ściśle biorąc na podstawie tablic zamiesz czonych w dodatku A można dojść do wniosku, że każda rozbieżność większa od l,96c7 jest nie do przyjęcia przy założonym 5-procentowym poziomie prawdopodobieństwa. Po zmniejszeniu tego poziomu do 2 procent niemożliwe do przyjęcia byłyby rozbieżności większe od 2,32
Zadania Uwaga: Gwiazdka przy zadaniu oznacza, że szkic rozwiązania lub odpowiedź znajduje się w na końcu książki. Ci*5Jt\(paragraf 5.1). Student wykonuje pomiary momentów pędu L i L wirującego układu przed i po wprowadzeniu dodatkowej masy. W celu sprawdzenia zasady zachowania momentu pędu oblicza różnicę L — L (spo dziewając się uzyskać wynik równy 0). Pomiar powtarza 50 razy, a uzyskane wyniki (wyrażone w pewnych nie określonych jednostkach) zapisuje w prze działach, tak jak pokazano w tabeli 5.3, po 5, 10 i 50 powtórzeniach. Narysuj histogram kolumnowy dla każdego z przypadków. (Zwróć uwagę, aby tak dobrać skalę swoich histogramów, by powierzchnie każdego z prostokątów reprezentowały liczbę wyników w odpowiednich przedziałach.) p
p
k
k
Tabela 5.3. Przedział Liczba po
od - 9 od - 7 od - 5 od - 3 od - 1 do 1 do —7 do —5 do - 3 do - 1
5 próbach 10 próbach 50 próbach
0 0 1
2 2 7
1 1 3
0 2 8
od 1 do 3
od 3 do 5
od 5 do 7
od 7 do 9
0 1 9
1 1 6
0 0 4
0 0 2
1 3 10
0,1 ¥x
dfit>
0 *
151 i
0
i
0
i
o,
o
— ?5Jl (paragraf 5.2). Rozkład graniczny wyników pewnego hipotetycznego pomiaru ma postać
f(x) = C 0
dla pc| < a, w pozostałych przypadkach.
a) Korzystając z warunku normalizacji (5.13), oblicz wielkość stałej C w zależności od parametru a. b) Naszkicuj rozkład graniczny. Jakie jest znaczenie stałej dl c) Korzystając z równań (5.15) i (5.16), znajdź średnią x i odchylenie standardowe dla dużej liczby pomiarów. 5.3 (paragraf 5.3). Korzystając z papieru milimetrowego i odpowiednio dobierając skale na osiach, wykonaj precyzyjne wykresy rozkładu Gaussa 2
-(x-Xf/2a
e
a. dla X = 2, ( j = l oraz X = 3, a = 0,3. Posłuż się kalkulatorem w celu ob liczenia wartości funkcji f , ( )Jeżeli kalkulator ma podwójną pamięć umoż liwiającą jednoczesne przechowywanie wartości a^/ln oraz — 2a , pozwoli to na szybsze wykonanie obliczeń. Jeżeli będziesz pamiętać, że funkcja jest symetryczna względem x = X, zmniejszy to dwukrotnie ilość niezbędnych rachunków. Dla porównania narysuj obydwie funkcje na tym samym wy kresie. x
x a
2
r
"£^5_.4_j|jparagraf 5.3). Jeżeli jeszcze tego nie zrobiłeś, narysuj trzeci histogram z zadania 5.1. Student z zadania 5.1 stwierdza, że uzyskany przez niego rozkład wyników jest zgodny z rozkładem Gaussa f , i ) wyśrodkowanym w X — 0 i z szerokością a = 3,4. Narysuj ten rozkład na tym samym wykresie co Twój histogram. (Przeczytaj wskazówki do zadania 5.3. Zauważ, że nie dysponujesz sposobem ilościowego sprawdzenia dopasowania; możesz jedynie zadowolić się wzrokową oceną, czy funkcja Gaussa rzeczywiście pasuje do histogramu.) x
x a
5.5 (paragraf 5.3). Szerokość rozkładu Gaussa jest charakteryzowana przez parametr a. Innym parametrem mającym przejrzystą interpretację geometrycz ną jest szerokość połówkowa (ang. full width at half maximum - FWHM). Jest to odległość pomiędzy dwoma punktami x, w których wartość f ( ) równa jest połowie wartości w maksimum, tak jak na rysunku 5.18. Udowodnij, że x
x
szerokość połówkowa = 2o\/21n2 = 2,35er.
152
Rysunek 5.18. Szerokość połówkowa krzywej
Jznacza to, że punkty odpowiadające polowie wysokości rozkładu położone fi w X + \,\la lub w zgrubnym przybliżeniu X±a. *5.6 (paragraf 5.3). Podaj szczegółowe przekształcenia prowadzące od wzoru (5.30) do (5.31) i wykazujące, że odchylenie standardowe a dla bardzo zużej liczby pomiarów opisywanych przez rozkład normalny równe jest szerokości tego rozkładu, a, a = a. x
x
5.7 (paragraf 5.4). Jeżeli wyniki pomiarów pewnej wielkości x opisywane = a przez rozkład Gaussa f , (x), to prawdopodobieństwo uzyskania wyniku ezacego pomiędzy X — ta a X + ta wynosi x a
X + t<7
P(w promieniu ta) =
J' f
x
(x)dx.
ff
X~ta
Udowodnij, wskazując wszystkie niezbędne zamiany zmiennych, że 1 J P(w promieniu ta) = — j = \ e y/2n -t
2 2 / 2
dz.
(5.69)
Po każdej zamianie zmiennych zbadaj uważnie, co dzieje się z granicami załkowania. Całka (5.69) jest często nazywana funkcją błędu i oznaczana erf(t) _b normalną całką błędu. t53))(paragraf 5.4). Student wykonuje wielokrotne pomiary pewnej wielko ści y, a następnie w wyniku obliczeń uzyskuje średnią y = 23 i odchylenie zandardowe a — 1. Jaką część uzyskanych wyników spodziewałbyś się zna_ezć pomiędzy a) 22 i 24? b) 22,5 i 23,5? c) 21 i 25? y
153
d) 21 i 23? e) 24 i 25? f) W jakich granicach (równoodległych w obydwie strony od średniej | spodziewałbyś się znaleźć 50 procent wszystkich wyników ? Dane niezbędne do udzielenia odpowiedzi na wszystkie postawione pyta nia znajdziesz na rysunku 5.13. Bardziej szczegółowych informacji o praw dopodobieństwach tego rodzaju szukaj w dodatkach A i B. 5.9 (paragraf 5.4). Staranne badania wykazują, że wzrost mężczyzn w pew nym kraju podlega rozkładowi normalnemu ze średnią h = 175 cm i od chyleniem standardowym a = 5 cm. Losowo wybrano grupę liczącą 1000 mężczyzn. Ilu spośród nich, według twoich oczekiwań, powinno mieć wzrost a) pomiędzy 170 cm a 180 cm? b) większy niż 180 cm? c) większy niż 190 cm? d) pomiędzy 165 cm a 170 cm? ^^10^(paragraf 5.5). Załóżmy, że dysponujemy N pomiarami x ,...,x pewnej—wielkości x i jesteśmy przekonani, że rozkładem granicznym jest funkcja Gaussa f , ( )> P y czym wartości X oraz o są nieznane. Zasada największego prawdopodobieństwa głosi, że najlepszą oceną szerokości jest ta wartość a, dla której prawdopodobieństwo P (x ,...,x ) wystąpienia zmie rzonych wartości x ,...,x jest największe. Oblicz pochodną P (x ,...,x ) po a ze wzoru (5.41) i wykaż, że maksimum występuje wtedy, gdy a jest dane wzorem (5.44). Jak wynika z dyskusji następującej po wzorze (5.44), otrzymany wynik oznacza, że najlepszym przybliżeniem a jest odchylenie standardowe N uzyskanych wartości x ,...,x . 1
x
H
r z
x a
Xa
t
1
N
N
Xi0
1
1
H
N
5.11 (paragraf 5.6). Sprawdź tożsamość (5.54) wykorzystaną w trakcie uzasadniania reguły kwadratowego przenoszenia błędów przypadkowych. ( ^ ! i ^ X p a r a g r a f 5.7). O t o wyniki czterdziestu pomiarów czasu t ,...,t . w którym kamień spada z pewnego okna na ziemię (wszystkie czasy w setnych częściach sekundy) 1
40
86(72:17^77 60 73 & 72 79 65 66 70; 74 84 7 § 8 0 @ r a) pblicz odchylenie standardowe o dla wyników czterdziestu pomiarów. bjTJblicz średnie 7 , . . . , ? czterech pomiarów dla każdej z kolumn. W ten sposób można wyobrazić sobie dane jako wyniki dziesięciu eksperymentów. t
1
154
10
• .mrych w każdym otrzymano średnią czterech czasów. Znając odpowiedź na lianie (a), zastanów się, jakiej wartości odchylenia standardowego spodzielibyś się dla dziesięciu średnich t ,...,t l Ile ono wynosi? :) Narysuj histogramy dla czterdziestu pojedynczych pomiarów t ,...,t mz dla dziesięciu średnich t ,...,t . Dla obydwu wykresów przyjmij te same me oraz przedziały, tak by można było łatwo porównać histogramy. Granice •z t działów można wybrać na różne sposoby, z których prawdopodobnie ^prostszy polega na przyjęciu średniej wszystkich czterdziestu pomiarów *_90) jako jednej z granic, a odchylenia standardowego dziesięciu średnich . . r jako szerokości przedziałów. 1
10
1
1
Ą0
10
10
*5.13^(paragraf 5.8). Student starannie powtarza pomiary przyspieszenia emskiego g i otrzymuje wynik końcowy 9,5 m / s z odchyleniem standarvym 0,1. Jeżeli jego pomiary byłyby opisane przez rozkład normalny frodkowany wokół powszechnie przyjętej wartości 9,8 i z szerokością 0,1, ;. nosiłoby prawdopodobieństwo uzyskania wyniku, który różni się tak -rdzo (lub bardziej) od 9,8 jak ten otrzymany przez studenta? Zakładając, że ment nie popełnił rzeczywistych błędów, czy uważasz za prawdopodobne, że ego pomiarach wystąpiły jakieś niezauważone błędy systematyczne? 2
5.14 (paragraf 5.8). Dwóch studentów wykonuje pomiary tej samej wartoi uzyskuje wyniki końcowe x = 13 ± 1 oraz x = 15 + 1, przy czym jako trewności podano odchylenia standardowe. i Przyjmując, że wszystkie błędy są niezależne i przypadkowe, odpowiedz, t -wnosi różnica x — x i jaka jest jej niepewność? b) Zakładając, że wszystkie wielkości podlegają rozkładom normalnym, : r : wiedz, jakie byłoby prawdopodobieństwo uzyskania tak dużej rozbieżno=k ta, którą uzyskali studenci? Czy uważasz taką rozbieżność za znaczącą - roziomie 5 procent)? A
A
B
B
*5.15) (paragraf 5.8). Eksperymentator postanawia sprawdzić zasadę zainia energii w przypadku pewnej reakcji jądrowej i mierzy wartości t:ńi początkowej i końcowej, uzyskując odpowiednio £ = 75 + 3 MeV oraz = 60 + 9 MeV, przy czym jako obydwie niepewności pomiarowe podano :mylenia stąndardowe_wynjków. Czy stwierdzona rozbieżność jest znacząca z. - zziomie 5 procent)? Postaraj się jasno uzasadnić swoje rozumowanie. p
z których w każdym otrzymano średnią czterech czasów. Znając odpowiedź na pytanie (a), zastanów się, jakiej wartości odchylenia standardowego spodzie wałbyś się dla dziesięciu średnich ? , . . . , ? ? Ile ono wynosi? c) Narysuj histogramy dla czterdziestu pojedynczych pomiarów J , . . . , t oraz dla dziesięciu średnich 7 . . . , 7 . Dla obydwu wykresów przyjmij te same skale oraz przedziały, tak by można było łatwo porównać histogramy. Granice przedziałów można wybrać na różne sposoby, z których prawdopodobnie najprostszy polega na przyjęciu średniej wszystkich czterdziestu pomiarów (72,90) jako jednej z granic, a odchylenia standardowego dziesięciu średnich t jako szerokości przedziałów. 1
10
1
l5
40
10
10
^ l T ) ( p a r a g r a f 5.8). Student starannie powtarza pomiary przyspieszenia ziemskiego g i otrzymuje wynik końcowy 9,5 m / s z odchyleniem standar dowym 0,1. Jeżeli jego pomiary byłyby opisane przez rozkład normalny wyśrodkowany wokół powszechnie przyjętej wartości 9,8 i z szerokością 0,1, ile wynosiłoby prawdopodobieństwo uzyskania wyniku, który różni się tak bardzo (łub bardziej) od 9,8 jak ten otrzymany przez studenta? Zakładając, że student nie popełnił rzeczywistych błędów, czy uważasz za prawdopodobne, że w jego pomiarach wystąpiły jakieś niezauważone błędy systematyczne? 2
5.14 (paragraf 5.8). Dwóch studentów wykonuje pomiary tej samej warto ści x i uzyskuje wyniki końcowe x = 13 + 1 oraz x = 15 + 1 , przy czym jako niepewności podano odchylenia standardowe. a) Przyjmując, że wszystkie błędy są niezależne i przypadkowe, odpowiedz, ile wynosi różnica x — x i jaka jest jej niepewność? b) Zakładając, że wszystkie wielkości podlegają rozkładom normalnym, odpowiedz, jakie byłoby prawdopodobieństwo uzyskania tak dużej rozbieżno ści jak ta, którą uzyskali studenci? Czy uważasz taką rozbieżność za znaczącą na poziomie 5 procent)? A
A
B
B
fsTl^ (paragraf 5.8). Eksperymentator postanawia sprawdzić zasadę za chowania energii w przypadku pewnej reakcji jądrowej i mierzy wartości energii początkowej i końcowej, uzyskując odpowiednio E = 75 + 3 MeV oraz Et = 6 0 + 9 MeV, przy czym jako obydwie niepewności pomiarowe podano sdchylenia standardowe wyników. Czy stwierdzona rozbieżność jest znacząca na poziomie 5 procent)? Postaraj się jasno uzasadnić swoje rozumowanie. p
Część II 6. 7. 8. 9. 10. 11. 12.
Odrzucanie danych Średnie ważone Metoda najmniejszych kwadratów Kowariancja i korelacja Rozkład dwumianowy Rozkład Poissona Test x zgodności rozkładów 2
Jeśli przeczytałeś i zrozumiałeś rozdział 5, jesteś już gotowy do prze studiowania zagadnień bardziej zaawansowanych, co powinno Ci przyjść nadspodziewanie łatwo. W siedmiu rozdziałach drugiej części zaprezen towano siedem takich zagadnień. Niektóre z nich są zastosowaniami rozwiniętych już przez nas metod statystycznych, inne stanowią ich rozszerzenie. Wszystkie są istotne i poważny student prędzej czy później będzie się musiał ich nauczyć. Z drugiej strony niekoniecznie trzeba je wszystkie poznać od razu. Z tego powodu zostały one przedstawione w krótkich niezależnych rozdziałach, które można studiować w dowol nym porządku w zależności od własnych potrzeb i zainteresowań.
R O Z D Z I A Ł
6
ODRZUCANIE DANYCH
W rozdziale tym przedyskutujemy kłopotliwe pytanie, czy odrzucać wyniki pomiarów, jeśli - jak się wydaje - są one efektem pomyłki.
6.1. Problem odrzucania danych Zdarza się czasami, że jeden z wyników serii pomiarowej wyraźnie odbiega od pozostałych. W takim przypadku eksperymentator musi zadecydować, czy anomalny wynik jest rezultatem jakiejś pomyłki i powinien zostać odrzucony, czy też jest wynikiem wiarygodnym, który powinien być wykorzystany na równi z innymi. Wyobraźmy sobie na przykład, że wykonaliśmy sześć pomia rów okresu drgań wahadła i otrzymaliśmy wyniki (wszystkie w sekundach) 3,8; 3,5; 3,9; 3,9; 3,4; 1,8.
(6.1)
W tym przypadku wartość 1,8 wyraźnie różni się od wszystkich pozostałych i musimy zdecydować, co z tym zrobić. Wiemy z rozdziału 5, że uznany za słuszny wynik pomiaru może różnić się znacznie od innych wyników pomiaru tej samej wielkości. Mimo to rozbież ność tak duża jak ta w ostatnim pomiarze ze zbioru (6.1) jest bardzo mało prawdopodobna. Jesteśmy zatem skłonni podejrzewać, że pomiar czasu 1,8 s był wynikiem jakiejś niewykrytej omyłki lub też został spowodowany inną zewnę trzną przyczyną. Być może po prostu źle odczytaliśmy ostatni wynik. Może właśnie podczas ostatniego pomiaru nasz elektroniczny stoper na skutek chwilowego braku zasilania zatrzymał się na moment.
159
Jeśli prowadzimy szczegółowe notatki, potrafimy czasami ustalić źródło takiego anomalnego wyniku. N a przykład moglibyśmy z nich odczytać, źe do ostatniego pomiaru ze zbioru (6.1) użyliśmy innego stopera. Sprawdzając go następnie, moglibyśmy ustalić, że stale się późni. W tym przypadku anomal ny wynik powinien być natychmiast odrzucony. Niestety zwykle niemożliwe jest ustalenie zewnętrznej przyczyny po wstania anomalnego wyniku. Musimy zatem zdecydować się na odrzucenie (bądź pozostawienie) wyniku, opierając się jedynie na samych rezultatach pomiarów. D o realizacji tego celu przyda się nasza znajomość rozkładu Gaussa. Odrzucanie danych pomiarowych jest zagadnieniem kontrowersyj nym i wśród ekspertów nie ma jednomyślności na ten temat. Jest to przy tym także ważne zagadnienie. W naszym przykładzie fakt odrzucenia podej rzanej wartości 1,8 s ma znaczny wpływ na najlepsze przybliżenie okresu drgań wahadła. Średnia wszystkich sześciu pomiarów równa jest 3,4 s. podczas gdy średnia pierwszych pięciu wyników, 3,7 s, różni się od niej znacznie. Poza tym decyzja o odrzuceniu danych jest subiektywna i naukowiec, który ją podejmuje może się łatwo narazić na zarzut „naciągania" swoich wyników. Sytuację pogarsza fakt, że taki anomalny wynik może być odzwier ciedleniem jakiegoś ważnego efektu. Faktycznie, wiele ważnych odkryć nau kowych objawiło się po raz pierwszy jako wynik rażąco różny od pozo stałych, który wyglądał na pomyłkę. Odrzucając wynik 1,8 s w przykładzie (6.1), moglibyśmy tym samym odrzucić najciekawszą część danych. Tak naprawdę jedynym rzetelnym sposobem postępowania w obliczu danych jak te z przykładu (6.1) jest powtarzanie pomiaru wiele, wiele ra zy. Jeśli anomalny rezultat pojawi się znowu, to przypuszczalnie będzie my umieli wyśledzić jego przyczynę w postaci czy to omyłki, czy też prawdziwego efektu fizycznego. Jeśli zaś w ciągu powiedzmy 100 pomia rów nie pojawi się on powtórnie, to nasz ostateczny wynik nie będzie isto tnie zależał od tego, czy weźmiemy pod uwagę zaobserwowaną anomalię czy też nie. Niemniej jednak stukrotne powtarzanie pomiaru za każdym razem, gdy pojawi się wynik wyglądający podejrzanie, jest często niemożliwe do realizacji (szczególnie na pierwszej pracowni). Potrzebujemy zatem pewnego kryterium odrzucania podejrzanego wyniku. Istnieją różne takie kryteria, niektóre całkiem skomplikowane. Kryterium, które teraz opiszemy, zwane jest kryterium Chauveneta i stanowi proste i kształcące zastosowanie roz kładu Gaussa.
160
6.2. Kryterium Chauveneta ? zwróćmy do sześciu wyników z przykładu (6.1): 3,8; 3,5; 3,9; 3,9; 3,4; 1,8. Jeśli założymy chwilowo, że wszystkie są właściwymi wynikami pomiarów • ielkości x, to możemy obliczyć średnią x = 3,4 s
(6.2)
a = 0,8 s.
(6.3)
i odchylenie standardowe x
Możemy teraz określić ilościowo, jak dalece anomalny jest podejrzany wy nik 1,8. Różni się on od średniej 3,4 o 1,6, czyli o dwa odchylenia standardowe. Jeśli założymy, że wyniki pomiarów podlegają rozkładowi Gaussa wyśrod kowanemu wokół wartości (6.2), o szerokości danej przez wartość (6.3), to możemy obliczyć prawdopodobieństwo otrzymania wyniku, który co najmniej o tyle różni się od wartości średniej. Zgodnie z wykresem przedstawionym na rys. 5.13 równe jest ono: *P(poza 2 ( 7 J = 1 — P(wewnątrz 2a ) = 1-0,95 = 0,05. x
Innymi słowy, zakładając, że wartości (6.2) i (6.3), odpowiednio x i a , są właściwe, spodziewalibyśmy się, że spośród 20 pomiarów tylko jeden da wynik różniący się od średniej co najmniej tyle, ile podejrzana wartość 1,8 s. Jeśli przeprowadzilibyśmy 20 lub więcej pomiarów, to właściwie powinniśmy się spodziewać otrzymania jednego czy dwóch wyników takich jak owe 1,8 s i nie byłoby wówczas powodu, aby je odrzucać. Jednak dokonaliśmy tylko sześciu pomiarów, zatem prawdopodobieństwo otrzymania wyniku tak złego jak 1,8 byłoby faktycznie równe x
0,05 • 6 = 0,3. To oznacza, że w sześciu eksperymentach powinniśmy oczekiwać (przeciętnie) tylko 1/3 pomiaru dającego tak zły wynik jak 1,8 s. Ten wynik dostarcza nam szukanej przez nas ilościowej miary „braku sensowności" podejrzanego wyniku. Jeśli zdecydujemy się traktować 1/3 eks perymentu jako „absurdalnie mało prawdopodobne", to stwierdzimy, że war-
161
tość 1,8 s nie jest uzasadnionym wynikiem pomiaru i powinna zostać od rzucona. Decyzja, gdzie wyznaczyć granice „absurdalnego nieprawdopodobieństwa", zależy od eksperymentatora. Kryterium Chauveneta, jak to się zwykle podaje, mówi, że jeśli liczba pomiarów dających co najmniej tak złe wyniki jak wartość podejrzana jest mniejsza niż 1, to podejrzany wynik powinien zostać odrzucony. Oczywiście wybór wartości - jest arbitralny, ale jest także rozsądny i można go bronić. Możemy teraz łatwo uogólnić zastosowanie kryterium Chauveneta. Przy puśćmy, że wykonaliśmy N pomiarów ,
x ,...,x 1
N
tej samej wielkości x. Obliczamy x i a , korzystając ze wszystkich N wyników. Jeśli jeden z wyników (nazwijmy go x ) różni się od x tak bardzo, że wygląda to podejrzanie, to najpierw obliczamy x
pod
x _ -^pod
,-x A
^-^T'
(6.4)
a więc liczbę określającą, o ile odchyleń standardowych x różni się od x. Następnie znajdujemy (z rys. 5.13 lub bardziej kompletnej tabeli w dodatku A) prawdopodobieństwo P(poza t a ), że właściwy wynik pomiaru będzie się różnił od x o t lub więcej odchyleń standardowych. Wreszcie mnożymy je przez N - całkowitą liczbę wykonanych pomiarów, aby otrzymać n(gorszych niż x ) = JVP(poza t a ). p o d
poA
x
pod
pod
poi
x
Wartość n określa spodziewaną liczbę pomiarów dających wyniki co najmniej tak złe jak x
p o d
. Jeśli n jest mniejsze niż i, to x
pod
nie spełnia kryterium
Chauveneta i zostaje odrzucone. Naturalnie, po odrzuceniu każdego wyniku, który nie spełnia kryterium Chauveneta, przelicza się x i a , korzystając z pozostałych danych. Nowa wartość o będzie mniejsza niż wartość początkowa i może się zdarzyć, że z nowym a następne pomiary nie spełnią kryterium Chauveneta. Jednak większość autorytetów zgadza się, że po obliczeniu nowych wartości x i a kryterium Chauveneta nie powinno być stosowane powtórnie. Wielu naukowców ma poczucie, że odrzucenie danych pomiarowych nigdy nie jest usprawiedliwione, chyba że istnieje zewnętrzny dowód na niepoprawność kwestionowanych wyników. Bardziej umiarkowane stanowisko głosi, że x
x
x
x
162
•iryterium Chauveneta powinno być wykorzystywane do zidentyfikowania da nych, które należy co najmniej wziąć pod uwagę jako kandydatów do od rzucenia. Uważny student powinien zatem wykonać podwójne obliczenia, raz maczając kwestionowane wyniki, a raz bez nich. Dzięki temu będzie on w stanie itwierdzić, jak dalece podejrzane wyniki wpływają na ostateczny rezultat.
6.3. Przykład Student wykonuje dziesięć pomiarów długości x i otrzymuje wyniki (wszystkie w mm):
następujące
46, 48, 44, 38, 45, 47, 58, 44, 45, 43. Zwracając uwagę, że wartość 58 wydaje się rażąco duża, sprawdza swoje notatki, ale nie znajduje dowodu, że wynik ten był rezultatem omyłki. Stosuje zatem kryterium Chauveneta. Jaki będzie jego wniosek? Uznając prowizorycznie wszystkie dziesięć wyników, student oblicza x = 45,8
i
a = 5,1. x
Różnica pomiędzy podejrzaną wartością x = 58, a średnią x = 45,8 wynosi 12,2, czyli 2,4 odchylenia standardowego, tj. p o d
x
pod~
x
_
58 — 45,8
o
_
5,1
x
W tabeli z dodatku A student sprawdza, iż prawdopodobieństwo, że wynik pomiaru będzie się różnił od x o 2,4 a lub więcej jest równe x
P(poza 2,4
= 1-
0,984
= 0,016. W dziesięciu pomiarach mógłby się zatem spodziewać otrzymania 0,16 jed nego wyniku równie złego jak jego podejrzany rezultat. Ponieważ jest to mniej, niż wynosi granica 1 ustalona przez kryterium Chauveneta, więc powinien co najmniej rozważyć możliwość odrzucenia podejrzanego wyniku. Następną podejrzaną wartością jest 38, odległe o 1,5 odchylenia standar dowego od średniej x. Podobne obliczenia pokazują, że spośród dziesięciu
163
pomiarów mógłby się on spodziewać 1,3 wyniku, równie złego jak ten, tak więc ten rezultat jest całkowicie akceptowalny. Jeśli student zdecyduje się na odrzucenie wyniku 58, to musi jeszcze raz obliczyć x i a , co daje następujący wynik: x = 44,4 i a = 2,9. x
x
Jak można było się tego spodziewać, nowa średnia zmieniła się odrobinę, odchylenie standardowe zaś znacznie zmalało.
Zadania Uwaga: Gwiazdka przy zadaniu oznacza, że szkic rozwiązania lub odpowiedź znajduje się na końcu książki. 6.1 (paragraf 6.2). Zapalona eksperymentatorka wykonała 50 pomiarów cie pła Q, wydzielonego w pewnym procesie. Znalezione przez nią średnia i od chylenie standardowe były równe Q = 4,8 i a — 0,4; obie wartości w kaloriach. a) Zakładając, że jej pomiary podlegają rozkładowi normalnemu, znajdź prawdopodobieństwo, że pojedynczy pomiar różniłby się od średniej o 0,8 cal lub więcej. Ilu wyników, różniących się od średniej o więcej niż 0,8 cal powinna się spodziewać wśród swoich pomiarów? Czy studentka stosująca kryterium Chauveneta odrzuciłaby wynik 4,0 cal? b) Czy odrzuciłaby wynik 6,0 cal? Q
\^~6^T^paragraf 6.2). Student zmierzył dziesięć razy napięcie i otrzymał następujące wyniki: 0,86; 0,83; 0,87; 0,84; 0,82; 0,95; 0,83; 0,85; 0,89; 0,88. a) Oblicz średnią V i odchylenie standardowe o> tych wyników. b) Czy student powinien odrzucić wynik 0,95 wolta, jeśli zdecydował się skorzystać z kryterium Chauveneta? Przedstaw jasno swoją argumentację. N^TT^paragraf 6.2). Studentka przeprowadziła 14 pomiarów okresu drgań oscylatora tłumionego, otrzymując wyniki (w dziesiątych częściach sekundy): 7, 3, 9, 3, 6, 9, 8, 7, 8, 12, 5, 9, 9, 3. Czując, że wynik 12 jest podejrzanie wysoki, zdecydowała się zastosować kryterium Chauveneta. Czy odrzuci ona podejrzany wynik? Ilu wyników równie odległych od średniej jak 12 powinna się ona spodziewać?
164
6.4 (paragraf 6.2). Kryterium Chauveneta definiuje granice, poza którymi wynik pomiaru jest traktowany jako możliwy do odrzucenia. Jeśli dokonuje my dziesięciu pomiarów i jeden z nich różni się od średniej o więcej niż około dwóch odchyleń standardowych (w obu kierunkach), to pomiar może być odrzucony. Dla 20 pomiarów odpowiednie granice to około 2,2 odchyleń standardowych. Wykonaj tabelę ukazującą „granicę odrzucalności" dla 5, 10, 15, 20, 20, 50, 100, 200 i 1000 pomiarów. (Skorzystaj z tabeli funkcji błędu •v dodatku A.)
oM - 0:00 DOOOOO
2
X ¿1
0>O te 0 , 0 0 / ! t>5!
R O Z D Z I A Ł
7
ŚREDNIE WAŻONE
W tym rozdziale zajmujemy się zagadnieniem łączenia dwóch lub więcej niezależnych pomiarów pojedynczej wielkości fizycznej. Stwierdzimy, że naj lepsze przybliżenie takiej wielkości, oparte na wynikach wielu pomiarów, jest odpowiednią średnią ważoną tych wyników.
7.1. Zagadnienie łączenia osobnych pomiarów Zdarza się często, że wielkość fizyczna jest mierzona wiele razy, być może w wielu różnych laboratoriach, i powstaje problem, w jaki sposób powiązać te wyniki, aby otrzymać jedno najlepsze przybliżenie. Przypuśćmy na przykład, że dwóch studentów A i B mierzy uważnie wielkość x i otrzymuje następujące wyniki: student A :
x = x ±a
student B:
x =x ± a.
A
(7.1)
A
i B
(7.2)
B
Każdy z tych wyników sam jest wynikiem wielu pomiarów, a więc x jest średnią wszystkich pomiarów studenta A ,
A
B
A
B
B
A
A
166
B
Bl
r s : nie tak. W tej sytuacji powiedzielibyśmy, że wyniki są sprzeczne i powin niśmy zbadać uważnie oba pomiary, żeby stwierdzić, czy któryś z nich (lub : ba) nie jest obarczony niezauważonym błędem systematycznym. Załóżmy jednak, że dwa wyniki pomiarów (7.1) i (7.2) są zgodne, czyli że :: zbieżność \x — x \ nie jest istotnie większa niż odchylenia a \a . Sensowne est zatem pytanie, jakie jest najlepsze przybliżenie x prawdziwej wartości X opartej na tych dwóch wynikach? W pierwszej chwili chciałoby się użyć >:edniej (x + x )/2. Jednak chwila zastanowienia powinna doprowadzić do wniosku, że jeśli obie niepewności a i a są różne, to wynik powinien być inny. Zwykła średnia (x + x )/2 obu pomiarom przyznaje jednakową wartość, pod czas gdy pomiar bardziej dokładny powinien być w jakiś sposób faworyzowany. A
B
A
B
np
A
B
A
A
E
B
7.2. Średnia ważona Możemy w prosty sposób rozwiązać nasz problem, korzystając z zasady największego prawdopodobieństwa, tak jak to zrobiliśmy w paragrafie 5.5. Jeśli założymy, że wyniki obu pomiarów podlegają rozkładowi Gaussa i ozna czymy nieznaną prawdziwą wartość x przez X, to prawdopodobieństwo, że student A otrzyma wynik x jest równe A
P (x )KJ- -^-W°< x
A
e
t
( 7 3 )
prawdopodobieństwo zaś otrzymania wyniku x przez studenta B: B
(x
X)2/2a
P (x )cc—e- °- î x
(7.4)
B
Umieszczając indeks X, wskazujemy explicite, że prawdopodobieństwa te zależą od nieznanej wartości właściwej. (Zależą one także od odpowiednich szerokości
B
A
B
P (x , X
A
x ) = P (x )P (x ) B
x
A
x
B
2 2
cc-^—e-* ' ,
(7.5)
167
1
gdzie wprowadziliśmy wygodne oznaczenie j
(
c m
kwadrat)
Ta ważna wielkość jest sumą kwadratów odchyleń od Z w dwóch pomiarach podzielonych przez odpowiadające im niepewności. Jest ona czasem zwań; „sumą kwadratów". Zasada największego prawdopodobieństwa zakłada, dokładnie tak jak pc przednio, że najlepsze przybliżenie nieznanej prawdziwej wartości X ma tak wartość, żeby prawdopodobieństwo wystąpienia faktycznie zaobserwowanyc wartości x i x było największe. Oznacza to, że najlepsze przybliżenie X jewartością, dla której prawdopodobieństwo (7.5) jest największe, czy też, co je; równoważne, żeby wykładnik y był najmniejszy. (Ponieważ maksymalizacj prawdopodobieństwa pociąga za sobą minimalizację „sumy kwadratów" / więc ta metoda przybliżania X zwana jest czasem „metodą najmniejszyc kwadratów".) Tak więc, aby znaleźć najlepsze przybliżenie, różniczkujemy p prostu wyrażenie (7.6) względem X i przyrównujemy pochodną do zera A
B
2
2
1
Rozwiązanie tego równania względem X daje najlepsze przybliżenie x , któi - jak łatwo sprawdzić - równe jest np
Ten dosyć skomplikowany wynik uczynimy bardziej przejrzystym, jeśli zdel niujemy wagi statystyczne: 1 W
A
=
•
~ 2
OA
1 W
1
B = ~ 2 -
(
7
° B
Podstawiając je do równania (7.7), otrzymamy _ wx A
+ wx w + w
A
B
A
B
B
Jeśli pierwotne wyniki pomiarów są jednakowo dokładne (a = a i sn w = w \ to nasz wynik upraszcza się do zwykłej średniej (x + x )/2. W og< ności wynik (7.9) jest średnią ważoną. (Wzór ten jest podobny do wzo A
A
168
B
A
B
B
2
gdzie wprowadziliśmy wygodne oznaczenie y (chi kwadrat)
(7.6) Ta ważna wielkość jest sumą kwadratów odchyleń od X w dwóch pomiarach, podzielonych przez odpowiadające im niepewności. Jest ona czasem zwana „sumą kwadratów". Zasada największego prawdopodobieństwa zakłada, dokładnie tak jak po przednio, że najlepsze przybliżenie nieznanej prawdziwej wartości X ma taką wartość, żeby prawdopodobieństwo wystąpienia faktycznie zaobserwowanych wartości x i x było największe. Oznacza to, że najlepsze przybliżenie X jest wartością, dla której prawdopodobieństwo (7.5) jest największe, czy też, co jest równoważne, żeby wykładnik x był najmniejszy. (Ponieważ maksymalizacja prawdopodobieństwa pociąga za sobą minimalizację „sumy kwadratów" % , więc ta metoda przybliżania X zwana jest czasem „metodą najmniejszych kwadratów".) Tak więc, aby znaleźć najlepsze przybliżenie, różniczkujemy po prostu wyrażenie (7.6) względem X i przyrównujemy pochodną do zera A
B
2
2
X
-
'2 -
I 1
2 2^
+
O A
= 0.
°B
Rozwiązanie tego równania względem X daje najlepsze przybliżenie x , które - jak łatwo sprawdzić - równe jest np
O A
W
° B / /
°BJ
Ten dosyć skomplikowany wynik uczynimy bardziej przejrzystym, jeśli zdefi niujemy wagi statystyczne:
W
A
=
~T
W
1
7
B = ~ 2 -
Ga
8
( - )
° b
Podstawiając je do równania (7.7), otrzymamy w + w A
B
Jeśli pierwotne wyniki pomiarów są jednakowo dokładne (a = a i stąd w = w ), to nasz wynik upraszcza się do zwykłej średniej {x + x )/2. W ogól ności wynik (7.9) jest średnią ważoną. (Wzór ten jest podobny do wzoru A
A
168
B
A
B
B
opisującego środek ciężkości układu dwóch ciał o masach w i w umiesz czonych w punktach o współrzędnych odpowiednio x i x .) W tym przypad ku „wagami" są odwrotności kwadratów niepewności pomiarów, jak we wzorze (7.8). Jeśli pomiar A jest bardziej dokładny niż B, to o w ; tak więc najlepsze przybliżenie x jest bliższe wartości x niż x dokładnie tak jak to być powinno. Nasza analiza może być uogólniona na przypadek wielu pomiarów tej samej wielkości. Przypuśćmy, że wykonaliśmy JV oddzielnych pomiarów wielkości x A
A
B
B
A
A
B
n p
B
A
B
z odpowiadającymi im niepewnościami: a . Korzystając z tych samych jak poprzednio argumentów, znajdujemy najlepsze przybliżenie oparte na wynikach tych pomiarów, które jest średnią ważoną N
(7.10)
I*; przy czym wagi w są odwrotnościami kwadratów odpowiednich niepewności, t
w =l/af, (7.11) dla i = 1, 2,..., N. Ponieważ waga w =l/af, związana z każdym pomiarem, zawiera kwadrat odpowiedniej niepewności a , więc każdy z pomiarów, który jest o wiele mniej dokładny niż pozostałe, wnosi o wiele mniejszy wkład do ostatecznego wyniku (7.10) niż inne. N a przykład jeśli jeden z pomiarów jest cztery razy mniej dokładny niż inne, to jego waga jest 16 razy mniejsza niż waga innych po miarów. Wynik taki w wielu zastosowaniach mógłby być po prostu pominięty. Ponieważ ostateczny wynik (7.10) określający x jest prostą funkcją pierwotnych zmierzonych wartości x ,..., x , więc łatwo obliczyć wynik korzystając z reguł przenoszenia błędu. W zadaniu 7.5 proponujemy Czytel nikowi sprawdzenie, że niepewność najlepszego przybliżenia x , określona wzorem (7.10), równa jest t
t
t
n p
1
N
np
1/2
% =(!>)" >
7
12
(- )
i-l
gdzie w = l/a f jak zwykle. ;
169
7.3. Przykład Trzech studentów zmierzyło kilka razy opór i otrzymało następujące trzy wyniki (w omach): (opór R zmierzony przez pierwszego studenta) = 11 ± 1; (opór R zmierzony przez drugiego studenta) = 12 + 1 ; (opór R zmierzony przez trzeciego studenta) = 10 + 3; Jakie jest najlepsze przybliżenie oporu R oparte na przedstawionych wyni kach? Trzy niepewności a a i a są równe 1, 1 i 3. Odpowiednie wagi w = l/er? są zatem równe: v
2
3
;
w = 1, 1
w = 1, 2
w = 1/9. 3
Tak więc zgodnie z równaniem (7.10) najlepsze przybliżenie jest równe 2> i? ;
;
_ (Ml) + (M2)+(i-10)
l+ i+i 9
= 11,42 omów. Niepewność tego wyniku jest dana przez wyrażenie (7.12) jako
^
n p
= (Z^)"
1/2
= (l + l + ? ) "
1 / 2
= 0>69.
Zatem ostateczny wynik wynosi i? = 11,4 ± 0 , 7 oma. Interesujące jest zbadanie, jaki wynik dostalibyśmy ignorując zupełnie trzy razy mniej dokładny i tym samym dziewięć razy mniej istotny wynik trzeciego studenta. Prosty rachunek daje nam wynik P = 11,50 (w porównaniu z 11,4) z niepewnością 0,71 (w porównaniu z 0,69). Jest jasne, że trzeci rezultat nie ma istotnego wpływu na ostateczny wynik. n p
Zadania Uwaga: Gwiazdka przy zadaniu oznacza, że szkic rozwiązania lub odpowiedź znajduje się na końcu książki.
170
*/7j) (paragraf 7.2). ai Dwa pomiary prędkości dźwięku w dały wyniki 3 3 4 + 1 i 336 + 2 (oba ni s). Czy uważasz je za spójne? Jeśli tak, to znajdź najlepsze przybliżenie . _ ego niepewność. b) Powtórz część (a) dla wyników 3 3 4 + 1 i 336 + 5. Czy warto jest brać : uwagę drugi z wyników ? ( paragraf 7.2). Dwóch studentów zmierzyło różnymi metodami opór. Każdy z nich wykonał 10 pomiarów i obliczył średnią oraz jej odchylenie :cndardowe, otrzymując następujące wyniki: ^7j2
J
Student A: R = 72 ± 8 omów; Student B: R = 78 + 5 omów. a) Jakie jest najlepsze przybliżenie R i jego niepewność po wzięciu pod _wagę obu wyników? b) Ile pomiarów powinien wykonać student A (taką samą techniką), aby ego wynik miał taką samą wagę jak wynik studenta B. 7 . 3 (paragraf 7.2). Znajdź najlepsze przybliżenie i jego niepewność na podstawie następujących czterech wyników pomiarów tej samej wielkości: 1,4 + 0,5;
1,2 + 0,2;
1,0 + 0,25;
1,3 + 0,2.
7 . 4 (paragraf 7.2). Przypuśćmy, że N pomiarów tej samej wielkości x obar czonych jest taką samą niepewnością. Udowodnij, że w takiej sytuacji średnia ważona określona wzorem (7.10) sprowadza się do zwykłej średniej x=(YjXi)/N, a wyrażenie (7.12) opisujące niepewność redukuje się do znanego wzoru na odchylenie standardowe średniej. * 7 . 5 (paragraf 7.2). Jeśli dane jest N wyników pomiarów x . . . , x jednej wielkości x, obarczonych niepewnościami odpowiednio tr ,..., a , to najlepsze przybliżenie wartości x opisywane wyrażeniem (7.10) równe jest n p (Z i i)/(X i) wagami w = l / a . Wyrażenie to definiuje x jako funkcję x^,..., x . Korzystając ze wzoru (3.47) na przenoszenie błędu, pokaż, że niepewność x dana jest wzorem (7.12) jako u
1
x
=
w
x
vv
z
N
N
2
t
n p
N
n p
1/a
°* „-<2>«r -
R O Z D Z I A Ł
8
METODA NAJMNIEJSZYCH KWADRATÓW
W omawianych dotychczas metodach statystycznej analizy danych skupialiś my się wyłącznie na wielokrotnych pomiarach tej samej wielkości. Robiliśim tak nie dlatego, że analiza wielokrotnych pomiarów jednej wielkości jesi najbardziej interesującym zagadnieniem statystyki, ale ponieważ należy dobrze zrozumieć ten problem zanim zajmiemy się innymi, bardziej ogólnymi zagad nieniami. Jesteśmy wreszcie gotowi do przedyskutowania pierwszego (bardzc ważnego) spośród takich zagadnień.
8.1. Punkty pomiarowe, które powinny układać się na prostej Jeden z najbardziej powszechnych i interesujących typów doświadczeń pole ga na pomiarze wielu wartości dwóch różnych wielkości fizycznych w celi zbadania matematycznej formuły opisującej związek pomiędzy tymi wielkoś ciami. N a przykład można byłoby upuszczać kamień z wielu różnych wyso kości h ,..., h i mierzyć odpowiadające im czasy spadku t ,..., t , a b sprawdzić, czy wysokości i czasy związane są ze sobą oczekiwaną relacj t
N
x
N
Prawdopodobnie najważniej szymii doświadczeniami tego typu są U w których oczekiwana relacja jest liniowa i ten przypadek rozważymy n początku. N a przykład jeśli wierzymy, że ciało spada ze stałym przyspieszę niem g, to jego prędkość v powinna być liniową funkcją czasu t, v = v + gt. 0
172
Jgólniej, będziemy rozważać dowolne dwie wielkości fizyczne x i y, o których sądzimy, że są powiązane relacją liniową postaci y = A + Bx,
(8.1)
gdzie A i B są stałymi. Niestety istnieje wiele sposobów zapisu funkcji liniowej, ••• szczególności należy uważać, aby równania (8.1) nie pomylić z równie popularną formą y = ax + b. Jeśli dwie zmienne y i x są liniowo zależne jak w równaniu (8.1), to wykres zależności y od x powinien być prostą o nachyleniu B, przecinającą oś . w punkcie y = A. Gdybyśmy zmierzyli N różnych wartości x ,..., x oraz odpowiadające im wartości y ..., y i jeśli nasze pomiary nie byłyby obar czone niepewnościami, to każdy z punktów (x , y ) leżałby dokładnie na prostej y = A + Bx, jak na rys. 8.la. W praktyce niepewności istnieją i możemy najwyżej oczekiwać, że odległość każdego z punktów {x , y ) od prostej będzie rozsądna w porównaniu z niepewnościami, tak jak to pokazano na rys. 8.Ib. 1
u
N
N
t
t
t
;
Rysunek 8.1. a) Jeśli dwie zmienne x i y są związane relacją liniową jak w równaniu (8.1) i jeśli nie byłoby niepewności eksperymentalnych, to wszystkie punkty pomiarowe {x ,y ) leżałyby dokładnie na prostej y = A + Bx. b) W praktyce zawsze istnieją niepewności pomiarowe, które można przedstawić w postaci kresek granic błędów, i można się jedynie spodziewać, że punkty {x ,y ) będą leżały w rozsądnej odległości od prostej. W tym przypadku zaznaczono, iż tylko y jest obarczone znaczącą niepewnością i
i
i
i
Kiedy wykonujemy serię pomiarów opisanego właśnie typu, pojawiają się dwa pytania. Po pierwsze, jeśli przyjmujemy jako pewnik, że y ix są związane relacją liniową, to interesującym zagadnieniem jest znalezienie linii prostej y = A + Bx, która jest najlepiej dopasowana do wyników pomiarów. Jest to równoważne znalezieniu najlepszego przybliżenia stałych A i B opartego na danych y j , . . . , (x , y ). Do takiego problemu można podejść stosując metodę graficzną, którą pokrótce omówiono w paragrafie 2.6. Można go także rozwiązać metodą analityczną, stosując zasadę największego prawdopodobieńN
N
173
stwa. Ta analityczna metoda znajdowania linii prostej, która najlepiej pasowa łaby do szeregu punktów doświadczalnych, zwana jest metodą regresji liniowej lub metodą najmniejszych kwadratów . Metoda ta jest głównym tematem tego rozdziału. Można postawić drugie pytanie, czy zmierzone wartości (x y ),...,(x , y) rzeczywiście potwierdzają nasze oczekiwania co do liniowej zależności y od xl Możemy zatem najpierw znaleźć prostą, która najlepiej pasuje do danych, jednak potem musimy wymyśleć jakiś sposób na zmierzenie, jak dobrze ta prosta pasuje do danych. Tym drugim zagadnieniem zajmiemy się w rozdziale 9. 1
v
1
N
N
8.2. Obliczenie stałych A i B Powróćmy teraz do znajdowania prostej y = A + Bx, która najlepiej pasuje do zbioru punktów pomiarowych (x , y j , . . . , {x , y ). Dla ułatwienia dyskusji założymy, że aczkolwiek nasze pomiary y są obarczone pewną niepewnością, to niepewność w pomiarach x jest zaniedbywalna. Często jest to sensowne założenie, gdyż niejednokrotnie niepewności jednej zmiennej są o wiele większe niż niepewności drugiej i te ostatnie można bezpiecznie zignorować. Dalej założymy, że niepewności wszystkich wartości y mają taką samą wielkość. (W wielu doświadczeniach takie założenie jest również rozsądne, jeśli zaś niepew ności są różne, to naszą analizę można uogólnić poprzez nadanie pomiarom odpowiednich wag; porównaj zad. 8.4.) Bardziej szczegółowo, zakładamy, że każdy wynik y podlega rozkładowi Gaussa z taką samą dla wszystkich pomiarów szerokością o . 1
N
N
;
Jeśli znalibyśmy stałe A i B, to dla dowolnej wartości x (która - jak to założyliśmy - nie ma niepewności) moglibyśmy obliczyć prawdziwą wartość odpowiedniego y t
t
(prawdziwa wartość y ) = A + Bx . t
t
(8.2)
Wynik pomiaru y podlega rozkładowi normalnemu wyśrodkowanemu wokół swojej wartości prawdziwej z szerokością o . Tak więc prawdopodobieństwo otrzymania zmierzonej wartości y jest równe i
y
t
PAM*—
1
W,
(8.3)
W literaturze polskiej spotkać można także określenia metoda wyrównawcza i metoda
Gaussa (przyp.
174
e~
tłum.).
gdzie indeksy A i B wskazują, że prawdopobieństwo to zależy od (nieznanych) wartości A i B. Prawdopodobieństwo otrzymania kompletnego zbioru wyni ków y ..., y jest iloczynem u
N
;
^ , b ( J i . - . 3 ' j v )
=
-P^b(3'i)
PA,B(y )
•••
N
2 2
K—e-" ' ,
(8.4)
<7y gdzie wykładnik dany jest wzorem
f - i <»=±£!Ł. i=l
,5)
(
°y
W znany już sposób najlepsze przybliżenia nieznanych stałych A i B oparte na danych pomiarach to takie wartości A i B, dla których prawdopodobieństv ° JVbO i>-"> ^Af) J e s t największe, lub dla których suma kwadratów y z równania (8.5) jest najmniejsza (stąd nazwa metody najmniejszych kwad ratów). Aby znaleźć te wartości, różniczkujemy j względem A oraz B i przy-rwnujemy pochodne do zera: ;
2
2
2
N
dv
2
= (-2/a )Ą( -A-B ) yi
2
= 0
Xi
N
dv
2
= ( - 2 / d , ) ^ [y-A-Bx )
= 0.
i
;
(8.6)
(8.7)
ownania te można przepisać w postaci równań na A i B:
AN+BY x i
AZx
i
i
+ BZ xf i
= Y.yi
8 8
(-)
= Y xy. d
i
i
(8.9)
Ddtąd pomijać będziemy granice i= 1 do N występujące przy znaku sumowa na YJ-) Są one znane jako równania normalne, ich rozwiązanie zaś daje nam isjlepsze przybliżenia stałych A i B, otrzymane metodą najmniejszych kwad•s:ów:
175
i
B =
AT(I*«tt)-(I> )(I>'.-)
(8.11)
i
A
gdzie wprowadziliśmy wygodne oznaczenie
(8.12)
A=N(Y xf)-(lx f. J
i
Wyniki (8.10) i (8.11) dają najlepsze przybliżenie współczynników A i B linii prostej y = A + Bx, oparte na wynikach pomiarów (x , y ) , ( x , y ). O tej prostej mówi się, że jest dopasowana metodą najmniejszych kwadratów lub że jest prostą regresji zmiennych y i x. Naturalne jest teraz postawienie pytania o niepewność naszych przybliżeń A i B. Okazuje się, że zanim będziemy umieli na nie odpowiedzieć, musimy omówić problem niepewności
1
N
N
v
x
N
8.3. Niepewność pomiarów j W trakcie pomiarów wartości y ,..., y stworzyliśmy sobie przypuszczalnie pewne wyobrażenie o ich niepewności. Niemniej jednak ważna jest umiejęt ność obliczania niepewności na podstawie analizy samych wyników pomiaro wych. Trzeba pamiętać, że wartości y ,...,y nie są wynikami N pomiarów tej samej wielkości. (Mogą to być na przykład czasy spadku kamienia z N róż nych wysokości.) Zatem nie będziemy mogli wnioskować niczego na temat rzetelności pomiarów na podstawie rozrzutu otrzymanych wyników. Mimo to możemy łatwo oszacować niepewność a wartości y ,..., y. Wynik pomiaru każdego y podlega (jak to zakładaliśmy) rozkładowi normal nemu ze środkiem w wartości prawdziwej A + Bx i o szerokości a . Tak więc odchylenia y — A — Bx podlegają rozkładom normalnym, wyśrodkowanym wokół wartości 0 i z tą samą szerokością a . Sugeruje to natychmiast, że dobre przybliżenie a byłoby dane przez sumę kwadratów o znanej postaci t
N
r
N
y
t
N
t
t
t
y
i
y
y
l
N Y(y-A-Bx ) . 2
i
176
(8.13)
W istocie wynik ten można potwierdzić stosując zasadę największego praw: r odobieństwa. Jak zwykle, najlepszym przybliżeniem badanego parametru Maj a ) jest taka liczba, dla której prawdopodobieństwo (8.4) zaobserwowa na wartości y ,..., y jest największe. Tym najlepszym przybliżeniem, jak to a:wo sprawdzić różniczkując równanie (8.4) względem a i przyrównując z : chodną do zera, jest dokładnie wynik (8.13). Niestety, jak można było podejrzewać, przybliżenie a dane równaniem S.13) niezupełnie rozwiązuje nasz problem. Liczby Ai B w równaniu (8.13) są meznanymi, prawdziwymi wartościami stałych A i B. W praktyce musimy je zastąpić naszymi najlepszymi przybliżeniami A i B, danymi równaniami (8.10) i (8.11). Podstawienie to nieco zmniejsza wartość wyrażenia (8.13). Można pokazać, że redukcja ta jest kompensowana, jeśli N z mianownika zastąpimy rrzez N — 2. Tak więc ostateczna wartość niepewności pomiarów y . . . , y to x
N
y
2
l5
2
* =
N
(8.14)
Y(y-A-Bx ) , 2
i
N-2
gdzie A i B dane są równaniami (8.10) i (8.11). Jeśli mamy już niezależne oszacowanie niepewności pomiarów y . . . , y , to powinno być ono porów nywalne z wartością obliczoną ze wzoru (8.14). Nie próbowaliśmy uzasadniać czynnika N — 2 w równaniu (8.14), możemy jednak dodać parę słów komentarza. Po pierwsze, jeśli tylko N jest w miarę duże, to różnica pomiędzy N i N — 2 jest i tak nieistotna. Po drugie, sens obecności czynnika N — 2 staje się jasny, jeśli rozważymy przypadek pomiaru jedynie dwóch par danych (x , y ) i (x , y ). Mając dwa różne punkty, zawsze możemy znaleźć prostą dokładnie przez nie przechodzącą. Metoda najmniejszych kwadratów da nam parametry tej prostej. Jednak mając jedynie dwa punkty doświadczalne, nie jesteśmy prawdopodobnie w stanie powiedzieć niczego o rzetelności naszego pomiaru. Ponieważ oba punkty leżą dokładnie na dopasowanej prostej, oba składniki sumy z równań (8.13) i (8.14) są równe zeru. Tak więc wzór (8.13) (z N = 2 w mianowniku) dałby absurdalny wynik a = 0, podczas gdy wzór (8.14), z N — 2 = 0 w mianowniku daje o = 0/0, w sposób właściwy wskazuje, że o po dwóch pomiarach pozostaje nieokreślone. l5
1
x
N
2
2
y
y
y
Obecność czynnika (N — 2) we wzorze (8.14) przypomina (N—l), które pojawiło się we wzorze (5.46) na odchylenie standardowe N pomiarów jednej wielkości x. W tamtym przypadku przeprowadzaliśmy N pomiarów x ,..., x 1
N
177
tej samej wielkości x. Zanim mogliśmy obliczyć a , musieliśmy użyć naszych danych do wyznaczenia średniej x. W pewnym sensie pozostawiło to tylko N — l niezależnych wartości zmierzonych; tak więc mówimy, że po obliczeniu x pozostaje nam tylko (N — l) stopni swobody. Teraz przeprowadziliśmy N po miarów, ale przed obliczeniem a musieliśmy obliczyć dwie wielkości A i B. Zostaje nam zatem tylko (N — 2) stopni swobody. W ogólności definiujemy liczbę stopni swobody na dowolnym etapie obliczeń statystycznych jako liczbę niezależnych pomiarów minus liczba parametrów obliczonych z tych pomia rów. Można pokazać (chociaż nie zrobimy tego teraz), że w mianowniku wzorów, takich jak (8.14) i (5.46), powinna pojawić się liczba stopni swobody, a nie liczba pomiarów. Wyjaśnia to, dlaczego wzór (8.14) zawiera czynnik (N — 2), wzór (5.46) zaś czynnik (N— 1). x
y
8.4. Niepewność stałych A i 13 Po znalezieniu niepewności a zmierzonych wartości y ...,y , możemy łatwo powrócić do naszych przybliżeń stałych A oraz B i znaleźć ich niepewności. Najważniejsze, że przybliżenia A i B dane równaniami (8.10) i (8.11) są dobrze określonymi funkcjami zmierzonych wartości y . . . , y . Tak więc niepewności A i B można obliczyć metodami przenoszenia błędów, korzystając z niepewno ści y y . Pozostawiamy Czytelnikowi sprawdzenie (zadanie 8.8), że y
u
l5
N
N
N
2
c = o Y* IA 2
(8.15)
2
(8.16)
Y
A
i
2
a = N
gdzie A dane jest jak zwykle równaniem (8.12).
przez T . Musimy przy tym obliczyć sumy Z^!> Z-P?' Z^> Z^;^- Wiele kalkulatorów potrafi automatycznie znaleźć wszystkie te sumy, jednak nawet bez ich pomocy łatwo damy sobie z tym radę, jeśli dane będą właściwie zorganizowane. Korzystając z wyników przedstawionych w tabeli 8.1, ob liczamy t
425
Z^ = > £ P
= 37 125,
2
ZT, = T
Y Pi i
260,
= 25 810,
J
A = 5000, 2
gdzie A = N(Z-Pi ) — (Z-f;) - Zawsze gdy musimy odejmować duże liczby, ważne jest zachowanie dużej liczby cyfr znaczących. Mając potrzebne nam sumy, możemy niezwłocznie obliczyć najlepsze przybliżenia stałych A i B: 2
A
_ (£Pr)(ir,)-(£J',)(£i',i;) _ A
_
2 6 3 > 3 5
i B
=
NiYPjTd-iZPMiy
=
3
zl
W ten sposób otrzymaliśmy najlepsze przybliżenie temperatury zera bezwzglę dnego uzyskane przez studenta: A — — 263°C. Znając stałe A i B, możemy następnie obliczyć wartości A + BP , temperatu ry „oczekiwanej" na podstawie najlepszego dopasowania wyników prostą T='A + BP. Wyniki takiego rachunku przedstawione są w ostatniej kolumnie tabeli i wszystkie pasują sensownie do temperatur zmierzonych. Możemy teraz obliczyć różnice między liczbami w ostatnich dwu kolumnach tabeli i znaleźć t
2
* T = ^Y(T -A-BP )
2
1
i
i
=44,6,
co daje odchylenie standardowe
Zgadza się to z oceną studenta, który oszacował niepewność pomiaru tem peratury na „kilka stopni". Korzystając ze wzoru (8.15) możemy wreszcie obliczyć niepewność wy znaczenia A
180
przez T . Musimy przy tym obliczyć sumy Z^!> Z-P?' Z^> Z^;^- Wiele kalkulatorów potrafi automatycznie znaleźć wszystkie te sumy, jednak nawet bez ich pomocy łatwo damy sobie z tym radę, jeśli dane będą właściwie zorganizowane. Korzystając z wyników przedstawionych w tabeli 8.1, ob liczamy t
425
Z^ = > £ P
= 37 125,
2
ZT, = T
Y Pi i
260,
= 25 810,
J
A = 5000, 2
gdzie A = N(Z-Pi ) — (Z-f;) - Zawsze gdy musimy odejmować duże liczby, ważne jest zachowanie dużej liczby cyfr znaczących. Mając potrzebne nam sumy, możemy niezwłocznie obliczyć najlepsze przybliżenia stałych A i B: 2
A
_ (£Pr)(ir,)-(£J',)(£i',i;) _ A
_
2 6 3 > 3 5
i B
=
NiYPjTd-iZPMiy
=
3
zl
W ten sposób otrzymaliśmy najlepsze przybliżenie temperatury zera bezwzglę dnego uzyskane przez studenta: A — — 263°C. Znając stałe A i B, możemy następnie obliczyć wartości A + BP , temperatu ry „oczekiwanej" na podstawie najlepszego dopasowania wyników prostą T='A + BP. Wyniki takiego rachunku przedstawione są w ostatniej kolumnie tabeli i wszystkie pasują sensownie do temperatur zmierzonych. Możemy teraz obliczyć różnice między liczbami w ostatnich dwu kolumnach tabeli i znaleźć t
2
* T = ^Y(T -A-BP )
2
1
i
i
=44,6,
co daje odchylenie standardowe
Zgadza się to z oceną studenta, który oszacował niepewność pomiaru tem peratury na „kilka stopni". Korzystając ze wzoru (8.15) możemy wreszcie obliczyć niepewność wy znaczenia A
180
2
(T =
a
A
=331
= 18.
Zatem ostateczny wynik studenta, odpowiednio zaokrąglony powinien być: temperatura zera bezwzględnego, A = — 260±20°C, DC w zadowalający sposób zgadza się z akceptowaną wartością — 273°C. Jak często w takich przypadkach, wyniki powyższe stają się bardziej czytelne, jeśli naniesiemy je na wykres, jak na rys. 8.2. Pięć punktów doświad czalnych z niepewnościami temperatury + 7°C pokazano w prawym górnym rogu. Najlepiej dopasowana prosta przechodzi przez cztery kreski granic : edów, piątą zaś mija ona w niewielkiej odległości.
Rysunek 8.2. Wykres zależności temperatury T od ciśnienia P gazu utrzymywanego w stałej objętości (przemiana izochoryczna). Granice błędów mają wielkość jednego odchylenia standar dowego a po obu stronach każdego z pięciu punktów pomiarowych, a narysowaną prostą znaleziono metodą najmniejszych kwadratów. Temperaturę zera bezwzględnego znaleziono przez ekstrapolację prostej do punktu jej przecięcia z osią temperatury T T
Aby znaleźć wartość zera bezwzględnego, prostą tę przedłużono poza wszys tkie punkty pomiarowe, aż do przecięcia z osią T. Taki proces ekstrapolacji (przedłużania krzywej poza obszar punktów, które ją wyznaczają) wprowadza,
181
jak to jasno wynika z rysunku, duże niepewności. Bardzo mała zmiana nachylenia prostej będzie powodować ogromne zmiany w położeniu jej punk tu przecięcia z odległą osią T. Zatem każda niepewność danych doświadczal nych w ogromnym stopniu się zwiększa, jeśli przeprowadzamy ekstrapolację na dowolną odległość. Wyjaśnia to, dlaczego niepewność wartości zera bez względnego ( + 18°C) jest o tyle większa niż niepewności pierwotnych pomia rów temperatury ( + 7°C).
8.6. Dopasowanie innych krzywych metodą najmniejszych kwadratów Jak dotąd w tym rozdziale rozważaliśmy pomiary dwóch zmiennych, speł niających relację liniową y = A + Bx, a także dyskutowaliśmy obliczanie sta łych A i B. Ten ważny problem jest szczególnym przypadkiem szerokiej klasy zagadnień dopasowania krzywych, z których wiele można rozwiązać w podob ny sposób.
Dopasowanie wielomianu Zdarza się często, że spodziewamy się, iż jedna zmienna y daje się wyrazić przez wielomian drugiej zmiennej x, 2
n
y = A + Bx + Cx + ... +Hx .
(8.19)
N a przykład, oczekujemy, że wysokość, na jakiej znajduje się spadające ciało, będzie kwadratową funkcją czasu t, v
t
y = y + o -\ 0
2
gt >
gdzie y i v są odpowiednio początkową wysokością i prędkością, g zaś jest przyspieszeniem ziemskim. Mając dany zbiór punktów doświadczalnych, mo żemy znaleźć najlepsze przybliżenia stałych A, B,..., H ze wzoru (8.19), posługując się argumentami analogicznymi do przedstawionych w paragrafie 8.2. Przedstawimy teraz szkic takiego rozumowania. Załóżmy dla uproszczenia, że wielomian (8.19) jest funkcją kwadratową 0
0
2
y = A+Bx + Cx .
(8.20)
(Zainteresowany Czytelnik z łatwością rozszerzy poniższą analizę na przypa dek ogólny.) Zakładamy, jak poprzednio, że mamy zbiór punktów pomiaro-
182
rych (x , y ), i= 1,..., N i niepewności wszystkich wartości y są jednakowe, [ wszystkie wartości x są dokładnie znane. Dla każdego x odpowiednia prawrziwa wartość y dana jest wzorem (8.20), z A, B, C, których na razie nie znamy. Zakładamy, że pomiary y podlegają rozkładom normalnym. Każdy z tych rozkładów wyśrodkowany jest na odpowiedniej wartości prawdziwej i każdy ma z samą szerokość a . Pozwala nam to obliczyć prawdopodobieństwo otrzymania raobserwowanych przez nas wartości doświadczalnych y ..., y w znanej postaci {
t
t
t
t
t
t
y
p
N
2 2
P( ,...,y )oce^ ' , yi
(8.21)
N
gdzie teraz 2 2
,
* X = I —
{y-A-Bx-Cx ) r —•
2
(8-22)
ff2
i - i
W przypadku liniowym odpowiada to równaniu (8.5)). Najlepsze przybliżenia 4. £ i C to te, dla których wartości P(y ..., y ) są największe, czyli j jest najmniejsze. Różniczkując j względem A, B i C i przyrównując do zera otrzymane pochodne, otrzymujemy (Czytelnik powinien to sprawdzić): 2
u
N
2
AN + B ^ + A ^ AYxf
C ^ f ^ ^
+ B^f
+ C^f
=
+ BYx?
+ CYxf
=
x
t ty ,
.
t
(8-23)
2
Y* yi-
Dla dowolnego zbioru punktów pomiarowych (x y ) można ten układ równań (znany jako układ równań normalnych) rozwiązać i otrzymać najlepsze przybliżenia A, B i C. Równanie y = A+Bx + Cx , ze stałymi obliczonymi powyższą metodą, nazywamy funkcją kwadratową dopasowaną metodą naj mniejszych kwadratów lub krzywą regresji wielomianowej danych pomiarów. Metodę regresji wielomianowej można łatwo uogólnić na przypadek wielo mianu dowolnego stopnia, mimo że dla wielomianów wyższych stopni od powiednie równania normalne stają się bardzo nieporęczne. W zasadzie podobną metodę można zastosować do dowolnej funkcji y=f(x), która zależy od wielu nieznanych parametrów A, B,... Niestety równania normalne, okreś lające najlepsze przybliżenia wartości A, B,..., mogą być trudne lub wręcz niemożliwe do rozwiązania. Jest jednak jedna duża klasa zagadnień, które zawsze mogą być rozwiązane. Chodzi o problemy, w których funkcja y=f(x) zależy liniowo od parametrów A, B,... Do funkcji takich należą oczywiście wszystkie wielomiany - jasne jest, że wielomian taki jak (8.19) zależy liniowo od swych współczynników A, B,..., jednak dotyczy to także wielu innych u
t
2
183
funkcji. N a przykład, w niektórych problemach spodziewamy się, że y jest sumą funkcji trygonometrycznych, jak y = .4 sin x + 5 cos x.
(8.24 <
Dla tej funkcji, a także w rzeczywistości dla dowolnej funkcji liniowej parame trów A, B,... równania normalne wyznaczające najlepsze przybliżenia A, B... tworzą układ równań liniowych, który zawsze można rozwiązać ( porówna' zad. 8.12 i 8.13).
Funkcje wykładnicze Jedną z najważniejszych funkcji w fizyce jest funkcja wykładnicza Bx
y = Ae ,
(8.25
gdzie A i B są stałymi. Natężenie promieniowania I maleje wykładniczo po przejściu przez ośrodek pochłaniający odległości x, zgodnie ze wzorem:
I=I c-", 0
gdzie I jest natężeniem początkowym, fi zaś charakteryzuje absorpcję mate riału pochłaniającego. Ładunek pozostały na rozładowywanym kondensatorze maleje wykładniczo z czasem: 0
A l
Q = e e- , 0
przy czym Q jest ładunkiem początkowym, a X = l/(RC), gdzie R jest oporem, a C - pojemnością. Jeśli stałe A i B w równaniu (8.25) są nieznane, naturalne jest poszukiwanie ich przybliżeń na podstawie pomiarów x i y. Niestety bezpośrednie zastosowa nie naszych poprzednich argumentów prowadzi do równań na A i B, które nie dadzą się łatwo rozwiązać. Jednak istnieje możliwość transformacji nieliniowe go związku (8.25) pomiędzy y i x na relację liniową, do której możemy zastosować metodę najmniejszych kwadratów. W celu otrzymania wymaganej „linearyzacji" logarytmujemy po prostu równanie (8.25) i otrzymujemy 0
lny = ln.4-r-.Bx.
(8.26)
Widzimy, że mimo iż y nie jest liniową funkcją x, to lny już jest. Przekształ cenie nieliniowego związku (8.25) w relację liniową (8.26) jest przydatne także w wielu innych sytuacjach, poza metodą najmniejszych kwadratów. Jeśli
184
nr remy sprawdzić relację (8.25) graficznie, to narysowanie wykresu zależności : i x da nam krzywą, o której na pierwszy rzut oka niewiele da się : : .-.edzieć. Z drugiej strony, wykres zależności lny od x (lub wykres zależnoc: '.og y od x) powinien dać prostą, którą łatwo zidentyfikować. (Tego typu -« «:res szczególnie łatwo zrobić na papierze „półlogarytmicznym", na którym r ; r . a oś ma podziałkę logarytmiczną. Papier taki pozwala wykreślić logy -eapośrednio, nawet go nie obliczając.) Przydatność równania liniowego (8.26) w metodzie najmniejszych kwadrarow jest natychmiast widoczna. Jeśli wierzymy, że y i x powinny spełniać :_.eżność y = Ae , to zmienne z = lny i x powinny spełniać zależność (8.26), rzyli Bx
z = \nA + Bx.
(8.27)
Icśli mamy serię punktów doświadczalnych {x , y ), to dla każdego y możemy obliczyć z = ln y . Wtedy punkty (x„ z ) powinny leżeć na prostej (8.27). Prosta ta może być dopasowana metodą najmniejszych kwadratów, co daje najlepsze przybliżenia stałych lm4 (skąd znajdujemy A) i B. t
t
t
;
t
;
Przykład Wiele populacji (ludzi, bakterii, jąder promieniotwórczych itp.) ma tendencję do zmieniania się wykładniczo w czasie. Jeśli populacja taka maleje wykład niczo, możemy napisać z
N = N e~" ,
(8.28)
0
gdzie T jest zwane średnim czasem życia (jest to ściśle powiązane z okresem połowicznego zaniku t , w istocie t — 0,693 T). Biolog podejrzewający, że populacja bakterii maleje wykładniczo jak w równaniu (8.28), bada ją w trzech kolejnych dniach, otrzymując wyniki jak w pierwszych dwóch kolumnach :abeli 8.2. Jakie jest jego najlepsze przybliżenie średniego czasu życia T oparte na przedstawionych wynikach? 1/2
1/2
Tabela 8.2. Populacja bakterii Czas t (dni)
Populacja N
z,- = ln JV
0 1 2
153 000 137000 128 000
11,94 11,83 11,76
;
t
;
185
Jeśli N zmienia się zgodnie z równaniem (8.28), to zmienna z = ln N po winna zależeć liniowo od t: = lnJV = ln J V - - .
z
(8.29)
0
Nasz biolog oblicza zatem trzy wartości z = ln JV,- (i = 0, 1, 2) przedstawione w trzeciej kolumnie tabeli 8.2. Korzystając z tych liczb, dopasowuje on prostą (8.29), stosując metodę najmniejszych kwadratów, i znajduje najlepsze przy bliżenie współczynników rniV i ( —1/T), ;
0
ln JV = 11,93
i
0
- 1
(-1/r) = -0,089 d n i .
Druga z tych liczb implikuje, że najlepsze przybliżenie średniego czasu życia równe jest x
= 11,2 dni.
Metoda właśnie opisana jest sympatycznie prosta (szczególnie przy użyciu kalkulatora automatycznie obliczającego regresję liniową) i jest często stoso wana. Pomimo to metoda ta nie wydaje się całkiem logiczna. Nasze obliczenia prowadzące do dopasowania prostej y = A + Bx oparte były na założeniu, że zmierzone wartości y ..., y obarczone były jednakowymi niepewnościami. W tym przypadku przeprowadzamy nasze dopasowanie, korzystając ze zmien nej z = ln y. Jeśli zatem zmierzone wartości y były jednakowo niepewne, to wartości z, = ln y już takie nie są. Faktycznie, z prostego wzoru na przenosze nie błędu wynika, że v
N
t
t
dz a, = dy c = X y
(8.30)
y
Tak więc jeśli a jest takie samo dla wszystkich pomiarów, to o zmienia się (a. rośnie ze zmniejszaniem się y). W oczywisty sposób zmienna z = ln y nie spełnia wymaganego założenia stałej niepewności dla wszystkich pomiarów, nawet jeśli y to założenie spełnia. Łatwo jest obejść tę trudność. Można zmodyfikować metodę najmniejszych kwadratów, uwzględniając różne niepewności poszczególnych pomiarów pod warunkiem, że niepewności te są znane. (Metoda najmniejszych kwadratów uwzględniająca wagi statystyczne naszkicowana została w zadaniu 8.4.) Jeśli wiemy, że pomiary y ,...,y rzeczywiście są obarczone jednakowymi niepew nościami, to równanie (8.30) mówi nam, jak zmieniają się niepewności wartości z . . . , Zjy i do równania z = ln A + Bx możemy zastosować metodę ważonych najmniejszych kwadratów. y
z
1
l5
186
N
W praktyce często nie można być pewnym, że niepewności y ...,y rzeczywiście są jednakowe, tak więc można argumentować, że równie dobrze można założyć równość wszystkich niepewności z z i skorzystać z naj prostszej wersji metody najmniejszych kwadratów. Często niepewności niewie le się różnią i to, z której metody skorzystamy, nie ma istotnego wpływu na wyniki (tak było w opisanym powyżej przykładzie). W każdym przypadku bezpośrednie zastosowanie zwykłej (bez wag) metody najmniejszych kwad ratów jest jednoznacznym, prostym sposobem znajdowania sensownych (jeśli nie najlepszych) przybliżeń stałych A i B w równaniu y = Ae i dlatego jest w tym celu często używana. u
v
N
N
Bx
Regresja wielokrotna Do tej pory omawialiśmy tylko obserwacje dwóch zmiennych, x i y, i ich związek. W wielu realnych zagadnieniach trzeba jednak rozważać więcej niż dwie zmienne. N a przykład badając ciśnienie gazu P, stwierdza się, że zależy ono od objętości F o r a z temperatury T i analizuje się tę zależność. Najprost szym przykładem takiego problemu jest przypadek, kiedy jedna zmienna z zależy liniowo od dwóch innych zmiennych x i y: z = A + Bx + Cy.
(8.31)
Problem ten można rozwiązać przez bardzo naturalne uogólnienie metody najmniejszych kwadratów dla przypadku dwóch zmiennych. Jeśli dysponuje my serią pomiarów (x , y , z ) , i = 1,..., N (przy czym z mają takie same niepewności, x i y zaś są znane dokładnie), to możemy zastosować zasadę największego prawdopodobieństwa, dokładnie tak samo jak w paragrafie 8.2, aby pokazać, że najlepsze przybliżenia stałych A, B, C wyznaczone są przez równania normalne postaci t
t
t
;
i
t
A ^
+ B^f
+C ^ y ^ ^ u
(8.32)
Równania te można rozwiązać względem A, B i C, aby otrzymać najlepsze dopasowanie funkcji (8.31). Metoda ta zwana jest regresją wielokrotną („wielo krotną", ponieważ mamy do czynienia z więcej niż dwiema zmiennymi), ale nie będziemy jej szerzej omawiać w tym miejscu. 187
Zadania Uwaga: Gwiazdka przy zadaniu oznacza, że szkic rozwiązania lub odpowiedź znajduje się na końcu książki. (paragraf 8.2). Korzystając z metody najmniejszych kwadratów, znajdź prostą y = A + Bx, która najlepiej pasuje do czterech punktów (1, 12); (2, 13); (3, 18); (4, 19). Nanieś na wykres punkty i prostą. 8.2 (paragraf 8.2). Aby znaleźć współczynnik sprężystości k sprężyny, studentka obciążyła sprężynę różnymi masami m i zmierzyła odpowiednie długości /. Jej wyniki zestawione są w tabeli 8.3. Ponieważ siła mg równa jest k(l — l ), gdzie l jest długością sprężyny zawieszonej swobodnie, więc powy ższe dane powinny pasować do prostej / = l + {g/k) m. Dopasuj prostą do tych danych, stosując metodę najmniejszych kwadratów. Znajdź najlepsze przy bliżenia długości l i współczynnika sprężystości k. 0
0
0
0
Tabela 8.3 obciążenie m (g) długość/(cm)
200 5,1
300 5,5
400 5,9
500 6,8
600 7,4
700 7,5
800 8,6
900 9,4
^8^3Jparagraf 8.2). Załóżmy, że x i y spełniają relację y = Bx; tj. leżą na prostej°~przechodzącej przez początek układu współrzędnych. Załóżmy także, że mamy N par punktów (x , y ) z zaniedbywalnymi niepewnościami x i rów nymi sobie niepewnościami y. Korzystając z argumentów jak te z paragrafu 8.2, udowodnij, że najlepsze przybliżenie B równe jest t
{
1J874, (paragraf 8.2). Przypuśćmy, że znaleźliśmy N par wartości (x ; , y i dwóch zmiennych x oraz y i zakładamy, że spełniają one relację liniową y = A + Bx. Przypuśćmy, że pomiary x są obarczone zaniedbywalną niepew nością, niepewności zaś y mają różne wartości a (to znaczy niepewność y, równa jest a niepewność y równa jest a itd.). Przyjrzyj się wyprowadzeniu metody najmniejszych kwadratów z paragrafu 8.2 i uogólnij ją na przypadek niejednakowych niepewności y . Pokaż, że najlepsze przybliżenia A i B równe są: t
t
;
v
i
2
2
t
A i
188
= [(Zw x, )(Xw y )-(X>v x )(Zw .x y .)]/zl 2
i
i
i
i
i
1
i
1
(8.331
B
= [(Zw .)(Iw x ; )-(Z x )(Zw y )]/zl, ;
(8.34)
^=(Zw )(Zw x )-(Xw x ) .
(8.35)
1
j
i3
i
Wi
i
i
• ^gami w = 1/(7? oraz ;
2
i
2
i
i
i
i-;:odę najmniejszych kwadratów uwzględniającą wagi statystyczne pomiarów - : zna stosować tylko wtedy, gdy niepewności a (lub co najmniej ich względ: 7 wielkości) są znane. Najczęściej spotykamy się z taką sytuacją w przypadku ::miarów zliczeń, takich jak np. zliczanie rozpadów promieniotwórczych. Jak i
: powiedziano w paragrafie 3.1 (i zostanie udowodnione w rozdziale 11), niepewność odpowiadająca dowolnej liczbie zliczeń v równa jest
y/v.
8.5 (paragraf 8.2). Załóżmy, że wiemy, iż y jest liniową funkcją x, to znaczy = A + Bx, i przypuśćmy, że mamy trzy pary pomiarów (x, y) : (1; 2 + 0,5), (2; =0,5), (3; 2 ± 1 , 5 ) , dla których niepewności x są zaniedbywalne. Korzystając : metody najmniejszych kwadratów, uwzględniającej wagi statystyczne pomia::w (równania (8.33) do (8.35)), oblicz A i B. Porównaj swoje wyniki z tymi, które otrzymałbyś zaniedbując zmienność niepewności, tj. używając równań >.10)-{8-12), nie uwzględniających wag statystycznych pomiarów. Nanieś na < ykres dane i obie proste oraz spróbuj zrozumieć różnice. vj*8^ (paragraf 8.4). Badając ruch pociągu poruszającego się przypuszczalnie ze srała prędkością, mierzymy czas, w jakim mija on określone cztery punkty swojej trasy. Położenie tych punktów i znalezione czasy przedstawiono w tabeli S.4. Dopasowując prostą d = d + vt metodą najmniejszych kwadratów, znajdź najlepsze przybliżenie prędkości pociągu v. Jaka jest niepewność vi 0
Tabela 8.4 położenie (km) czas(s)
0 17,6
tooo w 40,4
20&O»* 67,7
3(9t5
~ -
90,1
8.7 (paragraf 8.4). Student mierzy ciśnienie gazu P w pięciu różnych temperaturach T, utrzymując stałą jego objętość V. Jego wyniki przedstawiono w tabeli 8.5. Wyniki te powinny pasować do równania liniowego o postaci T= A + BP, gdzie A jest temperaturą zera bezwzględnego (z uznaną wartością — 273°C, o czym była mowa w paragrafie 8.5). Znajdź najlepsze dopasowanie danych studenta i stąd wyznacz najlepsze przybliżenie temperatury zera bezwzględnego oraz jej niepewność.
189
Tabela 8.5 ciśnienie P, (mm Hg) temperatura 7] (°C)
79
82
85
88
90
8
17
30
37
52
*8.8 (paragraf 8.4). a) Skorzystaj z zasady największego prawdopodobieństwa w sposób na szkicowany w dyskusji równania (8.13), aby pokazać, że równanie (8.13) określa niepewność a wartości y w serii pomiarów (x y ),(x , y ), 0 których przypuszcza się, że leżą na prostej. b) Skorzystaj z reguł przenoszenia błędów, aby pokazać, że niepewności a 1 a parametrów dopasowania linii prostej y = A + Bx dane są równaniami (8.15) i (8.16). y
u
t
N
N
A
B
*8.9 (paragraf 8.4). Metoda najmniejszych kwadratów, stosowana do zbio ru punktów (x , y j , . . . , (x , y ) nie traktuje zmiennych x i y jednakowo. W szczególności parametry dopasowania prostej y = A + Bx obliczane są przy założeniu jednakowej niepewności y ..., y i zaniedbywalnej niepewności x ..., x . Jeśli byłoby odwrotnie, to x i y musiałyby się zamienić rolami i pasować do prostej x = A' + B'y. Obie proste y = A + Bx i x = A' + B'y byłyby identyczne, gdyby N punktów leżało dokładnie na prostej, ale w ogól ności będą się one odrobinę różnić. Dopasuj prostą x = A' + B'y do danych z zadania 8.1 (zakładając jednakową niepewność x i zaniedbywalną niepew ność y ). Znajdź A' i B' oraz ich niepewności o , i a ,. Jakie byłyby wartości A' i B' obliczone na podstawie wyników zadania 8.1? Porównaj proste otrzymane tymi dwiema metodami. Czy różnica jest znacząca? Ł
N
N
v
u
N
N
i
;
A
B
2
8.10 (paragraf 8.6). Rozważ dopasowanie wielomianu y = A + Bx + Cx do zbioru punktów (x , y ), i = 1,..., N. Skorzystaj z zasady największego praw dopodobieństwa, aby pokazać, że najlepsze przybliżenia stałych A, B, C dane są równaniem (8.23). Postępuj zgodnie ze wskazówkami przedstawionymi w tekście pomiędzy równaniami (8.20) i (8.23). ;
t
*8.11 (paragraf 8.6). Jednym ze sposobów mierzenia przyspieszenia swobo dnie spadającego ciała jest pomiar wysokości y , na której się znajduje w jednakowych odstępach czasu (korzystając na przykład z fotografii wieloekspozycyjnej). Przyspieszenie to można znaleźć dopasowując do wyników do świadczenia funkcję kwadratową, jakiej się spodziewamy: t
y=
2
yo+v t-\gt . Q
(8.36)
Skorzystaj z równań (8.23), aby znaleźć najlepsze przybliżenie trzech współ-
190
rzników równania (8.36) i stąd najlepsze przybliżenie g na podstawie nków przedstawionych w tabeli 8.6. Tabela 8.6 : dziesiąte części s) nkośc/i(cm)
—2 131
—1 113
0 89
1 51
2 7
Zwróć uwagę, że początek pomiaru czasu możemy ustalić dowolnie. Mog:y się wydawać, że bardziej naturalne byłoby przyjęcie t = 0, 1,..., 4. Jednak, -; związując zadanie, stwierdzisz, że zdefiniowanie czasu tak, aby punkty - : miarowe były rozłożone symetrycznie wokół zera, powoduje, że znika około o liczonych sum. Fakt ten istotnie upraszcza rachunki. Taki trik można m;:osować zawsze, gdy wartości zmiennej niezależnej są równoodległe. 8.12 (paragraf 8.6). Przypuśćmy, że spodziewamy się, iż y jest postaci = Af(x) + Bg(x), gdzie A i B są nieznanymi parametrami, / i g zaś są ustainymi, znanymi funkcjami x ( j a k / = x i g = x l u b / = cos x i g = sin x). Ko— stając z zasady największego prawdopodobieństwa pokaż, że najlepsze przyzzżenia A i B na podstawie danych (x , y ), i — 1,..., N, muszą spełniać relacje: 2
;
t
2
^I[/(x,)] +al/(x,)
g{x ) t
=
Zyt
f(p^i),
(8.37) 2
AZf(x )g(x )+BZLg(x )-] i
i
=Zy a(x ).
i
i
i
*8.13 (paragraf 8.6). Wysokość y, na jakiej znajduje się ciężarek drgający l a pionowej sprężynie, powinna być opisywana wzorem
y = A cos cot + B sin cot. Studentka zmierzyła z zaniedbywalną niepewnością częstość OJ = 10 rad/s. Korzystając z fotografii wieloekspozycyjnej znalazła także y w pięciu równo odległych chwilach, tak jak to przedstawiono w tabeli 8.7. Tabela 8.7 : (dziesiąte części s) y(cm)
—4 3
—2 -16
0 6
2 9
4 -8
Skorzystaj z równania (8.37), aby znaleźć najlepsze przybliżenia A i B. Narysuj punkty i swoją najlepiej dopasowaną krzywą. (Jeśli najpierw narysu-
191
jesz punkty pomiarowe, będziesz miał możliwość stwierdzenia, jak trudno byłoby wybrać najlepsze dopasowanie bez metody najmniejszych kwadratów.) Czy uznałbyś, że dane zadowalająco pasują do spodziewanej zależności, jeśli studentka oceniła niepewności zmierzonych wartości y na „parę centymet rów"? ra zachoSzących w próbce radioaktywnej maleje wykładniczo w miarę rozpadu jąder: R = i? e
_ t / I
0
,
gdzie t jest średnim czasem życia jądra promieniotwórczego. Student obser wujący przez trzy godziny pewien rozpad promieniotwórczy zanotował wyniki przedstawione w tabeli 8.8. Znajdź najlepsze przybliżenie średniego czasu życia T, dopasowując do jego wyników prostą mR = ln R — t/x. Skorzystaj z meto dy najmniejszych kwadratów. 0
Tabela 8.8 czas t (godziny) szybkość zliczania R (jednostki umowne)
0
13,8
7,9
2
3
6,1
2,9
R O Z D Z I A Ł
9
KOWARIANCJA I KORELACJA
K : lejny rozdział poświęcimy wprowadzeniu ważnego pojęcia kowariancji. Kowariancja pojawia się w naturalny sposób w trakcie rozważań na temat rrzenoszenia błędów i dlatego zajmiemy się nią w paragrafie 9.2, poprze dzonym krótkim przeglądem zasad przenoszenia błędów znajdującym się w paragrafie 9.1. W paragrafie 9.3 na podstawie kowariancji zdefiniuje my współczynnik korelacji liniowej dla N punktów pomiarowych i.x , y ), ...,(x , y ). Współczynnik ten, oznaczany jako r, jest miarą zgodności pomiędzy punktami pomiarowymi y ) a linią prostą opisaną równaniem y = A + Bx. Jego znaczenie omówimy w paragrafach 9.4 i 9.5. 1
1
N
N
;
9.1. Przegląd zasad przenoszenia błędów W tym i następnym paragrafie raz jeszcze powrócimy do ważnego zagad nienia, jakim jest przenoszenie błędów. Po raz pierwszy zajęliśmy się przeno szeniem błędów w rozdziale 3, w którym udało się nam sformułować szereg wniosków. Wyobrażaliśmy sobie, że mierzymy dwie wielkości x i y z zamiarem obliczenia wartości pewnej ich funkcji q(x, y), jak na przykład q = x + y czy j = x sin y. (W rzeczywistości rozważaliśmy wtedy funkcję q(x, ...,z) o dowol nej liczbie zmiennych x,...,z; obecnie dla uproszczenia ograniczymy się tylko do dwóch zmiennych.) Proste rozumowanie przekonało nas, że niepewność q est dana wzorem 2
6q
cq_ 8q_ 8x + by. dy 8x
(9.1)
193
Po raz pierwszy wyprowadziliśmy tę zależność dla przypadków szczególnych jak suma, różnica, iloczyn i iloraz. Na przykład, jeżeli q, ponieważ możliwe jest częściowe znoszenie się błędów x i y. Opuszczając dowód stwierdziliśmy, że dla niezależnych i przypadkowych błędów x i y lepszym oszacowaniem niepewności obliczanej wartości q(x, y) jest wyrażenie (9.2)
Powiedzieliśmy także, ponownie pomijając dowód, że bez względu na niezależ ność i przypadkowość błędów, prostsze wyrażenie (9.1) zawsze daje górne ograniczenie wartości bq; oznacza to, że niepewność bq nigdy nie jest większa od obliczonej na podstawie wzoru (9.1). W rozdziale 5 podaliśmy poprawną definicję oraz dowód wyrażenia (9.2). N a początku przekonaliśmy się, że dobrą miarą niepewności pomiaru 8x jest odchylenie standardowe a , w szczególności zobaczyliśmy, że jeżeli pomiary wielkości x podlegają rozkładowi normalnemu, to możemy mieć 68 procent ufności, że zmierzona wartość leży w promieniu a od wartości prawdziwej. Po drugie, stwierdziliśmy, że jeżeli pomiary x i y opisane są przez niezależne rozkłady normalne z odchyleniami standardowymi a i a , to wartości q(x, y) również podlegają rozkładowi normalnemu z odchyleniem standardowym x
x
x
y
(9.3) Rezultat ten uzasadnia nasze stwierdzenie zapisane w wyrażeniu (9.2). W paragrafie 9.2 wyprowadzimy dokładny wzór na niepewność wielko ści q, który ma zastosowanie bez względu na to, czy wielkości x i y podlegają rozkładom normalnym i czy ich niepewności są niezależne. W szczególności pokażemy, że wyrażenie (9.1) zawsze prowadzi do górnego ograniczenia niepewności dq. Zanim wyprowadzimy te zależności, przyjrzyjmy się definicji odchylenia standardowego. Odchylenie standardowe a dla JV pomiarów zostało pierwot nie zdefiniowane równaniem x
N 2
l(x-x) ;= i
194
(9.4
Jeżeli pomiary x podlegają rozkładowi normalnemu, to w granicy dla dużych wartości N definicja (9.4) jest równoważna definicji a jako parametru szeroko ści, który występuje w funkcji Gaussa x
1
2
-(x-X) /lal
e
opisującej rozkład wyników x. Ponieważ będziemy obecnie dopuszczać moż liwość, że niepewności x nie spełniają rozkładu normalnego, nie będziemy mogli korzystać z drugiej definicji. Jednakże możemy i będziemy definiować a za pomocą równania (9.4). Niezależnie od tego, czy rozkład błędów jest rozkładem normalnym, ta definicja o daje wiarygodną miarę przypadkowych niepewności występujących w pomiarach x. (Podobnie jak w rozdziale 5, założymy, że wszystkie błędy systematyczne są znane i zostały zredukowane do zaniedbywalnego poziomu, a pozostałe błędy są przypadkowe.) x
x
Pozostaje zwykła dowolność w kwestii wyboru definicji o w postaci (9.4) lub w jej „poprawionej" formie, w której mianownik N został zastąpiony przez {N — l). N a szczęście prowadzone dalej rozważania stosują się do obydwu definicji, o ile konsekwentnie stosujemy jedną albo drugą. Dla wygody będzie my posługiwać się definicją (9.4) z N w mianowniku. x
9.2. Kowariancja a przenoszenie błędów Załóżmy, że w celu określenia wartości funkcji q(x, y) kilkukrotnie powtórzyli śmy pomiary dwóch wielkości x i y, uzyskując N par danych (x ,y ), (x ,y ). N a podstawie N pomiarów x ,...,x obliczyliśmy w zwykły sposób średnią x oraz odchylenie standardowe u ; podobnie na podstawie y ,...,y obliczyliśmy y oraz o . Następnie, mając N par danych, możemy obliczyć N wartości funkcji będącej przedmiotem zainteresowania 1
N
N
1
1
N
x
1
N
y
q.i =
(i =
i,...,N).
Znając q ...,q , obliczamy ich średnią q, która jak sądzimy jest najlepszym przybliżeniem wartości q, oraz odchylenie standardowe o , które jest naszą miarą przypadkowych niepewności wartości q . Jak zwykle, przyjmiemy założenie, że niepewności pomiarowe są niewielkie, a więc wszystkie wyniki x ,...,x są bliskie x, a y ...,y bliskie y. Pozwala to skorzystać z przybliżenia u
N
ą
t
1
N
u
N
195
^
_ _ ^
+
dq _ ~dx ( ~ ^ Xi
X
dq _ ~dy~( ~ ^
+
yi
(9.5)
y
W wyrażeniu tym pochodne cząstkowe dq/dx oraz dq/dy obliczamy w punk cie x = x, y = y i dlatego są one identyczne dla wszystkich i = 1,... TY. W tym przybliżeniu wyrażenie na średnią przyjmuje postać 1
1 N
N
N
^
dq q(x,y)+-^-(x -x) ox
_
i
+
dq _ —{y -y) dy i
Zapisaliśmy średnią q w postaci sumy trzech członów. Pierwszy z nich to po prostu q(x, y), podczas gdy pozostałe dwa są równe zeru. (Wynika to chociażby z definicji średniej, która mówi, że 0-) W ten sposób osiągnęliśmy wynik o godnej podkreślenia prostocie =
q = q(x, y).
(9.6)
Oznacza to, że chcąc znaleźć średnią q, powinniśmy obliczyć wartość funkcji q(x,y) w punkcie x = x, y = y. Odchylenie standardowe dla N wartości q ,...,q jest dane przez 1
N
1 2
l(q-q) Podstawiając doń (9.5) oraz (9.6), stwierdzamy, że 1 = iV
dq dx
+2
196
1
^-(x -x) ;
+
-(y -y) ;
N
dq 3q 1
TY
ZC^-^H^-y)-
3x dy TY
ZO^-y)
2
(9.7)
Sumy w pierwszych dwóch wyrazach są dokładnie takie same, jak w definic jach odchyleń standardowych a i a . Sumy z ostatniego członu nie spotkaliś my nigdy wcześniej. Nosi ona nazwę kowariancji x i y, i jest oznaczana przez x
y
1
o
xy
= ^Z(x -x)(y -y). i
(9-8)
i
Po uwzględnieniu tej definicji równanie (9.7) na odchylenie standardowe a przyjmuje postać
q
.2
Wzór ten pozwala obliczyć odchylenie standardowe a bez względu na niezale żność pomiarów x i y oraz bez powoływania się na ich normalny rozkład. Jeżeli pomiary x i y są niezależne, to - jak można się łatwo przekonać - dla dużej ich liczby kowariancja a powinna dążyć do zera. Niezależnie od wartości y , wielkość x — xz równym prawdopodobieństwem występowałyby ze znakiem plus jak i minus. Tak więc po wielu pomiarach składniki dodatnie i ujemne w sumie (9.8) powinny się w przybliżeniu równoważyć; dla nieskończenie wielu pomiarów czynnik 1/JV gwarantuje zbieżność a do zera. (Dla skończonej liczby pomiarów kowariancja a nie będzie dokładnie zerem, chociaż jej wartość powinna być mała, o ile błędy x i y są rzeczywiście niezależne i przypadkowe.) Gdy a jest równe zeru, równanie (9.9) sprowadza się do ą
xy
t
i
xy
xy
(9.10) co jest znanym nam wynikiem dla niezależnych i przypadkowych niepewności. 1
Nazwa kowariancja dla
x
xy
xy
x
197
Jeżeli pomiary x i y nie są niezależne, to nie ma powodu, aby kowarian cja a była równa zeru. Łatwo wyobrazić sobie sytuację, w której dodatnim odchyleniom x będą zawsze towarzyszyć dodatnie odchylenia y i na odwrót. Tym samym liczby (x — x) i (y —y) będą zawsze tego samego znaku (obydwie dodatnie lub obydwie ujemne), a więc ich iloczyn będzie zawsze dodatni. Ponieważ wszystkie składniki sumy (9.8) są nieujemne, a nie będzie znikać nawet w granicy, gdy liczba pomiarów będzie dążyć do nieskończoności. Gdy kowariancja a jest różna od zera (nawet dla nieskończenie wielu pomiarów), mówimy o istnieniu korelacji pomiędzy błędami x i y. W tym przypadku niepewność a wielkości q(x,y) dana wzorem (9.9) nie jest równa tej, którą otrzymalibyśmy stosując wzór (9.10) słuszny dla błędów przypadkowych i niezależnych. xy
i
t
xy
ą
Korzystając ze wzoru (9.9), otrzymujemy zawsze obowiązujące górne ogra niczenie wartości a . W ramach prostego ćwiczenia z algebry (zadanie 9.1) można wykazać, że kowariancja o spełnia tak zwaną nierówność Schwarza q
^
(T
\ xy\
(9.11)
G a . x
y
Podstawiając (9.11) do wyrażenia (9.9) na niepewność a , przekonamy się, że q
2
'V
rl + 2
dy 8q
dx
o + x
dq dq dx dy a a x
y
dq dy o
y
czyli
cą dx
cq Ty
(9.12)
Za pomocą otrzymanego przed chwilą wyniku ustaliliśmy dokładnie sens podanego na początku prostego wyrażenia 5
uą cq oy 5x + ex dy
(9.13)
określającego niepewność 8q. Jeżeli uznamy odchylenie standardowe a za naszą miarę niepewności związanej z wielkością q, to z (9.12) wynika, że wyrażenie (9.13) rzeczywiście określa górną granicę niepewności. Bez względu
198
na to, czy błędy x i y są niezależne i czy podlegają rozkładowi normalnemu, niepewność q nigdy nie będzie większa niż prawa strona wyrażenia (9.13). Jeżeli pomiary x i y są skorelowane tak, że \a \ = o a , co zgodnie z (9.11) jest największą możliwą wartością, niepewność q może być tak duża, jak dopusz cza to wzór (9.13), ale w żadnym przypadku nie może być większa. Rola kowariancji a w przedstawionym opisie jest w istocie czysto teorety czna; w rzeczywistości pojęcie kowariancji jest dość rzadko wykorzystywane przy okazji określania niepewności wielkości złożonych (przynajmniej w ra mach pierwszej pracowni fizycznej). W dalszym ciągu omówimy zagadnienia, dla których kowariancja ma podstawowe i praktyczne znaczenie. xy
x
y
xy
9.3. Współczynnik korelacji liniowej Pojęcie kowariancji a wprowadzone w paragrafie 9.2 pozwala odpowiedzieć na postawione w rozdziale 8 pytanie: w jakim stopniu zbiór wyników pomia rów (x ,y ),...,(x ,y ) dwóch zmiennych uzasadnia hipotezę o liniowym zwią zku pomiędzy wielkościami x i y. Załóżmy, że otrzymaliśmy N par wartości (x ,y ),...,(x ,y ) dwóch zmien nych, które - jak podejrzewamy - wiąże zależność liniowa w postaci xy
1
1
N
N
1
1
N
N
y = A + Bx. Należy pamiętać, że liczby x ,...,x nie oznaczają już wyników pomiarów jednej określonej wartości tak jak w dwóch poprzednich paragrafach; przeciw nie, stanowią one ciąg N różnych wartości pewnej zmiennej (na przykład, N różnych wysokości, z których upuszczamy kamień). Ta sama uwaga odnosi się także do y ,...,y . Posługując się metodą najmniejszych kwadratów, potrafimy wyznaczyć współczynniki A i B prostej, która jest najlepszym dopasowaniem do punktów (x,,V|),...,(x ,y ). Jeżeli dysponujemy wiarygodnym oszacowaniem niepewno ści poszczególnych pomiarów, możemy sprawdzić, czy punkty pomiarowe leżą wystarczająco blisko prostej (wziąwszy pod uwagę niepewności). Jeżeli tak, to pomiary uzasadniają przypuszczenie, że x i y łączy zależność liniowa. Niestety, w wielu doświadczeniach trudno z góry podać wiarygodne osza cowanie niepewności i do rozstrzygnięcia o liniowym związku pomiędzy dwiema zmiennymi muszą wystarczyć same dane. W szczególności istnieje pewien rodzaj eksperymentu, w którym nie można z góry określić, jak duża jest niepewność. Jest on częściej spotykany w naukach społecznych niż w fizyce i najlepiej objaśnić go posługując się przykładem. 1
x
N
N
N
s
199
Załóżmy, że wykładowca zamierzając przekonać swoich słuchaczy o po zytywnych skutkach, jakie na wyniki egzaminu ma wykonywanie pracy domowej, rejestruje oceny uzyskane z prac domowych oraz egzaminów, a następnie przedstawia je w postaci zbioru punktów na wykresie, tak jak na rysunku 9.1. Oceny uzyskane z prac domowych zaznaczono na osi poziomej, a oceny uzyskane na egzaminie - na osi pionowej. Każdy z punktów (x ,y ) zawiera uzyskaną przez studenta ocenę z pracy domowej x oraz ocenę z egzaminu y . Wykładowca chciałby wykazać istnienie korelacji pomiędzy wysokimi notami z prac domowych i egzaminów, i na odwrót (wykonany przez wykładowcę wykres przemawia na korzyść tej hipotezy). W opisanym eksperymencie brak niepewności w określaniu poszczególnych punktów; oceny każdego ze studentów są dokładnie znane. Niepewność tkwi raczej w ustaleniu stopnia korelacji pomiędzy ocenami, a o tym trzeba zdecydować na podstawie danych. i
i
i
t
y 1 0 0
•o
50
I
|
0
1
50
100
x
wynik prac domowych
Rysunek 9.1. Wykres przedstawiający związek pomiędzy ocenami z pracy domowej i egzaminu. Każdy z dziesięciu punktów (x , y ) informuje o ocenie, jaką student uzyskał z pracy domowej x i egzaminu y t
t
i
t
Oczywiście zmienne x i y (niezależnie od ich natury) mogą łączyć zależno ści bardziej złożone niż liniowa, y = A + Bx. Wiele praw fizyki prowadzi do zależności kwadratowych w postaci y = A + Bx + Cx . My jednak ograniczy my się do rozważenia najprostszego przypadku, który polega na zbadaniu, czy otrzymany zbiór punktów uzasadnia hipotezę o istnieniu liniowej relacji y = A + Bx. 2
200
Stopień, w jakim punkty ( x , y ) , . . . , ( x , y ) przemawiają za liniowym związkiem pomiędzy x i y, wyraża współczynnik korelacji liniowej lub krócej współczynnik korelacji 1
1
N
N
r=
(9.14) aa x
y
gdzie kowariancja a oraz odchylenia standardowe a i a są zdefiniowane równaniami (9.8) i (9.4). Stosując wspomniane definicje, możemy zapisać współczynnik korelacji w postaci xy
x
y
2
X(x,--x)(y,.-y) r = -j= Z(x - x ) X ( y - y )
(9.15)
2
2
1/2
Jak się niebawem przekonamy, liczba r określa stopień zgodności punktów (x ,y ) z linią prostą. Zakresem jej możliwych wartości jest przedział od — 1 do 1. Jeżeli r jest bliskie + 1 , to punkty są rozłożone wzdłuż pewnej prostej; jeżeli r jest bliskie 0, to punkty są nieskorelowane i nie wyznaczają prostej. Aby udowodnić podane stwierdzenia, zauważmy najpierw, że nierówność Schwarza (9.11), \a \ s% o a , pociąga za sobą warunek |r| < 1, czyli i
i
xy
x
y
-1
1.
Następnie załóżmy, że wszystkie punkty (x ,y ) leżą dokładnie na prostej y = A + Bx. W takim razie dla każdego i mamy y = A + Bx , a co za tym idzie także y = A + Bx. Odejmując stronami dwa ostatnie równania, widzimy, że dla każdego i i
i
i
y.-y
=
i
B(x -x). i
Wstawiając te zależności do równania (9.15), stwierdzamy, że
2
Zauważmy jednak, że obecnie ich znaczenie jest nieco odmienne. Na przykład x ,...,x w paragrafie 9.2 oznaczały pomiar jednej liczby i w przypadku gdy pomiary te były dokładne, wartość a była mała. Obecnie x , . . . , x oznaczają pomiary różnych wartości zmiennej i nawet gdy pomiary są precyzyjne, nie ma podstaw, aby sądzić, że a będzie niewielkie. Zauważmy ponadto, że niektórzy autorzy posługują się liczbą r , nazywaną współczynnikiem determinacji. 1
x
1
s
JV
x
2
201
1/2 2
2
X(x -x) B X(x -x) 1
2
)B\
= ±1.
(9.16)
i
Innymi słowy, jeżeli punkty (x ,y ),...,(x ,y ) układają się dokładnie na prostej, to r = + 1 ; znak r zależy od nachylenia prostej (r = 1 dla dodatniego B oraz r = — 1 dla B ujemnego). Nawet wtedy, gdy zmienne x i y naprawdę wiąże zależność liniowa, nie spodziewamy się wcale, aby nasze punkty do świadczalne układały się dokładnie na linii prostej. Tak więc nie oczekujemy, aby r było dokładnie równe + 1 . Z drugiej strony, spodziewamy się, że wartość r będzie bliska + 1 , o ile wierzymy, że x i y wiąże zależność liniowa. Przyjmijmy teraz przeciwne założenie i wyobraźmy sobie, że zmienne x i y są niezależne. Dla dowolnej wartości y , x z równym prawdopodobień stwem może być większe i mniejsze od x. W ten sposób składniki sumy 1
1
JV
JV
3
t
;
^ {x,-x)(y -y) I
i
obecnej w liczniku wyrażenia na r (9.15) z jednakową częstotliwością wy stępują z plusem i minusem, podczas gdy mianownik wyrażenia jest stale dodatni. Tak więc w granicy, gdy liczba wykonanych pomiarów N dąży do nieskończoności, współczynnik korelacji zbliża się do zera. W przy padku skończonej liczby punktów pomiarowych, nie spodziewamy się, że r będzie dokładnie równe zeru; ale oczekujemy, że jego wartość będzie niewielka (o ile obydwie zmienne są rzeczywiście wzajemnie niezależne). Jeżeli dwie zmienne dają, w granicy nieskończenie wielu pomiarów, kowa riancję a równą zeru (a więc i r = 0), to mówimy, że te zmienne są nieskorelowane. Jeżeli dla skończonej liczby pomiarów wartość współczynnika korelacji r = a /a a jest niewielka, to fakt ten przemawia za hipotezą o braku korelacji pomiędzy zmiennymi x i y. Jako przykład niech posłużą oceny z egzaminów i zadań domowych przedstawione na rysunku 9.1. Ich zbiorcze zestawienie zawiera tabela 9.1. Proste obliczenia (zadanie 9.4) wykazują, że współczynnik korelacji obydwu ocen jest równy r = 0,8. Wykładowca uznaje, że jest to wartość „przekonująco bliska" 1, i może w następnym roku oznajmić studentom, że ważne jest wykonywanie zadań domowych, ponieważ istnieje wyraźna korelacja pomię dzy uzyskanymi z nich ocenami a wynikami egzaminu. xy
xy
3
x
y
Jeżeli prosta przebiegałaby dokładnie poziomo, to B = 0, co w równaniu (9.16) dawałoby r = 0/0, a więc wielkość nieoznaczoną. Na szczęście w praktyce ten szczególny przypadek nie jest istotny, ponieważ odpowiada stałej, niezależnej od x, wartości y .
202
Tabela 9.1. • -ient i :
domowa x
t
• f^rnin y
t
Oceny uzyskane przez studentów 2
3
4
5
6
7
8
9
10
90
60
45
100
15
23
52
30
71
88
90
71
65
100
45
60
75
85
100
80
Jeżeli wykładowca stwierdziłby, że współczynnik korelacji r jest bliski zera, nalazłby się w kłopotliwej sytuacji przekonawszy się, że zadania domowe -.zostają bez wpływu na wyniki egzaminu. Odkrycie, że r jest bliskie — 1, byłoby dla wykładowcy jeszcze bardziej niepokojące, gdyż oznaczałoby, że r.nieje korelacja negatywna (anty korelacja) pomiędzy ocenami z zadań domo-ych i egzaminu; innymi słowy studenci sumiennie odrabiający prace domowe wypadają słabo podczas egzaminu.
9.4. Ilościowe znaczenie współczynnika r Z przedstawionego przykładu wynika jasno, że wciąż nie mamy pełnej od powiedzi na początkowe pytanie o poparcie, jakiego punkty pomiarowe .izielają hipotezie o liniowej korelacji pomiędzy zmiennymi x i y. Nasz ;• kładowca uzyskawszy współczynnik korelacji r = 0,8 stwierdził, że jest on przekonująco bliski" 1. Ale w jaki sposób obiektywnie zdecydować, co to znaczy „przekonująco blisko 1"? Czy wartość r = 0,6 byłaby przekonująco rliska 1? A r = 0,4? Odpowiemy na te pytania, posługując się następującym : szumowaniem. Załóżmy, że dwie zmienne są nieskorelowane; to znaczy w granicy nieskoń: zenie wielu pomiarów współczynnik korelacji byłby równy zeru. Dla skońizonej liczby pomiarów jest bardzo mało prawdopodobne, że r będzie dokład nie równe zeru. Ściśle biorąc, można obliczyć prawdopodobieństwo uzys kania r większego od pewnej określonej wartości. Niech P (\r\ > r ) N
0
: znaczą prawdopodobieństwo uzyskania na podstawie N pomiarów nieskore:wanych zmiennych x i y współczynnika r większego od określonej warto>ci r . N a przykład, moglibyśmy obliczyć prawdopodobieństwo 4
0
4
Ponieważ o istnieniu korelacji świadczy r bliskie +1 lub — 1, będziemy rozważać praw: .-podobieństwo otrzymania bezwzględnej wartości \r\ 5= r . 0
203
P {\r\>0,S) N
uzyskania w rezultacie N pomiarów nieskorelowanych zmiennych x i y współ czynnika korelacji przynajmniej tak dużego, jak ten uzyskany przez naszego wykładowcę 0,8. Obliczenie tego prawdopodobieństwa jest dość skomplikowa ne i nie będziemy go w tym miejscu przytaczać. Wyniki dla kilku charakterys tycznych wartości parametrów są przedstawione w tabeli 9.2, a bardziej dokładne zestawienie można znaleźć w dodatku C.
Tabela 9.2. Prawdopodobieństwo P (\r\ > r„), że wyniki N pomiarów dwu nieskorelowanych zmiennych x i y dałyby współczynnik korelacji \r\ > r . Podane wartości wyrażają prawdopodo bieństwo procentowe, puste miejsca oznaczają wartości mniejsze niż 0,05 procent N
0
N
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
3 6 10 20 50
100 100 100 100 100
94 85 78 67 49
87 70 58 40 16
81 56 40 20 3
74 43 25 8 0,4
67 31 14 2
59 21 7 0,5
51 . 12 2 0,1
41 6 0,5
29 1 -
-
-
-
0 0 0 0 0
-
-
Mimo że nie podaliśmy metody obliczania prawdopodobieństw z tabeli 9.2, jesteśmy w stanie zrozumieć ich ogólne zachowanie, jak również od powiednio je wykorzystać. Skrajna lewa kolumna zawiera liczbę pai danych N. (W naszym przykładzie wykładowca zanotował oceny dziesięciu studentów; tak więc N = 10.) Liczby w kolejnych kolumnach wyrażają praw dopodobieństwo, że TV pomiarów nieskorelowanych zmiennych da współczyn nik r nie mniejszy niż ten w nagłówku danej kolumny. I tak prawdopodobień stwo, że dziesięć par nieskorelowanych liczb da współczynnik \r\ ^ 0,8 wynos zaledwie 0,5 procent, co nie jest dużą wartością. Nasz wykładowca może więi powiedzieć, że jest mało prawdopodobne, aby nieskorelowane oceny dał; współczynnik korelacji nie mniejszy niż 0,8, który to w rzeczywistości uzyska] Innymi słowy, jest wielce prawdopodobne, że oceny z zadań domowych i eg zaminu są ze sobą skorelowane. Pewne fakty związane z tabelą 9.2 wymagają komentarza. Wszystkie liczb w kolumnie r = 0 są równe 100 procent, ponieważ wartość \r\ jest zawsz nieujemna; tak więc prawdopodobieństwo otrzymania \r\ 5= 0 wynosi zawsz 100 procent. Podobnie ostatnia z kolumn zawiera zera, ponieważ prawdopc 0
204
5
; rieństwo otrzymania \r\ ^ 1 wynosi O. Liczby w środkowych kolumnach rrrnieniają się wraz z liczbą punktów danych N, co łatwo zrozumieć. Jeżeli konamy zaledwie trzy pomiary, szansa otrzymania na ich podstawie współ.:; unika korelacji \r\ ^ 0,5 jest całkiem duża (mówiąc ściśle 67 procent); ale tzeii przeprowadzimy 20 pomiarów i obydwie wielkości są naprawdę nie• : relowane, szansa otrzymania \r\ ^ 0,5 jest oczywiście bardzo mała 2 procent). Znając prawdopodobieństwa z tabeli 9.2 (lub jej bardziej kompletnego spowiednika w dodatku C), mamy najpełniejszą odpowiedź na pytanie, • jakim stopniu N par wartości (x ,y ) przemawia za istnieniem liniowego związku pomiędzy x i y. Najpierw na podstawie punktów pomiarowych : zliczamy współczynnik korelacji r (indeks o stanowi skrót od „otrzymany"). Następnie, korzystając z jednej ze wspomnianych tabel, możemy znaleźć prawdopodobieństwo P (\r\^\r \), że N nieskorelowanych par da współczyn nik korelacji nie mniejszy niż otrzymany r . Jeżeli prawdopodobieństwo to jest wystarczająco małe", to wnioskujemy, że jest bardzo mało prawdopodobne, aby zmienne x i y były ze sobą nieskorelowane, a więc jest bardzo praw dopodobne, że są one skorelowane. i
i
0
N
0
0
Pozostaje wciąż określenie granicy, poniżej której prawdopodobieństwo jest „wystarczająco małe". Jednym z powszechniejszych wyborów jest uzna wanie współczynnika korelacji r za „istotny", jeżeli prawdopodobieństwo uzyskania współczynnika r takiego, że \r\ U \r \ dla nieskorelowanych zmien nych jest mniejsze niż 5 procent. Korelacja jest czasami określana jako ..wysoce istotna", jeżeli odpowiednie prawdopodobieństwo jest mniejsze od 1 procenta. Niezależnie od dokonanego wyboru, nie dostaniemy jednoznacz nej odpowiedzi, czy zmienne są skorelowane czy nie; zamiast tego dys ponujemy ilościową miarą określającą, jak mało prawdopodobne jest to, że nie są one skorelowane. 0
0
9.5. Przykłady Załóżmy, że wykonujemy pomiary trzech par wartości (x ,y ) i stwierdzamy, że współczynnik korelacji wynosi 0,7 łub ( — 0,7). Czy przemawia to za hipotezą o liniowym związku pomiędzy zmiennymi x i y? i
i
5
Wprawdzie niemożliwe jest uzyskanie \r\ > 1, to jednak możliwe jest \r\ = 1. Jednakże r jest zmienną ciągłą i prawdopodobieństwo otrzymania \r\ równego dokładnie jedności jest równe zeru. Tym samym P (\r\ > 1) = 0. N
205
Korzystając z tabeli 9.2, możemy przekonać się, że nawet w przypadku całkowitego braku korelacji pomiędzy zmiennymi x i y istnieje 51-procentowe prawdopodobieństwo otrzymania \r\ ^ 0,7 dla N = 3. Innymi słowy, jest cał kiem możliwe, że x i y są nieskorelowane; tak więc nie dysponujemy żadnym przekonującym dowodem istnienia korelacji. Nawet uzyskanie współczynnika korelacji równego 0,9 nie jest wystarczające, ponieważ prawdopodobieństwo otrzymania \r\ ^ 0,9 dla trzech pomiarów wynosi 0,29. Jeżeli współczynnik korelacji 0,7 otrzymano by na podstawie sześciu par danych, sytuacja byłaby nieco lepsza, ale wciąż nie wystarczająco dobra. Dla N = 6 prawdopodobieństwo otrzymania \r\ ^ 0,7 w przypadku nieskorelowanych zmiennych wynosi 12 procent. Nie jest to jeszcze wystarczająco mało, aby wykluczyć możliwość braku korelacji pomiędzy x i y. Przeciwnie, jeżeli po wykonaniu 20 pomiarów stwierdzilibyśmy, że współ czynnik korelacji jest równy 0,7, to mielibyśmy poważny argument przemawia jący za istnieniem korelacji, gdyż dla N = 20 prawdopodobieństwo uzyskania |r| 5= 0,7 dla dwóch nieskorelowanych zmiennych wynosi zaledwie 0,1 procent. Jest to z pewnością sytuacja mało prawdopodobna i można by z przekona niem twierdzić, że korelacja została wykazana. W szczególności jest to przypa dek „wysoce istotny", ponieważ odpowiednie prawdopodobieństwo jest mniej sze niż 1 procent.
Zadania Uwaga: Gwiazdka przy zadaniu oznacza, że szkic rozwiązania lub odpowiedź znajduje się na końcu książki. *9.1 (paragraf 9.2). Wykaż, że kowariancja zdefiniowana w (9.8) spełnia nierówność Schwarza (9.11) \a \ < a a xy
x
(9.17)
r
Wskazówka: Przyjmij, że t jest dowolną liczbą, a następnie rozważ funkcję
A
Zl{x-x) + t{y-y)V
> 0.
(9.18)
Ponieważ funkcja A(t) jest nieujemna dla dowolnej wartości t, możesz znaleźć jej minimum A \ , przyrównując pochodną dA/dt do zera. Otrzymana war tość w minimum A i jest większa lub równa zeru. Pokaż, że A = o -{a la ) i wyprowadź stąd (9.17). m n
m n
2
min
206
2
x
2
y
y
9.2 (paragraf 9.2). a) Wyobraź sobie serię N pomiarów dwóch ustalonych długości x i y. :-zaprowadzonych w celu znalezienia wartości pewnej funkcji q(x,y). Załóż. że w pomiarach użyto różnych taśm, ale każdą z par {x ,y ) zmierzono rrzry użyciu tej samej taśmy; to znaczy parę (x ,y ) zmierzono jedną taśmą. T - : e (x ,y ) inną itd. Przyjmując, że głównym źródłem błędów jest skurczenie ix jednych taśm, a rozciągnięcie innych wykaż, że kowariancja o powinna zzzeć wartość dodatnią. i
1
2
i
1
2
xy
b) Rozpatrując tę samą sytuację, pokaż, że a — o o , co oznacza, że o :s:ąga maksymalną wartość dozwoloną przez nierówność Schwarza (9.17). ''•'skazówka: Przyjmij, że i-ta taśma skurczyła się o czynnik
x
y
xy
t
i
t
i
(paragraf 9.3). a) Udowodnij tożsamość
Zx y -Nxy.
£(X;-x)(y -y) =
t
;
t
b) N a tej podstawie pokaż, że współczynnik w (9.15) można zapisać w postaci
1
"
X
f -
Y,x',-Nx'
N
^
korelacji
\ ~] 1/2 •
zdefiniowany
<«9)
£y?-iVy
Wzór ten pozwala często wygodniej znaleźć współczynnik korelacji r, unikając :bliczania indywidualnych odchyleń x — x oraz y —y. i
;
9.4 (paragraf 9.4). a) Sprawdź, że współczynnik korelacji r dla dziesięciu par ocen przed stawionych w tabeli 9.1 wynosi r « 0,8. b) Posługując się tablicą prawdopodobieństw z dodatku C, znajdź praw dopodobieństwo uzyskania współczynnika korelacji \r\ ^ 0,8, jeżeli obydwie zceny nie byłyby ze sobą skorelowane. paragraf 9.4). W zjawisku fotoelektrycznym energia kinetyczna K emitowanych elektronów jest, jak się sądzi, liniową funkcją częstotliwości/ ziżytego światła, K = hf->,
207
gdzie h i 0 są stałymi. W celu sprawdzenia tej zależności studentka mierzy K dla N różnych wartości / i oblicza współczynnik korelacji na podstawie uzyskanych przez siebie wyników. a) Czy zyskała ona argument na poparcie liniowego związku (9.20), wyko nując pięć pomiarów (TV = 5) i otrzymując r = 0,7? b) A w przypadku N = 20 i r = 0,5? paragraf 9.4). a) Zaznacz na wykresie pięć następujących par liczb będących wynikami pomiarów: x = 1 2 3 4 5 y= 4 4 3 2 1 Oblicz ich współczynnik korelacji r. Prostszy ze sposobów polega na wykorzy staniu wzoru (9.19). Czy dane wykazują istotną korelację? Niezbędną tabelę prawdobieństw można znaleźć w dodatku C. b) Powtórz punkt (a) dla następujących danych: x = 1 2 3 4 5 y= 3 1 2 2 1 9.7 (paragraf 9.4). Psycholog, badający związek pomiędzy inteligencją ojców i synów, określa współczynnik inteligencji IQ dziesięciu par ojców i synów, uzyskuje wyniki przedstawione w tabeli 9.3, gdzie x to IQ ojca, y to IQ syna. Czy przedstawione dane przemawiają za istnieniem korelacji pomię dzy inteligencją ojców i synów? i
i
Tabela 9.3 Xi
74 76
83 103
85 99
96 109
98 111
100 107
106 91
107 101
120 120
124 119
R O Z D Z I A Ł
10
ROZKŁAD DWUMIANOWY
Do tej pory zajmowaliśmy się jedynie rozkładem Gaussa zwanym też roz kładem normalnym. Teraz poznamy dwa inne równie ważne przykłady roz kładów: rozkład dwumianowy (w tym rozdziale) i rozkład Poissona (w roz dziale 11).
10.1. Rozkłady wyników doświadczalnych W rozdziale 5 wprowadziliśmy pojęcie rozkładu, czyli funkcji opisującej wzglę dne częstości wszystkich możliwych wyników wielokrotnie powtarzanego po miaru. N a przykład, moglibyśmy N razy zmierzyć okres drgań wahadła T, otrzymując rozkład różnych uzyskanych wartości T. Moglibyśmy także zbadać wzrost h w grupie N obywateli Stanów Zjednoczonych, otrzymując rozkład wzrostu h. Następnie wprowadziliśmy pojęcie rozkładu granicznego, czyli takiego roz kładu, który powstałby, gdyby liczba powtórzeń pomiaru N stała się bardzo duża. Rozkład graniczny można postrzegać jako prawdopodobieństwo wystą pienia w pojedynczym pomiarze dowolnego spośród możliwych wyników: prawdopodobieństwo, że pojedynczy pomiar okresu da pewną określoną wartość T lub prawdopodobieństwo, że wzrost dowolnie wybranego obywate la Stanów Zjednoczonych będzie równy h. Z tego powodu rozkład graniczny jest czasami nazywany rozkładem prawdopodobieństwa. Spośród wielu możliwych rozkładów granicznych interesowaliśmy się do tej pory jedynie rozkładem normalnym, zwanym także rozkładem Gaussa,
209
ponieważ opisywał on rozkład wyników pomiaru narażonego na wpływ wielu źródeł przypadkowych i drobnych błędów. Jako taki rozkład Gaussa jest dla fizyków najważniejszym rozkładem granicznym i w pełni zasługuje na uwagę, którą mu dotychczas poświęciliśmy. Pomimo to istnieją i inne rozkłady niezmiernie ważne zarówno z przyczyn teoretycznych, jak i praktycznych, i dwoma spośród nich zajmiemy się w tym i następnym rozdziale. Obecnie skupimy uwagę na rozkładzie dwumianowym. Rozkład ten nie ma szczególnego znaczenia praktycznego dla fizyka eksperymentatora. Jednakże dzięki swojej prostocie stanowi doskonały punkt wyjścia do wyjaśnienia wielu ogólnych własności rozkładów, a jego znaczenie teoretyczne polega na moż liwości wyprowadzenia zeń tak ważnego rozkładu Gaussa.
10.2. Prawdopodobieństwo w rzutach kośćmi Podstawy rozkładu dwumianowego najłatwiej wyjaśnić posługując się przykła dem. Załóżmy, że nasz „eksperyment" będzie polegał na rzucie trzema kośćmi i określeniu liczby otrzymanych szóstek. Możliwe wyniki to 0, 1, 2 lub 3 szóstki. Jeżeli powtórzymy taki eksperyment bardzo wiele razy, znajdziemy rozkład graniczny, który będzie informować o prawdopodobieństwie, że w po jedynczym rzucie (trzema kośćmi) otrzymamy v szóstek, gdzie v = 0, 1, 2 lub 3. Eksperyment jest na tyle prosty, że można łatwo obliczyć prawdopodo bieństwa wystąpienia każdego z wyników. Zauważmy najpierw, że prawdopo dobieństwo otrzymania szóstki w rzucie jedną kością, jeżeli kości nie zostały sfałszowane, wynosi \. Wróćmy teraz do rzutu trzema kośćmi i zastanówmy się, jakie będzie prawdopodobieństwo jednoczesnego wystąpienia trzech szós tek (v = 3). Ponieważ prawdopodobieństwa otrzymania szóstki dla poszczegól nych kości wynoszą \ i są wzajemnie niezależne, prawdopodobieństwo wy rzucenia trzech szóstek jest równe P(3 szóstki dla 3 kości) = Obliczenie prawdopodobieństwa wyrzucenia dwóch szóstek (v = 2) jest nieco trudniejsze, ponieważ wynik ten można osiągnąć różnymi sposobami. Pierwsza i druga kość może wskazywać szóstkę, a trzecia nie (6, 6, nie 6), albo szóstki mogą być na pierwszej i trzeciej kości, a na drugiej nie (6, nie 6, 6) itd. Nasze rozumowanie podzielimy na dwa etapy. Najpierw zastanowimy się, jakie jest prawdopodobieństwo wystąpienia dwóch szóstek w dowolnym okre-
210
ślonym porządku (np. 6, 6, nie 6). Prawdopodobieństwo, że pierwsza kość będzie wskazywać szóstkę wynosi i. Tak samo dla drugiej kości. Odwrotnie, prawdopodobieństwo niewystąpienia szóstki na trzeciej z kości jest równe g. Tym samym prawdopodobieństwo otrzymania dwóch szóstek w określonej kolejności wynosi
P(6, 6, nie 6) =
Prawdopodobieństwo uzyskania dwóch szóstek w jakiejkolwiek innej kolejno ści jest dokładnie takie samo. N a koniec zauważmy, że istnieją trzy różne iposoby otrzymania dwóch szóstek: (6, 6, nie 6), (6, nie 6, 6) oraz (nie 6, 6, 6). W ten sposób całkowite prawdopodobieństwo uzyskania dwóch szóstek (w dowolnej kolejności) jest równe
(10.1)
P(2 szóstki dla 3 kości) = 3 • ¡6,9%.
Podobne obliczenia dają prawdopodobieństwo 34,7% w przypadku wy stąpienia jednej szóstki dla rzutu trzema kośćmi oraz 57,9% w przypadku braku szóstek. Wyniki przeprowadzonych przez nas rachunków możemy przedstawić rysując rozkład prawdopodobieństwa liczby szóstek dla rzutu :rzema kośćmi, rysunek 10.1. Jest to przykład rozkładu dwumianowego, którego ogólną postać teraz przedstawimy.
57,9 % 50 34,7 % 1
6,9 % 0,5 %
I
.-.•sunek 10.1. Prawdopodobieństwo wystąpienia w rzucie trzema kośćmi v szóstek. Jest ono opisane przez rozkład dwumianowy b„ (v), gdzie n = 3 i p = 1/6 p
211
10.3. Definicja rozkładu dwumianowego Zanim zajmiemy się ogólną postacią rozkładu dwumianowego, musimy wpro wadzić niezbędną terminologię. Po pierwsze wyobraźmy sobie, że przeprowa dzamy n niezależnych prób, takich jak rzut n kośćmi, gra w orła i reszkę za pomocą n monet czy też sprawdzenie n gaśnic. Każda z prób może dać różne wyniki; dla rzutu kością liczba oczek jest zawarta pomiędzy 1 i 6, moneta może upaść orłem lub reszką do góry, gaśnica może zadziałać lub nie. Wynik, którym w danym momencie jesteśmy zainteresowani, nazywamy sukcesem. Takim „sukcesem" może być otrzymanie szóstki, orła lub zadziałanie gaśnicy. Prawdopodobieństwo odniesienia sukcesu w dowolnej próbie oznaczymy przez p, podczas gdy q = 1 — p będzie wyrażało prawdopodobieństwo „pora żki" (tzn. innego wyniku niż ten, którym jesteśmy zainteresowani). Tak więc l
p = i w przypadku wyrzucenia szóstki, p = - dla wylosowania orła, podczas gdy p równe 95 procent rozsądnie określa szansę zadziałania pewnego typu gaśnicy. Pamiętając o wszystkich podanych definicjach, możemy zapytać się o pra wdopodobieństwo wystąpienia v sukcesów w n próbach. Obliczenia, które przeprowadzimy, wykażą, że szukane prawdopodobieństwo jest dane przez tak zwany rozkład dwumianowy P(v sukcesów w n próbach) =
b (v) np
1-2 ••• v W symbolu b„ (v) litera b oznacza rozkład dwumianowy (ang. binomial - dwumianowy), a indeksy n i p przypominają, że rozkład jest zależny od liczby prób n oraz od prawdopodobieństwa p odniesienia sukcesu w pojedyn czej próbie. Rozkład (10.2) jest zwany dwumianowym ze względu na ścisły związek z powszechnie znanym rozwinięciem dwumianowym. W szczególności ułamek p
we wzorze (10.2) nosi nazwę symbolu Newtona i jest oznaczany przez
/n\ \v /
n(n— 1) ••• (w — v + 1) =
l-2-v n\ v! (n — v)!'
212
(10.3)
(10.4)
• j czym skorzystaliśmy z definicji silni, n\ = 1 -2 •••n. ;rołczynniki dwumianowe występują w rozwinięciu dwumianowym n
1
{p + q)" = p + np"- q+
... +q"
(10.5)
(" W które jest słuszne dla dowolnych liczb p i q oraz dodatniej i całkowitej liczby patrz zadanie 10.4). Korzystając z notacji wprowadzonej we wzorze (10.3), możemy zapisać :: zkład dwumianowy w bardziej zwięzłej postaci
P(v sukcesów w n próbach) =
b (v) np
' >y-\ v
(10.6)
gdzie p, jak zwykle, oznacza prawdopodobieństwo wystąpienia sukcesu w poedynczej próbie, a q = 1— p. Wzór (10.6) można otrzymać prowadząc rozumowanie podobne do tego, które znamy z podanego w paragrafie 10.1 przykładu z kośćmi,
P (2 szóstki dla 3 kości) = 3 • (^J
• f-0
(10.7)
Rzeczywiście, podstawiając v = 2, n = 3, p = g, a q = § do wzoru (10.6), otrzymamy wynik identyczny z (10.7). Co więcej, znaczenie poszczególnych czynników w obydwu wzorach jest dokładnie takie samo. Czynnik p wyraża prawdopodobieństwo uzyskania wyłącznie sukcesów w v próbach, q ~ jest prawdopodobieństwem wystąpienia samych porażek w pozostałych n — v. y
n
Współczynnik dwumianowy ^j,
v
jak łatwo można wykazać, wyraża liczbę
możliwych sposobów osiągnięcia v sukcesów w n próbach. To dowodzi, że
213
rozkład dwumianowy (10.6) opisuje dokładnie to prawdopodobieństwo, które go szukaliśmy.
Przykład Załóżmy, że gramy w orła i reszkę jednocześnie czterema monetami (n = 4) i liczymy v otrzymanych orłów. Jakie są prawdopodobieństwa uzyskania różnych możliwych wartości v = 0, 1, 2, 3, 4? Ponieważ prawdopodobieństwo uzyskania orła w pojedynczym rzucie wynosi p =
prawdopodobieństwo, którego szukamy, jest dane przez rozkład
dwumianowy b„ (v) z n = 4 oraz p = q = \, p
P(v orłów w 4 rzutach) =
Poszczególne wartości, które z łatwością można obliczyć (patrz zadanie 10.5), tworzą rozkład przedstawiony na rysunku 10.2.
^50
I
37,5% 25%
o "O oB o 1
25%
6,25%
6,25 %
R y s u n e k 10.2. Rozkład dwumianowy b„ (v) z n = 4 i p = 1/2. Rozkład ten opisuje prawdopodo bieństwo wystąpienia w rzucie czterema monetami v orłów p
Jak widać, najbardziej prawdopodobną liczbą orłów jest v = 2, czego można by oczekiwać. W tym przypadku prawdopodobieństwa są rozłożone symetrycznie względem najbardziej prawdopodobnej wartości. Oznacza to, że prawdopodobieństwo uzyskania trzech orłów jest takie samo jak jednego a prawdopodobieństwo uzyskania czterech takie samo jak żadnego. Jak sij przekonamy, wspomniana symetria występuje jedynie wtedy, gdy p = \.
214
10.4. Własności rozkładu dwumianowego Rozkład dwumianowy b (v) informuje o prawdopodobieństwie osiągnięcia ..sukcesów" w n próbach, jeżeli p jest prawdopodobieństwem odniesienia rakcesu w pojedynczej próbie. W sytuacji gdy wielokrotnie powtarzamy cały eksperyment (składający się z n prób), naturalne jest pytanie o przeciętną :;zbę sukcesów v. Wyraża się ona wzorem v=
Z
(10.8)
vKJv),
v= 0
i jak łatwo policzyć (zadanie 10.8) jest równa
v = np.
(10.9)
Oznacza to, że jeżeli powtórzymy wielokrotnie serię składającą się z n prób, to przeciętna liczba odniesionych sukcesów będzie iloczynem prawdopodobieńst wa sukcesu w pojedynczej próbie (p) i długości serii n, tak jak należałoby się spodziewać. Podobnie można obliczyć standardowe odchylenie
ffv
= V»/>(i-P).
(10.10)
Gdy p = j (jak w przypadku gry w orła i reszkę), przeciętna liczba od noszonych sukcesów jest równa n/2. Ponadto, dla p = \ łatwo wykazać, że
Wv) =W»-v)
(io-ii)
l
(zadanie 10.11). Oznacza to, że dla p = - rozkład dwumianowy jest symetrycz ny względem wartości przeciętnej n/2, co zauważyliśmy już wcześniej na rysunku 10.2. 1
W przypadku ogólnym, gdy p^ -,
rozkład dwumianowy b
(v) nie jest
symetryczny. Na przykład, wykres na rysunku 10.1 jest jawnie niesymetryczny, gdyż najbardziej prawdopodobną liczbą sukcesów jest v = 0, a prawdopodo-
215
bieństwa dla v = 1, 2 i 3 maleją monotonicznie. Także przeciętna liczba sukcesów (v = 0,5) nie pokrywa się z najbardziej prawdopodobną liczbą sukcesów (v = 0). Interesujące jest porównanie rozkładu dwumianowego b (v) z bardziej nam znanym rozkładem Gaussa f (x). Największa być może różnica polega na tym, że w eksperymencie opisywanym przez pierwszy z nich wyniki mają postać dyskretną v = 0, 1, 2,..., n, a w drugim - ciągłą, tak jak mierzona wielkość x. Rozkład Gaussa ma postać symetrycznego piku wycentrowanego na wartości przeciętnej x = X, co oznacza, że wartość przeciętna X jest jednocześnie wartością najbardziej prawdopodobną (to znaczy taką, dla której f , {x) osiąga maksimum). Jak się już przekonaliśmy, rozkład dwumianowy np
X a
1
x a
jest symetryczny tylko wtedy, gdy p = \, a wartość przeciętna z reguły nie pokrywa się z wartością najbardziej prawdopodobną.
Przybliżenie rozkładu dwumianowego rozkładem Gaussa Niezależnie od wszystkich różnic istnieje pewien ważny związek pomiędzy rozkładem dwumianowym a rozkładem Gaussa. Jeżeli weźmiemy rozkład dwumianowy b (v) dla dowolnej ustalonej wartości p, to dla bardzo dużych n, dobrym przybliżeniem b (v) jest rozkład Gaussa f (x) z tą samą wartoś cią przeciętną i odchyleniem standardowym; to znaczy np
np
v
x
K () P
X(T
v
fx,„ ( )
(
d l a
bardzo dużych n),
(10.12)
gdzie X = np
i
a = y/np(l-p).
(10.13)
Do wzoru (10.12) będziemy odnosić się jako do przybliżenia rozkładu dwumianowego rozkładem Gaussa. Nie udowodnimy go teraz , ale wyczer pująco zilustrujemy jego prawdziwość za pomocą rysunku 10.3, który pokazu je kształt rozkładu dwumianowego z p = \ dla trzech coraz to większych wartości n(n = 3, 12, 48). N a każdy z rozkładów dwumianowych nałożono 2
1
Słowo dyskretne
2
znaczy tyle co „oddzielone od siebie" i jest przeciwieństwem słowa ciągłe.
Dowody można znaleźć w podręcznikach: Stuart L. Meyer, Data Analysis for Scientists and Engineers (John Wiley, 1975), s. 226 i Hugh D. Young, Statistical Treatment of Experimental Date: (McGraw-Hill, 1962), dodatek C. [W literaturze polskiej wspomniany dowód można znaleźć na przykład w książce pod va. H. Szydłowskiego Teoria pomiarów (PWN, 1981), paragraf 4.2 - [przyp.
216
tłum)'].
rozkład Gaussa o tej samej wartości przeciętnej i odchyleniu standardowym. W przypadku trzech prób (n = 3) rozkład dwumianowy jest wyraźnie różny od rdpowiadającego mu rozkładu Gaussa. W szczególności rozkład dwumianowy est wyraźnie asymetryczny, podczas gdy krzywa Gaussa jest oczywiście iealnie symetryczna względem swojej wartości przeciętnej. Gdy n = 12, asy metria rozkładu dwumianowego jest znacznie mniej wyraźna i obydwa roz kłady są dość zbliżone do siebie. Gdy n = 48, różnica pomiędzy obydwoma rozkładami jest tak niewielka, że nieomal niewidoczna w skali rysunku 10.3c.
b)
|
«=12
20
o O CL O
10
C)
5
n = 48
10 -
I 2
o 4
8
12
16
20
Rysunek 10.3. Rozkłady dwumianowe dla p = 1/4 i n = 3, 12, 48. Krzywa ciągła na każdym z rysunków odpowiada funkcji Gaussa z tymi samymi wartościami średniej i odchylenia standar dowego
Możliwość przybliżenia rozkładu dwumianowego dla dużych wartości n rozkładem Gaussa jest w praktyce niezmiernie użyteczna. Obliczenia warto ści rozkładu dwumianowego dla n większych od 20 stają się kłopotliwe,
217
podczas gdy wartość funkcji Gaussa jest zawsze łatwa do znalezienia, niezależ nie od wartości X i er. Jako przykład obliczymy prawdopodobieństwa 23-krotnego wystąpienia orła w 36 rzutach monetą. Jest ono dane przez rozkład dwumianowy b (v), ponieważ prawdopodobieństwo otrzymania orła 36A/2
w pojedynczym rzucie wynosi p = \ . Zatem P(23 orły w 36 rzutach) = b
36>1/2
(23)
(10.14) 3
6
36! / O 23113! 2 . ' •
(
l
a
l
5
)
V
3
co, jak wykazują dość żmudne obliczenia , jest równe P(23 orły) = 3,36%. Z drugiej strony, znając wartość przeciętną dla rozkładu np = 18 i odchylenie standardowe a = yjnpil—p) = 3, możemy przybliżyć wyrażenie (10.14) przez funkcję G a u s s a / (23) i po wykonaniu prostych rachunków otrzymamy 1 8
3
P(23 o r ł y ) w /
18>3
= 3,32%.
W niemal wszystkich przypadkach otrzymany wynik można uznać za dosko nałe przybliżenie. Użyteczność przybliżenia rozkładem Gaussa jest jeszcze bardziej oczywista, gdy szukamy prawdopodobieństw dla wielu zdarzeń. N a przykład prawdopo dobieństwo uzyskania co najmniej 23 orłów w 36 rzutach jest dane przez sumę P(23 lub więcej orłów) = P(23 orły)+ P(24 orły)+ ... + P ( 3 6 orłów), której obliczenie jest niezwykle żmudne. Jeżeli jednak skorzystamy z przy bliżenia rozkładu dwumianowego przez rozkład Gaussa, to odpowiednie prawdopodobieństwo będzie łatwe do obliczenia. Ponieważ w przypadku rozkładu Gaussa v jest zmienną ciągłą, prawdopodobieństwo uzyskania v = 23, 24,... można najdokładniej obliczyć jako prawdopodobieństwo P (v$s22,5) uzyskania v>22,5. Zauważmy, że v = 22,5 to 1,5 odchylenia standardowego powyżej wartości przeciętnej 18. (Przypomijmy, że u = 3; tak więc 4,5 = 1,5<7). Prawdopodobieństwo otrzymania wyniku leżącego wyżej niz Gauss
3
Niektóre kalkulatory są wyposażone w funkcję silnia n\ i dzięki temu obliczenie warte;, wyrażenia (10.15) jest łatwe. Jednakże w większości takich kalkulatorów dla n > 7 0 występu przepełnienie, co sprawia, że wbudowana funkcja staje się bezużyteczna.
218
l,5a ponad wartością przeciętną równe jest zaznaczonemu na rysunku 10.4 polu powierzchni pod wykresem funkcji Gaussa. Można je łatwo znaleźć posługując się tablicą z dodatku B: P(23 orły lub w i ę c e j ) * P
Gauss
(v>X + l »
= 6,7%.
Rezultat ten dobrze zgadza się z wynikiem dokładnym (dwie cyfry znaczące), który wynosi 6,6%.
U-l,5ff—»JRysunek 10.4. Prawdopodobieństwo wystąpienia wyniku większego co najmniej o l,5er od średniej, równe jest powierzchni zacieniowanego obszaru pod wykresem krzywej Gaussa
10.5. Rozkład Gaussa dla niepewności przypadkowych rozdziale 5 stwierdziliśmy, że wyniki pomiaru narażonego na działanie iielu małych i przypadkowych błędów podlegają rozkładowi normalnemu. I becnie potrafimy udowodnić ten fakt, posługując się prostym modelem dla r : miar ów spełniających wymienione warunki. Załóżmy, że mierzymy wielkość x, której prawdziwa wartość wynosi X. -przyjmiemy, że występujące błędy systematyczne są możliwe do zaniedbania, ale śmieje n niezależnych źródeł błędów przypadkowych (takich jak skutki paralakczasów reakcji i tym podobnych). Chcąc uprościć rozważania, założymy też, szystkie wspomniane źródła wprowadzają błędy o pewnej ustalonej wielko•-• :', Oznacza to, że każde ze źródeł powoduje zawyżenie albo zaniżenie wyniku E, oraz że obydwie te możliwości występują z jednakowym prawdopodobieńst. . - . p = \. N a przykład, w sytuacji gdy wartość prawdziwa wynosi X i wy-aruje tylko jedno źródło błędów, wówczas możliwymi do uzyskania wynikami 9 . x = X—s oraz x = X + e, obydwa jednakowo prawdopodobne. Jeżeliby s- mapowały dwa źródła błędów, pomiar mógłby dać w wyniku x = X — 2i z:zA obydwa błędy wystąpiłyby ze znakiem minus), x =X (jeden błąd z mir._err_ a drugi z plusem) lub x =X + 2s (jeżeli obydwa błędy byłyby doda.mr rrienione możliwości przedstawione są na rysunkach 10.5a i b. •V przypadku ogólnym, gdy występuje n źródeł błędów, otrzymany -yrr_x raby przybierać wartości od x = X — ns do x = X + ns. W o k r e i o c y n .
przypadku, gdy n źródeł wprowadza błędy dodatnie, a (n — v) ujemne, uzys kany wynik będzie miał wartość
x = X + ve — (n — v)s
(10.16)
= X + (2v-n)s. Prawdopodobieństwo otrzymania tego wyniku dane jest przez rozkład dwu mianowy P(v błędów dodatnich) = &
M/2
(v).
(10.17)
Tym samym możliwe wartości są rozłożone symetrycznie względem wartości prawdziwej X, z prawdopodobieństwami określonymi przez funkcję dwumia nową (10.17). Rysunek 10.5 ilustruje przypadki dla n = 1, 2 i 32.
a)
b)
C)
n=2
« = 32
«=1 o -o o o 1 o , X - e X X
+ e
X - 2e
X
X + 2e
X -
X + lOe
lOe
Rysunek 10.5. Rozkład pomiarów narażonych na wpływ n przypadkowych zaburzeń o wielkości s, dla n — 1, 2, 32. Krzywe ciągłe na rysunkach (b) i (c) odpowiadają rozkładowi Gaussa z tym samym środkiem i szerokością. (Skale osi pionowych na wszystkich trzech rysunkach są różne.)
Obecnie twierdzimy, że jeżeli liczba źródeł błędów n jest duża, a po szczególne błędy £ są niewielkie, to wyniki pomiarów opisane są rozkładem normalnym. W trosce o ścisłość zauważmy, że odchylenie standardowe roz-j kładu dwumianowego jest równe cr = -Jnp(\ — p) = n/4. Tym samym zgodnie z równaniem (10.16) odchylenie standardowe pomiarów x jest równe a = 2sa = fi s/n. Zgodnie z założeniami przejdźmy do granicy z rc->x i £->0, zachowując jednocześnie stałą wartość a = s^fn. Osiągamy w ten sposób dwa skutki. Po pierwsze, zgodnie z tym co powiedzieliśmy w poprzed nim paragrafie, rozkład dwumianowy przechodzi w rozkład Gaussa ze środ kiem w X i szerokością a . Ilustrują to wyraźnie rysunki 10.5b i c, na któryca przedstawiono także odpowiednie funkcje Gaussa. Po drugie, w miarę jak e-»0, możliwe wartości pomiarów zbliżają się do siebie (co również widać na rysunku 10.5), tak że rozkład dyskretny przechodzi w rozkład ciągły, jakim jes oczekiwany rozkład Gaussa.
-J
v
x
v
x
x
220
10.6. Zastosowania: testowanie hipotez t-dząc jaki powinien być rozkład wyników doświadczenia, możemy zapytać zaobserwowane wyniki są rozłożone tak, jak się tego spodziewaliśmy, .zące temu testy rozkładu odgrywają olbrzymią rolę w naukach fizycznych, rszcze większą w biologii i socjologii. Jeden z ważnych i ogólnych testów test x będzie tematem rozdziału 12. Obecnie podamy dwa przykłady •: 5:szych testów, które można stosować w pewnych zagadnieniach związa ła :h z rozkładem dwumianowym. 2
r udanie nowego smaru do nart oraźmy sobie, że producent smarów do nart twierdzi, że opracował » asnie nowy gatunek smaru, który znacznie bardziej niż poprzednio zmniejzi tarcie nart o śnieg. Chcąc zweryfikować to twierdzenie, moglibyśmy wziąć ___esięć par nart i pokryć badanym smarem po jednej narcie z każdej pary. -zepnie moglibyśmy porównać szybkości osiągane przez pokrytą i niepota smarem nartę z każdej pary, pozwalając im zsuwać się po odpowiednim krytym śniegiem stoku. Jeżeli w każdej parze pokryta smarem narta okazałyby się szybsza, dys: rtowalibyśmy silnym argumentem, że nowy smar jest rzeczywiście skuteczny, niestety, rzadko otrzymujemy tak jednoznaczny rezultat; nawet jeżeli się to zarza, chcielibyśmy mieć pewną ilościową miarę wagi takiego dowodu, łasimy więc odpowiedzieć na dwa nasuwające się pytania. Po pierwsze, jak rściowo wyrazić dowód skuteczności (lub nieskuteczności) smaru? Po drugie, dzie umieścić granicę podziału? Czy jeżeli w dziewięciu przypadkach narty okryte smarem okażą się szybsze, będzie to wynik rozstrzygający? A jeżeli edą one szybsze w ośmiu przypadkach? A w siedmiu? Dokładnie takie same pytania pojawiają się w całej gamie podobnych s t ó w statystycznych. Badając skuteczność nawozu, porównywalibyśmy tem: wzrostu roślin nawożonych i nienawożonych. Chcąc przewidzieć, który kandydatów wygra wybory, wylosowalibyśmy próbkę wyborców i porównali zzby zwolenników każdego z kandydatów. Aby odpowiedzieć na postawione pytania, musimy precyzyjnie określić, rago oczekujemy po naszych próbach. W przyjętej terminologii nazywa się to formułowaniem hipotezy statystycznej. W przykładzie ze smarem do nart ajprostszą hipotezą jest hipoteza zerowa, która głosi, że stosowanie nowego maru pozostaje bez znaczenia. Przyjmując tę hipotezę, należy obliczyć praw-
221
dopodobieństwa różnych możliwych wyników testu, a następnie ocenić zna czenie konkretnego wyniku. Załóżmy, że przyjęliśmy hipotezę, według której nowy smar nie wpływa na zachowanie nart. W każdej parze narta smarowana i niesmarowana z równym prawdopodobieństwem mogłaby okazać się szybsza; oznacza to, że prawdopo dobieństwo wygrania wyścigu przez nartę pokrytą smarem jest równe p = \. Prawdopodobieństwo, że narty pokryte smarem wygrają v wyścigów jest określone przez rozkład dwumianowy P(v wygranych w 10 wyścigach) =
b (v) 101/2
10!
/1^
1 (
v!(10-v)!V2
(10.18)
Zgodnie ze wzorem (10.18) prawdopodobieństwo, że nasmarowane narty wygrają we wszystkich dziesięciu wyścigach wynosi P(10 wygranych w 10 wyścigach) = \ —J
«0,1%.
(10.19)
Oznacza to, że w razie prawdziwości hipotezy zerowej jest mało prawdopodob ne, by pokryte smarem narty wygrały we wszystkich dziesięciu wyścigach. Odwrotnie, jeżeli nasmarowane narty rzeczywiście wygrają we wszystkich wyścigach, jest mało prawdopodobne, by hipoteza zerowa była prawdziwa. Ściśle biorąc, prawdopodobieństwo (10.19) jest na tyle małe, że argument na korzyść smaru trzeba by uznać za „wielce istotny", co krótko wyjaśnimy. Załóżmy na razie, że nasmarowane narty wygrały osiem z dziesięciu wyścigów. Możemy obliczyć prawdopodobieństwo dla ośmiu lub więcej wy granych P(8 lub więcej wygranych w 10 wyścigach) = P(8 wygranych) + P(9 wygranych)+ P (10 wygranych) « 5 , 5 % .
(10.20)
Prawdopodobieństwo wygrania przez nasmarowane narty co najmniej ośmiu wyścigów jest ciągle niewielkie, chociaż już nie tak małe jak w przypadku wszystkich dziesięciu wyścigów. Chcąc zdecydować, jaki wniosek wyciągnąć z ośmiu wygranych, powinniś my zauważyć, że istnieją dokładnie dwie możliwości: albo a) przyjęta hipoteza zerowa jest prawdziwa (smarowanie jest bez znacze nia), ale przypadkowo nastąpiło mało prawdopodobne zdarzenie (nasmarowa ne narty wygrały osiem prób); albo
222
bl przyjęta hipoteza zerowa jest fałszywa, a smar jest naprawdę skuteczny. e-stach statystycznych istnieje zasada wybierania pewnego określonego • d: podobieństwa (np. 5 procent) jako granicy, poniżej której wystąpienie ir.-.ia jest uznawane za nieprawdopodobne. Jeżeli prawdopodobieństwo rzeczywistego wyniku (w naszym przypadku co najmniej osiem wygranych) na: duje się poniżej tej granicy, to wybieramy wariant (b), odrzucając hipotezę :erdzając, że eksperyment był istotny. Z reguły wynik uznaje się za istotny, o ile jego prawdopodobieństwo jest rriiejsze niż 5 procent oraz za „bardzo istotny", jeżeli jego prawdopodobieństs : jest mniejsze niż 1 procent. Ponieważ prawdopodobieństwo (10.20) wynosi 5 procent, nie wystarcza to, aby w sposób „istotny" stwierdzić, że smar jest tuteczny. Z drugiej strony, jak wiemy, prawdopodobieństwo dziesięciu wyrranych jest równe 0,1 procent. Ponieważ jest ono mniejsze niż 1 procent, żerny stwierdzić, że dziesięć wygranych stanowi „bardzo istotny" dowód •.ateczności smaru. *
4
Postępowanie ogólne Metody z opisanego właśnie przykładu mają zastosowanie dla dowolnej serii i podobnych ale niezależnych prób, z których każda ma te same dwa możliwe wyniki, „sukces" i „porażkę". Należy zacząć od sformułowania hipotezy, co •v tym przypadku sprowadza się do podania prawdopodobieństwa sukcesu r w dowolnej próbie. Przyjęta wartość p określa spodziewaną przeciętną liczbę sukcesów v = np w n próbach. Jeżeli zmierzona liczba sukcesów v w n pró bach jest zbliżona do np, to brak jest argumentów przeciwko przyjętej hipotezie. (Jeżeli nasmarowane narty wygrałyby pięć spośród dziesięciu wy ścigów, nie byłoby powodów, aby przypuszczać, że smarowanie ma jakiekol wiek znaczenie.) Jeżeli v jest wyraźnie większe od np, to obliczamy (opierając się na przyjętej hipotezie) prawdopodobieństwo uzyskania co najmniej v suk cesów. Jeżeli to prawdopodobieństwo jest mniejsze od wybranego przez nas ..poziomu istotności" (np. 5% lub 1%), to twierdzimy, że otrzymany 5
4
Być może warto podkeślić dużą prostotę testu, który właśnie opisaliśmy. Mogliśmy mierzyć różne dodatkowe parametry, takie jak czas uzyskany przez każdą z nart, maksymalne szybkości poszczególnych nart i tym podobne. Zamiast tego, ograniczyliśmy się do stwierdzenia, która z nart wygrała wyścig. Testy, które nie posługują się dodatkowymi parametrami nazywane są testami nieparametrycznymi. Ich przewaga polega na dużej prostocie i szerokim zakresie zastosowań. 5
Jak zwykle v = np jest średnią liczbą sukcesów spodziewaną w przypadku wielokrotnego powtarzania serii n prób.
223
wynik jest nieprawdopodobnie mały (o ile przyjęta hipoteza jest prawdziwa) i tym samym hipoteza powinna zostać odrzucona. W ten sam sposób po stępujemy, jeżeli otrzymana liczba sukcesów jest wyraźnie mniejsza od np. Argumentacja jest podobna poza tym, że powinniśmy obliczyć prawdopodo bieństwo uzyskania co najwyżej v sukcesów. Zgodnie z tym, czego powinniśmy się spodziewać, taka procedura nie daje jednoznacznej odpowiedzi, czy przyjęta hipoteza jest na pewno prawdziwa czy na pewno fałszywa. To co dostajemy to pewna liczbowa miara zasadności uzyskanych wyników w świetle przyjętej hipotezy; tak więc jesteśmy w stanie przyjąć pewne obiektywne chociaż dowolne kryteria odrzucenia hipotezy. Gdy eksperymentator formułuje wniosek na podstawie podobnego rozumowania, jest ważne, aby wyraźnie określił kryteria, którymi się posłużył, oraz obliczoną wartość prawdopodobieństwa, co pozwoli przyszłemu Czytelnikowi ocenić zasadność wyciągniętych wniosków. 6
Prognozy przedwyborcze Jako drugi przykład posłużą nam wybory, w których uczestniczą dwaj kan dydaci, A i B. Załóżmy, że kandydat A głosi, jakoby szeroko zakrojone badania wykazały, że popiera go 60 procent całego elektoratu. Wyobraźmy sobie także, że kandydat B zwraca się z prośbą o sprawdzenie tego twierdzenia (oczywiście z nadzieją, że odsetek wyborców popierających A okaże się wyraźnie mniejszy od 60 procent). W tym przypadku hipoteza statystyczna stwierdza, że 60 procent elek toratu opowiada się za kandydatem A; tak więc prawdopodobieństwo, że przypadkowo wybrany wyborca będzie zwolennikiem A wynosi p = 0,6. Ma jąc świadomość, że nie jesteśmy w stanie dotrzeć do wszystkich wyborców, starannie dobieramy losową próbkę liczącą 600 osób i pytamy o ich sympatie. Jeżeli 60 procent rzeczywiście popiera kandydata A, to spodziewana liczba jego zwolenników w naszej próbce powinna wynosić np = 600 • 0,6 = 360. Czy znajdując 330 zwolenników A możemy twierdzić, że w sposób przekonujący zakwestionowaliśmy hipotezę o 60-procentowym poparciu dla Al Szukając odpowiedzi na to pytanie, zauważmy, że (zgodnie z przyjętą hipotezą) prawdopodobieństwo popierania A przez v wyborców dane jesi rozkładem dwumianowym
6
Jak za chwilę pokażemy, w niektórych eksperymentach właściwym prawdopodobieństwer jest „dwukrańcowe" prawdopodobieństwo uzyskania wartości v odbiegającej w dowolnym kierunk od np o wartość równą lub większą od wartości faktycznie uzyskanej.
224
P(v wyborców popiera A) = b (v), n
(10.21)
gizie n = 600 i p = 0,6. Ponieważ n ma tak dużą wartość, z dobrym skutkiem rrożna zastąpić rozkład dwumianowy rozkładem Gaussa ze środkiem • np = 360 i z odchyleniem standardowym a = ^Jnp(l—p) = 12 v
P(v wyborców popiera 4 )
=/
v
3 6 0
,i2( )-
(10.22)
Przeciętna liczba zwolenników A wynosi 360. Tak więc faktyczna liczba rvolenników A w naszej próbce (to znaczy 330) jest o 30 mniejsza od rrzewidywanej. Ponieważ odchylenie standardowe wynosi 12, uzyskany przez nas wynik znajduje się w odległości 2,5 odchylenia standardowego poniżej spodziewanej przeciętnej. Prawdopodobieństwo uzyskania takiego lub jeszcze rrrniejszego wyniku (na podstawie tablicy znajdującej się w dodatku B) jest rawne 0,6 procent . Otrzymany wynik należy uznać za „bardzo istotny" i na roziomie 1 procent możemy bez wahania odrzucić hipotezę jakoby A był popierany przez 60 procent elektoratu. 7
Ten przykład ilustruje dwie ogólne cechy testów tego rodzaju. Po pierwsze, r.wierdziwszy, że 330 wyborców opowiada się za A (czyli o 30 mniej niż byśmy się spodziewali), obliczyliśmy prawdopodobieństwo, że liczba zwolenników A wyniesie 330 lub mniej. Na początku można by zastanawiać się nad prawdopodobieństwem, że liczba zwolenników A wynosi dokładnie v = 330. Jednakże ma ono małą wartość (0,15 procent); nawet prawdopodobieństwo : trzymania najbardziej prawdopodobnego wyniku (v = 360) ma niewielką wartość (3,3 procent). Szukając właściwej miary, mówiącej jak dalece nie spodziewany jest wynik v = 330, postanowiliśmy wziąć pod uwagę wszystkie Tsyniki nie większe od 330. Otrzymany wynik v = 330 był o 30 mniejszy od wyniku przewidywanego = 360. Prawdopodobieństwo wyniku mniejszego co najmniej o 30 od przedętnej jest czasami określane jako „prawdopodobieństwo jednostronne", po nieważ odpowiada powierzchni pod jednym z krańców krzywej rozkładu, tak jak na rysunku 10.6a. W niektórych testach właściwym prawdopodobieńst wem jest „prawdopodobieństwo dwustronne" odpowiadające wynikom róż niącym się od wartości przeciętnej co najmniej o 30 w obydwie strony; na rysunku 10.6b jest to prawdopodobieństwo uzyskania v ^ 3 3 0 łub 0 390. Wybór w teście statystycznym prawdopodobieństwa jedno- lub dwustronnego 7
Mówiąc ściśle, powinniśmy obliczyć prawdopodobieństwo dla v < 330,5, ponieważ w roz kładzie Gaussa zmienna v ma charakter ciągły. Jest 2,46 a poniżej średniej; tak więc poprawna wartość prawdopodobieństwa wynosi 0,7 procent, ale tak mała różnica nie ma żadnego wpływu na wniosek końcowy.
225
zależy od rozpatrywanej alternatywy hipotezy pierwotnej. W opisanym przy kładzie chcieliśmy wykazać, że kandydata A popiera mniej niż 60 procent wyborców; tak więc właściwe było prawdopodobieństwo jednostronne. Jeżeli zamierzalibyśmy udowodnić, że część elektoratu popierająca A różni się od 6 0 procent (w którąkolwiek stronę), to właściwe byłoby prawdopodobieństwo dwustronne. W praktyce wybór właściwego prawdopodobieństwa jest zwykle dość prosty. W każdym przypadku eksperymentator powinien wyraźnie okreś lić, którego prawdopodobieństwa używa, jaki poziom istotności wybrał i jaką wartość prawdopodobieństwa otrzymał. Mając te informacje przyszły Czytel nik będzie w stanie ocenić znaczenie, jakie ma dla niego podany wynik.
a)
b)
R y s u n e k 10.6. a) Jednostronne prawdopodobieństwo wystąpienia wyniku mniejszego co najmniej o 30 od średniej, b) Dwustronne prawdopodobieństwo wystąpienia wyniku różniącego się co najmniej o 30 od średniej. (Skala nie jest zachowana.)
Zadania Uwaga: Gwiazdka przy zadaniu oznacza, że szkic rozwiązania lub odpowiedź znajduje się na końcu książki. 10.1 (paragraf 10.2). Przeanalizuj opisane w paragrafie 10.2 doświadczenie polegające na rzucaniu trzema kośćmi. Znajdź prowdopodobieństwa niewystąpienia żadnej szóstki oraz wyrzucenia jednej szóstki. Sprawdź wartości wszystkich czterech prawdopodobieństw przedstawionych na rysunku 10.1. *10.2 (paragraf 10.2). a) Oblicz prawdopodobieństwa P(v szóstek w dwóch rzutach) dla wszyst kich możliwych wartości v w rzucie dwiema kośćmi. Przedstaw je w postaci histogramu. b) Wykonaj to samo polecenie dla rzutu czterema kośćmi. 10.3 (paragraf 10.3). a) Oblicz 5!, 6!, 251/23!. b) Posługując się związkiem n\ = (n + l)!/(n+1), pokaż, że 0! powinnc zostać zdefiniowane jako równe 1.
226
c) Pokaż, że współczynniki dwumianowe zdefiniowane w równaniu (10.3) są równe / n\ n\ \ v J v!(n — v)! ' *10.4 (paragraf 10.3). Oblicz współczynniki dwumianowe
dla v = 0, 1,
2, 3 oraz ^ \ dla v = 0 , 4 . Następnie zapisz rozwinięcie dwumianowe (10.5) wyrażenia (p + q)" dla n = 3 i n = 4. 10.5 (paragraf 10.3). a) Oblicz i przedstaw w postaci histogramu funkcję rozkładu dwumiano wego b
n
(v) dla n=A,p
= \i wszystkich możliwych wartości v.
b) Powtórz część (a) dla n = 4 i p = $. *10.6 (paragraf 10.3). Do szpitala przyjęto czterech pacjentów cierpiących na chorobę, w której śmiertelność wynosi 80 procent. Korzystając z wyników zadania 10.5b, znajdź prawdopodobieństwa następujących zdarzeń: a) żaden z pacjentów nie przeżyje, b) przeżyje dokładnie jeden pacjent, c) przeżyje co najmniej dwóch pacjentów. *10.7 (paragraf 10.3). Znajdź prawdopodobieństwa otrzymania v szóstek w rzucie pięcioma kośćmi dla v = 0, 1,..., 5. 10.8 (paragraf 10.4). Udowodnij, że średnia liczba sukcesów n
^= Z
v
v
K () P
dla rozkładu dwumianowego wynosi np. Istnieje szereg sposobów wykonania tego zadania, z których najprostszy można streścić następująco: Wypisz rozwinięcie dwumianowe (10.5) dla (p + q) . Ponieważ jest ono prawdziwe dla dowolnych wartości p i q, możesz obliczyć jego pochodną względem p. Jeżeli przyjmiesz teraz p + q = 1 i po mnożysz stronami przez p, otrzymasz pożądany wynik. n
*10.9 (paragraf 10.4). Odchylenie standardowe dowolnego rozkładu /(v) jest zdefiniowane jako 2
( V ~ V ) 2
2
.
2
Udowodnij, że jest to równoważne v — (v) .
227
*10.10 (paragraf 10.4). Wykorzystaj wynik zadania (10.9), aby wykazać, że dla rozkładu dwumianowego bnp(v) Cv =
np{\-p).
(Skorzystaj z metody opisanej w zadaniu 10.8, dwukrotnie różniczkując wzglę dem p.) 10.11 (paragraf 10.4). Udowodnij, że dla p = \ rozkład dwumianowy spełnia zależność
Ki (v) /2
=
b
n , i / 2 (
n
-
v
) ;
co znaczy, że rozkład jest symetryczny względem v = n/2. 10.12 (paragraf 10.4). Przybliżenie rozkładu dwumianowego rozkładem Gaussa jest doskonałe dla wielkich n, ale i nadspodziewanie dobre dla małych n (szczególnie jeżeli p jest bliskie j). W celu zilustrowania tego faktu, oblicz ^4,1/2 ( ) ( d ^ = 0, 1,..., 4) w sposób ścisły oraz posługując się rozkładem Gaussa. Porównaj otrzymane wyniki. v
v
*10.13 (paragraf 10.4). Korzystając z przybliżenia rozkładu dwumianowe go rozkładem Gaussa, znajdź prawdopodobieństwo 15-krotnego wystąpienia orła w 25 rzutach monetą. Oblicz to samo prawdopodobieństwo w sposób ścisły i porównaj wyniki. *10.14 (paragraf 10.4). Korzystając z przybliżenia rozkładu dwumianowe go rozkładem Gaussa, znajdź prawdopodobieństwo co najmniej 18-krotnego wystąpienia orła w 25 rzutach monetą. (Obliczając prawdopodobieństwo określone rozkładem Gaussa, należy znaleźć prawdopodobieństwo dla v>17,5.) Porównaj wynik z wartością dokładną, która wynosi 2,16 procent. 10.15 (paragraf 10.6). Załóżmy, że podczas testów smaru do nart opisa nych w paragrafie 10.6, nasmarowane narty wygrały dziewięć z dziesięciu prób. Zakładając, że smarowanie pozostaje bez znaczenia, oblicz prawdopodobieńst wo wystąpienia przynajmniej dziewięciu wygranych. Czy dziewięć wygranych stanowi istotny dowód (poziom 5 procent), że smar jest skuteczny? Czy dowód jest „bardzo istotny" (poziom 1 procent)? *10.16 (paragraf 10.6). Chcąc zbadać skuteczność nowego nawozu, ogrod nik wybrał 14 par podobnych roślin i poddał po jednej roślinie z każdej pary działaniu nawozu. Po dwóch miesiącach 12 spośród nawożonych roślin było w lepszej kondycji niż ich nienawożeni partnerzy (pozostałe dwie rośliny były
228
w gorszym stanie). Zakładając, że nowy nawóz naprawdę nie odgrywa roli, oblicz prawdopodobieństwo czysto przypadkowego uzyskania co najmniej 12 sukcesów. Czy dwanaście sukcesów stanowi istotny dowód (poziom 5 procent), że nowy nawóz jest skuteczny? Czy jest to dowód „bardzo istotny" (poziom 1 procent)? 10.17 (paragraf 10.6). Wiadomo, że 25 procent pewnego gatunku nasion zazwyczaj kiełkuje. W celu zbadania nowego „stymulatora kiełkowania" wysiano-100 nasion i poddano je jego działaniu. Czy można wyciągnąć wniosek Ina poziomie 5 procent istotności), że stymulator jest skuteczny, o ile wykiełkowały 32 nasiona? *10.18 (paragraf 10.6). W jednej ze szkół 420 spośród 600 uczniów zdaje standardowy test matematyczny, którego ogólnokrajowy współczynnik zdawalności wynosi 60 procent. Określ, ilu uczniów tej szkoły powinno według Ciebie zdać test, zakładając, że nie wykazują oni szczególnych uzdolnień w tym kierunku. Jakie jest prawdopodobieństwo, że test zda przynajmniej 420 uczniów? Czy szkoła ma podstawy do stwierdzenia, że jej uczniowie są szczególnie dobrze przygotowani do zdawania tego testu?
R O Z D Z I A Ł
11
ROZKŁAD POISSONA
W rozdziale tym zapoznamy się z trzecim przykładem rozkładu granicznego rozkładem Poissona. Opisuje on wyniki eksperymentów polegających na zliczaniu zdarzeń występujących losowo, ale z określoną przeciętną często tliwością. Rozkład Poissona odgrywa szczególną rolę w fizyce atomowej i jądrowej, gdzie rejestruje się przypadki rozpadu nietrwałych atomów i jąder.
11.1. Definicja rozkładu Poissona Aby poznać przykład rozkładu Poissona, wyobraźmy sobie, że dysponujemy próbką pewnej substancji promieniotwórczej. Posługując się licznikiem Geigera zliczamy v elektronów wyemitowanych w wyniku rozpadu promieniotwórczego w przeciągu jednej minuty. Jeżeli licznik jest sprawny, to nie będzie występowała niepewność związana z określeniem liczby v. Pomimo to, powtarzając doświad czenie, nieomal na pewno będziemy otrzymywać różne wartości v. Zmiany liczby v nie są wyrazem niedokładności w procesie zliczania, lecz stanowią nieodłączną cechę zjawiska rozpadu promieniotwórczego. Każde jądro promieniotwórcze ma określone prawdopodobieństwo roz padu w dowolnym jednominutowym okresie. Znając to prawdopodobieństwo oraz liczbę jąder znajdujących się w naszej próbce, moglibyśmy obliczyć oczekiwaną średnią liczbę rozpadów w przeciągu jednej minuty. Jednakże rozpad każdego jądra zachodzi w przypadkowym momencie i w dowolnym jednominutowym okresie liczba aktów rozpadu może się różnić od oczekiwa nej średniej liczby.
230
Nasuwa się pytanie: Jaki rozkład liczby zliczeń v w okresie jednominuto wym powinniśmy otrzymać powtarzając pomiar wielokrotnie (wymieniając próbkę, jeżeli zużyje się ona w sposób zauważalny)? Jeżeli zapoznaliście się z rozdziałem 10, zauważycie, że właściwym rozkładem jest rozkład dwumiano wy. Jeżeli mamy n jąder i prawdopodobieństwo rozpadu każdego z nich wynosi p, to prawdopodobieństwo v rozpadów jest po prostu prawdopodo bieństwem v „sukcesów" w n „próbach", czyli b {v). Jednakże w eksperymen tach, którymi zajmujemy się obecnie, występuje pewne istotne uproszczenie. Liczba „prób" (czyli jąder) jest olbrzymia (n ~ 1 0 ) , a prawdopodobieństwo „sukcesu" (czyli rozpadu) jest niewielkie (często zbliżone do p ~ 1 0 ~ ) . W tych warunkach (duże n i małe p) rozkład dwumianowy, jak można pokazać, jest nierozróżnialny od pewnej prostszej funkcji zwanej rozkładem Poissona. W szczególności można wykazać, że np
20
20
P(v zliczeń w dowolnym określonym czasie) = p (v), /ł
(H-l)
przy czym rozkład Poissona, p„(v), jest dany wzorem
(11.2)
P„(v)
W przedstawionej definicji \i jest pewnym dodatnim parametrem (u > 0), który, jak się wkrótce przekonamy, jest oczekiwaną średnią liczbą zliczeń w wybranym przedziale czasu, a v! oznacza funkcję silnia (0! = 1). Nie będziemy w tej książce zajmować się wyprowadzeniem rozkładu Poissona (11.2), ale ograniczymy się do stwierdzenia, że jest to właściwy rozkład w odniesieniu do eksperymentów, którymi obecnie się zajmujemy. Chcąc poznać znaczenie parametru a we wzorze (11.2), wystarczy, abyśmy obliczyli średnią liczbę zliczeń v, którą spodziewalibyśmy się otrzymać w przy padku wielokrotnego powtarzania doświadczenia. Szukana średnia jest równa 1
CO
CO
. .V
v= Ivp„(v)= I v e - * ^ : . v=0
1
v=0
V
(11.3)
"
Wyprowadzenie można na przykład znaleźć w następujących podręcznikach: Hugh D.
Young, Statistical
Treatment
Analysis for Scientists
of Experimental
and Engineers
tłum.) Siegmund Brandt Metody
Data (McGraw-Hill, 1962) §8, Stuart L. Meyer, Data
(John Wiley, 1975), s. 207 lub (w języku polskim -
statystyczne
i obliczeniowe
analizy
danych
przyp.
(PWN, 1976), §5.4.
231
Pierwszy składnik sumy można pominąć (ponieważ jest on równy 0), a v/v! można zastąpić przez l/(v —1)!. Jeżeli przed znak sumy wyciągniemy wspólny czynnik pe~^, otrzymamy
Suma nieskończonego szeregu
-
daje funkcję wykładniczą e'*. Tym samym czynnik wykładniczy e ' ' we wzorze (11.4) ulega redukcji z sumą szeregu i otrzymujemy prosty wynik w postaci
v=
(11.6)
fi.
Oznacza to, że parametr p charakteryzujący rozkład Poissona p^iy) jest średnią liczbą zliczeń dla wielokrotnie powtarzanego eksperymentu.
11.2. Własności rozkładu Poissona Rysunek 11.1 przedstawia rozkład Poissona dla p. = 0,8 oraz p = 3. Na rysunku 11.la, odpowiadającym przypadkowi p = 0,8, widzimy, że najbardziej prawdopodobne wartości zliczeń to v = 0 i 1 (przy czym prawdopodobieństwo v = 0 jest nieco większe), chociaż prawdopodobieństwa uzyskania v = 2 lub 3 mają także znaczące wartości. N a rysunku 11.Ib, odpowiadającym p = 3,
a)
b)
£
50
i •a
20
fi =0,!
« =3
0>
o -a o P. o •a
10
I &
0
_L
0 0
1
2
3
4
5
v
0
1
2
3
4
5
6
7
8
9
v
Rysunek 11.1. Przykłady rozkładu Poissona odpowiadające średnim liczbom zliczeń ^ = 0,8 i 3
232
najbardziej prawdopodobne wartości zliczeń to 2 i 3, z zakresem znaczących prawdopodobieństw pomiędzy v = 0 a v = 7. N a obydwu rysunkach rozkłady są wyraźnie asymetryczne. Jeżeli będziemy rozważać eksperyment z większą przeciętną liczbą zliczeń, np. ¡1 = 9, tak jak przestawiono na rysunku 11.2, rozkład stanie się bardziej symetryczny względem wartości średniej. W rzeczywistości można udowodnić, że w miarę jak fi -» co, rozkład Poissona staje się coraz bardziej symetryczny i zbliża się do rozkładu Gaussa z tymi samymi wartościami średniej i od chylenia standardowego. N a rysunku 11.2 krzywa przerywana odpowiada rozkładowi Gaussa z wartością średnią 9 i z takim samym odchyleniem standardowym. Jak widać, nawet wtedy, gdy \i jest równe zaledwie 9, rozkład Poissona jest bardzo bliski odpowiedniego rozkładu Gaussa, przy czym niewielka rozbieżność jest związana z pozostającą asymetrią rozkładu Poisso na. Postaramy się pokrótce wykazać, że możliwość zastępowania rozkładu Poissona odpowiednim rozkładem Gaussa dla dużych wartości \i jest niezwyk le użyteczna. 2
o
N 10
\
/
5.
\
/ O'-
u=9
\
/
ja o -a o
--,
- 'i*****L 10
1
l^b*L-**
15
Rysunek 11.2. Rozkład Poissona dla p. — 9. Krzywa przerywana odpowiada rozkładowi Gaussa z tym samym środkiem i odchyleniem standardowym
Następną interesującą własność rozkładu Poissona dostrzeżemy obliczając odchylenie standardowe a . Jak wiemy z rozdziału 4, c jest średnią kwad ratów odchyleń (v — v) . Tak więc 2
v
2
lub (korzystając z wyniku zadania 10.9)
7-(V) . 2
(11.7)
Patrz Stuart L. Meyer, op. cit., s. 227.
233
Poprzednio obliczyliśmy, że v jest równe fi. Podobne v = f i + fi (patrz zadanie 11.6). Tak więc er = fi, czyli 2
2
obliczenia
dają
2
fi.
(11.8)
Oznacza to, że rozkład Poissona ze średnią liczbą zliczeń fi ma odchylenie standardowe yfpi. Wynik (11.8) jest w praktyce niezwykle użyteczny. Jeżeli jednokrotnie przeprowadzimy eksperyment polegający na zliczaniu i otrzymamy wynik v, to łatwo się przekonać (korzystając z zasady największego prawdopodobieństwa - tak jak w zadaniu 11.9), że najlepsze przybliżenie oczekiwanej średniej liczby zliczeń fi jest a = v. Ze wzoru (11.8) bezpośrednio wynika, że najlepszym przybliżeniem odchylenia standardowego jest po prostu . Innymi słowy, jeżeli przeprowadzimy pomiar liczby zdarzeń w pewnym przedziale czasu, uzyskując wynik v, to możemy podać ostateczną odpowiedź na pytanie o spodziewaną przeciętną liczbę zliczeń w danym przedziale czasu w postaci nv
v±V^-
(11-9)
Ten sam wynik został podany bez dowodu w równaniu (3.2). Jeżeli prowadzili byśmy zliczanie przez dłuższy czas, otrzymalibyśmy większą wartość v. W myśl (11.9) oznaczałoby to większą niepewność y/v . Jednakże niepewność względ na, określona jako niepewność względna = zmniejszałaby się wraz z wydłużaniem czasu zliczania. Interesujące wnioski wynikają z porównania ze sobą rozkładów Poissona i Gaussa. Po pierwsze, podczas gdy rozkład Gaussa f (x) jest ciągły, ponieważ x jest zmienną ciągłą, rozkład Poissona jest dyskretny (podobnie jak rozkład dwumianowy), ponieważ v = 0, 1, 2,... Po drugie, rozkład Gaussa fx a ( ) J określony przez dwa parametry, wartość średniej X oraz sze rokość a, podczas gdy rozkład Poissona p (v) jest zdefiniowany przez poje dynczy parametr fi, gdyż, jak się właśnie przekonaliśmy, szerokość er rozkładu Poissona jest automatycznie określona przez wartość średnią fi (to znaczy a = s/fJ.). N a koniec wreszcie, jeżeli będziemy zajmować się rozkładem PoisXa
x
e s t
/(
v
v
234
sona, którego przeciętna liczba zliczeń p jest duża, to dyskretny charakter v staje się coraz mniej istotny i, tak jak już wspomnieliśmy w związku z rysunkiem 11.2, rozkład Poissona (podobnie jak dwumianowy) jest dobrze przybliżany przez rozkład Gaussa f , (x) tą samą średnią i szerokością. To znaczy z
x a
P,(v)*/i,,(x)
(dla dużych p),
(11.10)
gdzie X = u
oraz
a =
Przybliżenie (11.10) nosi nazwę przybliżenia gaussowskiego rozkładu Poissona. Jest ono analogiczne do odpowiedniego przybliżenia rozkładu dwumianowego (omawianego w paragrafie 10.4) i jest użyteczne w tych samych warunkach, czyli wtedy, gdy występujące parametry przyjmują duże wartości. By lepiej to zilust rować, wyobraźmy sobie, że chcemy obliczyć rozkład Poissona dla p = 64. Prawdopodobieństwo uzyskania, na przykład, 72 zliczeń jest dane wzorem P(72 zliczenia) =
Pt54
(72) = e
- 6 4
-^-,
(11.11)
który po żmudnych obliczeniach prowadzi do wyniku P(72 zliczenia) = 2,9%. Jednakże w myśl wzoru (11.10) prawdopodobieństwo (11.11) można z dużą dokładnością przybliżyć przez P(72 zliczenia) « 764,8(72), które to, jak łatwo obliczyć, prowadzi do wyniku P(72 zliczenia) w 3,0%. Jeżeli chcielibyśmy wprost obliczyć prawdopodobieństwo uzyskania co najmniej 72 zliczeń w opisanym eksperymencie, to niezwykle żmudne oblicze nia dałyby wynik P ( v ^ 7 2 ) = p (72) + r> (73)+... = 17,3%. 64
64
Korzystając z przybliżenia (11.10), wystarczy, abyśmy obliczyli prawdopodo bieństwo otrzymania v ^ 71,5 (ponieważ w rozkładzie Gaussa zmienna v jest
235
ciągła). Skoro 71,5 jest o 7,5, czyli o 0,94
(v
>
71,5)
=
P
G a u s s (v > X + 0,94cr) = 17,4%, co w większości przypadków można uznać za doskonałe przybliżenie.
11.3. Przykłady Jak już podkreślaliśmy, rozkład Poissona ma zastosowanie do wyników, eksperymentu polegającego na zliczaniu zdarzeń występujących losowo, ale z określoną przeciętną częstotliwością. W ramach zajęć na pierwszej pracowni fizycznej dwoma najczęściej spotykanymi ćwiczeniami tego rodzaju jest zlicza nie rozpadów jąder promieniotwórczych oraz zliczanie cząstek tworzących promieniowanie kosmiczne. Kolejnym ważnym przykładem jest eksperyment polegający na bada niu oczekiwanego rozkładu granicznego, którym może być rozkład Gau ssa, rozkład dwumianowy lub sam rozkład Poissona. Każdy z rozkładów granicznych zawiera informację na temat oczekiwanej liczby zdarzeń pew nego rodzaju w wielokrotnie powtarzanych eksperymentach. (Na przykład rozkład Gaussa f , ( ) określa, jaka część wyników pomiarów wielkości x powinna się znaleźć w przedziale pomiędzy x = a i x — b). W praktyce otrzymywana liczba rzadko kiedy zgadza się z wartością oczekiwaną. Za miast tego wykazuje ona fluktuacje zgodne z rozkładem Poissona. W szcze gólności, jeżeli oczekiwana liczba zdarzeń pewnego typu wynosi n, można oczekiwać, że otrzymywane liczby zdarzeń będą różnić się od n o wielkość rzędu y/n. x
x a
W wielu przypadkach rozsądnie jest oczekiwać, że rozkład wyników będzie w przybliżeniu zgodny z rozkładem Poissona. Liczba jaj składanych w ciągu godziny na farmie drobiarskiej oraz dobowa liczba urodzeń w szpitalu powin ny przynajmniej w przybliżeniu spełniać rozkład Poissona (chociaż należałoby się także spodziewać pewnych okresowych wahań). Chcąc sprawdzić to założe nie, należałoby rejestrować dane w przeciągu wielu ustalonych okresów Przedstawiając uzyskane wyniki na wykresie i porównując je z rozkładem Poissona, można naocznie przekonać się o zgodności obydwu rozkładów W celu bardziej wymiernego porównania, należałoby posłużyć się testem yopisanym w rozdziale 12.
236
Rejestracja promieniowania kosmicznego Jako konkretny przykład zastosowania rozkładu Poissona weźmy ekspery ment polegający na obserwacji promieniowania kosmicznego. „Promieniowa nie" to stanowią w rzeczywistości cząstki naładowane, takie jak protony i cząstki a, wnikające do atmosfery ziemskiej z przestrzeni kosmicznej. Nie które z nich docierają aż do powierzchni Ziemi i mogą być rejestrowane v laboratorium (na przykład przy użyciu licznika Geigera). W zagadnieniu, które przedstawimy, skorzystamy z faktu, że liczba cząstek docierających do ianej powierzchni w określonym czasie powinna podlegać rozkładowi Pois sona. Student A zapewnia, że zmierzył liczbę cząstek promieniowania kosmicz nego docierających do licznika Geigera w ciągu minuty. Utrzymuje on, że pomiary przeprowadził starannie, wielokrotnie je powtarzając i stwierdził, że przeciętnie w ciągu minuty do licznika dociera dziewięć cząstek, z „zaniedbywalną" niepewnością. Aby sprawdzić ten wynik, student B mierzy liczbę :ząstek docierających do licznika w ciągu minuty i otrzymuje wynik 12. Czy podważa to wiarygodność wyniku studenta A mówiącego, że oczekiwana częstotliwość wynosi dziewięć? Studentka C, chcąc wykonać jeszcze dokładniejszy test, zlicza cząstki docierające w ciągu dziesięciu minut. N a podstawie wyników studenta A spo dziewa się otrzymać w wyniku 90, ale w rzeczywistości otrzymuje 120. Czy ten fakt podaje w wątpliwość wyniki studenta Al Przyjrzyjmy się najpierw wynikowi studenta B. Jeżeli A nie myli się, to spodziewana średnia liczba zliczeń jest równa 9. Ponieważ zliczenia powinny spełniać rozkład Poissona, odchylenie standardowe wynosi y/9 = 3. Wynik studenta B, czyli 12, leży więc w odległości zaledwie jednego standardowego odchylenia od wartości średniej 9. Nie jest to oczywiście wystarczająca roz bieżność, by zakwestionować wynik A. Dokładniej, spodziewając się, że praw dopodobieństwo dowolnego wyniku v jest dane przez pg(v), możemy obliczyć całkowite prawdopodobieństwo uzyskania wyniku różniącego się od 9 nie mniej niż o 3. Jak się okazuje, wynosi ono 40% (patrz zadanie 11.11). Jest aczywiste, że wynik B nie jest wcale zaskakujący i A nie ma podstaw, aby się niepokoić. Wynik studentki C stanowi zupełnie inny problem. Jeżeli A ma rację, to C powinna otrzymać 90 zliczeń w ciągu 10 minut. Ponieważ, jak sądzimy, mamy do czynienia z rozkładem Poissona, odchylenie standardowe powinno wynosić y/90 = 9,5. Tak więc wynik C jest oddalony o przeszło trzy od chylenia standardowe od wartości przewidywanej przez A, równej 90. Przy tak dużych liczbach rozkład Poissona praktycznie nie różni się od rozkładu
237
Gaussa, tak więc od razu możemy skorzystać z tablicy znajdującej się w dodat ku A i stwierdzić, że prawdopodobieństwo uzyskania liczby zliczeń różniącej się od średniej co najmniej o trzy odchylenia standardowe wynosi 0,3%. Oznacza to, że jeżeli student A nie myli się, to zaobserwowanie 120 zliczeń przez C jest bardzo mało prawdopodobne. Odwracając problem, możemy stwierdzić, że niemal na pewno gdzieś tkwi błąd. Być może A nie wykonał pomiarów z taką dokładnością, jak to utrzymywał. Być może licznik A lub C ile działał wprowa dzając do jednego z tych pomiarów błąd systematyczny. Być może wreszcie A przeprowadził swoje pomiary w okresie, w którym natężenie strumienia promieniowania kosmicznego było naprawdę mniejsze niż zazwyczaj.
Zadania Uwaga: Gwiazdka przy zadaniu oznacza, że szkic rozwiązania lub odpowiedz znajduje się na końcu książki. * 11.1 (paragraf 11.1). a) Oblicz rozkład Poissona p (v) dla p = 0,5 i v = 0, 1, wykonaj histogram p^(v) w zależności od v. b) Powtórz polecenie (a) dla p = 1. c) Powtórz polecenie (a) dla p = 2. M
6, a następnie
• 1 1 . 2 (paragraf 11.1). a) Rozkład Poissona, podobnie jak wszystkie inne rozkłady, musi spełniać „warunek normalizacji", GO
I
p„(V) = i.
v = 0
Warunek ten gwarantuje, że całkowite prawdopodobieństwo zaobserwowania wszystkich możliwych wartości v musi być 1. Udowodnij ten warunek. [Pa miętaj, że rozwinięcie e^ w nieskończony szereg dane jest wzorem (11.5).] b) Różniczkując (11.12) względem p, a następnie mnożąc przez p, poda inny dowód zależności v = p zapisanej w równaniu (11.6). 11.3 (paragraf 11.1). Właściciel fermy drobiarskiej stwierdził w przeciąga 28 dni, że pomiędzy 10:00 a 10:30 przed południem stado kur składa przecię:nie 2,5 jaja. Zakładając, że liczba składanych jaj spełnia rozkład Poissona ze średnią p = 2,5, oblicz w ilu dniach kury nie złożyły żadnego jaja pomiędz;. 10 a 10:30. W ilu dniach spodziewałbyś się złożenia co najwyżej dwóch jaj" W ilu co najmniej trzech?
238
20
* 11.4 (paragraf 11.1). Pewna próbka promieniotwórcza zawiera 1,5-10 jąder, z których każde rozpada się z prawdopodobieństwem p = 10" w cza sie jednej minuty. a) Jaka jest oczekiwana średnia liczba rozpadów p, zachodzących w prób ce w ciągu jednej minuty? b) Oblicz prawdopodobieństwo p^(v) zaobserwowania v rozpadów w cią gu jednej minuty dla v = 0, 1, 2, 3. c) Jakie jest prawdopodobieństwo zaobserwowania co najmniej czterech rozpadów w ciągu jednej minuty? 2 0
* 11.5 (paragraf 11.1). Oczekiwana liczba rozpadów w ciągu jednej minuty dla pewnej próbki promieniotwórczej wynosi 3. Student bada liczbę rozpadów dla 100 niezależnych jednominutowych okresów, uzyskując wyniki zawarte w tabeli 11.1. a) Wykonaj histogram tych wyników, rysując f (częstość pomiarów, w których uzyskano v) jako funkcję v. b) N a tym samym wykresie przedstaw oczekiwany rozkład pi{v). Czy dane pasują do oczekiwanego rozkładu? v
Tabela 11.1 liczba rozpadów v krotność obserwacji
0 19
5
1 23
2
3 21
4 14
5 12
6 3
7
8 1
2
9 0
11.6 (paragraf 11.2). a) Wykaż, że średnia v dla rozkładu Poissona p^(v) jest równa v = p + p. [Najprostszym tego sposobem jest dwukrotne zróżniczkowanie tożsamości (11.12) względem p.] b) Następnie udowodnij, że odchylenie standardowe v, wynosi a = y/p• [Skorzystaj z tożsamości (11.7).] 2
2
2
v
*11.7 (paragraf 11.2). Oblicz średnią v i odchylenie standardowe a dla danych z zadania 11.5. Porównaj uzyskane wyniki z oczekiwanymi wartoś ciami 3 i y/J. v
11.8 (paragraf 11.2). Wiadomo, że przeciętna częstotliwość rozpadów jąder w pewnej próbce wynosi z grubsza 20 na minutę. Jak długo musiałby trwać pomiar, jeżeli chciałbyś zmierzyć tę częstotliwość z dokładnością do 4%?
239
* 11.9 (paragraf 11.2). a) Wyobraźmy sobie, że zliczamy cząstki promieniowania kosmicznego docierające do licznika w ciągu jednej minuty i uzyskujemy wynik v . Zakładając, że liczba cząstek spełnia rozkład Poissona p^(v), gdzie p jest nieznaną oczekiwaną średnią liczbą zliczeń, zapisz prawdopodobieństwo uzyskania otrzymanego wyniku v . Skorzystaj z zasady największego praw dopodobieństwa, aby udowodnić, że najlepszym przybliżeniem p jest 0
0
/Unp = v . 0
(Pamiętaj, że najlepszym przybliżeniem p jest wartość, dla której prawdopodo bieństwo uzyskania zaobserwowanej liczby zliczeń v jest największe.) b) Wyobraźmy sobie, że wykonujemy N niezależnych pomiarów v ,...,v ; uzasadnij w podobny sposób, że w tym przypadku ^ jest średnią 0
1
fl
n p
1 J
N
* 1=1
* 11.10 (paragraf 11.2). Oczekiwania średnia liczba zliczeń w pewnym eksperymencie wynosi p = 16. a) Korzystając z przybliżenia rozkładem Gaussa (11.10), oszacuj prawdo podobieństwo uzyskania dziesięciu zliczeń. Porównaj to oszacowanie z wyni kiem dokładnym pi6(10). b) Korzystając z przybliżenia rozkładem Gaussa, oszacuj prawdo podobieństwo uzyskania co najwyżej dziesięciu zliczeń. [Pamiętaj, żeby uwzględnić fakt ciągłości rozkładu Gaussa, obliczając P a a s s ( v < 10,5). Szuka ne prawdopodobieństwo można znaleźć korzystając z tablicy znajdującej się w dodatku B . ] Oblicz dokładny wynik i porównaj go z otrzymanym przy bliżeniem. Zauważ, że nawet w przypadku tak małych wartości jak p = 16, przy bliżenie gaussowskie daje całkiem dobre wyniki, zaoszczędzając - przynaj mniej w punkcie (b) - wielu uciążliwości związanych ze ścisłymi obliczeniam: U
* 11.11 (paragraf 11.3). a) Oblicz prawdopodobieństwa p<>(v) uzyskania v zliczeń dla v = 7, 8, 9, K oraz 11 w doświadczeniu, w którym oczekiwana średnia liczba zliczeń wyno si 9. b) Oblicz następnie prawdopodobieństwo uzyskania liczby zliczeń różnią cej się od średniej 9 co najmniej o 3. Czy otrzymanie 12 zliczeń wywołało:; podejrzenia, że oczekiwana średnia liczba zliczeń jest w rzeczywistości różna od 9?
240
11.12 (paragraf 11.3). Studentka, posługując się licznikem Geigera, mierzy aktywność źródła promieniotwórczego. Umieszcza źródło w pobliżu licznika, który rejestruje 1600 zliczeń w ciągu 10 minut. Po usunięciu źródła stwierdza, że licznik zlicza w dalszym ciągu, chociaż ze zmniejszoną częstotliwością. Fakt dalszego zliczenia tłumaczy jako wynik obecności promieniowania tła, takiego jak promieniowanie kosmiczne czy radioaktywne skażenie laboratorium. W celu określenia natężenia tego promieniowania pozostawia licznik na dziesięć minut i uzyskuje wynik 400 zliczeń. a) Ile wynoszą niepewności obydwu wyników zliczania? b) Oblicz obydwie częstotliwości zliczeń, wyrażone w zliczeniach na minu tę, oraz ich niepewności. c) Oblicz różnicę obydwu wyników z części (b) w celu określenia częstot liwości zliczeń związanych ze źródłem oraz jej niepewność.
R O Z D Z I A Ł
12
TEST i ZGODNOŚCI ROZKŁADÓW
Zdobyliśmy już bogate doświadczenie w posługiwaniu się rozkładami granicz nymi. Pod tym pojęciem rozumiemy funkcje, które opisują oczekiwany roz kład wyników wielokrotnie powtarzanego eksperymentu. Istnieje wiele róż nych rozkładów granicznych, właściwych dużej liczbie możliwych eksperymen tów. W różnych działach fizyki najczęściej są spotykane trzy, omówione juz przez nas, rozkłady: rozkład Gaussa (czyli normalny), rozkład dwumianowy i rozkład Poissona. W ostatnim rozdziale zastanowimy się, w jaki sposób stwierdzić czy wyniki przeprowadzonego eksperymentu podlegają przewidywanemu rozkła dowi granicznemu. W tym celu wyobraźmy sobie, że wykonujemy pewien eksperyment, dla którego znamy, jak sądzimy, oczekiwany rozkład wyników Załóżmy ponadto, że powtarzamy eksperyment kilkakrotnie, notując otrzy mane wyniki. Postawione pytanie brzmi: Jak sprawdzić, czy otrzymany rozkład jest zgodny z oczekiwanym rozkładem teoretycznym? Przekonamy się, że na to pytanie można odpowiedzieć posługując się prostą metodą zwaną testem chi-kwadrat, czyli y . 2
12.1. Wprowadzenie do testu /
2
Zacznijmy od przedstawienia konkretnego przykładu. Załóżmy, że przeprowa dziliśmy 40 pomiarów x ,..., x zasięgu x pocisków wystrzeliwanych z pew nego działka i otrzymaliśmy wyniki zebrane w tabeli 12.1. Załóżmy ponadto, że mamy podstawy przypuszczać, iż pomiary powinny podlegać rozkładowi 1
242
40
Gaussa f (x), co jest z pewnością naturalnym założeniem. W eksperymen tach tego typu środek rozkładu X i jego szerokość a nie są zazwyczaj znane z góry. Naszym pierwszym krokiem jest więc obliczenie na podstawie posiada nych 40 wyników najlepszych przybliżeń wymienionych wielkości: Xa
40
/
(najlepsze przybliżenie X) = x = Z x / 40 t
= 730,1 cm
(12.1)
oraz (najlepsze przybliżenie a)
/Zfc-x)
2
V
39 46,8 cm.
(12.2)
Tabela 12.1. Zmierzone wartości x (w cm) 731 739 678 698
772 780 748 770
771 709 689 754
681 676 810 830
722 760 805 725
688 748 778 710
653 672 764 738
757 687 753 638
733 766 709 787
742 645 675 712
Możemy już zapytać, czy faktyczny rozkład wyników x , . . . , x jest zgodny z hipotezą, mówiącą, że pomiary podlegają rozkładowi Gaussa f (x), dla którego wartości X i a wyznaczyliśmy. Aby udzielić odpowiedzi, należy obliczyć, jaki powinien być rozkład 40 wyników w przypadku słusz ności naszej hipotezy, a następnie porównać go z rozkładem otrzymanym w doświadczeniu. Pierwsza trudność wynika z ciągłości zmiennej x; nie można mówić o oczekiwanej liczbie pomiarów równych pewnej określonej wartości x. Zamiast tego powinniśmy rozważać ich liczbę zawartą w pewnym przedziale a
4 0
Xa
t
243
Tabela 12.2. Jeden z możliwych wyborów przedziałów w przypadku danych z tabeli 12.1. Ostatni wiersz zawiera liczby wyników zaliczonych do każdego z przedziałów Numer przedziału k Wartości x zaliczane do przedziału
1 x
2 —a
4
3
X—o
X
+
X +
a
czyli x< 683,3
czyli 683,3
czyli 730,1 < x < 7 7 6 , 9
czyli 776,9
8
10
16
6
Liczba wyników 0 w przedziale
k
1
dziale. Otrzymaną liczbę będziemy oznaczać przez O . Dla danych z naszego przykładu otrzymane liczby 0 , 0 , 0 , 0 wypisane zostały w dolnym wierszu tabeli 12.2. Następnie, przyjmując, że pomiary podlegają rozkładowi normalnemu (z wyznaczonymi wartościami X i er), możemy obliczyć oczekiwa ną liczbę pomiarów E w fe-tym przedziale. N a koniec wreszcie musimy określić, w jakim stopniu otrzymane w eksperymencie liczby O zgadzają się z oczekiwanymi liczbami E . k
1
2
3
4
k
k
k
Obliczenie oczekiwanych liczb pomiarów E nie jest skomplikowane. Pra wdopodobieństwo, że dowolny pomiar znajdzie się w przedziale a
l s
2
3
4
2
Pi
Pl
X-a
3
X+a
X
Rysunek 12.1. Prawdopodobieństwa P , . . . , P otrzymania wyniku należącego do jednej z czte rech komórek. fe = l , . . . , 4 odpowiadają powierzchniom czterech zaznaczonych obszarów pec wykresem funkcji Gaussa 1
4
odpowiadają łącznie, jak wiadomo, 68 procentom; tak więc prawdopodobieńs two otrzymania wyniku w obrębie jednego z dwóch środkowych przedziale wynosi 34 procent; to znaczy P = P3 = 0,34. Dwa zewnętrzne obszary skłaca2
1
Jeżeli zmierzona wartość leży dokładnie na granicy pomiędzy przedziałami, można p n sać po połowie pomiaru do każdego z przedziałów.
244
ją się na pozostałe 32 procent; tak więc P = P = 0,16. Obliczenie ocze kiwanych liczb E sprowadza sie do prostego mnożenia przez całko witą liczbę pomiarów, N = 40. Oczekiwane przez nas liczby pomiarów w poszczególnych przedziałach zawiera tabela 12.3. Fakt, że liczby E nie są całkowite, przypomina nam, że „liczba oczekiwana" nie jest wartością, którą naprawdę spodziewamy się otrzymać w doświadczeniu; jest to raczej wartość przeciętna, jakiej spodziewalibyśmy się powtarzając wielokrotnie eksperyment. 1
4
k
k
Tabela 12.3. Oczekiwane E i otrzymane O liczby wyników w przedziałach dla 40 pomiarów z tabeli 12.1 k
h
1
2
3
4
16%
34%
34%
16%
6,4 8
13,6 10
13,6 16
6,4 6
Przedział k Prawdopodobieństwo P Oczekiwana liczba zdarzeń k
E =NP k
k
Faktyczna liczba zdarzeń O
k
Nasze zadanie polega obecnie na sformułowaniu wniosku, w jakim stopniu oczekiwane liczby E odpowiadają liczbom otrzymanym w doświadczeniu O dolny wiersz tabeli 12.3). Nie należy oczywiście spodziewać się wystąpienia idealnej zgodności pomiędzy E i O w przypadku skończonej liczby pomia rów. Z drugiej strony, o ile nasza hipoteza, że pomiary odlegają rozkładowi Gaussa, jest słuszna, to w pewnym sensie różnice k
k
k
k
r
O -E k
(12.3)
k
powinny być niewielkie. Odwrotnie, jeżeli okazałoby się, że odchylenia O — E >ą duże, to podejrzewalibyśmy, że hipoteza nie jest prawdziwa. Chcąc sprecyzować stwierdzenie, że odchylenie O — E jest „małe" lub .duże", powinniśmy określić, jakiej wartości O — E spodziewalibyśmy się, gdyby pomiary rzeczywiście podlegały rozkładowi Gaussa. Na szczęście nie est to trudne zadanie. Jeżeli wyobrazimy sobie wielokrotne powtarzanie całej serii czterdziestu pomiarów, to liczbę wyników w fc-tym przedziale O można Taktować jako wynik eksperymentu polegającego na zliczaniu, czyli takiego, a ki opisaliśmy w rozdziale 11. Uzyskiwane w poszczególnych powtórzeniach artości O powinny mieć średnią E i - jak byśmy się spodziewali - powinny k
k
k
k
k
k
k
k
k
"-ktuować wokół E z odchyleniem standardowym rzędu ypE . k
k
Tak więc
245
liczbami, które powinniśmy porównywać są odchylenie O — E i oczekiwana K
K
wartość jego fluktuacji SJE/. Przedstawione rozumowanie prowadzi nas do zbadania stosunku (12.4i
Dla części przedziałów k powyższy stosunek będzie przyjmował wartości dodatnie, a dla innych ujemne; dla niektórych k może on być znacząco większy od jedności, ale dla większości powinien być rzędu jedności lub mniejszy. W celu zbadania hipotezy (czy pomiary podlegają rozkładowi Gaussa) natura lną metodą postępowania jest obliczenie dla każdego k kwadratu wielkości (12.4), a następnie przeprowadzenie sumowania po wszystkich przedziałach k = 1 , . . . , n (w naszym przypadku n =4). Procedura ta określa liczbę znaną jako chi kwadrat, n
2
(O -E )
x = I 2
K
K
(12.5i
2
Powinno być oczywiste, że liczba x jest wiarygodną miarą zgodności pomię dzy otrzymanym i oczekiwanym rozkładem. Jeżeli y = 0, zgodność jest doskonała; oznacza to, że O = E dla wszystkich przedziałów k, co jest zdarzeniem wprost nieprawdopodobnym. N a ogół, poszczególne składniki sumy (12.5), których jest n, powinny być zbliżone do 1. Tak więc, jeżeli 1
K
K
2
X ^n 2
(y rzędu n lub mniejsze), otrzymany i oczekiwany rozkład są zgodne w stop niu, w jakim można się było tego spodziewać. Innymi słowy, jeżeli x ^ n, nie mamy podstaw, aby wątpić, że pomiary podlegały rozkładowi, którego się spodziewaliśmy. Z drugiej strony, jeżeli 2
2
X »n 2
(x znacznie większe od liczby przedziałów), otrzymane i oczekiwane liczby różnią się wyraźnie i nie ma powodów, aby sądzić, że wyniki pomiarów podlegają przewidywanemu rozkładowi. Występujące w naszym przykładzie liczby zebrano w tabeli 12.4, a proste obliczenia z ich wykorzystaniem dają
246
X
2
=
ź ^ k=l (1,6)
2
(O -E ) E ^k (-3,6) k
2
= 6,4
k
2
13,6
, (2,4) , ( - 0 , 4 ) + - H— 13,6 6,4 2
2
(12.6)
= 1,80.
2
Tabela 12.4. Obliczenie % dla danych z tabeli 12.1 Numer przedziału k
2
1
Przedział
x
X -<7
4
3 X
X
+
a
Oczekiwana liczba zdarzeń 6,4
13,6
13,6
8
10 -3,6
16
6,4
Faktyczna liczba zdarzeń
o
k
1,6
O ~E k
k
2,4
6 -0,4
2
Ponieważ wartość y wynosząca 1,80 jest mniejsza od liczby składników sumy (równej 4), brak nam podstaw, aby wątpić w hipotezę, która mówi, że wyniki pomiarów podlegają rozkładowi normalnemu.
12.2. Ogólna definicja testu f Nasza uwaga skupiała się dotychczas na konkretnym przykładzie: 40 pomia rach ciągłej zmiennej x, oznaczającej zasięg pocisku wystrzeliwanego z pew nego działka. Zdefiniowaliśmy wielkość x i przekonaliśmy się, że stanowi ona przynajmniej zgrubną miarę zgodności pomiędzy rozkładem wyznaczonym eksperymentalnie a rozkładem Gaussa, który zgodnie z oczekiwaniami spo dziewaliśmy się otrzymać. Obecnie wykażemy, że w ten sam sposób liczbę y można zdefiniować i wykorzystać w przypadku wielu innych doświadczeń. Rozważmy dowolny eksperyment polegający na pomiarze wielkości x, w którego przypadku istnieją powody, aby spodziewać się wystąpienia pew nego określonego rozkładu wyników. Wyobraźmy sobie, że pomiary powtó rzyliśmy wielokrotnie (JV razy), i podzieliwszy rozstęp zmiennej x na n prze działów k = 1 , . . . n, zliczamy wyniki O , które znalazły się w /c-tym przedziale. Zakładając, że pomiary rzeczywiście podlegają przewidywanemu rozkładowi, 2
2
k
247
obliczamy oczekiwane liczby pomiarów E przypadające na fc-ty przedział. W końcu obliczamy j dokładnie w ten sam sposób, jak we wzorze (12.5) k
2
n
(O -E f k
k
(12.7)
4=1
2
Przybliżone znaczenie j jest w zawsze takie samo jak w poprzednim przy kładzie. To znaczy, jeżeli j <,n, zgodność pomiędzy przewidywanym i wy znaczonym eksperymentalnie rozkładem jest zadowalająca; jeżeli % y>n, wy stępuje istotna rozbieżność. Sposób wyboru przedziałów, które służą do obliczenia x zależy w pewnej mierze od charakteru eksperymentu, z którym mamy do czynienia. W szcze gólności zależy on od tego, czy mierzona wielkość x jest ciągła czy dyskretna. Kolejno omówimy obydwa te przypadki. 2
2
2
Pomiary zmiennej ciągłej Przykład omówiony w paragrafie 12.1 odnosił się do ciągłej zmiennej x i nie wiele można dodać ponad to, co zostało już powiedziane. Jedynym rozkładem granicznym, jakim zajmowaliśmy się dotychczas w związku ze zmienną ciągłą, jest rozkład Gaussa, ale można oczywiście spodziewać się otrzymania wielu innych rozkładów. N a przykład, w licznych eksperymentach w fizyce atomo wej i jądrowej, oczekiwany rozkład mierzonej wielkości x (najczęściej energii) jest rozkładem Lorentza
f{x)
2
2
*(x-X)
+
y
>
gdzie X i y są pewnym stałymi. Niezależnie od oczekiwanego rozkładu f(x), całkowite pole powierzchni pod wykresem f(x) w zależności od x jest równe 1, a prawdopodobieństwo otrzymania wyniku pomiędzy x = a i x = b jest po prostu polem wycinka powierzchni pomiędzy a i b, b
P(a
248
= \f(x)
dx.
Tak więc, jeżeli k-ty przedział znajduje się pomiędzy x = a i x = a , oczekiwana liczba wyników w fe-tym przedziale (po wykonaniu N pomiarów) k
k+1
wynosi E =
N-P(a
k
=
k
k+1
(12.8)
Nff(x)dx.
W paragrafie 12.4, w którym zajmiemy się ilościowym wykorzystaniem testu x > zobaczymy, że oczekiwana liczba E nie powinna być zbyt mała. Chociaż nie istnieje ściśle określone dolne ograniczenie, wartość E nie powin na być mniejsza niż 5, 2
k
k
(12.9)
E >5. k
Wynika stąd, że musimy tak dobrać granice przedziałów, aby E określone równaniem (12.8) spełniało podany warunek. Przekonamy się także, że sama liczba przedziałów nie powinna być zbyt mała. W przykładzie z paragrafu 12.1, w którym przewidywanym rozkładem jest rozkład Gaussa o nieznanym z góry środku X i szerokości a, test x nie będzie funkcjonować (jak się przekonamy), jeżeli liczba przedziałów będzie mniejsza niż 4; oznacza to, że we wspomnia nym przykładzie musiał być spełniony warunek k
2
(12.10)
O 4. 2
Łącząc ze sobą warunki (12.9) oraz (12.10), widzimy, że testu % nie można z pożytkiem stosować w odniesieniu do podobnych eksperymentów, jeżeli liczba wszystkich posiadanych wyników jest mniejsza od 20.
Pomiary zmiennej dyskretnej Załóżmy teraz, że mierzymy wielkość dyskretną, taką jak znana nam już liczba szóstek w wielokrotnych rzutach kośćmi. W praktyce, najczęściej spotykanym rodzajem zmiennej dyskretnej jest liczba całkowita (taka jak liczba szóstek). Zmienną dyskretną będziemy oznaczać przez v zamiast x (którego to symbolu używamy dla zmiennej ciągłej). W przypadku rzutu pięcioma kośćmi v może przyjmować następujące wartości v = 0, 1,..., 5 i nie zachodzi potrzeba dzielenia ich na przedziały. Wystarczy policzyć, ile razy otrzymaliśmy każdy z sześciu możliwych wyników. Można to wyrazić inaczej, mówiąc, że dokonali śmy podziału na sześć przedziałów, z których każdy zawiera jeden możliwy wynik.
249
Pomimo to, często korzystnie jest zebrać kilka różnych wartości tak, aby tworzyły jeden przedział. Rozważmy następujący przykład. Oczekiwań} w przypadku 200 powtórzeń rzutu pięcioma kośćmi (patrz prawdopodobień stwa obliczone w zadaniu 10.7) rozkład wyników jest przedstawiony w pierw szej kolumnie tabeli 12.5. Widzimy, że przewidywane liczby rzutów dających cztery lub pięć szóstek są odpowiednio równe 0,6 i 0,03 - obydwie liczby wyraźnie mniejsze od wymaganych w przypadku testu x pięciu zdarzeń w każdym przedziale. Trudność tę można łatwo pokonać gromadząc w jed nym przedziale zdarzenia odpowiadające v = 3, 4 i 5. W ten sposób otrzymali śmy cztery przedziały, k = 1, 2, 3, 4, które zostały opisane wraz z oczekiwany mi wartościami E w ostatnich dwóch kolumnach tabeli 12.5. 2
k
Tabela 12.5. Oczekiwane krotności występowania v szóstek (v = 0, 1,..., 5) dla 200 rzutów pięcioma kośćmi
Wynik
Brak szóstki Jedna szóstka Dwie Trzy Cztery Pięć
Oczekiwana liczba zdarzeń
Numer przedziału k
Oczekiwana liczba zdarzeń w przedziale E k
80,4 80,4 32,2 6,4 0,6 0,03
1 2 3
80,4 80,4 32,2
4
7,0
Dokonawszy wyboru przedziałów w opisany przed chwilą sposób, mog libyśmy policzyć zdarzenia O , które znalazły się w każdym z nich. Następnie moglibyśmy obliczyć wartość x i sprawdzić, czy uzyskany i oczekiwany rozkład są ze sobą zgodne. Wiemy, że w tym eksperymencie oczekiwanym rozkładem jest rozkład dwumianowy b ( v ) pod warunkiem, że kości nie są k
2
5>1/6
obciążone (tak, że p jest naprawdę równe 5). Tak więc w tym przypadku test rozkładu stanowi w gruncie rzeczy sprawdzian, czy kości są dobre czy obciążone. W każdym eksperymencie odnoszącym się do zmiennej dyskretnej można wybrać przedziały tak, by zawierały po jednej z możliwych wartości, za kładając, że oczekiwana liczba zdarzeń dla każdego z przedziałów jest przynaj mniej równa wymaganej liczbie 5. W przeciwnym razie należy utworzyć większy przedział obejmujący kilka różnych wyników tak, aby uzyskać do stateczną liczbę oczekiwanych zdarzeń.
250
Inne formy testu x
2
2
Notację x stosowaliśmy już we wcześniejszych fragmentach książki, w przypa dku równań (7.6) i (8.5); mogła być też zastosowana w odniesieniu do sumy kwadratów w (5.42). We wszystkich wymienionych przypadkach y jest sumą kwadratów w ogólnej postaci 2
,
" / wartość zmierzona —wartość oczekiwana i \ odchylenie standardowe
(12.11)
2
We wszystkich tych przypadkach j jest miarą zgodności pomiędzy zmierzo nymi a oczekiwanymi wartościami pewnej zmiennej. Jeżeli zgodność jest dobra, j J przybliżeniu równe n; jeżeli zgodność jest zła, % jest znacznie większe od n. Niestety, % możemy wykorzystywać do badania zgodności, o ile znamy wartości oczekiwane i odchylenie standardowe i - co za tym idzie - potrafimy obliczyć wartości (12.11). Najczęściej spotykanym przypadkiem, w którym wielkości te znane są z wystarczającą dokładnością, jest rodzaj testu opisany w tym rozdziale; jest to test rozkładu z wartościami E danymi przez rozkład i odchyleniem standardowym danym przez *J E . Pomimo to test x bardzo szerokie zastosowanie. Przypomnijmy, na przykład, zagadnienie oma wiane w rozdziale 8, pomiary dwu zmiennych x i y, gdzie y jest, jak przypuszczamy, pewną określoną funkcją x, 2
e s t
w
2
2
k
2
m
a
k
i jak na przykład y = A + Bx). Załóżmy, że dysponujemy N parami wyników ix,-, y ), przy czym niepewność x jest możliwa do zaniedbania, a niepewności y są równe a . W tym przypadku rolę oczekiwanej wartości y spełnia wartość funkcji f(x ), a więc moglibyśmy zbadać, jak dobrze y odpowiada funkcji f(x), obliczając t
i
t
t
t
t
* - c ( -
v
,
" r )
!
Wszystkie poczynione uprzednio uwagi odnoszące się do oczekiwanej wartości - mają zastosowanie do tej liczby, podobnie jak możliwe jest wykorzystanie :estów ilościowych opisanych w następnych paragrafach. Nie będziemy zajmo wać się obecnie tym ważnym zastosowaniem, ponieważ jest rzadkością, aby na poziomie wstępnej pracowni fizycznej niepewności a były znane z wystarczającą : : kładnością, ale zainteresowanych odsyłamy do zadania 12.14. t
251
12.3. Stopnie swobody i zredukowany test x
2
Wykazaliśmy, że potrafimy zbadać zgodność pomiędzy zmierzonym i oczeki wanym rozkładem, obliczając % i porównując wynik z liczbą przedziałów, pomiędzy które podzielono dane. Okazuje się, że nieco lepszym rozwiązaniem jest porównanie x ^ liczbą przedziałów n, ale z liczbą stopni swobody, oznaczaną przez d. Pojęcie stopni swobody poruszyliśmy już krótko w para grafie 8.3. Obecnie zajmiemy się nim bardziej szczegółowo. Mówiąc ogólnie, liczba stopni swobody d w obliczeniach statystycznych jest zdefiniowana jako liczba danych pochodzących z pomiaru, pomniejszona o liczbę parametrów wyznaczanych na ich podstawie i wykorzystywanych w obliczeniach. W zagadnieniach, które omawiamy w tym rozdziale, danymi są liczby pomiarów O w każdym z n przedziałów k = 1 , . . . , n. Tym samym liczba danych pomiarowych to po prostu n, czyli liczba przedziałów. Tak więc. w zagadnieniach rozważanych obecnie 2
2
n
e
z
k
d = n — c, gdzie n jest liczbą przedziałów, a c - liczbą parametrów, które trzeba wyznaczyć na podstawie danych, aby z kolei znaleźć oczekiwane wartości E . Liczba c jest często nazywana liczbą więzów, co postaramy się krótko wyjaśnić. Liczba więzów c zmienia się w zależności od rozważanego zagadnienia Zajmijmy się najpierw doświadczeniem polegającym na rzucaniu kośćm: opisanym w paragrafie 12.2. Jeżeli rzucamy pięcioma kośćmi i sprawdzam;, hipotezę, że kości nie są obciążone, to oczekiwany rozkład liczby szóstek jes: rozkładem dwumianowym fc (v), gdzie v = 0,..., 5 jest liczbą szóstek w do wolnym rzucie. Obydwa parametry wspomnianej funkcji - liczba kości, piec oraz prawdopodobieństwo wyrzucenia szóstki, 1/6 - są znane z góry i me musimy obliczać ich na podstawie danych pomiarowych. Obliczając oczekiwa ną liczbę zdarzeń dla konkretnego v, musimy pomnożyć prawdopodobieństw : wynikające z rozkładu dwumianowego przez łączną liczbę rzutów JV r naszym przykładzie N = 200). Ten parametr jest zależny od danych. Mówią: konkretnie, N jest sumą liczb O , k
51/6
k
AT= ¿ 0 , .
(12.12
k=l
Tak więc, obliczając oczekiwane wyniki naszego eksperymentu, musimy zna leźć dokładnie jeden parametr (N ) na podstawie danych. Liczba więzów jes: zatem równa
252
c=l, a liczba stopni swobody d
= n—l.
W tabeli 12.5 wyniki rzutów kośćmi zostały zebrane w czterech przedziałach [n = 4); tak więc w tym eksperymencie występowały trzy stopnie swobody. Równanie (12.12) dobrze ilustruje dziwne nazewnictwo, takie jak „więzy" i „stopnie swobody". Gdy liczba N została już określona, można uznać, że równanie (12.12) „nakłada więzy" na wartości 0 . . . , 0 . Mówiąc ściślej, wskutek więzu (12.12) tylko n — l spośród wartości 0 . . . , 0 jest niezależnych. Na przykład, pierwszych n—l liczb 0 . . . , O _ mogłoby przyjmować dowol ne wartości (z pewnego zakresu), ale ostatnia liczba O byłaby w zupełności określona przez równanie (12.12). W tym sensie, tylko n — l spośród danych ma swobodę przyjmowania niezależnych wartości; tak więc mówimy, że istnieje tylko n—l niezależnych stopni swobody. W pierwszym przykładzie z niniejszego rozdziału zasięg x pocisku był mierzony 40 razy (N = 40). Wyniki zostały zebrane w czterech przedziałach i n = 4) i porównane z tymi, których moglibyśmy oczekiwać na podstawie rozkładu Gaussa f (x). W tym przypadku były trzy więzy i tym samym tylko jeden stopień swobody, U
N
1 ;
n
L T
N
1
n
Xa
d = n — c = 4 — 3 = 1. Pierwszy z więzów odpowiada równaniu (12.12); całkowita liczba pomiarów jest sumą liczby pomiarów O w poszczególnych przedziałach. Ale tym razem występują dwa dalsze więzy, ponieważ nie znamy z góry parametrów X i a oczekiwanego rozkładu Gaussa f (x). Znaczy to, że zanim mogliśmy obliczyć oczekiwane wartości E , musieliśmy wyznaczyć X i a, wykorzystując w tym celu dane. Tak więc wystąpiły łącznie trzy więzy i w tym przykładzie k
Xjtf
k
d = n-3.
(12.13)
Przypadkowo uzyskaliśmy wytłumaczenie, dlaczego w tym przykładzie musia ły pojawić się przynajmniej cztery przedziały. Przekonamy się, że liczba stopni swobody musi być w każdym przypadku większa lub równa jedności; z rów nania (12.13) wynika, że musieliśmy wybrać n ^ 4 . W omawianych obecnie przykładach zawsze będziemy mieli do czynienia z przynajmniej jednym więzem (JV = Y,Qk> wynikającym się z całkowitej liczby pomiarów), ale w niektórych przypadkach wystąpią jeden lub dwa dodatkowe więzy. Tak więc liczba stopni swobody, d, będzie się zmieniać od n — 1 do n — 3
253
(w omawianych przez nas przykładach). Gdy n jest duże, różnica pomiędzy n i d jest zupełnie nieistotna, ale gdy n jest niewielkie (co się niestety często zdarza), pojawia się oczywiście wyraźna rozbieżność. Wyposażeni w pojęcie stopni swobody, możemy uściślić test x - Można wykazać (czego jednak nie zrobimy), że oczekiwana wartość % jest równa dokładnie liczbie stopni swobody d, 2
2
(12.14)
2
(oczekiwana przeciętna wartość x ) = d.
2
To ważne równanie nie oznacza wcale, że naprawdę spodziewamy się, że x = d na podstawie dowolnej serii pomiarów. Wyraża natomiast przekonanie, że gdybyśmy powtórzyli całą serię pomiarów nieskończenie wiele razy, każdo razowo obliczając x , wtedy średnia wyznaczonych wartości x byłaby równa d. Pomimo to, nawet w przypadku jednego zbioru danych porównanie x i d sta nowi miarę zgodności. W szczególności jeżeli przewidywany przez nas rozkład okazał się właściwym rozkładem, to jest mało prawdopodobne, aby % było wyraźnie większe od d. Odwracając problem, jeżeli stwierdzilibyśmy, że x d, to byłaby podstawa, aby twierdzić, że przewidywany rozkład nie był właściwy. Nie udowodniliśmy wyniku zapisanego w równaniu (12.14), ale możemy się przekonać, że niektóre wynikające z niego wnioski brzmią rozsądnie. Na przykład, korzystając z zależności d = n — c, można zapisać równanie (12.14) w postaci 2
2
2
2
2y>
(12.15)
2
(oczekiwana przeciętna wartość x ) = n — c. 2
Oznacza to, że dla dowolnego n oczekiwana wartość x jest mniejsza, gdy c jest większe (to znaczy wtedy, gdy obliczamy więcej parametrów na pod stawie danych). Dokładnie tego powinniśmy się byli spodziewać. W przy kładzie z paragrafu 12.1 wykorzystaliśmy dane, wyznaczając środek X i szero kość a oczekiwanego rozkładu f (x)Ponieważ X i a zostały tak dobrane, aby jak najlepiej odpowiadać danym, spodziewalibyśmy się cokolwiek lepszej zgodności pomiędzy wyznaczonym i oczekiwanym rozkładem; tak więc dwa dodatkowe więzy powinny doprowadzić do zmniejszenia wartości x - Jest to dokładnie wniosek z równania (12.15). Równanie (12.14) sugeruje nam nieco wygodniejszą postać testu x - Wpro wadzimy zredukowany test chi kwadrat (czyli chi kwadrat dzielone przez liczbę stopni swobody), który będziemy oznaczać przez x i definiować jako x
2
2
2
2
f = X /d.
254
(12.16
2
Ponieważ oczekiwana wartość x J
e s t
równa d, widzimy, że
2
(oczekiwana przeciętna wartość # ) = 1.
(12.17)
Tak więc, niezależnie od liczby stopni swobody wnioski wynikające z naszego testu można sformułować następująco: Jeżeli uzyskamy wartość x zbliżoną do 1 lub mniejszą, to nie mamy podstaw, aby kwestionować wybór oczekiwanego rozkładu; jeżeli uzyskamy wartość x znacznie większą od jedności, to jest mało prawdopodobne, aby przewidywany rozkład był właściwy. 2
2
12.4. Prawdopodobieństwa związane z testem j
2
Nasz test zgodności danych pomiarowych z ich oczekiwanym rozkładem jest w dalszym ciągu dość prymitywny. Potrzebujemy teraz ilościowej miary zgod ności. W szczególności chcemy pewnych wskazówek, gdzie umieścić granicę pomiędzy zgodnością a niezgodnością. N a przykład, w eksperymencie z para grafu 12.1 wykonaliśmy 40 pomiarów pewnego zasięgu x, którego rozkład, jak sądzimy, powinien być rozkładem Gaussa. Zebraliśmy otrzymane dane w czte rech przedziałach i stwierdziliśmy, że % = 1,80. Ze względu na istnienie trzech więzów mamy tylko jeden stopień swobody (d = 1); tak więc zredukowana wartość chi kwadrat, % = i Id, jest także równa 1,80 2
2
1
f
= 1,80.
2
Pozostaje pytanie: Czy wartość y — 1,80 jest na tyle większa od jedności, aby wykluczyć przewidywany rozkład Gaussa? Starając się odpowiedzieć na to pytanie, przyjmijmy, że wyniki pomiarów podlegały przewidywanemu rozkładowi (w naszym przykładzie rozkładowi Gaussa). Korzystając z tego założenia, możemy obliczyć prawdopodobieństwo uzyskania co najmniej tak dużej wartości % , jak uzyskany przez nas wynik 1,80. Jak się wkrótce przekonamy, prawdopodobieństwo to jest równe 2
2
P(X >1,80)«18%. Oznacza to, że w razie gdyby nasze wyniki podlegały przewidywanemu rozkładowi, istniałoby 18-procentowe prawdopodobieństwo otrzymania war tości x większej lub równej od 1,80, czyli wyniku faktycznie uzyskanego. 2
255
2
Innymi słowy, w przedstawionym eksperymencie wartość % sięgająca 1,80 nie jest wcale niewiarygodna; tak więc nie ma podstaw (wynikających z przed stawionego rozumowania), aby odrzucić przewidywany rozkład. Przyjęta przez nas ogólna metoda postępowania powinna już być całkiem jasna. Po wykonaniu dowolnej serii pomiarów obliczamy zredukowaną war tość chi kwadrat, którą odtąd będziemy oznaczać przez xl (gdzie indeks „o" oznacza „otrzymane", ponieważ xl jest rzeczywiście wartością otrzymaną). Następnie, zakładając, że pomiary podlegają przewidywanemu rozkładowi, obliczamy prawdopodobieństwo 2
P(?>~X o)
(12.18)
2
uzyskania wartości x większej lub równej od xl, czyli wartości faktycznie uzyskanej. Jeżeli prawdopodobieństwo to jest znaczne, to wartość xl powinna być zaakceptowana i nie będzie podstaw do odrzucenia przewi dywanego rozkładu. Jeżeli prawdopodobieństwo to jest niewielkie, to war tość x zbliżona do otrzymanego wyniku xl jest bardzo mało prawdopodob na ( jeżeli pomiary podlegałyby przewidywanemu przez nas rozkładowi) i tym samym jest bardzo mało prawdopodobne, aby przewidywany rozkład był właściwy. 2
Jak zawsze w przypadku testów statystycznych, niezbędne jest określenie granicy pomiędzy prawdopodobieństwem, które jest „rozsądne", a które nie. Dwie ważne liczby zostały już wymienione w związku z zagadnieniem korela cji. Przyjmując granicę 5 procent, powiedzielibyśmy, że otrzymana wartość xl wykazuje „istotną rozbieżność", o ile 2
2
P(x >X o)<5%, i odrzucilibyśmy przewidywany rozkład „na poziomie 5 procent istotności". Jeżeli przyjęlibyśmy 1 procent jako granicę, moglibyśmy określić rozbieżność jako „bardzo istotną", gdyby P (% ^ xl) < 1 procent, i odrzucić przewidywany rozkład „na poziomie 1 procenta istotności". Jakąkolwiek liczbę wybralibyśmy jako granicę warunkującą odrzucenie, liczba ta powinna być podana do wiadomości. Jeszcze większe znaczenie ma przytoczenie prawdopodobieństwa P(x ^xl\ tak by Czytelnik mógł ocenić związaną z nim wiarygodność. 2
2
2
Obliczanie prawdopodobieństwa P(x ^X.l) jest zbyt złożone, aby opisać je w tej książce. Jednak odpowiednie wartości można z łatwością stabelaryzować, czego przykładem jest tabela 12.6 lub dokładniejsze tablice zamieszczone w dodatku D. Okazuje się, że prawdopodobieństwo uzyskania określonej wartości x zależy od liczby stopni swobody. Dlatego będziemy zapisywać 2
256
2
c o
odpowiednie prawdopodobieństwo w postaci P (x. ^xl), jego zależność od d.
m
a
podkreślić
d
2
2
2
Tabela 12.6. Procentowe prawdopodobieństwo P (x ^X ) uzyskania wartości x nie mniejszej od konkretnej wartości przy założeniu, że pomiary naprawdę podlegają zakładanemu roz kładowi. Puste miejsca wskazują na prawdopodobieństwa mniejsze od 0,05 procent d
xl d
0
0,25
0,5
0,75
1,0
1,25
1,5
1,75
2
3
4
5
6
1 2 3 5 10 15
100 100 100 100 100 100
62 78 86 94 99 100
48 61 68 78 89 94
39 47 52 59 68 73
32 37 39 42 44 45
26 29 29 28 25 23
22 22 21 19 13 10
19 17 15 12 6 4
16 14 11 8 3 1
8 5 3 1
5 2 0,7 0,1
3 0,7 0,2 -
1 0,2 -
0,1
-
-
-
-
-
2
Zazwyczaj przy obliczaniu prawdopodobieństwa P (x ^X.l) otrzymane liczby pomiarów w przedziałach O są traktowane jak zmienne ciągłe roz łożone wokół ich wartości oczekiwanych E zgodnie z rozkładem Gaussa. W zagadnieniach, które obecnie rozważamy, O jest zmienną dyskretną pod legającą rozkładowi Poissona. Założywszy, że wszystkie liczby są wystar czająco duże, dyskretna natura O nie jest istotna i rozkład Poissona jest dobrze przybliżany przez rozkład Gaussa. W tej sytuacji można z powodze niem skorzystać ze stablicowanych wartości prawdopodobieństwa P (x ^X.l)Dlatego właśnie powiedzieliśmy, że przedziały muszą być tak wybrane, aby oczekiwane liczby pomiarów E w każdym z przedziałów były wystarczająco duże (przynajmniej 5). Z tej samej przyczyny liczba przedziałów nie powinna być zbyt mała. d
k
k
k
2
k
2
d
k
Pamiętając o wymienionych zastrzeżeniach, podamy teraz w tabeli 12.6 prawdopodobieństwa P {x ^xl) obliczone dla kilku charakterystycznych war tości d i xl- Liczby w lewej kolumnie określają sześć wybranych liczb stopni swobody (d=l, 2, 3, 5, 10, 15). Nagłówki pozostałych kolumn zawierają możliwe wartości xl- Każda komórka tabeli zawiera procentową wartość 2
d
2
Uzasadnialiśmy, że pomiar liczby O sprowadza się do eksperymentu polegającego na zliczaniu i dlatego O powinna podlegać rozkładowi Poissona. Jeżeli przedział k jest zbyt szeroki, przedstawione uzasadnienie jest nie całkiem poprawne, ponieważ prawdopodobieństwo zaliczenia pomiaru do przedziału k nie jest znacznie mniejsze od 1 (co jest jednym z warunków rozkładu Poissona wymienionych w paragrafie 11.1); tak więc należy zapewnić rozsądną liczbę przedziałów. k
k
257
2
prawdopodobieństwa P (x ^xl) w zależności od d i xl- I tak, w przypadku dziesięciu stopni swobody (d = 10), prawdopodobieństwo uzyskania x ^2 wynosi 3 procent, d
2
2
P (X >2)
= 3%.
10
Tak więc, gdybyśmy uzyskali zredukowaną wartość chi kwadrat równą 2 w doświadczeniu z dziesięcioma stopniami swobody, moglibyśmy wyciągnąć wniosek, że otrzymane wyniki „istotnie" różnią się od przewidywanego roz kładu i odrzucić przewidywany rozkład na poziomie 5 procent istotności (chociaż nie na poziomie 1 procenta). Wszystkie prawdopodobieństwa w drugiej kolumnie tabeli 12.6 wynoszą 100 procent, ponieważ zawsze można mieć pewność, że x ^ 0 . W miarę jak xl wzrasta, prawdopodobieństwo otrzymania x ^X.l maleje w tempie zależ nym od d. I tak, dla dwóch stopni swobody (d = 2), P ( x ^ l ) wynosi 37 procent, podczas gdy dla d = 15, P ( x ^ 1) jest równe 45 procent. Zauważmy, że P (x ^ 1) jest zawsze znaczne (ściśle mówiąc przynajmniej 32 procent); tak więc wartość xl równa lub mniejsza 1 jest zawsze wiarygodna i nigdy nie pociąga za sobą konieczności odrzucenia przewidywanego rozkładu. 2
2
2
d
2
d
2
d
Najmniejsza wartość xl, która wymaga zakwestionowania przewidywane go rozkładu zależy od d, W przypadku jednego stopnia swobody, xl może dojść do 4, zanim rozbieżność stanie się „istotna" (na poziomie 5 procent). Dla dwóch stopni swobody odpowiednia granica wynosi xl = 3; dla d=5 jest bliższa 2 (ściśle xl — 2,2) i tak dalej. Wyposażeni w prawdopodobieństwa z tabeli 12.6 (lub dodatku D) jesteśmy w stanie przypisać ilościowe znaczenie wartości xl pochodzącej z konkretnego eksperymentu. W paragrafie 12.5 przedstawimy kilka przykładów.
12.5. Przykłady Przykład podany w paragrafie 12.1 został już wnikliwie przeanalizowany. W tym paragrafie zapoznamy się z trzema kolejnymi przykładami ilustrujący mi zastosowanie testu x 2
V
Inny przykład rozkładu Gaussa Przykład z paragrafu 12.1 dotyczył pomiarów, których wyniki, jak przypusz czaliśmy, powinny podlegać rozkładowi normalnemu. Rozkład Gaussa jest
258
spotykany w praktyce na tyle często, że przedstawimy krótko kolejny przykład z nim związany. Załóżmy, że antropolog interesuje się wzrostem mieszkańców pewnej wyspy. Sądzi on, że wzrost dorosłych mężczyzn powinien podlegać rozkładowi normalnemu i dokonuje pomiaru wzrostu w próbie składającej się z 200 mężczyzn. N a podstawie tych pomiarów oblicza średnią i odchylenie standardowe, uznając otrzymane liczby za najlepsze przybliżenie środka X i szerokości a przewidywanego rozkładu normalnego Następnie x
f (x).
Tabela 12.7. Pomiary wzrostu 200 dorosłych mężczyzn
Numer przedziału k
Wzrost
Wyznaczona liczba
Oczekiwana liczba
zdarzeń O
zdarzeń E 13,4
k
k
1
mniej niż X - 1,5 a
14
2
29
18,3
3
pomiędzy X - 1,5 a a X - a pomiędzy X - a a X - 0,5 a
30
30,0
4
pomiędzy X - 0,5 a a X
27
38,3
5
pomiędzy X a X + 0,5 a
28
38,3
6
pomiędzy X + 0,5 a a X + a
31
30,0
7
pomiędzy X + a a
28
18,3
8
powyżej X+1,5
13
13,4
X+l,5a
Nasz antropolog chce następnie przekonać się, czy wyniki te zgodnie z przewidywaniami podlegają rozkładowi normalnemu / ( x ) . Z tą myślą oblicza on najpierw prawdopodobieństwo P zaliczenia dowolnego mężczyzny do /c-tego przedziału (przyjmując, że prawdziwy jest rozkład normalny). Wyra ża się ono całką z funkcji obliczoną w granicach odpowiedniego Xt przedziału, a konkretną wartość można łatwo znaleźć za pomocą tablicy całek znajdującej się w dodatku B. Oczekiwana liczba mężczyzn E w każdym z przedziałów jest iloczynem prawdopodobieństwa P i łącznej liczby zmierzo nych mężczyzn (200). Liczby te znajdują się w ostatniej kolumnie tabeli 12.7. Xi(T
k
f „{x)
k
k
W celu znalezienia oczekiwanych wartości E antropolog musiał skorzystać z trzech parametrów uprzednio wyznaczonych na podstawie danych (cał kowita liczebność próby oraz obliczone wartości X i a). Tak więc przy ośmiu przedziałach i trzech więzach liczba stopni swobody wynosi d = 8 — 3 = 5. Proste obliczenia przeprowadzone z wykorzystaniem tabeli 12.7 dadzą zredu kowaną wartość chi kwadrat k
259
1
d h
ó
E
k
-
x
Ponieważ otrzymana wartość jest wyraźnie większa od 1, od razu nasuwa to przypuszczenie, że wzrost wyspiarzy nie podlega rozkładowi normalnemu. Mówiąc dokładniej, z tabeli 12.6 wynika, że gdyby wzrost wyspiarzy podlegał oczekiwanemu rozkładowi, wtedy prawdopodobieństwo P (% ^ 3,5) otrzyma nia x równego lub większego od 3,5 wynosiłoby około 0,5. Jakkolwiek by na to patrzeć, jest to mało prawdopodobne i dochodzimy do wniosku, że nie wygląda na to, aby wzrost mieszkańców wyspy podlegał rozkładowi normal nemu. W szczególności, na poziomie 1 procenta (czyli wysokiej istotności), możemy odrzucić hipotezę o normalnym rozkładzie wzrostu. 2
5
2
Jeszcze raz o rzucaniu kośćmi W paragrafie 12.2 omawialiśmy eksperyment polegający na notowaniu liczby szóstek w kolejnych rzutach pięcioma kośćmi. Załóżmy, że wykonaliśmy 200 rzutów i zebraliśmy wyniki w przedziałach w opisany wcześniej sposób. Zakładając, że kości nie są obciążone, możemy obliczyć - postępując tak jak poprzednio - oczekiwane liczby E . Podano je w trzeciej kolumnie tabeli 12.8. k
Tabela 12.8. Rozkład liczby szóstek w 200 rzutach 5 kośćmi Numer przedziału k 1 2 3 4
Zdarzenia zaliczane do przedziału brak jedna dwie 3 , 4 lub
Oczekiwana liczba zdarzeń E
Faktyczna liczba zdarzeń O
80,4 80,4 32,2 7,0
60 88 39 13
k
szóstek szóstka szóstki 5 szóstek
k
W przeprowadzonym naprawdę eksperymencie pięć kości było rzucanych 200 razy. Wyniki zanotowane dla każdego z przedziałów zawiera ostatnia kolumna tabeli 12.8. Chcąc zbadać zgodność pomiędzy uzyskanym a oczeki wanym rozkładem, zauważamy, że występują trzy stopnie swobody (cztery przedziały minus jeden więź) i obliczamy
J
260
k=l
^k
Korzystając z tabeli 12.6, widzimy, że dla trzech stopni swobody prawdopodo bieństwo wystąpienia % , co najmniej tak dużego jak stwierdzona wartość, wynosi około 0,7 procent, o ile kości nie były obciążone. Dochodzimy do wniosku, że prawie na pewno kości nie były dobre. Porównanie liczb E i O z tabeli 12.8 sugeruje, że przynajmniej jedna z kości była obciążona na korzyść szóstki. 2
k
k
Przykład rozkładu Poissona z
Jako ostatni przykład zastosowania testu % omówimy eksperyment, w którym spodziewamy się wystąpienia rozkładu Poissona. Załóżmy, że posłużyliśmy się licznikiem Geigera w celu zbadania liczby cząstek promieniowania kosmicz nego docierających do pewnego obszaru. Przyjmijmy ponadto, że zliczenia prowadziliśmy w 100 oddzielnych jednominutowych okresach, a otrzymane wyniki znalazły się w dwóch pierwszych kolumnach tabeli 12.9.
Tabela 12.9. Liczba cząstek promieniowania kosmicznego zarejestrowanych w 100 oddzielnych jednominutowych przedziałach Zliczenia v w ciągu 1 minuty Zero Jedno Dwa Trzy Cztery Pięć Sześć Siedem Osiem lub więcej Razem
Liczba zdarzeń
Numer przedziału k
7 17 29 20 16 8
)
Liczba zdarzeń Oczekiwana liczba zdarzeń E w przedziale k, O k
k
1
1 2 3 4 5
17 29 20 16
7.5 19,4 25,2 21,7 14,1
6
11
12,1
2
0 J 100
Rzut oka na liczby znajdujące się w drugiej kolumnie przemawia za zebraniem wszystkich przypadków, dla których v ^ 5 w jednym przedziale. Dokonany podział na sześć przedziałów (k = 1,..., 6) ilustruje kolumna trze cia, a odpowiadające poszczególnym przedziałom liczby zdarzeń O znajdują się w kolumnie czwartej. Hipoteza, którą chcemy zbadać, mówi, że zmienna v podlega rozkładowi Poissona p„(v). Ponieważ nie znamy oczekiwanej średniej liczby zliczeń fi, k
261
musimy zacząć od wyznaczenia średniej dla stu okresów zliczania. Jak się łatwo przekonać, jest ona równa v = 2,59, co jest najlepszym przybliżeniem dla fi. Korzystając z wyniku \i = 2,59, jesteśmy w stanie obliczyć prawdopodobień stwo p (v) wystąpienia konkretnej liczby zliczeń v, a stąd wartości oczekiwa nych E , które to zebrano w ostatniej kolumnie tabeli. W trakcie obliczania wartości E skorzystaliśmy z dwóch parametrów wyznaczonych na podstawie danych pomiarowych: całkowitej liczby zbada nych okresów (100) i wyznaczonej wartości ju(/i = 2,59). (Przypomnijmy, że rozkład Poissona jest jednoznacznie określony przez wartość \ i i dlatego nie musimy obliczać odchylenia standardowego a. Ściśle mówiąc a = a więc znajomość n daje automatycznie wartość a). Istnieją zatem dwa więzy, które przy sześciu przedziałach dają cztery stopnie swobody, d = 4. k
k
Proste obliczenia z wykorzystaniem danych z dwóch ostatnich kolumn tabeli 12.9 dają zredukowaną wartość chi kwadrat
U
k=l
^k
Ponieważ otrzymana wartość jest mniejsza od jedności, możemy natychmiast stwierdzić, że zgodność otrzymanych danych z rozkładem Poissona jest w pełni zadowalająca. Mówiąc ściślej, z tablicy zamieszczonej w dodatku D wynika, że wystąpienie wartości x równej 0,35 jest bardzo prawdopodob ne; w rzeczywistości P ( # ^ 0 , 3 5 ) ? Ł 8 5 procent. Tak więc nasz eksperyment nie daje żadnych podstaw, aby wątpić, że właściwym rozkładem jest rozkład Poissona. 2
2
4
2
Wartość x = 0,35 , którą otrzymaliśmy w eksperymencie, jest wyraźnie mniejsza niż 1, wskazując, że otrzymane wyniki bardzo dobrze zgadzają się z rozkładem Poissona. Jednak, nawet tak mała wartość x nie jest silniejszym argumentem, że dane podlegają przewidywanemu rozkładowi, niż na przykład wartość x = 1- Jeżeli wyniki naprawdę podlegają przewidywanemu rozkłado wi, a my wielokrotnie powtarzalibyśmy całą serię pomiarów, to powinniśmy spodziewać się wielu różnych wartości x fluktuujących wokół wartości prze ciętnej równej 1. Tak więc, jeżeli wyniki pomiarów są opisywane przez przewidywany rozkład, otrzymana wartość x — 0,35 jest jedną z możliwych wartości z szerokiego zakresu określonego przez przypadkowe fluktuacje wokół wartości średniej. W żadnym razie nie nadaje to dodatkowego znacze nia naszemu wnioskowi, że pomiary podlegają przewidywanemu rozkładowi. 2
2
z
2
Jeżeli Czytelnicy prześledzili przedstawione trzy przykłady, nie powinni mieć trudności z zastosowaniem testu x jakichkolwiek doświadczeniach, które można napotkać w ramach pierwszej pracowni fizycznej. Kolejne przy2
262
w
kłady można znaleźć w zamieszczonych dalej zadaniach. Czytelnicy powinni sprawdzić, czy zrozumieli na czym polega test y , rozwiązując przynajmniej niektóre z nich. 1
Zadania Uwaga: Gwiazdka przy zadaniu oznacza, że szkic rozwiązania lub odpowiedź znajduje na końcu książki. *12.1 (paragraf 12.1). Każdy ze studentów należących do pięćdziesięcioosobowej grupy otrzymał kawałek tego samego (jak przynajmniej powiedzia no) metalu z zadaniem wyznaczenia jego gęstości. Na podstawie 50 wyników obliczono średnią J> oraz odchylenie standardowe o , a następnie postanowio no sprawdzić, czy wyniki podlegają rozkładowi normalnemu. W tym celu pomiary zebrano w czterech przedziałach, których granice znajdują się w ~p—(T , p, p +
p
Tabela 12.10 Przedział k
1 2 3 4
Wartości p zaliczane do przedziału
Liczba zdarzeń w przedziale, O
mniejsze od p —ff pomiędzy p —
12 13 11 14
p
p
p
p
k
Zakładając, że pomiary podlegają rozkładowi normalnemu ze środkiem w p i o szerokości o , oblicz oczekiwane liczby pomiarów E dla każdego z przedziałów. N a tej podstawie oblicz j . Czy pomiary podlegają rozkładowi normalnemu? k
1
12.2 (paragraf 12.1). W zadaniu 4.7 podano wyniki 30 pomiarów czasu t, których średnia równa jest t = 8,15 s, a odchylenie standardowe o = 0,04 s. Pogrupuj dane w cztery przedziały, których granice znajdują się w t—o , t, t + a , a następnie policz zdarzenia O znajdujące się w każdym z przedziałów k = 1, 2, 3, 4. Zakładając, że pomiary podlegają rozkładowi normalnemu ze środkiem w t i o szerokości o , podaj oczekiwane liczby zdarzeń E dla każdego z przedziałów. Oblicz wartość j . Czy istnieją przesłanki, aby podej rzewać, że pomiary nie podlegają rozkładowi normalnemu? t
t
t
k
t
k
2
263
12.3 (paragraf 12.2). Gracz postanawia sprawdzić kość, rzucając nią 240 razy. Każdy rzut może dać jeden z sześciu możliwych wyników (k = 1, 2 , 6 , gdzie k jest liczbą oczek). Otrzymane wyniki rzutów zawiera tabela 12.11. Ile wynosi oczekiwana liczba zdarzeń E , przy założeniu, że kość nie jest ob ciążona? Traktując każdy z możliwych wyników jako osobny przedział, oblicz X . Czy można podejrzewać, że kość jest obciążona? k
2
Tabela 12.11
Liczba oczek k Liczba zdarzeń O
k
1 20
2 46
3 35
4 45
5 42
6 52
*12.4 (paragraf 12.2). W 400 rzutach trzema kośćmi notowano liczbę szóstek, a otrzymane wyniki przedstawiono w tabeli 12.12. Zakładając, że kości są dobre, oblicz oczekiwane liczby zdarzeń dla każdego z trzech prze działów. (Niezbędne wartości prawdopodobieństwa dane są przez rozkład dwumianowy omówiony w paragrafie 10.2.) Oblicz y . Czy istnieją powody, aby podejrzewać, że kości są obciążone? 2
Tabela 12.12
Wynik Brak szóstek Jedna szóstka Dwie lub trzy szóstki
Przedział k
Liczba zdarzeń O
1 2 3
217 148 35
k
*12.5 (paragraf 12.3). a) W przypadku każdego z zadań od 12.1 do 12.4 podaj liczbę więzów c i liczbę stopni swobody d. b) Załóżmy, że w zadaniu 12.1 przyjęta wartość gęstości p była znana, a my postanowiliśmy zbadać hipotezę mówiącą, że wyniki podlegają roz kładowi normalnemu ze środkiem w p . Ile więzów i ile stopni swobody występuje w takim przypadku? p
p
*12.6 (paragraf 12.4). Dla danych z zadania 12.1 oblicz zredukowaną wartość x . Ile wynosi prawdopodobieństwo otrzymania co najmniej tak dużej wartości y , w przypadku gdy pomiary podlegały rozkładowi normalnemu? 2
2
264
Czy można odrzucić hipotezę o normalnym rozkładzie pomiarów na poziomie 5 procent istotności? A na poziomie 1 procenta? (Niezbędne wartości praw dopodobieństw znajdują się w dodatku D.) 12.7 (paragraf 12.4). Czy w sytuacji z zadania 12.4 można odrzucić hipotezę o normalnym rozkładzie na poziomie 5 procent lub 1 procenta istotności? (Niezbędne wartości prawdopodobieństw znajdują się w dodatku D.) *12.8 (paragraf 12.5). Dla 360 rzutów parą kości notowano łączną liczbę otrzymanych oczek. Możliwe do otrzymania wartości i odpowiadające im liczby zdarzeń zawiera tabela 12.13. Oblicz prawdopodobieństwa dla każdej z wartości sumy, a następnie odpowiadające im oczekiwane liczby zdarzeń (zakładając, że kości są dobre). Oblicz y , d oraz y = X /d- Ile wynosi prawdopodobieństwo wystąpienia wartości y nie mniejszej od faktycznie uzyskanej, przy założeniu, że kości były dobre? Czy można odrzucić na poziomie 5 procent istotności hipotezę, że kości były dobre? A na poziomie 1 procenta? (Niezbędne wartości prawdopodobieństw znajdują się w dodatku D.) 2
2
2
2
Tabela 12.13 Łączna liczba oczek Liczba zdarzeń
2 6
3 14
4 23
5 35
6 57
7 50
8 44
9 49
10 39
11 27
12 16
2
12.9 (paragraf 12.5). W zadaniu 12.3 oblicz wartość y . Czy można, na poziomie 5 procent istotności, wyciągnąć wniosek, że kości były obciążone? A na poziomie 1 procenta? (Niezbędne wartości prawdopodobieństw znajdują się w dodatku D.) 2
*12.10 (paragraf 12.5) Ile wynosi wartość y w zadaniu 12.4? Ile wynosi prawdopodobieństwo wystąpienia wartości y nie mniejszej od faktycznie uzyskanej, przy założeniu, że kości były dobre? Wyjaśnij, czy otrzymano dowód przemawiający za tym, że kości były obciążone? (Niezbędne wartości prawdopodobieństw znajdują się w dodatku D.) 2
2
12.11 (paragraf 12.5). Oblicz y dla danych z zadania 11.5, zakładając, że wyniki powinny podlegać rozkładowi Poissona ze średnią liczbą zliczeń \i = 3. (Zbierz wszystkie zdarzenia, dla których v > 6 w jednym przedziale). Z iloma stopniami swobody mamy w tym przypadku do czynienia? (Pamiętaj, że /i było dane z góry, a nie obliczane na podstawie danych.) Ile wynosi y ? Czy dane są zgodne z przewidywanym rozkładem Poissona ? (Niezbędne wartości prawdopodobieństw znajdują się w dodatku D.) 2
265
*12.12 (paragraf 12.5). a) Krąży opinia, że w pewnej promieniotwórczej próbce zachodzą przecięt nie dwa rozpady na minutę. Chcąc to sprawdzić, pewien student mierzy liczby rozpadów w 40 oddzielnych jednominutowych okresach i uzyskuje rezultaty przedstawione w tabeli 12.14. Jakich wyników mógłby się spodziewać student, gdyby liczba rozpadów podlegała rozkładowi Poissona? (Zbierz wszystkie przypadki odpowiadające v ^ 3 w jednym przedziale.) Oblicz y , d oraz y = y /d. (Nie zapomnij, że p nie było obliczone na podstawie danych.) Czy odrzuciłbyś, na poziomie 5 procent istotności, hipotezę, że rozpady w próbce podlegają rozkładowi Poissona z p. = 2? 2
2
2
b) Student stwierdza, że prawdziwa wartość średniej jego pomiarów wyno si v = 1,35 i na tej podstawie postanawia sprawdzić, czy dane odpowiadają rozkładowi Poissona z p = 1,35. Jakie są w tym przypadku wartości d i y l Czy dane są zgodne z nową hipotezą? 2
Tabela 12.14 Liczba rozpadów v Liczba zdarzeń
0
1
2
3
4
5 lub więcej
11
12
11
4
2
0
*12.13 (Paragraf 12.5). W rozdziale 10 omawialiśmy test zgodności z roz kładem dwumianowym. Rozważaliśmy wtedy n prób, każda z dwoma moż liwymi wynikami, sukcesem (o prawdopodobieństwie p) i porażką (o praw dopodobieństwie 1 — p). Następnie badaliśmy, czy zaobserwowana liczba suk cesów v jest zgodna z założoną wartością p. Dopóki liczby są odpowiednio duże, możemy zbadać to samo zagadnienie za pomocą testu y z dwoma przedziałami - k = 1 dla sukcesów i k = 2 dla porażek - i jednym stopniem swobody. W przedstawionych dalej sytuacjach skorzystaj z obydwu metod i porównaj wyniki. W przypadku dużych liczb przekonasz się, że zgodność jest doskonała; w przypadku mniejszych liczb, nie jest ona wprawdzie tak wy śmienita, ale wciąż wystarczająco dobra, aby wartość y była użyteczna. 2
2
a) Producent zup jest przekonany, że w wytwarzanym przez siebie rosole z kurczaka może zastosować inny rodzaj makaronu bez wpływu na powodze nie zupy. Chcąc sprawdzić tę hipotezę, produkuje 16 puszek zupy z nowym rodzajem makaronu, oznaczonych symbolem „ X " , oraz 16 puszek zawierają cych stary rodzaj makaronu, oznaczonych jako „Y". Następnie wysyła po jednej puszce z każdego rodzaju do 16 jurorów, prosząc ich o wskazanie
266
smaczniejszego produktu. W przypadku gdyby hipoteza producenta była prawdziwa, mógłby on spodziewać się, że ośmiu jurorów wyżej oceni puszki X. a pozostałych ośmiu puszki Y. W rzeczywistości liczba jurorów, którzy wyżej ocenili puszki X wynosi v = 11. Oblicz y prawdopodobieństwo uzys kania nie mniejszej jego wartości. Czy przeprowadzony test wskazuje na istotną różnicę pomiędzy obydwoma rodzajami makaronu? Następnie oblicz dokładnie, korzystając z rozkładu dwumianowego, odpowiednie prawdopodo bieństwo i porównaj obydwa wyniki. Zauważ, że test y uwzględnia odchyle nia występujące w obydwu kierunkach. Tak więc dla porównania powinieneś obliczyć „dwustronne" prawdopodobieństwo dla wartości v odbiegających od ośmiu przynajmniej o trzy w obydwu kierunkach, to jest dla v = 11, 12,..., 16 i v = 5, 4,..., 1. 2
o r a z
2
b) Powtórz część (a) w przypadku następnego testu, w którym producent przygotowuje 400 puszek każdego rodzaju, a liczba jurorów, którzy wybrali puszki X, wynosi 225. (Obliczając prawdopodobieństwa dane rozkładem Poissona, skorzystaj z przybliżenia go rozkładem Gaussa.) c) W części (a) liczby były na tyle małe, że test y miał jedynie przybliżony charakter. (Uzyskane na jego podstawie prawdopodobieństwo wyniosło 14 procent wobec poprawnej wartości 21,0 procent.) W przypadku gdy liczba stopni swobody jest równa 1, możemy nieco ulepszyć test y , korzystając z „poprawionego x " zdefiniowanego jako 2
2
2
2
(\O -E \-\
2
poprawione y = X k=l
k
k
£ k
2
Oblicz poprawione y dla danych z części (a) i pokaż, że posłużenie się tą wartością (zamiast zwykłego y ) w tablicy w dodatku D daje lepsze przy bliżenie. 2
3
2
12.14 (paragraf 12.5). Test y można wykorzystać do zbadania zgodności zbioru wyników pomiarów (x , y ) dwóch zmiennych z przewidywaną zależnoś cią y =f(x), przy założeniu, że niepewności znane są z dobrą dokładnością. Załóżmy, że oczekujemy liniowego związku pomiędzy y i x i
t
y=f(x)
= A + Bx.
3
2
Nie uzasadniliśmy posługiwania się poprawionym testem x , ale przedstawiony przykład wykazuje jego skuteczność. Szczegóły można znaleźć w: H.L. Alderi, E.B. Roessler, Introduction to Probability
and Statistics
(Freeman, 1977) s. 263.
267
(Na przykład, y może oznaczać długość metalowego pręta, a x jego tem peraturę.) Załóżmy, że z przewidywań teoretycznych wynikają wartości A = 50 i B = 6 oraz że pięć pomiarów x i y dało wyniki przedstawione w tabeli 12.15. Podana niepewność y jest jego odchyleniem standardowym; to znaczy wszyst kie pięć pomiarów y ma to samo odchylenie standardowe a = 4. Wykonaj tabelę zmierzonych i oczekiwanych wartości y i oblicz % według wzoru 2
t
Tabela 12.15 x (niepewność do zaniedbania) y (wszystkie ± 4 )
1 60
2 56
3 71
4 66
5 86
i
Ponieważ żadne parametry nie były obliczane na podstawie danych, brak jest więzów, a liczba stopni swobody wynosi 5. Oblicz y i skorzystaj z tablicy w dodatku D, aby znaleźć prawdopodobieństwo wystąpienia wartości y nie mniejszej od faktycznie uzyskanej, zakładając, że y spełnia zależność (12.19). Czy odrzuciłbyś, na poziomie 5 procent, przewidywany związek (12.19) ? (Jeżeli Stałe A i B nie były znane z góry, można by obliczyć je na podstawie danych, korzystając z metody najmniejszych kwadratów. Następnie można postąpić jak poprzednio, ale przy trzech stopniach swobody.) 2
2
DODATEK
A
FUNKCJA BŁĘDU, I
Jeżeli pomiary pewnej zmiennej ciągłej x są narażone na wpływ wielu niewiel kich i przypadkowych zaburzeń, to oczekiwany rozkład wyników jest roz kładem normalnym, czyli rozkładem Gaussa e
(
/*,,(*) = — ^ " *
_ X ) 2 / 2 f f 2
'
gdzie X oznacza wartość prawdziwą x, a a - odchylenie standardowe. b
Całka funkcji opisującej rozkład normalny,
J
f (x)dx, nosi nazwę funkcji x a
a
błędu i określa prawdopodobieństwo, że wartość pomiaru znajdzie się w prze dziale pomiędzy x = a i x = b b
P{a^x^b)
=
lf (x)dx. x
a
Tablica A zawiera wartości całek dla a — X — ta i b = X + ta. Daje to praw dopodobieństwo otrzymania wyniku w promieniu t odchyleń standardowych od wartości prawdziwej X P(w promieniu ta) = P(X — ta < x ^ X + ta) X + ta
= J fx,Ax)dx X-ta
= —L= J2%
z 2
2
}e- ' dz. -t
269
Tablica A . Prawdopodobieństwo (w procentach), P(w promieniu ter) X + ta
— I /
X i ( I
( x ) d x wyrażone jako
X-ta
funkcja parametru t t
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0 0,1 0,2 0,3 0,4
0,00 7,97 15,85 23,58 31,08
0,80 8,76 16,63 24,34 31,82
1,60 9,55 17,41 25,10 32,55
2,39 10,34 18,19 25,86 33,28
3,19 11,13 18,97 26,61 34,01
3,99 11,92 19,74 27,37 34,73
4,78 12,71 20,51 28,12 35,45
5,58 13,50 21,28 28,86 36,16
6,38 14,28 22,05 29,61 36,88
7,17 15,07 22,82 30,35 37,59
0,5 0,6 0,7 0,8 0,9
38,29 45,15 51,61 57,63 63,19
38,99 45,81 52,23 58,21 63,72
36,69 46,47 52,85 58,78 64,24
40,39 47,13 53,46 59,35 64,76
41,08 47,78 54,07 59,91 65,28
41,77 48,43 54,67 60,47 65,79
42,45 49,07 55,27 61,02 66,29
43,13 49,71 55,87 61,57 66,80
43,81 50,35 56,46 62,11 67,29
44,48 50,98 57,05 62,65 67,78
1,0 1.1 1,2 1,3 1,4
68,27 72,87 76,99 80,64 83,85
68,75 73,30 77,37 80,98 84,15
69,23 73,73 77,75 81,32 84,44
69,70 74,15 78,13 81,65 84,73
70,17 74,57 78,50 81,98 85,01
70,63 74,99 78,87 82,30 85,29
71,09 75,40 79,23 82,62 85,57
71,54 75,80 79,59 82,93 85,84
71,99 76,20 79,95 83,24 86,11
72,43 76,60 80,29 83,55 86,38
1,5 1,6 1,7 1,8 1,9
86,64 89,04 91,09 92,81 94,26
86,90 89,26 91,27 92,97 94,39
87,15 89,48 91,46 93,12 94,51
87,40 89,69 91,64 93,28 94,64
87,64 89,90 91,81 93,42 94,76
87,89 90,11 91,99 93,57 94,88
88,12 90,31 92,16 93,71 95,00
88,36 90,51 92,33 93,85 95,12
88,59 90,70 92,49 93,99 95,23
88,82 90,90 92,65 94,12 95,34
2,0
95,45 96,43 97,22 97,86 98,36
95,56. 96,51 97,29 97,91 98,40
95,66 96,60 97,36 97,97 98,45
95,76 96,68 97,43 98,02 98,49
95,86 96,76 97,49 98,07 98,53
95,96 96,84 97,56 98,12 98,57
96,06 96,92 97,62 98,17 98,61
96,15 97,00 97,68 98,22 98,65
96,25 97,07 97,74 98,27 98,69
96,34 97,15 97,80 98,32 98,72
98,76 99,07
98,79 99,09 99,33 99,50 99,64
98,83 99,12 99,35 99,52 99,65
98,86 99,15 99,37 99,53 99,66
98,89 99,17 99,39 99,55 99,67
98,92 99,20 99,40 99,56 99,68
98,95 99,22 99,42 99,58 99,69
98,98 99,24 99,44 99,59 99,70
99,01 99,26 99,46 99,60 99,71
99,04 99,29 99,47 99,61 99,72
2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9
99,31 99,49 99,63
3,0 3,5 4,0 4,5 5,0
99,73 99,95 99,994 99,9993 99,99994
270
Funkcja ta jest czasem oznaczana przez erf (t), chociaż notacja ta jest także stosowana w odniesieniu do nieco innej funkcji. Prawdopodobieństwo, że wynik pomiaru znajdzie się poza wymienionym przedziałem można znaleźć stosując odejmowanie: P(poza ta) — 100% —P(w promieniu ta). Więcej informacji Czytelnik znajdzie w paragrafie 5.4 i dodatku B.
DODATEK
B
FUNKCJA BŁĘDU, II
W pewnych obliczeniach dogodną postacią funkcji błędu jest
X
= --L}e-*7Mz. •\/2n
x
x
+
l
a
o
(Całka ta jest oczywiście równa połowie całki, która została stabelaryzowana w dodatku A.) Prawdopodobieństwo P ( a ^ x < b ) , że pomiar znajdzie się w przedziale a x ^b, można wyznaczyć na podstawie Q(t), wykonując jedno odejmowanie lub dodawanie. N a przykład,
P(X + a < x ^ X + 2a) = Q ( 2 ) - Q ( l ) Podobnie P(X-2a
< x < x + f 7 ) = Q(2) + Q(l). X-2a
X
X+a
Prawdopodobieństwo, że wynik pomiaru będzie większy od pewnej wartości X + ta jest po prostu równe 0,5 — Q{t). N a przykład,
P{x> X + a) = 5 0 % - g ( l ) . X
272
X+a
Tablica B. Prawdopodobieństwo X + ta
(w procentach), Q(t)=
J
f (x)dx Xa
x
wyrażone jako funkcja parametru t t
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0 0,1 0,2 0,3 0,4
0,00 3,98 7,93 11,79 15,54
0,40 4,38 8,32 12,17 15,91
0,80 4,78 8,71 12,55 16,28
1,20 5,17 9,10 12,93 16,64
1,60 5,57 9,48 13,31 17,00
1,99 5,96 9,87 13,68 17,36
2,39 6,36 10,26 14,06 17,72
2,79 6,75 10,64 14,43 18,08
3,19 7,14 11,03 14,80 18,44
3,59 7,53 11,41 15,17 18,79
0,5 0,6 0,7 0,8 0,9
19,15 22,57 25,80 28,81 31,59
19,50 22,91 26,11 29,10 31,86
19,85 23,24 26,42 29,39 32,12
20,19 23,57 26,73 29,67 32,38
20,54 23,89 27,04 29,95 32,64
20,88 24,22 27,34 30,23 32,89
21,23 24,54 27,64 30,51 33,15
21,57 24,86 27,94 30,78 33,40
21,90 25,17 28,23 31,06 33,65
22,24 25,49 28,52 31,33 33,89
1,0
34,Ł3> 36,43 38,49 40,32 41,92
34,38 36,65 38,69 40,49 42,07
34,61 36,86 38,88 40,66 42,22
34,85 37,08 39,07 40,82 42,36
35,08 37,29 39,25 40,99 42,51
35,31 37,49 39,44 41,15 42,65
35,54 37,70 39,62 41,31 42,79
35,77 37,90 39,80 41,47 42,92
35,99 38,10 39,97 41,62 43,06
36,21 38,30 40,15 41,77 43,19
43,32 44,52 45,54 46,41 47,13
43,45 44,63 45,64 46,49 47,19
43,57 44,74 45,73 46,56 47,26
43,70 44,84 45,82 46,64 47,32
43,82 44,95 45,91 46,71 47,38
43,94 45,05 45,99 46,78 47,44
44,06 45,15 46,08 46,86 47,50
44,18 45,25 46,16 46,93 47,56
44,29 45,35 46,25 46,99 47,61
44,41 45,45 46,33 47,06 47,67
2,3 2,4
47,72 48,21 48,61 48,93 49,18
47,78 48,26 48,64 48,96 49,20
47,83 48,30 48,68 48,98 49,22
47,88 48,34 48,71 49,01 49,25
47,93 48,38 48,75 49,04 49,27
47,98 48,42 48,78 49,06 49,29
48,03 48,46 48,81 49,09 49,31
48,08 48,50 48,84 49,11 49,32
48,12 48,54 48,87 49,13 49,34
48,17 48,57 48,90 49,16 49,36
2,5 2,6 2,7 2,8 2,9
49,38 49,53 49,65 49,74 49,81
49,40 49,55 49,66 49,75 49,82
49,41 49,56 49,67 49,76 49,82
49,43 49,57 49,68 49,77 49,83
49,45 49,59 49,69 49,77 49,84
49,46 49,60 49,70 49,78 49,84
49,48 49,61 49,71 49,79 49,85
49,49 49,62 49,72 49,79 49,85
49,51 49,63 49,73 49,80 49,86
49,52 49,64 49,74 49,81 49,86
3,0 3,5 4,0 4,5 5,0
49,87 49,98 49,997 49,9997 49,99997
1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2
273
DODATEK
C
PRAWDOPODOBIEŃSTWO DLA WSPÓŁCZYNNIKÓW KORELACJI
Stopień zgodności N punktów ( x j ^ ) , . . . , (x , y ) z linią prostą jest wyrażony przez współczynnik korelacji liniowej ls
=
N
N
E(^-^)(yj-y) 2
X(x -x) X(^-y)
2
1 / 2
;
który zawsze zawiera się w przedziale - l < r < l , Wartości r bliskie + 1 wskazują na wysoki stopień korelacji liniowej; wartości zbliżone do 0 wskazują na niewielką korelację lub jej brak. Bardziej ilościową miarę zgodności można znaleźć korzystając z tablicy C. Dla dowolnej określonej wartości r , P (\r\^ \r \) oznacza prawdopodobień stwo, że N zmierzonych wartości dwóch nieskorelowanych zmiennych da współczynnik korelacji r równy co najmniej r . Tak więc, jeżeli otrzymamy współczynnik r , dla którego Pjv(|r| ^ \r \) jest niewielkie, to jest mało praw dopodobne, że badane zmienne są nieskorelowane; korelacja została w ten sposób wykazana. W szczególności, jeżeli P (\r\)^\r \)^5%, to korelacja określana jest mianem istotnej; jeżeli prawdopodobieństwo jest mniejsze od 1 procenta, to korelacja jest określona jako wysoce istotna. Na przykład, prawdopodobieństwo, że 20 pomiarów (N — 20) dwóch nieskorelowanych zmiennych da |r|^0,5 jest zgodnie z tablicą równe 2,5 procent. Tak więc, jeżeli 20 pomiarów dałoby \r\ = 0,5, dysponowalibyśmy istotnym dowodem istnienia korelacji liniowej pomiędzy badanymi zmiennymi. Więcej informacji na ten temat można znaleźć w paragrafach od 9.3 do 9.5. Wartości zawarte w tablicy C obliczono przy użyciu całki 0
N
0
0
0
0
N
274
0
P (\r\>K\)= N
1 ) / 2 ]
"W
Jn
}
r[(JV-2)/2] irj
Patrz, na przyklad, E.M. Pugh, G.H. Winslow, The Analysis of Physical Measurements (Addison-Wesley, 1966), paragraf 12-8. Tablica C. Prawdopodobieństwo (w procentach) P Qr\ > r„) otrzymania ma podstawie N pomia rów dwóch nieskorelowanych zmiennych współczynnika korelacji \r\^r , wyrażone jako funkcja N i r . (Puste miejsca oznaczają wartości prawdopodobieństwa mniejsze od 0,05 procent.) N
0
0
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
3 4 5
100 100 100
94 90 87
87 80 75
81 70 62
74 60 50
67 50 39
59 40 28
51 30 19
41 20 10
29 10 3,7
0 0 0
6 7 8 9 10
100 100 100 100 100
85 83 81 80 78
70 67 63 61 58
56 51 47 43 40
43 37 33 29 25
31 25 21 17 14
21 15 12 8,8 6,7
12 8,0 5,3 3,6 2,4
5,6 3,1 1,7 1,0 0,5
1,4 0,6 0,2 0,1
0 0 0 0 0
11 12 13 14 15
100 100 100 100 100
77 76 75 73 72
56 53 51 49 47
37 34 32 30 28
22 20 18 16 14
12 9,8 8,2 6,9 5,8
5,1 3,9 3,0 2,3 1,8
1,6 1,1 0,8 0,5 0,4
0,3 0,2 0,1 0,1
16 17 18 19 20
100 100 100 100 100
71 70 69 68 67
46 44 43 41 40
26 24 23 21 20
12 11 10 9,0 8,1
4,9 4,1 3,5 2,9 2,5
1,4 1,1 0,8 0,7 0,5
25 30 35 40 45
100 100 100 100 100
63 60 57 54 51
34 29 25 22 19
15 11 8,0 6,0 4,5
4,8 2,9 1,7 1,1 0,6
1,1 0,5 0,2 0,1
0,15
0,2
N
0
0,05
0,1
-
-
-
-
0,3 0,2 0,1 0,1 0,1
-
-
0,2 -
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
0,25
0,3
0,35
0,4
0,45
50 60 70
100 100 100
73 70 68
49 45 41
30 25 22
16 13 9,7
8,0 5,4 3,7
3,4 2,0 1,2
1,3 0,6 0,3
0,4 0,2 0,1
0,1
80 90 100
100 100 100
66 64 62
38 35 32
18 16 14
7,5 5,9 4,6
2,5 1,7 1,2
0,7 0,4 0,2
0,1 0,1
-
-
-
-
-
-
-
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
-
275
DODATEK
D
i
PRAWDOPODOBIEŃSTWO DLA TESTU i
Jeżeli seria pomiarów została podzielona pomiędzy przedziały k = l,...n, to liczbę pomiarów zaliczonych do przedziału k można oznaczyć przez O . Oczekiwaną liczbę pomiarów (na podstawie założonego lub przewidywanego rozkładu) w przedziale k oznaczamy przez E . Stopień zgodności pomiędzy stwierdzonym doświadczeniem i założonym rozkładem jest określony przez zredukowaną wartość \ zdefiniowaną jako k
k
2
1
£ (O -E )
2
k
k
gdzie d jest liczbą stopni swobody, d = n — c, a c jest liczbą więzów (patrz paragraf 12.3). Oczekiwana przeciętna wartość 2 jest równa 1. Jeżeli x > to otrzymane w doświadczeniu wyniki nie zgadzają się z przewidywanym roz kładem; jeżeli x < 1, to zgodność jest zadowalająca. Powyższemu testowi można nadać ilościowy charakter, korzystając z pra wdopodobieństw zawartych w tablicy D. \ oznacza wartość x otrzymaną w doświadczeniu, dla którego liczba stopni swobody wynosi d. Wielkość Pd(% ^ xl) wyraża prawdopodobieństwo uzyskania x równej co najmniej wyznaczonej doświadczalnie wartości x , o ile pomiary naprawdę podlegają zakładanemu rozkładowi. Tak więc, jeżeli P (x ^ xl) dużą wartość, wyznaczony i przewidywany rozkład są ze sobą zgodne; jeżeli wspomniana wielkość jest mała, to najprawdopodobniej występuje pomiędzy nimi rozbież ność. W szczególności, jeżeli wartość P (y ^xl) J mniejsza niż 5 procent, mówimy, że niezgodność jest istotna i odrzucamy przewidywany rozkład na poziomie 5 procent. Jeżeli jest ona mniejsza od 1 procenta, niezgodność jest 2
2 > > 1
2
2
2
2
2
2
0
2
m
d
2
d
276
e s t
a
2
2
Tablica D . Prawdopodobieństwo (w procentach) P (x 5= X„ ) otrzymania w doświadczeniu o d stopniach swobody wartości x > X , wyrażone jako funkcja d i x - (Puste miejsca oznaczają wartości prawdopodobieństwa mniejsze od 0,05 procent.) d
2
2
2
0
0
V d
1 2 3 4 5
0
0,5
1,0
1,5
2,0
100 100 100 100 100
48 61 68 74 78
32 37 39 41 42
22 22 21 20 19
0,4 0,6
0
0,2
1 2 3 4 5
100 100 100 100 100
65 82 90 94 96
6 7 8 9 10
100 100 100 100 100
11 12 13 14 15
53 67 75 81 85
2,5
3,0
3,5
4,0
4,5
5,0
5,5
6,0
8,0
10,0
16 14 11 9,2 7,5
11 8,2 5,8 4,0 2,9
8,3 5,0 2,9 1,7 1,0
6,1 3,0 1,5 0,7 0,4
4,6
3,4
1,8 0,7 0,3 0,1
1,1 0,4
2,5 0,7 0,2 0,1
1,9 0,4
1,4 0,2 -
0,5 -
0,2 -
-
-
-
-
-
-
-
-
0,8
1,0
1,2
1,4
1,6
1,8
2,0
2,2
2,4
44 55 61 66 70
37 45 49 52 55
32 37 39 41 42
27 30 31 31 31
24 25 24 23 22
21 20 19 17 16
98 99 99 99 100
88 73 90 76 92 78 94 80 95 82
57 59 60 62 63
42 43 43 44 44
30 30 29 29 29
21 20 19 18 17
14 13 12 11 10
100 100 100 100 100
100 100 100 100 100
96 96 97 98 98
83 84 86 87 88
64 65 66 67 68
44 45 45 45 45
28 28 27 27 26
16 16 15 14 14
9,1 8,4 7,7
16 17 18 19 20
100 100 100 100 100
100 100 100 100 100
98 89 99 90 99 90 99 91 99 92
69 70 70 71 72
45 45 46 46 46
26 25 25 25 24
13 12 12 11 11
22 24 26 28 30
100 100 100 100 100
100 100 100 100 100
73 74 75 76 77
46 46 46 46 47
23 23 22 21 21
10 9,2 8,5 7,8 7,2
99 100 100 100 100
93 94 95 95 96
0,1 -
18 17 14 13 11
2,6
2,8
3,0
14 12 16 11 14 11 9,1 7,4 11 8,6 6,6 5,0 9,2 6,6 4,8 3,4 7,5 5,1 3,5 2,3
9,4 6,1 3,8 2,4 1,6
8,3 5,0 2,9
1,0 0,7 0,4 0,3 0,2
0,6 0,4 0,2
0,1 0,1 0,1
0,1 -
9,5 8,2 7,2 6,3 5,5
5,1 4,2 3,5 2,9
4,8 4,2 3,7 3,3 2,9
6,0 5,5 5,1 4,7 4,3
2,5 2,2 2,0
3,7 3,2 2,7 2,3 2,0
1,2 0,9 0,7 0,6 0,5
7,1 6,5
1,7 1,5
0,1
6,2
4,0 3,1 2,4
2,5
1,6
1,9 1,5
1,9 1,4 1,0 0,8
1,1 0,8 0,5 0,4
2,4 2,0 1,7 1,4 1,2
1,2 0,9 0,7 0,6 0,5
0,6 0,4 0,3 0,2 0,2
0,3 0,2
1,0 0,8 0,7 0,6 0,5
0,4 0,3 0,2 0,2 0,1
0,1 0,1 0,1
0,4 0,3 0,2
0,1 0,1 -
0,1 0,1
-
0,1 0,1 0,1
1,7 1,0
0,1 0,1
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
0,1 -
211
określana jako wysoce istotna, a przewidywany rozkład zostaje odrzucony na poziomie 1 procenta. Załóżmy, na przykład, że w wyniku eksperymentu, w którym liczba stopni wynosi 6 (d = 6), otrzymaliśmy zredukowaną wartość chi kwadrat równą 2,6 (tj. x 2,6). Zgodnie z tablicą D, prawdopodobieństwo uzyskania X ^ 2,6 wynosi 1,6 procent, o ile pomiary podlegają przewidywanemu roz kładowi. Tak więc na poziomie 5 procent (chociaż niezupełnie na poziomie 1 procenta) należałoby odrzucić przewidywany rozkład. Więcej informacji na wspomniany temat można znaleźć w rozdziale 12. Wartości z tablicy D zostały wyznaczone na podstawie całki 2
=
0
2
O
00
Patrz, na przykład, E.M. Pugh, G.H. Winslow, The Anałysis Measurements (Addison-Wesley, 1966), paragraf 12-5.
oj Physical
BIBLIOGRAFIA
Poniżej zamieściłem listę książek, które moim zdaniem są użyteczne. Zostały one ułożone według stopnia zaawansowania i szerokości obejmowanej tematyki. Pięknym i jasnym wprowadzeniem do metod statystycznych, nie posługującym sie rachunkiem całkowym jest książka Olivera L. Lacy'ego, Statistical Methods in Experimentation (MacMillan, 1953). Nieco bardziej zaawansowana, ale równie jasna i nie opierająca się rachunku całkowym jest książka Henry L. Aldera i Edwarda L. Roesslera, Introduction to Probability and Statistics (Freeman, 1977). Trzy kolejne podręczniki reprezentują poziom zbliżony do mojej książki oraz omawiają w dużej mierze te same tematy: D. C. Baird, Experimentation; An Introduction to Measurement Theory and Experiment Design (Prentice Hall, 1962); N. C. Barford, Experimental Measurements; Precision, Error and Truth (Addison-Wesley, 1967); Hugh D. Young, Statistical Treatment of Experimental Data (McGraw-Hill, 1962). Rozwinięcie kolejnych tematów i liczne wyprowadzenia można znaleźć w następujących bardziej zaawansowanych podręcznikach: Philip R. Bevington, Data Reduction and Error Analysis for the Physical Sciences (McGraw-Hill, 1969); Stuart L. Meyer, Data Analysis for Scientists and Engineers (John Wiley, 1975); Emerson M. Pugh i George H. Winslow, The Analysis of Physical Measurements (Addison-Wesley, 1966).
H. Abramowicz, Jak analizować wyniki pomiarów, PWN, Warszawa 1992. S. Brandt, Metody statystyczne i obliczeniowe analizy danych, PWN, Warszawa 1976. W. T. Eadie i in., Metody statystyczne w fizyce doświadczalnej, P W N , Warszawa 1989. G. L. Squires, Praktyczna fizyka, PWN, Warszawa 1992. H. Szydłowski, Pracownia fizyczna, wyd. VII popr., PWN, Warszawa 1994. Teoria pomiarów, praca zb. pod red. H. Szydłowskiego, PWN, Warszawa 1981.
279
ODPOWIEDZI DO WYBRANYCH
ZADAŃ
Uwaga o cyfrach znaczących: N a skutek stosownia różnych procedur zaokrąg lenia mogą powstawać małe różnice w najmniej znaczących cyfrach, jednak zwykle nie są one ważne. W zadaniach z rozdziałów 2 i 3 niepewności podane poniżej obliczono najprostszymi metodami przy zaokrąglaniu do jednej cyfry znaczącej po każdym etapie obliczeń. W kilku przypadkach, gdzie bardziej złożone procedury dają inny wynik, dokładna odpowiedź, zaokrąglona od powiednio na końcu rachunków, przedstawiona jest w nawiasach. W przypad ku zadań z rozdziałów 4-12 wszystkie wyniki otrzymano za pomocą kal kulatora (z dziesięcioma cyframi na wyświetlaczu), a następnie zaokrąglono.
Rozdział 2 2.2
(a) 5,03+0,04 metra, (b) Jest silny argument na pozostawienie dodatkowej Zcyfry znaczącej i zapisanie wyniku w postaci 19,5 + 1 s. (c) (—3,2+0,3) • 1 0 " culomba. (d) (0,56 + 0,07)-10" metra, (e) (3,27 + 0,04) • 10 g-cm/s. (a) Jedynym sensownym wynikiem na tym etapie jest 1,9 + 0,1 g/cm . Rozbieżność równa jest 0,05 g/cm i nie jest znacząca. Kolumna zmiany momentu pędu (L — L') powinna wyglądać następują co: 0,3 + 0,9; - 0 , 6 + 1 , 5 ; - 2 , 2 + 2 (co można zaokrąglić do - 2 ± 2 ) ; 1 ± 4 ; 1 ± 4 ; —4 + 4. Różnica (L — L') powinna teoretycznie być równa zeru. We wszystkich przypadkach z wyjątkiem jednego wartość zmierzona jest mniejsza niż niepewność. W tym jedynym zaś ( — 2,2 + 2) jest niewiele większa. Można zatem stwierdzić, że wartości zmierzone są zgodne z war tością oczekiwaną równą zeru. 1 9
6
2.3
3
3
3
2.5
280
Rysunek 0 2 . 8
2.8
(a) Ponieważ istnieje prosta (jak na rys. 02.8), która przechodzi przez początek układu współrzędnych i przez wszystkie granice błędów, więc dane są zgodne z przewidywaną zależnością v cc h. (b) Nachylenie prostej, będącej wynikiem najlepszego dopasowania «18,4; Największa wartość nachylenia prostej będącej jeszcze sensow nym dopasowaniem «20,4; wartość najmniejsza «16,4. Tak więc na chylenie prostej, będącej najlepszym dopasowaniem do punktów pomia rowych, równe jest 18,4 + 2 m / s (lub ewentualnie 18 + 2) i zgadza się ze spodziewaną wartością 19,6 m / s . Powstaje pytanie, czy powinno się wymagać, żeby tak kreślone proste przechodziły przez początek układu współrzędnych czy też nie? Odpowiedź zależy od szczegółów doświad czenia. W naszym przypadku proste mogą omijać zero i stąd tak duża niepewność. 2
2
2
2.9
(a) Z rysunku 02.9(a), który obejmuje początek układu współrzędnych, nie sposób stwierdzić, czy T zmienia się w zależności od A. Zmienność T o d A ujawnia się natychmiast na rysunku 02.9(b), na którym skala na osi rzędnych jest znacznie zwiększona. Oczywiście dobór odpowiedniej skali wykresu musi zależeć od rozważanego problemu. (b) Jeśli na obu rysunkach zaznaczono by granice błędów 0,3 s (w górę i w dół), to w oczywisty sposób nie byłoby powodów do stwierdzenia, że Tzmienia się wraz z A. 2 . 1 2 (a) Różnice prędkości v — v są równe 4,0 + 0,3 cm/s i 0,6 + 0,4 cm/s. (b) Niepewności względne tych wyników to odpowiednio 8 procent i 70 procent. k
p
281
2 . 1 4 Wynik
Niepewność 2
(a) 292 c m (b) 270 cm • s (c) 12 kg-m
procentowa
Niepewność
bezwzględna
2
3% 10% 10%
9 c m (lub „dokładnie" 7) 30 cm • s 1 kg-m
2.15 (a) q
= 10-20 = 200; (największa prawdopodobna wartość ą) = 11-21 = 231; (najmniejsza prawdopodobna wartość q) = 9 • 19 = 171. Zasada wyrażona równaniem (2.27) daje wynik ą = 200 ± 3 0 , co dobrze się zgadza. (b) (największa prawdopodobna wartość) = 18-35 = 630; (najmniejsza prawdopodobna wartość) = 2-5 = 10. Reguła (2.27) daje q = 200 + 300 (tj.
max
min
Rozdział 3 3.1 (a) 32 + , / 3 2 « 3 2 + 6. (b) 786 + 7 786 * 7 9 0 + 30. (c) 16 + 3 dla A, 13,1+0,5 dla B. Zauważ, że odpowiedzi studentów A i B są zgodne, ale odpowiedź B jest obarczona mniejszą niepewnością.
282
3.3 (a) 3 ± 7 . (b) 40 + 20. (c) 0,5 + 0,1. (d) 63 + 6.
3.4 (a) 0,48 + 0,02 s (lub 4%). (b) 0,470 + 0,005 s (lub 1%). (c) Nie. Po pierwsze wahadło w końcu się zatrzyma, chyba że jest utrzymywane w ruchu. Jednak nawet jeśli wahadło jest utrzymywane w ruchu, istotne staną się inne czynniki, które zniweczą nasze starania osiągnięcia coraz większej dokładności. N a przykład jeśli mierzymy czas przez wiele godzin, czyn nikiem ograniczającym może stać się dokładność stopera, okres Z zaś może zmieniać się na skutek zmiany temperatury, wilgotności itd. 3.6 Głębokość 4 0 + 1 0 metrów. (Bardziej dokładne rachunki dają 4 4 + 1 5 , co można byłoby zostawić bez zaokrąglenia.) 3.8 „suma błędów" „pierwiastek z sumy kwadratów" a+b a+c a+d
80 + 8 90 + 6 58 + 5
80 + 6 90 + 5 58 + 5
3.10 (a) 0,70 + 0,05 MeV. (b) 0,40 + 0,01 MeV.
3.11 (a) sin 8 = 0,82 + 0,02. (Nie zapomnij, że kiedy korzystamy ze wzoru 5 (sin B) = | cos 9150, wtedy 50 musi być wyrażone w radianach) ( b ) / = e - , 5 / = / 5fl, e = 2 0 ± 2 . (c) / = l n a , 5 / = 5o/a , Ina = 1,10 + 0,03. a
a
n p
n p
np
np
np
3.14 n= 1,66 + 20%; 1,52 + 9%; 1,54 + 6%; 1,58 + 3 % ; 1,53 + 2%. W miarę wzrostu wielkości kąta wartość bn/n zmniejsza się. Jest tak głównie dlatego, że niepewność bezwzględna jest stała; tak więc, gdy kąty są duże, niepewności względne maleją. 3.16 (a) 1 i 1. (b) y i x. (c) 2xy i 3x y . 3
2
2
2
3
2
2
3
3.17 (c) Lewa strona równania = (x + u) (y + v) = (x + 2xu + u )(y + + 3y v + 3yv + v ) = x y + 2xy u + 3x y v + (składniki zawierające u , uv, v i wyższe potęgi). Prawa strona równania = x y + 2xy u + 3x y v. Tak więc, jeśli u i v są małe, to (Lewa strona równania)«(Prawa strona równania). 3.19 (a) Poprawny wynik to bq = 0,005, ale metoda obliczenia niepewności krok po kroku daje rezultat dq = 0,1. (b) 8q = 0,1 obliczone oboma sposobami. W punkcie (a) liczby są takie, że mały błąd w x zmienia x + y i x + z w prawie takim samym stosunku i znosi się to w ilorazie (x + y)/(x + z); obliczenia krok po kroku ignorują taką możliwość. W punkcie (b) błąd x zwiększa x + y, ale zmniejsza x + z i na odwrót, zatem błąd wyznaczenia q nie znosi się. 2
2
3
2
3
3
2
2
2
2
2
3
3
2
2
283
Rozdział 4 4.1
x = 7,2;
4.3
d = ( 1 / A 0 E 4 = ( W E f o - * ) = ( 1 / W ) z > i - ( W ) W * = x-x = 0. Jeś li któryś z kolejnych kroków nie jest jasny, przepisz sumy w jawnej postaci, tj. = d +d + ... +d itd.
X
x
2
2
Y {X-X)
4.4
J
N
= Y (xj-2x x
+ x)
= Y x -2xY x
+
j
i
2
2
J
J
i
= Y,x i-2xNx 2
2
Nx 2
+ Nx
Y x -Nx . 2
=
2
J
(Jeśli masz jakieś wadliwości, przepisz jeszcze raz sumy w jawnej postaci.) 4.7 (a) t = 8,149 s, a = -0p9 s. (b) Poza l±a spodziewamy się 30%, czyli 9 pomiarów, dostaliśmy zaś 8. Poza 1 ±2a spodziewamy się 5%, czyli 1,5 pomiaru, a otrzymaliśmy 2. 4.9 (Ostateczny wynik t) = ~t±o- = 8,149 + 0,007 s. 4.11 A = 1221,2 m m , c r = 0,3 m m . Bardzo dobrze zgadza się to z wartoś cią 1221,2 + 0,4 m m podaną w tekście. 4.13 (a) 3 3 6 + 1 5 m/s. Systematyczna niepewność 1% wyznaczenia/jest za niedbywania w porównaniu z 4,5% niepewności X. (b) 336 + 11 m/s. W tym przypadku dominuje niepewność systematyczna. t
t
t
t
2
2
3
2
Rozdział 5 5.1 Przyjrzyj się rysunkowi 0 5 . 1 . Krzywa przerywana na rysunku 05.1(c) przedstawia rozkład Gaussa z zadania 5.4. 5.2 (a) C = l/(2a). (b) Wszystkie wartości pomiędzy —a i a występują z rów nym prawdopodobieństwem; brak jest wyników na zewnątrz przedziału od — a do a. (c) x = 0, a = a / ^ / 3 . 5.4 Patrz rozwiązanie zadania 5.1. 5.6 Całkę J z e " d z można zapisać w postaci J u d u , stosując podstawienia u = z i v = e " . Całkując przez części, otrzymamy człon [ M D ] " , który w naszym przypadku jest równy zeru. 5.8 (a) 68%. (b) 38%. (c) 9 5 % . (d) 48%. (e) 14%. (f) 22,3 23,7. 5.10 Zwróćcie uwagę, aby poprawnie zróżniczkować P; w wyniku powinniście otrzymać x
2
z 2 / 2
z 2 / 2
x
dP/da = G
284
(N +
3)
Y (x-X) -Na 2
J
2
exp
-Y (x-X) /2a 2
J
2
P osiąga maksimum, gdy dP/da = 0, co prowadzi do poszukiwanego wyniku. b)
a)
A
A
0,2
0,2
N=5 7Y= 10
j
_
i
_
9
7
j
i_
_
_
5
3
_1
1
3
5
7
9
-9
i
i
-7 -5
(ip-ik) I
c)
i_
- 3 -1 1 (ip-ik)_
3
5
7
l
fk.
0,2
Y
• >.
N=50
/ r* (•
-1
-9
-5
-3
-1
1
3
5
7
9
(Ip-Ik)
Rysunek 0 5 . 1
5.12 (a) er = 7,04. (b) t = 74,25; t — 67,75 itd. Jeżeli przez t oznaczymy średnią dowolnej grupy czterech pomiarów, to spodziewamy się, że
r
1
2
t
/ 10 średnich z grupy 4 pomiarów
0,4 0,3
40 pojedynczych pomiarów
/
0,2 0,1 0
12 9u
SLeT0
^°^
rze
P działu = er? = 3,56
Rysunek 05.12
285
5.13 Wynik uzyskany przez studenta (9,5) różni się od przewidywanego położenia środka rozkładu (9,8) o 0,3, co stanowi trzy odchylenia standardowe. Prawdopodobieństwo otrzymania wyniku oddalonego o co najmniej trzy odchylenia standardowe od środka rozkładu jest równe P (poza 3cr) = 0,3 procent. Jest to tak mało prawdopodobne, że należy podejrzewać, iż pomiary nie podlegają rozkładowi normalnemu wokół 9,8 z a = 0,1; tzn. albo student popełnił gruby błąd, albo w doświadczeniu występuje pewien błąd systematyczny. 5.15 E — £ = 1 5 M e V , z odchyleniem standardowym równym 9,5 MeV. Jeżeli pomiary podlegałyby rozkładowi normalnemu ze środkiem w E — E = 0 i cr = 9,5 MeV, to wynik pomiaru różniłby się od wartości prawdziwej o 15/9,5, czyli 1,6 odchylenia standardowego. Ponieważ P(poza l,6
p
k
p
Rozdział 6 6.2 (a) V = 0,862 wolta, a = 0,039 wolta, (b) Student odrzuci ten wynik. Rezultat 0,95 różni się od V o 0,088 lub 2,3 a. Ponieważ P(poza 2,3 a) = 2,1 procent, więc w dziesięciu pomiarach spodziewalibyśmy się jedynie 0,21 pomiarów różniących się o tyle lub więcej od wartości V. Zgodnie z kryterium Chauveneta wynik ten należy odrzucić. 6.3 Studentka nie odrzuci wyniku 12. W przypadku jej doświadczenia T = 7,00 i Oj = 2,72; tak więc 12 różni się od T o 5, czyli o 1,84. Ponieważ P (poza 1,84 a) = 6,6 procent, więc w 14 pomiarach spodziewa libyśmy się 0,92 pomiaru, który różniłby się o tyle lub więcej od T. v
Rozdział 7 7.1 (a) Przedstawione dwa pomiary są spójne i najlepsze przybliżenie oparte na nim jest równe 334,4 + 0,9 m/s. (b) Te wyniki także są spójne (może nawet bardziej). W tym przypadku najlepsze przybliżenie równe jest 334,08 + 0,98, co pewnie zostałoby zaokrąglone do 334 + 1 m/s. Jest oczywiste, że drugi wynik jest obarczony na tyle dużą niepewnością w porównaniu z pierwszym, że nie warto brać go pod uwagę. 7.2 (a) 76 + 4 omy. (b) około 26 pomiarów.
286
7.5 Zgodnie z równanie (3.47),
2
2
k..) =ę(^s) ' Występująca tu pochodna równa jest 3x /3x; = wjC^wA. Jeśli nie widzisz tego natychmiast, przepisz sumę ^ w x jako w x + w x + ... a na N N stępnie zróżniczkuj ją względem x x itd. Zatem np
(
;
l 5
(a
2
p
c z
y
H
2
K „ ) = VE P
w
1
2
2
+w x ,
2
) =
v
1
2
V(w a\.) , ;
(yV-)
i' ponieważ
<7
X
= ,/wj".
Rozdział 8 8.1 ^4 = 9,00; B = 2,60. Dopasowaniem jest linia prosta przedstawiona na rys. 0 8 . 1 . (Linia przerywana wiąże się z zadaniem 8.9.)
Rysunek 0 8 . 1
8.3 Argumentacja przebiega podobnie do przedstawionej przy wyprowadza niu równania (8.12) z równania (8.2). Jedyną istotną różnicą jest to, że cały czas A = 0. Tak więc P(y ,...,y ) ocexp( — % /2) jak we wzorze (8.4), 2
N
287
2
8.4
gdzie % dane jest wzorem (8.5), w którym A = 0. Po zróżniczkowaniu względem B dostajemy wzór (8.7) (gdzie także A = 0), wreszcie roz x ; X ? wiązaniem jest B = (X .3 i)/(E ' )Podobnie jak w zadaniu 8.3, wyprowadzenie przebiega podobnie jak wyprowadzenie wzoru (8.12) ze wzoru (8.2). Tak jak w równaniu (8.4), Piy^..., y )ccexp( —x /2), ale ponieważ pomiary obarczone są różnymi niepewnościami, więc x = Z > ( ^ ~~B i) - (Pamiętaj, że w = l/c?.) Następne kroki są takie same jak poprzednio. u = 41 + 1 m/s. (a) Musisz znaleźć wartość er, dla której P ( y , . . . , y ) w równaniu (8.4) jest największe. Pochodna dP/da równa jest 2
N
2
w
—
x
2
t
8.6 8.8
1
-(N
a
+
3)|-£
^
_
_
A
B
X
i
)
2
__
N
a
2 ^
e
x
p
2
(
_
x
2
/
2
)
.
przyrównując ją do zera, otrzymujemy szukaną wartość
N
t
N
i
2
Po podstawieniu dA/dy = [(E* ) — i * dokonaniu kilku prostych przekształceń otrzymujemy wzór (8.15). Podobny rachunek daje a . 8.9 A' = - 2 , 9 + 1,2; B' = 0,35 + 0,08. Korzystając z wartości A i B znalezio nych w zadaniu 8.1, moglibyśmy obliczyć A'= —3,5 i B' = 0,38, co w granicach niepewności eksperymentalnej odpowiada nowym wartoś ciom. Tak więc, mimo że obie metody prowadzą do innych prostych (patrz rys. 08.1), to różnica nie jest w rzeczywistości znacząca. 8.11 Najlepsze przybliżenie g = 9,4 m/s . 8.13 A = 5,5 cm, B = 11,1 cm. 8.14 T = 2,0 godziny. x
t
B
2
Rozdział 9 9.1
Obliczenia są najprostsze, jeżeli zauważy się, że funkcja A (t) to po prostu A(t)
9.3
(a)
= al + 2t(T
XY
+
2t
2
= Ź ^ ^ - ^ - y ^ + ^ y ) = (Y x y )-x(^y )-y(Y x ) = (l x y )-Nxy). i
i
i
i
i
288
i
J
i
i
+ Nx y
9.5 (a) P l i r > : . - = . jest całkiem pra' korelacja liniowa. W nego" argumentu na korzyść związki (b) P ( | r | 5=0,5) = 2 procent. Pome cent, jest to „istotny" argument za związkiem Smarnym 9.6 (a) r = - 0 , 9 7 . Ponieważ P (\r\5=0,97) * 1.2. cja. (b) r = - 0 , 5 7 . Ponieważ P (\r)\ 50,57) * 31 procei to o korelacji. 5
20
5
5
b)
a) y 4 3 2 1
J 1
I
I
L
2
3
4
J 1
5 x
I
i
2
3
I 4
L 5 x
Rysunek 0 9 . 6
Rozdział 10 10.2 (a) Dla dwóch rzutów prawdopodobieństwo otrzymania 0, 1 lub 2 szó stek wynoszą odpowiednio 69,44; 27,78 i 2,78 procent, (b) Dla czterech rzutów prawdopodobieństwa otrzymania 0, 1,..., 4 szóstek są odpowie dnio równe 48,23; 38,58; 11,57; 1,54 i 0,08 procent. 3 3
10.4 (p + q) =
X
v
pV-
v
3
2
2
3
=
v= 0
10.6
Szansa przeżycia dla dowolnego pacjenta wynosi p = 0,2, tak więc P(przeżyje v pacjentów) = 64,0,2 (v). (a) 4 1 % . (b) 4 1 % . (c) 18%. 10.7 4 0 , 2 % , 4 0 , 2 % , 16,1%, 3 , 2 % , 0,32%, 0,01%. 10.9
a = (v-v) = X/(v)(v-v) = 2
2
2
v
£/(v)(v -2vv 2
2
+ v )
= CL/(v)v ]-2vX/(v)v +v £/( ) =7 - v . 2
2
2
V
Zauważmy, że zastępując sumy całkami, możemy udowodnić analogicz ny związek dla rozkładu ciągłego, takiego jak rozkład Gaussa.
289
=X("jpV
10.10 Dla dowolnych p i q, (p + q)"
v
- Wykonując dwukrotne
różniczkowanie względem p, dostajemy 2
n(n-l)(p
+ qT-
v 2
=
n
Zv(v-l)(^jp - q -\
2
Mnożąc przez p i podstawiając q = l—p, otrzymujemy 2
I
=X(v -v)fc„, (v) = 7 - v .
2
n(n-l)p
p
2
2
Ponieważ v = np, oznacza to, że v = n(n — l)p + np. Podstawiając do równania wyprowadzonego w zadaniu 10.9 a = v — v (gdzie v = np), dochodzimy do szukanego wyniku. 9,68 procent (dla przybliżenia rozkładem Gaussa) i 9,74 procent (bez stosowania przybliżenia). P(v^l8)«P (v5l7,5) = P ( v 5 v + 2cr) = 2,28 procent. P(v5=12) = 0,65 procent (jeżeli stosowanie nawozu pozostaje bez zna czenia). Tak więc 12 „sukcesów" daje wynik „istotny" i „wysoce istot ny". Spodziewamy się, że egzamin zda 360 uczniów. P(zda co najmniej 420)«P (v5=360-l-5cr) = 0,00003 procent daje wysoce istotny wynik. 2
10.13 10.14 10.16
10.18
G a u s s
2
2
G a u s s
Gauss
Rozdział 11 11.1 11.2
(a) Dla v = 0, 1,..., 6, p ( v ) = 60,7; 30,3; 7,6; 1,3; 0,2; 0,02; 0,001 procent. (a) Z p (v) = e->Z pVv\=e-»e = l. (b) Różniczkując równanie (11.12) względem p, otrzymujemy 1/2
1
ll
i
fl
v 1
v
Y e~ (vn - -p )/v\ J
= 0
lub, korzystając ponownie z równania (11.12) v_1
Xve-^ /v! = 1. 11.4
290
Mnożąc przez p, otrzymujemy £ vp^(v) = p, co daje poszukiwany wynik, (a) p = (liczba jąder) -p = 1,5. (b) Prawdopodobieństwa zaobserwo wania v rozpadów, gdzie v = 0 , 1 , 2, 3, są odpowiednio równe 22,3; 33,5; 25,1 i 12,6 procent, (c) P ( v ^ 4 ) = 6,5 procent.
11.5
Pionowe kreski na rysunku O l 1.5 reprezentują wyznaczony w doświad czeniu rozkład. Kształt przewidywanego rozkładu Poissona p (v) został zaznaczony linią ciągłą. Zgodność obydwu rozkładów jest dobra. 3
oczekiwany rozkład Poissona P3(v)
o
10 v
0
R y s u n e k O l 1.5
11.7
v = 2,84,
11.9
Prawdopodobieństwo zarejestrowania v zliczeń jest równe Pp( o) W o " Wartość p, dla której prawdopodobieństwo to osią ga maksimum, można znaleźć obliczając pochodną względem p i przy równując wynik do zera. Wspomniana pochodna ma postać
v
0
v
=
e
_
v
v
M °)/v ! 0
i jest równa zeru, gdy p = v . 11.10 (a) 3,2 procent (dla przybliżenia rozkładem Gaussa), 3,4 procent (bez stosowania przybliżenia), (b) 8,5 procent (dla przybliżenia rozkładem Gaussa), 7,7 procent (bez stosowania przybliżenia). 11.11 (a) p (l) = 11,7 procent itd. (b) P ( v < 6 ) + P ( v ^ 12) = 40,3 procent. Za rejestrowanie 12 zliczeń nie jest wcale zaskakujące; tak więc nie ma powodów, by wątpić, że p = 9. 0
g
Rozdział 12 2
12.1 Oczekiwane liczby = 7,9; 17,1; 17,1; 7,9 i j = 10; zmierzone dane zupeł nie nie odpowiadają rozkładowi normalnemu. 12.4 Oczekiwane liczby = 231,5; 138,9; 29,6; j = 2,5; dla trzech przedziałów 1
291
2
X = 2,5 jest rozsądnym wynikiem i nie ma powodów, aby wątpić w dobrą jakość kości. 12.5 (a) W zadaniach 12.1 i 12.2 c = 3 i d = 1; w zadaniu 12.3 c = 1 i d = 5; w zadaniu 12.4 c = 1 i d = 2. (b) W przypadku gdy p było znane z góry, c = 2 i d = 2. 12.6 Ponieważ d = 1, % = X = 10; ^ i ( X ^ 1 0 ) 0>2 procent; Możemy za tem odrzucić rozkład normalny zarówno na poziomie 5 procent, jak i 1 procenta. 12.8 Prawdopodobieństwa otrzymania wyników 2, 3,..., 12 są równe 1/36, 2/36,..., 6/36,..., 1/36. Oczekiwane liczby odpowiednich zdarzeń E wynoszą 10, 20,..., 60,..., 10. x = 19,8, d = 10 i ^ = 1,98. P ( x 5 1 , 9 8 ) «3,2. N a poziomie 5 procent moglibyśmy przypuszczać, że kości są sfałszowane, ale nie na poziomie 1 procenta. 12.10 x = 1>2. P iX ^ 1,2)«30 procent. Ponieważ x > l , 2 j e s t całkiem praw dopodobne, nie ma powodów, aby wątpić w jakość kości. 12.12 (a) E(v = 0) = 5,4; E(v = 1) = £(v = 2) = 10,8; £ ( v ^ 3 ) = 13,0. X = 9,7; d = 3 i x = 3,2. P (% 5=3,2) « 2 , 5 procent; na poziomie 5 pro cent odrzucilibyśmy rozkład Poissona z p = 2. (b) i = 2 i 2 = 0,3; co oznacza, że dane są zgodne z rozkładem Poissona z p = 1,35. 12.13 (a) x — 2,25; P ( % 5 2 , 2 5 ) « 1 4 procent, a więc brak istotnej różnicy. P (v 511) + P (v ^ 5) = 21,0 procent. (b) x = 6,25; P J * 5 6,25) « 1 , 2 procent; P (v> 224,5) + P ( v ^ 175,5) = = 1,4 procent. N a poziomie 5 procent występuje istotna różnica. (c) Poprawiony ^ = 1,56. P (x 51,56)«21,2 procent, co pozostaje w doskonałej zgodności z wynikiem dokładnym 21,0 procent. p
2
2
2
=
k
2
2
2
10
2
2
2
2
2
2
2
3
2
2
2
1
2
2
2
2
±
SKOROWIDZ (przygotował Adam Babiński)
[ W skorowidzu ujęte są zagadnienia i pojęcia pojawiające się w książce oraz niektóre najbardziej istotne przykłady ich zastosowań.] x
fx.A )
funkcja Gaussa patrz rozkład normalny
A I symbol Newtona 212 n\, silnia patrz silnia X , chi kwadrat patrz chi kwadrat, test chi kwadrat x , najlepsze przybliżenie x, 28 a , kowariancja xi y patrz kowariancja a-, odchylenie standardowe patrz odchylenie standardowe a , odchylenie standardowe średniej patrz od chylenie standardowe średniej p^ (v), rozkład Poissona patrz rozkład Poissona znak sumy 99 a, szerokość rozkładu normalnego patrz rozkład normalny 2
n
xy
x
antykorelacja patrz korelacja negatywna błąd 15-16, 28, patrz też niepewność - prawdopodobny 133-134 - prawdziwy 32 - przypadkowy 96-98, 109-111 - standardowy patrz odchylenie standardowe średniej średniej patrz odchylenie standardowe śre dniej - systematyczny 25-26, 56-57, 96-98, 108-111
- średniej 104, patrz też odchylenie standardo we średniej Chauveneta kryterium patrz kryterium Chauveneta chi kwadrat, 167, 175, 246, 248, 251, patrz też test chi kwadrat, x , X , jako miara zgodności rozkładów 246-147 > Z , poprawione, 267 zredukowane, % 254, 276 cyfry znaczące 29-31 a niepewność względna 43-44 w iloczynie 52 2
x
2
2
2
2
dodawanie wartości zmierzonych patrz przeno szenie niepewności, suma wartości zmie rzonych dokładność 42, patrz też niepewność względna dwumian Newtona 60-61, 89, 213, 227 dyspersja patrz odchylenie standardowe dzielenie wartości zmierzonych patrz prze noszenie niepewności, iloraz wartości zmierzonych ekstrapolacja 181-182 erf(t) patrz funkcja błędu funkcja błędu 132-133, 153, 269-273
293
funkcja Gaussa 128, patrz malny
też rozkład nor
F W H M patrz szerokość połówkowa gęstość złota 18-19 graficzna metoda wyznaczania niepewności patrz przenoszenie niepewności, metoda gra ficzna graficzne sprawdzanie proporcjonalności 37-41 granice błędów 39 - - na wykresie 39-40, 49, 173 graniczny kąt załamania 73, patrz też współ czynnik załamania światła hipoteza bardzo istotna (1%) 223, 256 - istotna (5%) 223, 256 - statystyczna 221 - , testowanie patrz testowanie hipotez - zerowa 221 histogram 117 - komórkowy 118-119 - słupkowy 118 Hooke'a prawo patrz współczynnik sprężysto ści iloczyn wartości zmierzonej i stałej liczby patrz przenoszenie niepewności, iloczyn wartości zmierzonej i stałej liczby zmierzonych patrz przenoszenie niepewno ści, iloczyn wartości zmierzonych iloraz wartości zmierzonych patrz przenoszenie niepewności, iloraz wartości zmierzonych interpolacja 24 komórka patrz przedział kompensacja błędu 67-69, 85 korelacja 198, patrz też współczynnik korelacji - istotna 205 - negatywna (antykorelacja) 203 - współczynnika inteligencji IQ 208 kowariancja 197 - a przenoszenie błędów 195-199 - a współczynnik korelacji 201 kryterium Chauveneta 161-165 krzywa dzwonowa 124-126, patrz też rozkład normalny liczebność 116 linearyzacja 184 metoda Gaussa patrz kwadratów
294
metoda
najmniejszych
- najmniejszych kwadratów 168-192 , dopasowanie funkcji wykładniczej 184-186 , - linii prostej 174-182 , - wielomianu 182-184 uwzględniająca wagi statystyczne 186, 188-189 - regresji liniowej 174, patrz też metoda naj mniejszych kwadratów - wyrównawcza 174, patrz też metoda naj mniejszych kwadratów mnożenie wartości zmierzonej i stałej liczby patrz przenoszenie niepewności, iloczyn war tości zmierzonej i stałej liczby zmierzonych patrz przenoszenie niepewno ści, iloczyn wartości zmierzonych największe prawdopodobieństwo patrz zasada największego prawdopodobieństwa niepewności niezależne patrz przenoszenie nie pewności niezależnych - w pomiarach bezpośrednich 54-57 niepewność 28 - bezwzględna 42 - odczytu skali 21-24 - pomiarów wielokrotnych 24-26 - procentowa 42, patrz też niepewność względna - przypadkowa patrz błąd przypadkowy - systematyczna patrz błąd systematyczny - średniej patrz odchylenie standardowe śred niej ważonej 169, 171 - w zliczaniu zdarzeń losowych patrz zliczanie zdarzeń losowych - wartości funkcji jednej zmiennej patrz prze noszenie niepewności, funkcja jednej zmien nej wielu zmiennych patrz przenoszenie nie pewności, funkcja wielu zmiennych - wyrażenia potęgowego patrz przenoszenie niepewności, wyrażenie potęgowe - względna 41-44 a cyfry znaczące 30-31, 43-44 , iloczyn dwu wartości zmierzonych 44-47 - , znaczenie 25, 148 nierówność Schwarza 198, 206 normalizacja patrz warunek normalizacji normalna całka błędu patrz funkcja błędu odchylenie 99-100, patrz też odchylenie stan dardowe odchylenie standardowe 100-102, 111
, definicja 100 , - „poprawiona" 101-102 dużej próby 102, patrz też odchylenie stan dardowe jako granica 68% ufności 131-134 jako niepewność pojedynczego pomiaru 102-104 malej próby 102, patrz też odchylenie stan dardowe rozkładu 137 dwumianowego patrz rozkład dwu mianowy, odchylenie standardowe granicznego patrz rozkład graniczny, odchylenie standardowe normalnego patrz rozkład normalny, odchylenie standardowe Poissona patrz rozkład Poissona, od chylenie standardowe - - średniej 104-105 , uzasadnienie 145-147 - średnie 100, 111 odejmowanie wartości zmierzonych patrz prze noszenie niepewności, różnica wartości zmie rzonych odrzucanie danych 159-165 ogólna teoria względności, potwierdzenie 20-21 OS 106, patrz też odchylenie standardowe OSŚ 196, patrz też odchylenie standardowe średniej paralaksa 97 pierwiastek kwadratowy z wartości zmierzonej patrz przenoszenie niepewności, pierwiastek kwadratowy pochodna 74 - cząstkowa 86, 93 pole powierzchni prostokąta 106-107, 113 porównanie dwu wartości zmierzonych 34-37, 147-151 - wartości zmierzonych i akceptowanych 32-34, 147-151 poziom istotności 223, patrz też hipoteza prawdopodobieństwo dwustronne 225-226 - jednostronne 225-226 prędkość dźwięku 33-34, 112-113 promieniowanie kosmiczne 237-238, patrz też zliczanie zdarzeń losowych proporcjonalność 37, patrz też graficzne spraw dzanie proporcjonalności prosta regresji 176, patrz też metoda najmniej szych kwadratów
przedział 118-119, 243-244. 248-249. 257 - ufności 148 przemiana izochoryczna gazu doskonałeg 179-182, 189 przenoszenie błędów patrz przenoszenie niepe wności - niepewności 53-94, 193-199 a kowariancja 195-199 , błędy niezależne 66-73 - , dowód reguły ogólnej 144-145 , funkcja jednej zmiennej 73-77 , - wielu zmiennych 85-87, 144-145 , górna granica 198 , iloczyn wartości zmierzonej i stałej liczby 63-64 - - , - - zmierzonych 44-47, 59-63, 70-71 , iloraz wartości zmierzonych 59-63, 65-66. 70-71 krok po kroku 77-78 , metoda graficzna 73-76, 90-91 — , - kwadratowa 66-73 , , uzasadnienie 138-145 , - liniowa 66-73 niezależnych, 66-73 - - , ogólna reguła 84-87, 144-145 , pierwiastek kwadratowy z wielkości zmie rzonej 76 , różnica wartości zmierzonych 35-37, 48, 50-51, 58-59, 70 , suma wartości zmierzonej i stałej liczby 139-141 - - , - - zmierzonych 49, 58-59, 70, 141-143 , wyrażenie potęgowe 64-66, 76-77 przypadkowy składnik błędu patrz błąd przy padkowy przyspieszenie wózka na równi pochyłej 50-51, 82-84, 92 - ziemskie g 40-41, 49-50, 78-80, 91-92, 190-191 regresja liniowa 174, patrz też metoda naj mniejszych kwadratów - wielokrotna 187, patrz też metoda najmniej szych kwadratów - wielomianowa 182-184, patrz też metoda najmniejszych kwadratów rozbieżność 31-32 - znacząca i nieznacząca 149-151 rozkład 117 - dwumianowy, definicja 212-213 rozkład dwumianowy, odchylenie standardowe 215
295
rozkład dwumianowy, porównanie z rozkła dem normalnym 216-219 , Poissona 231-232 , symetryczny kształt dla p = - 215, 228 , średnia 215, 227 , - liczba sukcesów 227 - Gaussa patrz rozkład normalny - graniczny (asymptotyczny) 120-121, 209 jako prawdopodobieństwo 121-122 , normalizacja 122 — , odchylenie standardowe 124 , średnia 123-124 - , Lorentza 248 - normalny 124-131 , definicja 128 jako rozkład dla niepewności przypadko wych, dowód 219-220 , normalizacja 127-128 , odchylenie standardowe 130-131 , średniej 145-147 , porównanie z rozkładem dwumianowym 216-219 - - , - - Poissona 232, 234-236 , szerokość rozkładu 126 - - , średnia 129-130 - - , test chi-kwadrat 243-247, 258-260 - Poissona 230-241 , definicja 231 , normalizacja 238 , odchylenie standardowe 233-234 , porównanie z rozkładem dwumianowym 231-232 , normalnym 232, 234—236 , przybliżona symetria dla dużych p, 233 , średnia 231-232 - prawdopodobieństwo 209, patrz też rozkład graniczny - Studenta 149 rozkłady dyskretne 216 rozstęp 118 równanie normalne 175, 183, 187 różnica wartości zmierzonych patrz przenosze nie niepewności, różnica wartości zmie rzonych rzuty kośćmi 210-211, 226 - - a test chi-kwadrat 249-250, 260-261, 264-265 - monetą 214, 218, 228 silnia, n\ 213 Snelliusa prawo patrz współczynnik załamania światła
296
sprzeczność wyników 167 stopnie swobody 178, 252-255 Studenta rozkład patrz rozkład Studenta suma wartości zmierzonej i stałej liczby patrz przenoszenie niepewności, suma wartości zmierzonej i stałej liczby zmierzonych patrz przenoszenie niepewno ści, suma wartości zmierzonych - ważona 116 systematyczny składnik błędu patrz błąd sys tematyczny szerokość połówkowa krzywej 152-153 średnia 98-99 - jako najlepsze przybliżenie 98-99, 134-138 - rozkładu dwumianowego patrz rozkład dwu mianowy, średnia granicznego patrz rozkład graniczny, śred nia normalnego patrz rozkład normalny, śred nia Poissona patrz rozkład Poissona, średnia - ważona 167-172 , definicja 169 , niepewność patrz niepewność średniej ważonej średnie odchylenie kwadratowe 100, patrz też odchylenie standardowe temperatura zera bezwzględnego 179 test chi kwadrat 242-268 dla rozkładu normalnego 243-247 dla rozkładu Poissona 261-262, 266 dla rzutów kośćmi 249-250, 252-253, 260-261, 265 poprawiony 267 , prawdopodobieństwo związane z tes tem 257, 276-278 testowanie hipotez, postępowanie ogólne 223-224 , prognozy przedwyborcze 224-226 , smar do nart, 221-223, 228 testy nieparametryczne 223 ufność 147-151 waga statystyczna 168 wahadło matematyczne 78-80, 91-92 wariancja 101, patrz też odchylenie standardo we wartość bezwzględna 42 - prawdziwa 32, 125
- średnia patrz średnia - uznana 32-34 warunek normalizacji 117, 122 więzy 252-254 wskaźnik cyfrowy 55-56 współczynnik absorpcji i energia fotonów 90-91 - determinacji patrz współczynnik korelacji - korelacji 201 liniowej patrz współczynnik korelacji , prawdopodobieństwa 204-205, 274-275 - rozszerzalności cieplnej 68 - sprężystość k, 37^10, 103-105, 107-108, 188 - załamania światła 73, 80-81, 92
zagadnienie definicji 17, 55 zasada największego prawdopodobieństwa 136 w dopasowywaniu krzywych metodą najmniejszych kwadratów 175, 190 w metodzie najmniejszych kwadratów 175, 190 w obliczaniu średniej ważonej 168 zastosowana do rozkładu Poissona 240 zgodność wyników dwu pomiarów 167 zjawisko fotoelektryczne 207-208 zliczenia zdarzeń losowych 57, 88, 230-231, 234, 237-241, 261-262, patrz też rozkład Poi ssona znacząca rozbieżność 150-151 znaczące cyfry patrz cyfry znaczące
WYDAWNICTWO NAUKOWE PWN 00-251 Warszawa, ul. Miodowa 10 tel. (22) 26 22 91 tlx 81 37 63 pwn pi fax (22) 26 71 63
Niezależny miesięcznik informatyczny
Polska wersja amerykańskiego
PC Magazine
P i ę ć p o w o d ó w , aby c z y t a ć PC M a g a z i n e Po P o l s k u : © zamieszcza informacje o nowościach i trendach w rozwoju komputerów i oprogramowania © publikuje recenzje polskiego i zachodniego oprogramowania i książek © zawiera porady i wskazówki O zamieszcza publikacje, błyskotliwe felietony i gorące tematy @ ogtasza wyniki testów sprzętu komputerowego i oprogramowania Pismo można nabyć w punktach sprzedaży prasy i w księgarniach PWN. PCM PP w prenumeracie to dodatkowo: • stała cena • taniej niż w sprzedaży detalicznej • pewność posiadania każdego numeru
Zapraszamy - zostań naszym stałym czytelnikiem! PC Magazine Po Polsku 00-251 Warszawa; ul. Miodowa 10; tel. (02) 635 70 69 w. 250 Wydawca: Wydawnictwo Naukowe PWN Spółka z o.o.
Wydawnictwo Naukowe PWN, Spółka z o.< Wydanie I. Ark. drukarskich 18,75. Skład Phototext, Warszawa. Druk ukończono w sierpniu 1995 r. Drukarnia Wydawnictw Naukowych S.A. Łódź, ul. Żwirki 2
PODSTAWOWE WZORY W CZĘŚCI II Średnie ważone (rozdział 7)
Jeżeli x ,...,x są wynikami pomiarów pewnej wielkości x, a ich niepewności znane, to najlepszym przybliżeniem wartości x jest 1
N
x
,
-
a ,...,(r 1
N
(s. 169)
gdzie Wj = 1/(7?.
Dopasowanie linii prostej metodą najmniejszych kwadratów (rozdział '<
Jeżeli (x y ),.,.,(x , y ) są wyznaczonymi w doświadczeniu parami punktów, to współ czynniki w równaniu y = A + Bx opisującym prostą najlepiej dopasowaną do N punktów dane są przez u
1
N
N
2
^=[(i*. )(Ey.)-(5>«) 5 = [iv(Ex y )-(& )(Ey )]A ;
i
i
i
2
2
^ = *(l*. )-(l>i) .
(8.176)
Kowariancja i korelacja (rozdział 9)
Kowariancja cr^ dla JV par ( x
1 (
y ) , . . . , ( x , y ) określona jest przez t
N
N
" , = jj-I,(.x -t)(y,-yi. x
l
(s. 197)
Współczynnik korelacji liniowej jest zdefiniowany jako
Cr,.
Y(x,—x)(y —y) LEfa-*) !(>•,->•) J ' i
Wartości r zbliżone do — 1 lub 1 wskazują na występowanie wyraźnej korelacji liniowej; wartości bliskie 0 wskazują na słabą korelację lub jej brak. (Tablica prawdopodobieństw odpowiadających różnym wartościom r znajduje się w dodatku C.)
Rozkład dwumianowy (rozdział 10) Jeżeli prawdopodobieństwo „sukcesu" w jednej próbie wynosi p, to prawdopodobieństwo wystąpienia v sukcesów w n próbach dane jest przez P(v sukcesów w n próbach) - b
(v) -
n\
v!(n — v)!
v
p (1
p)"
(s. 213)
Dla wielu kolejnych serii składających się z n prób każda średnia liczba sukcesów określona jest przez v = np, a odchylenie standardowe °"v = J
(s. 215)
np(l-p).
Rozkład Poissona (rozdział 11) W przypadku zliczania rozpadów promieniotwórczych (lub innych zdarzeń występujących losowo) prawdopodobieństwo zarejestrowania v zliczeń (w pewnym określonym przedziale czasu) dane jest wzorem u"
P (v zliczeń) = p„ (v) = e ' " — , v!
(s. 231)
gdzie p, oznacza oczekiwaną przeciętną liczbę zliczeń w rozważanym przedziale czasu, v = p.
(dla wielu-eksperymentów).
(s. 232)
Odchylenie standardowe wynosi a = v
vV-
(s- 234)
Chi kwadrat (rozdział 12) Wyniki dowolnego, powtarzanego wielokrotnie pomiaru mogą być pogrupowane w prze działach, k= l,....,n. Niech O oznacza liczbę otrzymanych w doświadczeniu wyników i zaliczonych do przedziału k. Podobnie, przez E oznaczymy oczekiwaną liczbę wyników w fc-tym przedziale, obliczoną na podstawie pewnego przewidywanego rozkładu (Gaussa, dwumianowego, Poissona itd.). Zdefiniujemy chi kwadrat jako k
k
2
X =
t
(O -E f/E k
k
(s. 248)
k
oraz zredukowaną wartość chi kwadrat jako 2
(s. 254)
2
X = X /d,
gdzie d jest liczbą stopni swobody. 2
Jeżeli x » \ , to brak zgodności pomiędzy O oraz E i dlatego odrzucamy przewidy wany rozkład. Jeżeli x < l , 1° zgodność jest zadowalająca i rozkład wyznaczony oraz przewidywany pokrywają się ze sobą. (Tablica prawdopodobieństw związanych z / znajduje się w dodatku D.) k
2
k