Gruenefee Gruenefee
2536
BLOG

Zeznania świadka, a bayesowski zamęt

Gruenefee Gruenefee Nauka Obserwuj temat Obserwuj notkę 38

Jak wyczuwamy prawdopodobieństwo w naszym życiu codziennym – jakie problemy mogą z tego wynikać? I co ma wspólnego uciekający taksówkarz z pancerną brzozą w Smoleńsku.

Granatowe i brązowe taksówki….

W małym miasteczku istnieją tylko dwa przedsiębiorstwa taksówkowe. Taksówki pierwszej firmy Blue Cab - są granatowe, a drugiej - Brown Cab – brązowe. Procentowy udział na rynku przewozów Blue Cab wynosi 85 % , a Brown Cab 15 %.

Pewnego wieczoru doszło do wypadku drogowego z uciekającym taksówkarzem w tle. Wypadek widział tylko jeden świadek – pan Zenek. Pan Zenek zeznał, że to kierowca brązowej taksówki spowodował wypadek i uciekł. Poza tym nie było żadnych śladów, więc policja musiała polegać tylko na zeznaniach świadka. Pan Zenek zeznawał szczerze i w dobrej wierze – ale jakie jest prawdopodobieństwo tego, że pan Zenek się pomylił?

Nie ulega wątpliwości, że świadek widział taksówkę, bo wszystkie taksówki jeżdżące po mieście można rozpoznać po ogromnym szyldzie na dachu TAXI – stąd wypadek spowodował taksówkarz. Ale co z kolorem auta? Pan Zenek jest wprawdzie pewny, że widział brązowe taxi, ale jednak mógłby się mylić, wypadek zdarzył się o zmierzchu...

Śledczy przeprowadzili testy sprawdzające. Panu Zenkowi przedstawiono różne kolory, które później musiał on odtworzyć. Ku zadowoleniu dochodzeniówki, świadek wykazał się bardzo dobrą pamięcią , w 80 % udało mu się prawidłowo przyporządkować barwy. Czy możemy wyciągnąć z tego wniosek, że w 80 % opis taksówki jest poprawny?

Dlaczego nie... Brzmi logicznie, Ale jest jedno ale, mianowicie po mieście jeździ o wiele więcej granatowych taksówek, niż brązowych. Wiemy, że pan Zenek widział brązowe auto z prawdopodobieństwem wynoszącym 80 %, ale wiemy również, że w jego testach 20 % kolorów zostało przyporządkowane nieprawidłowo.
W końcu mamy cztery możliwości, jak mógłby przebiegać ten wypadek:

1. Auto biorące udział w wypadku było granatowe i mogło zostać rozpoznane jako granatowe.
2. Auto biorące udział w wypadku było granatowe i mogło zostać rozpoznane jako brązowe.
3. Auto biorące udział w wypadku było brązowe i mogło zostać rozpoznane jako brązowe.
4. Auto biorące udział w wypadku było brązowe i mogło zostać rozpoznane jako granatowe.

Z zeznania świadka wynika, że widział on brązowe auto, więc interesują nas tylko dwie możliwości przebiegu wypadku:

1. Auto biorące udział w wypadku było granatowe (85%) i mogło zostać rozpoznane jako brązowe (20%)
2. Auto biorące udział w wypadku było brązowe (15%) i mogło zostać rozpoznane jako brązowe (80%).

 

Ile wynosi prawdopodobieństwo, że taksówka biorąca udział w wypadku rzeczywiście była brązowa, tak jak twierdził pan Zenek?

Do obliczeń zastosujemy twierdzenie Bayesa, czyli twierdzenie teorii prawdopodobieństwa, wiążące prawdopodobieństwa warunkowe zdarzeń:

I co mamy? Prawdopodobieństwo wynosi 41 %! Zaskakujący wynik – pomimo tego, że pan Zenek identyfikuje prawidłowo kolory z dokładnością 80 %. Nasz wynik leży poniżej 50 %. Chyba lepiej byłoby rzucić monetą w celu ustalenia koloru taksówki....

Czy to tylko zwykła matematyczna zabaweczka? Chociaż na pierwszy rzut oka wygląda na igraszkę, jednak ten problem ma bardzo duże znaczenie w praktyce.

Posłużę się tu przykładem, który opisał autor książki The Drunkard’s Walk: How Randomness Rules Our Lives”, Leonard Mlodinow“.

W 1989 roku zadzwonił do Mlodinowa lekarz i oznajmił mu, że z prawdopodobieństwem 99.9 % nie przeżyje następnych 10 lat. To nie była żadna budująca wiadomość. A jednak Mlodinow żyje do dzisiaj, a wyrok śmierci przekazany mu przez lekarza zawdzięcza tylko złej interpretacji statystycznej. A jak do tego doszło?

Otóż Mlodinow założył sobie ubezpieczenie na życie, a jednym z wymogów było przebadanie się na nosicielstwo wirusa HIV. Wynik testu Mlodinowa był pozytywny – jest zarażony HIV. Testy te nie są perfekcyjne i zawsze istnieje granica błędu, w tym przypadku 1 wynik na 1000 przebadanych osób jest fałszywy. Pan doktor stwierdził, że 999 prób z 1000 są prawidłowe, czyli 99,9 % i taką też wiadomość przekazał Mlodinowi. Oczywiście pan doktor nie uwzględnił tu prawdopodobieństw warunkowych – prawdopodobieństwo, że test Mlodinowa dał wynik pozytywny, pod warunkiem, że nie jest on HIV – pozytywny i prawdopodobieństwo, że Mlodinow nie jest HIV- pozytywny, pod warunkiem, że test Mlodinowa dał wynik pozytywny..

Mlodinow jest białym, heteroseksualnym Amerykaninem, który nie używa narkotyków i w roku 1989 nie należał w żadnym wypadku do grup ryzyka. Dlatego logicznym krokiem w obliczeniu prawdopodobieństwa jest tu ograniczenie się do grupy, w której według statystyk 1 biały, heteroseksualny Amerykanin na 10.000 jest zainfekowany HIV.

Poza tym należy przeanalizować wszystkie możliwości, które mogą wystąpić przy analizie testu:

1. Wynik testu pozytywny, osoba jest zarażona HIV (prawda, pozytywny)
2. Wynik testu pozytywny, osoba nie jest zarażona HIV (fałsz, pozytywny)
3. Wynik testu negatywny, osoba nie jest zarażona HIV (prawda, negatywny)
4. Wynik testu negatywny, osoba jest zarażona HIV (fałsz, negatywny)

Ostatnia możliwość odpada, gdyż prawdopodobieństwo zajścia tego zdarzenia jest prawie zerowe, tzn. nie zdarzy się, że ktoś kto rzeczywiście jest zarażony HIV zostanie przeoczony. Prawdopodobieństwo, że wynik testu jest pozytywny, chociaż osoba nie jest zarażona, tzn. ( fałsz, pozytywny) wynosi, tak jak już doktor wspomniał 0.01 % - 1 fałszywy wynik z 1000). Przy 10.000 otrzymujemy 10 osób, które otrzymają pozytywny wynik, chociaż nie są zarażone. W sumie 11 osób spośród 10.000 otrzyma pozytywny rezultat testu, ale tylko 1 z nich jest rzeczywiście zarażona wirusem HIV. Jeśli się należy do tej grupy, to szansa, że się nie jest zainfekowanym wynosi jak 10:11, czyli około 90,91 %, chociaż wynik testu wskazuje na HIV – pozytywny! Pan doktor musiałby powiedzieć Mlodinowi, że prawdopodobieństwo, że nie jest zainfekowany HIV wynosi 90,91%, zamiast opowiadać mrożącą krew w żyłach bajkę, o tym , że jest w 99,9 % zarażony HIV.

Sieć bayesowska, niecykliczny graf skierowany, stanowi efektywną obliczeniowo i przestrzennie metodę reprezentacji łącznego rozkładu prawdopodobieństwa. Wykorzystywana jest w diagnostyce medycznej i technicznej, wyszukiwaniu informacji, wykrywaniu oszustw, sterowaniu itp.

Przykład z taksówkami wskazuje na rzeczywiste problemy pojawiające się w wielu dochodzeniach czy też procesach sądowych. Dobrze by było, gdyby ludzie z tej branży mieli podstawową wiedzę z zakresu rachunku prawdopodobieństwa i potrafili ze zrozumieniem ocenić dane statystyczne. Sieć Bayesa stanowi tu wygodne narzędzie, którym w przejrzysty sposób można przedstawić rozwiązywany problem. Jest to metoda efektywna przestrzennie jak i obliczeniowo. Dodatkowo dostęp do narzędzi pozwalających wyliczyć prawdopodobieństwo warunkowe na podstawie wprowadzonej sieci jest bardzo prosty. Sędziowie preferują jednak tradycyjne dowody (np. zeznaniami świadka), mimo że tak naprawdę również one świadczą tylko o prawdopodobieństwie (nieraz niezbyt wysokim), a nie pewności, określonych zdarzeń (świadek może się mylić, kłamać itp.).

A co ma do tego brzoza smoleńska?

Na stronie  rmf24.pl czytamy m. in.:

Bodin jest świadkiem katastrofy smoleńskiej. Widział, jak 10 kwietnia 2010 roku polski samolot uderzył skrzydłem w stojące na jego działce drzewo.

Nikołaj Bodin: Kiedy oddalił się (samolot - red.) od brzozy, już go nie widziałem.

Przemysław Marzec: Stracił skrzydło po uderzeniu?

Nikołaj Bodin: Skrzydło było odbite /złamane/, ale jeszcze wisiało. Potem pobiegłem za nim (samolotem - przyp. PM), widzę leży skrzydło, to niedaleko od tego miejsca. Potem pobiegłem dalej, a on już leżał w błocie.

Nie mamy możliwości zbadać zdolności percepcyjnych Bodina, ale do wykonania rachunków można przyjąć, że jego zdolność percepcyjna tj, że jest on w stanie dokonać trafnej identyfikacji wynosi 80 %, następnie stworzyć sieć Bayesa i przeprowadzić wnioskowanie.

Albo dla treningu

 Jak prawdopodobne jest to, że horoskopy w naszych gazetach w rzeczywistości pisze kot, pod warunkiem,  że cała astrologia to nonsens.;)))

Gruenefee
O mnie Gruenefee

Large Visitor Globe

Nowości od blogera

Komentarze

Inne tematy w dziale Technologie