Friday 8 December 2017

Ruchoma średnia wygładzanie matlab


Ten samouczek omawia sposób użycia MATLAB do przetwarzania obrazu. Przyjmuje się pewną znajomość MATLAB (powinieneś wiedzieć, jak używać macierzy i pisać plik M). Pomocne jest posiadanie narzędzia MATLAB Image Processing Toolbox, ale na szczęście do większości operacji nie są potrzebne skrzynki narzędziowe. Polecenia wymagające narzędzia Image Toolbox są oznaczone przybornikiem obrazu. Reprezentacja obrazu W programie MATLAB dostępnych jest pięć typów obrazów. Skala szarości. Obraz w skali szarości M pikseli wysokości i N pikseli szerokości jest reprezentowany jako macierz podwójnego typu danych o rozmiarze MN. Wartości elementów (np. MyImage (m, n)) oznaczają piksele w skali szarości w 0,1 przy 0 kolorach i 1 kolorze białym. Truecolor RGB. Prawdziwy obraz czerwono-zielono-niebieski (RGB) jest reprezentowany jako trójwymiarowa podwójna macierz M N3. Każdy piksel ma czerwone, zielone i niebieskie elementy wzdłuż trzeciego wymiaru z wartościami w skali 0,1, na przykład komponenty kolorów piksela (m, n) to Moje obrazki (m, n, 1) czerwone, Moje obrazki (m, n, 2) zielony, MyImage (m, n, 3) niebieski. Indeksowane. Indeksowane (z paletą) obrazy są reprezentowane przez macierz indeksu wielkości M N i matrycę kolorów o wielkości K 3. Barwista przechowuje wszystkie kolory używane w obrazie, a matryca indeksu reprezentuje piksele, odnosząc się do kolorów w mapie kolorów. Na przykład, jeśli 22-ty kolor to magenta MyColormap (22, :) 1,0,1. następnie MyImage (m, n) 22 jest pikselem w kolorze magenta. Binarny. Obraz binarny jest reprezentowany przez macierz logiczną M N, gdzie wartości pikseli wynoszą 1 (prawda) lub 0 (fałsz).uint8. Ten typ wykorzystuje mniej pamięci, a niektóre operacje są obliczane szybciej niż w przypadku podwójnych typów. Dla uproszczenia ten samouczek nie omawia dalej uint8. Skala szarości jest zazwyczaj preferowanym formatem przetwarzania obrazu. W przypadkach wymagających koloru, kolorowy obraz RGB może zostać rozłożony i potraktowany jako trzy osobne obrazy w skali szarości. Zindeksowane obrazy muszą zostać przekonwertowane na skalę szarości lub RGB dla większości operacji. Poniżej przedstawiono niektóre typowe manipulacje i konwersje. Kilka poleceń wymaga narzędzia Image Toolbox i jest oznaczone przybornikiem Image Toolbox. Czytanie i zapisywanie plików graficznych MATLAB może odczytywać i zapisywać obrazy za pomocą poleceń imread i imwrite. Mimo że obsługiwana jest duża liczba formatów plików, niektóre nie. Użyj imformatów, aby zobaczyć, co obsługuje twoja instalacja: Podczas odczytu obrazów niefortunnym problemem jest to, że imread zwraca dane obrazu w typie uint8, które muszą zostać przekonwertowane na podwójne i przeskalowane przed użyciem. Dlatego zamiast bezpośrednio wywoływać funkcję imread, używam następującej funkcji M-pliku do odczytu i konwersji obrazów: Kliknij prawym przyciskiem myszy i zapisz getimage. m, aby użyć tej funkcji M. Jeśli obraz baboon. png znajduje się w bieżącym katalogu (lub gdzieś w ścieżce wyszukiwania MATLAB), możesz go odczytać za pomocą funkcji MyImage getimage (baboon. png). Możesz także użyć ścieżek częściowych, na przykład jeśli obraz jest w bieżącym katalogu gtimages z getimage (imagesbaboon. png). Aby napisać obraz w skali szarości lub RGB, używaj Uważaj, że MyImage jest podwójną macierzą z elementami o nieprawidłowym skalowaniu 0.1if, zapisany plik prawdopodobnie pozostanie pusty. Podczas pisania plików graficznych bardzo polecam używanie formatu pliku PNG. Ten format jest niezawodny, ponieważ jest bezstratny, obsługuje truecolor RGB i kompresuje całkiem nieźle. Korzystaj z innych formatów z rozwagą. Podstawowe operacje Poniżej przedstawiono podstawowe operacje na obrazie w skali szarości u. Polecenia wymagające narzędzia Image Toolbox są oznaczone przybornikiem obrazu. (Uwaga: dla dowolnej tablicy składnia u (:) oznacza rozwinięcie u do wektora kolumnowego, np. Jeśli u 1,50,2, to u (:) wynosi 1052.) Na przykład moc sygnału obrazu jest używana w stosunek sygnału do szumu (SNR) i szczytowy stosunek sygnału do szumu (PSNR). Biorąc pod uwagę czysty obraz zanieczyszczony i zanieczyszczony hałasem u Należy zachować ostrożność przy normie. zachowanie jest normą (v) na wektorach v oblicza sqrt (suma (v.2)). ale norma (A) na macierzy A oblicza indukowaną normę macierzy L2, więc norma (A) na pewno nie jest sqrt (suma (A (:) .2)). Łatwo jest jednak użyć normy (A), gdzie powinna być normą (A (:)). Filtry liniowe Filtrowanie liniowe jest podstawową techniką przetwarzania sygnałów. Aby krótko przedstawić, filtr liniowy jest operacją, w której przy każdym pikselach x m, n obrazu, funkcja liniowa jest oceniana na pikselu i jej sąsiadach w celu obliczenia nowej wartości pikselowej y m, n. Filtr liniowy w dwóch wymiarach ma ogólną postać, w której x jest wejściem, y jest wyjściem, a h jest odpowiedzią impulsową filtra. Różne wybory h prowadzą do filtrów, które wygładzają, wyostrzają i wykrywają krawędzie, by wymienić tylko kilka zastosowań. Prawa strona powyższego równania jest zwięzła jako h x i nazywana jest splotem h i x. Filtrowanie w domenie przestrzennej W MATLAB z konw .2 zaimplementowano dwuwymiarowe filtrowanie liniowe. Niestety, conv2 może obsługiwać filtrowanie w pobliżu granic obrazu przez zerowe wypełnianie, co oznacza, że ​​wyniki filtrowania są zazwyczaj nieodpowiednie dla pikseli w pobliżu granicy. Aby obejść ten problem, możemy wstawić obraz wejściowy i użyć poprawnej opcji podczas wywoływania conv2. Następująca funkcja M to robi. Kliknij prawym przyciskiem myszy i zapisz conv2padded. m, aby użyć tej funkcji M. Oto kilka przykładów: Mówi się, że filtr 2D h ma być rozdzielny, jeśli można go wyrazić jako zewnętrzny produkt dwóch filtrów 1 i 1 h1 i h2. to znaczy h h1 (:) h2 (:). Szybciej jest przechodzić h1 i h2 niż h. jak to jest zrobione powyżej dla okna średniej ruchomej i filtra gaussowskiego. W rzeczywistości, filtry Sobel hx i hy są również separowalne, co to jest filtrowanie w domenie hier i h2. Filtrowanie w domenie przestrzennej z conv2 jest z łatwością kosztowną operacją. W przypadku filtra KK na obrazie MN, konw. Kosztuje dodatki i multiplikacje O (MNK 2) lub O (N 4) z założeniem M N K. W przypadku dużych filtrów filtrowanie w domenie Fouriera jest szybsze, ponieważ koszt obliczeniowy jest zredukowany do O (N 2 log N). Używając właściwości multiplikacji splotu transformaty Fouriera, splot jest obliczany równoważnie przez Wynik jest równoważny conv2padded (x, h) z wyjątkiem blisko granicy, gdzie powyższe obliczenia wykorzystują okresowe rozszerzenie granicy. Filtrowanie oparte na fourierach może być również wykonane z symetrycznym rozszerzeniem granicznym, odzwierciedlając dane wejściowe w każdym kierunku: (Uwaga: jeszcze bardziej wydajną metodą jest filtrowanie nakładające się na FFT. Monitorowanie przetwarzania sygnału implementuje nakładanie FFT w jednym wymiarze w widoku zfft .) Filtry nieliniowe Filtr nieliniowy to operacja, w której każdy filtrowany piksel ym, n jest nieliniową funkcją xm, n i jej sąsiadów. Poniżej krótko omówimy kilka rodzajów nieliniowych filtrów. Zamawianie filtrów statystycznych Jeśli posiadasz Przybornik Obrazu, możesz uporządkować filtry statystyczne za pomocą ordfilt2 i medfilt2. Filtr statystyk zamówień sortuje wartości pikseli w sąsiedztwie i wybiera k-tą największą wartość. Filtry min, max i mediany są przypadkami specjalnymi. Filtry morfologiczne Jeśli masz Przybornik Obrazu, bwmorph realizuje różne operacje morfologiczne na obrazach binarnych, takich jak erozja, poszerzenie, otwieranie, zamykanie i szkielet. Dostępne są również polecenia dotyczące morfologii obrazów w skali szarości: imerode. imdilate i imtophat. pośród innych. Zbuduj własny filtr Czasami chcemy użyć nowego filtra, którego MATLAB nie ma. Poniższy kod jest szablonem do implementacji filtrów. (Uwaga: częstym błędnym stwierdzeniem jest to, że pętle w MATLAB są powolne i należy ich unikać. To było kiedyś prawdziwe, z powrotem w MATLAB 5 i wcześniejszych, ale pętle we współczesnych wersjach są dość szybkie.) Na przykład, średni filtr z przycięciem alfa ignoruje d 2 najniższe i d 2 najwyższe wartości w oknie i uśrednia pozostałe (2 r 1) 2 d wartości. Filtr stanowi równowagę pomiędzy filtrem medianowym a filtrem średnim. W filtrze można zaimplementować filtr średniej z alfa. Jak w innym przykładzie, filtr obustronny jest Prostym (doraźnym) sposobem, aby po prostu wziąć średnią ważoną (przestrajaną przez alfa) w każdym punkcie z sąsiadami: lub jej odmianą . Tak, aby być bardziej wyrafinowanym, możesz najpierw przekształcić dane, a następnie odciąć wysokie częstotliwości. Coś takiego: wycina najwyższe 20 częstotliwości. Zachowaj ostrożność, aby je wyciąć symetrycznie, w przeciwnym razie przekształcenie odwrotne nie jest już rzeczywiste. Musisz dokładnie wybrać częstotliwość odcięcia dla odpowiedniego poziomu wygładzania. Jest to bardzo prosty rodzaj filtrowania (filtrowanie w dziedzinie częstotliwości w dziedzinie częstotliwości), więc możesz spróbować łagodnie tłumić wysokie częstotliwości rzędu, jeśli zniekształcenie jest nie do przyjęcia. odpowiedziało 4 października 09 o 9:16 FFT nie jest złym pomysłem, ale jego prawdopodobnie przesada tutaj. Uruchamianie lub przesuwanie średnich daje ogólnie słabe wyniki i powinno się ich unikać na cokolwiek oprócz późnej pracy domowej (i białego szumu). Używam filtrowania Savitzky'ego-Golay (w Matlab sgolayfilt (.)). Daje to najlepsze wyniki, czego szukasz - niektóre lokalne wygładzanie przy jednoczesnym zachowaniu kształtu krzywej. GEOS 585A, Analiza czasowa serii Applied: (520) 621-3457 Faks: (520) 621-8229 Godziny urzędowania Piątek, 1: 00-6: 00 PM (napisz e-mailem, aby zaplanować spotkanie) Opis kursu Narzędzia do analizy w dziedzinie czasu i częstotliwości są wprowadzane w kontekście przykładowych szeregów czasowych. Używam zbioru danych przykładowych szeregów czasowych do zilustrowania metod i zmieniam zestaw danych w każdym semestrze kursu. W tym roku przykładowy zestaw danych pochodzi z projektu NSF dotyczącego zmienności opadów śniegu w amerykańskim dorzeczu Kalifornii. Ten zbiór danych obejmuje chronologię pierścieni drzewiastych, indeksy klimatyczne, zapisy przepływu strumieniowego i szeregi czasowe równoważników śniegu i wody mierzone na stacjach śnieżnych. Zbierzcie swoje własne szeregi czasowe do wykorzystania w trakcie kursu. Mogą to być z twojego własnego projektu badawczego. Powrót na początek strony Jest to kurs wprowadzający, z naciskiem na praktyczne aspekty analizy szeregów czasowych. Metody są hierarchicznie wprowadzane - zaczynając od terminologii i grafiki eksploracyjnej, przechodząc do statystyki opisowej, a kończąc na podstawowych procedurach modelowania. Tematy obejmują detrending, filtrowanie, autoregresyjne modelowanie, analizę spektralną i regresję. Pierwsze dwa tygodnie spędzasz instalując Matlaba na swoim laptopie, uzyskując podstawowe wprowadzenie do Matlaba i gromadząc zestaw danych z szeregów czasowych dla kursu. Następnie obejmuje się dwanaście tematów lub lekcji, z których każdy obejmuje tydzień lub dwa okresy lekcyjne. Dwanaście zadań lekcyjnych pasuje do tematów. Przypisania polegają na stosowaniu metod poprzez uruchamianie wstępnie napisanych skryptów Matlab (programów) w szeregach czasowych i interpretowanie wyników. Kurs 3 kredyty dla studentów na kampusie Uniwersytetu Arizona w Tucson i 1 kredyt dla studentów online. Każda seria czasowa ze stałym przyrostem czasu (np. Dzień, miesiąc, rok) jest kandydatem do wykorzystania w kursie. Przykładami są codzienne pomiary opadów, sezonowy ogólny strumień, letnia średnia temperatura powietrza, roczne wskaźniki wzrostu drzew, wskaźniki temperatury powierzchni morza i dzienny wzrost wysokości krzewu. W wyniku podjęcia kursu powinieneś: rozumieć podstawowe pojęcia szeregów czasowych i terminologię być w stanie wybrać metody szeregów czasowych odpowiednie do celów, które są w stanie krytycznie ocenić literaturę naukową stosującą omawiane metody szeregów czasowych, poprawiły zrozumienie właściwości szeregów czasowych twojego własny zestaw danych umożliwia zwięzłe podsumowywanie wyników analizy szeregów czasowych na piśmie Wymagania wstępne Wstępny kurs statystyczny Dostęp do komputera przenośnego z zainstalowanym programem Matlab Zezwolenie instruktora (studenci i studenci online) Inne wymagania Jeśli jesteś na Uniwersytecie Arizona (UA) student na kampusie w Tucson, masz dostęp do Matlaba i wymaganych skrzynek narzędziowych za pośrednictwem licencji na stronie UA, ponieważ nie ma oprogramowania kosztowego. Żadne wcześniejsze doświadczenie z Matlab nie jest wymagane, a programowanie komputera nie jest częścią kursu. Jeśli jesteś online, a nie w kampusie na UA, będziesz mógł wziąć udział w kursie na semestr wiosenny 2017 jako kurs iCourse. Musisz upewnić się, że masz dostęp do Matlaba i wymaganych skrzynek (patrz poniżej) w twojej lokalizacji. Dostęp do Internetu. W trakcie kursu nie ma wymiany papierowej. Uwagi i zadania są wymieniane elektronicznie, a zakończone zadania są przesyłane elektronicznie za pośrednictwem systemu University of Arizona Desire2Learn (D2L). Wersja Matlaba. Aktualizuję skrypty i funkcje teraz, a następnie wykorzystuję bieżącą wersję licencji Matlaba dla witryny, a aktualizacje mogą korzystać z funkcji Matlab niedostępnych we wcześniejszych wersjach Matlab. Do 2017 roku używam programu Matlab w wersji 9.1.0.441655 (R2018b). Jeśli używasz wcześniejszej wersji, upewnij się, że jest to wersja Matlab Release 2007b lub nowsza. Oprócz głównego pakietu Matlab używane są cztery skrzynki narzędziowe: statystyki, przetwarzanie sygnału, identyfikacja systemu i splajn (wersja Matlab 2017a lub wcześniejsza) lub dopasowanie krzywej (wersja Matlab 2017b lub nowsza) Dostępność Kurs jest oferowany w semestrze wiosennym co drugi rok (2018, 2017, itp.). Jest on otwarty dla studentów i może być również przyjęty przez seniorów licencjackich za zgodą instruktora. Zapisy dla studentów z UA są ograniczone do 18 na semestr letni 2017. Niewielka liczba studentów online została zazwyczaj zakwaterowana, oferując kurs na różne sposoby. Teraz jest miejsce na kurs iCourse opisane powyżej. Powrót do początku strony Zarys kursu (lekcje) Harmonogram zazwyczaj umożliwia około dwóch tygodni na zebranie danych i zapoznanie się z Matlab. Następnie jeden tydzień (dwa okresy lekcyjne) poświęcony jest każdej z 12 lekcji lub tematów. Klasa spotyka się we wtorek i czwartek. Nowy temat zostanie wprowadzony we wtorek i będzie kontynuowany w następny czwartek. Czwartkowa klasa kończy się zadaniem i demonstracją uruchomienia skryptu na moich przykładowych danych. Przydział jest należny (musi zostać przesłany przez ciebie do D2L) przed zajęciami w następny wtorek. Pierwsza 12-godzinna klasa we wtorki jest używana do samooceny kierowanej i oceny przypisania i przesyłania ocenionych (stopniowanych) zadań do D2L. Pozostałe 45 minut służy do wprowadzenia następnego tematu. Musisz weź ze sobą laptopa na zajęcia we wtorki. 12 lekcji lub tematów objętych kursem są wymienione w zarysie zajęć. Studenci online powinni postępować zgodnie z tym samym harmonogramem składania zadań, co studenci będący rezydentami, ale nie mają dostępu do wykładów. Przesłane zadania studentów online nie podlegają samoocenie, ale są oceniane przeze mnie. Studenci online powinni mieć dostęp do D2L w celu przesyłania zadań. Semestr letni 2017. Klasa spotyka się dwa razy w tygodniu w 75-minutowych sesjach, 9: 00-10: 15 AM T, w pokoju 424 (sala konferencyjna) budynku Bryant Bannister Tree-Ring (budynek 45B). Pierwszy dzień zajęć to styczeń 12 (czwartek). Ostatni dzień zajęć to 2 maja (wtorek). W tygodniu przerwy wiosennej nie ma klasy (Mar 11-19). Analizujesz dane według własnego wyboru w zadaniach klasowych. Jak podano w przeglądzie kursu. istnieje duża elastyczność w wyborze szeregów czasowych. Przygotuję katalog odpowiednich szeregów czasowych, ale najlepiej skupić się na swoim zestawie danych. Pierwsze zadanie polega na uruchomieniu skryptu przechowującego dane i metadane zebrane w pliku mat, natywnym formacie Matlab. Kolejne przypisania pobierają dane z pliku mat w celu analizy szeregów czasowych. Zadania 12 tematów omawia się kolejno w trakcie semestru, który obejmuje około 15 tygodni. Przez pierwsze dwa tygodnie (4-5 spotkań klasowych) są używane niektóre materiały wprowadzające, decydujące i zbierające serie czasowe oraz przygotowujące Matlab na laptopie. Każdy tydzień po tym jest poświęcony jednemu z 12 tematów kursu. Każde zadanie polega na przeczytaniu rozdziału uwag, uruchomieniu powiązanego skryptu Matlab, który stosuje wybrane metody analizy szeregów czasowych do danych i zapisaniu interpretacji wyników. Zadania wymagają zrozumienia tematów wykładów oraz umiejętności korzystania z komputera i oprogramowania. Przesyłasz zadania, przesyłając je do D2L przed klasą wtorkową, kiedy zostanie wprowadzony następny temat. Pierwsze pół godziny tej wtorkowej klasy jest używane do samodzielnej oceny zadania, w tym do przesłania samoprzylepnych plików PDF do D2L. Sprawdzam co najmniej jedno zadanie z automatyczną gradacją każdego tygodnia (losowo) i mogę zmienić ocenę. Aby dowiedzieć się, jak uzyskać dostęp do przydziałów, kliknij pliki przydziału. Odczyty składają się z notatek z zajęć. Istnieje dwanaście zestawów plików notatek. pdf. po jednym dla każdego z tematów kursu. Dostęp do tych plików. pdf można uzyskać przez Internet. Więcej informacji na temat różnych tematów omawianych na kursie można znaleźć w referencjach wymienionych na końcu każdego rozdziału notatek lekcyjnych. Oceny opierają się wyłącznie na wynikach zadań, z których każdy jest wart 10 punktów. Nie ma egzaminów. Łączna liczba możliwych punktów dla 12 tematów wynosi 12 x 10 120. Ocena A wymagała 90-100 procent możliwych punktów. Ocena B wymaga 80-90 procent. Klasa C wymaga 70-80 procent i tak dalej. Oceny są przypisywane przez samoocenę kierowaną przez rubryki prezentowane w klasie. Liczba zdobytych punktów powinna być zaznaczona u góry każdego stopniowanego zadania. Twój znacznik przypisania powinien zawierać adnotację o wszelkich przecenach poprzez odniesienie do rubryki wskazanej w klasie (np. -0,5, rp3 oznacza odjęcie -0,5 z powodu błędu związanego z rubric point 3) Zadania, podane w klasie w czwartek, będą być należne (przesłane do D2L przez ciebie) przed rozpoczęciem zajęć w następny wtorek. Pierwsze pół godziny we wtorkowych posiedzeniach poświęcone będą prezentacji rubryk ocen, samooceny ukończonych zadań i przesyłaniu samodostatków do D2L. Ten harmonogram daje ci 4 dni na ukończenie zadania i przesłanie go do D2L przed 9:00 we wtorek. D2L śledzi czas przesłania zadania i żadna kara nie jest oceniana, dopóki nie zostanie przesłana przed godziną 9:00 we wtorek terminu. Jeśli masz zaplanowaną potrzebę nieobecności w klasie (np. Uczestnictwo w konferencji), jesteś odpowiedzialny za przesłanie swojego zadania przed godziną 9:00 we wtorek, kiedy to jest należne, oraz za przesłanie wersji własnej przez 10:15 tego samego dnia. Innymi słowy, harmonogram jest taki sam jak dla uczniów, którzy są w klasie. Jeśli pojawi się nagły wypadek (np. Masz grypę) i nie możesz wykonać zadania lub oceny zgodnie z harmonogramem, wyślij mi e-mail, a my osiągniemy pewne zakwaterowanie. W przeciwnym razie oceniona zostanie kara 5 punktów (połowa wszystkich dostępnych punktów za ćwiczenie). Wprowadzenie do organizacji szeregów czasowych danych do analizy Szeregi czasowe są szeroko definiowane jako dowolna seria pomiarów wykonywanych w różnym czasie. Niektóre podstawowe kategorie opisowe szeregów czasowych to: 1) długo vs krótki, 2) nawet krok w czasie w porównaniu z nierównomiernym krokiem w czasie, 3) dyskretny vs ciągły, 4) okresowy vs aperiodyczny, 5) stacjonarny vs niestacjonarny, i 6) jednowymiarowy vs wielowymiarowy . Te właściwości, jak również czasowe nakładanie się wielu serii, muszą być brane pod uwagę przy wyborze zestawu danych do analizy w tym kursie. W trakcie kursu przeanalizujesz własne szeregi czasowe. Pierwszym krokiem jest wybranie tych serii i zapisanie ich w strukturach w pliku mat. Jednorodność w przechowywaniu na początku jest wygodna dla tej klasy, tak więc uwaga może być skupiona na zrozumieniu metod szeregów czasowych, a raczej na debugowaniu kodu komputerowego w celu przygotowania danych do analizy. Struktura jest zmienną Matlaba podobną do bazy danych, ponieważ dostęp do jej treści uzyskuje się za pomocą tekstowych oznaczników pól. Struktura może przechowywać dane o różnych formach. Na przykład jedno pole może być numeryczną macierzą szeregów czasowych, innym może być tekst opisujący źródło danych itp. W pierwszym zadaniu uruchomi się skrypt Matlab, który odczytuje serie czasowe i metadane z plików tekstowych ascii, które przygotowujesz wcześniej i przechowuje dane w strukturach Matlab w jednym pliku mat. W kolejnych zadaniach zastosujesz metody szeregów czasowych do danych, uruchamiając skrypty Matlab i funkcje, które ładują plik mat i operują na tych strukturach. Wybierz przykładowe dane, które mają być użyte do przydziałów podczas kursu Czytaj: (1) Notes1.pdf, (2) Pierwsze kroki, dostępne z menu pomocy MATLAB Odpowiedź: Uruchom skrypt geosa1.m i odpowiedz na pytania podane w pliku w a1.pdf Jak rozróżnić kategorie szeregów czasowych Jak uruchomić i opuścić MATLAB Jak wprowadzić komendy MATLAB w wierszu polecenia Jak tworzyć cyfry w oknie rysunku Jak eksportować dane do edytora tekstu Różnice między skryptami MATLAB a funkcjami Jak uruchomić skrypty i funkcje forma zmiennej struktury MATLAB Jak zastosować skrypt geosa1.m, aby uzyskać zestaw szeregów czasowych i metadanych w strukturach MATLAB Rozkład prawdopodobieństwa szeregu czasowego opisuje prawdopodobieństwo, że obserwacja mieści się w określonym zakresie wartości. Empiryczny rozkład prawdopodobieństwa dla szeregu czasowego można uzyskać poprzez sortowanie i klasyfikowanie wartości serii. Kwantyle i percentyle są przydatnymi statystykami, które można pobrać bezpośrednio z empirycznego rozkładu prawdopodobieństwa. Wiele parametrycznych testów statystycznych przyjmuje, że szereg czasowy jest próbką z populacji o określonym rozkładzie prawdopodobieństwa populacji. Często zakłada się, że populacja jest normalna. W niniejszym rozdziale przedstawiono podstawowe definicje, statystyki i wykresy związane z rozkładem prawdopodobieństwa. Ponadto wprowadzono test (test Lillieforsa) do testowania, czy próbka pochodzi z rozkładu normalnego o nieokreślonej średniej i wariancji. Odpowiedź: Uruchom skrypt geosa2.m i odpowiedz na pytania wymienione w pliku w a2.pdf Definicje terminów: szeregi czasowe, stacjonarność, gęstość prawdopodobieństwa, funkcja rozkładu, kwantyl, rozkład, lokalizacja, średnia, odchylenie standardowe i pochylenie Jak interpretować najcenniejsza grafika w analizie szeregów czasowych - wykres szeregów czasowych Jak interpretować wykres pudełkowy, histogram i normalny wykres prawdopodobieństwa Parametry i kształt rozkładu normalnego Test Lilliefors na normalność: opis graficzny, założenia, hipotezy zerowe i alternatywne Zastrzeżenie dotyczące interpretacji poziomy istotności testów statystycznych, gdy szeregi czasowe nie są przypadkowe w czasie. Jak zastosować geosa2.m do sprawdzenia właściwości rozkładu szeregu czasowego i przetestować serię pod kątem normalności. Autokorelacja odnosi się do korelacji szeregu czasowego z jego przeszłymi i przyszłymi wartościami. Autokorelacja jest czasami nazywana opóźnioną korelacją lub korelacją szeregową. co odnosi się do korelacji między członkami szeregu liczb ułożonych w czasie. Pozytywna autokorelacja może być uważana za szczególną formę utrzymywania. tendencja do tego, aby system pozostał w tym samym stanie z jednej obserwacji do następnej. Na przykład prawdopodobieństwo, że jutro będzie deszcz, jest większe, jeśli dzisiaj jest deszczowo, niż dzisiaj, gdy jest sucho. Geofizyczne szeregi czasowe są często autokorelowane z powodu inercji lub procesów przenoszenia w systemie fizycznym. Na przykład wolno ewoluujące i poruszające się systemy niskociśnieniowe w atmosferze mogą nadawać uporowi dzienne opady. Lub powolne odwadnianie zasobów wód podziemnych może powodować korelację z kolejnymi rocznymi przepływami rzeki. Lub przechowywane fotosyntiany mogą wpływać na kolejne roczne wartości indeksów drzewiastych. Autorelacja utrudnia stosowanie testów statystycznych poprzez zmniejszenie liczby niezależnych obserwacji. Autokorelacja może także skomplikować identyfikację znaczącej kowariancji lub korelacji między seriami czasowymi (np. Wytrącanie z szeregiem pierścienia drzewa). Autokorelacja może być wykorzystana do przewidywań: serie związane z autokorelacją są przewidywalne, w sposób probabilistyczny, ponieważ przyszłe wartości zależą od wartości bieżących i przeszłych. Trzy narzędzia do oceny autokorelacji szeregu czasowego to (1) wykres szeregów czasowych, (2) opóźniony wykres rozrzutu i (3) funkcja autokorelacji. Odpowiedź: Uruchom skrypt geosa3.m i odpowiedz na pytania wymienione w pliku w a3.pdf Definicje: autokorelacja, trwałość, korelacja szeregowa, funkcja autokorelacji (acf), funkcja autokowariancji (acvf), efektywna wielkość próbki Jak rozpoznać autokorelację w szeregu czasowym fabuła Jak używać opóźnionych wykresów rozrzutu w celu oceny autokorelacji Jak interpretować wykreślone acf Jak dostosować rozmiar próbki do autokorelacji Matematyczna definicja funkcji autokorelacji Warunki wpływające na szerokość obliczonego przedziału ufności acf Różnica między jednostronnym a dwoma - sided test znaczącej autokorelacji lag-1 Jak zastosować geos3.m do badania autokorelacji szeregu czasowego Widmo szeregu czasowego jest rozkładem wariancji szeregu w funkcji częstotliwości. Celem analizy spektralnej jest oszacowanie i badanie widma. Widmo nie zawiera nowych informacji poza tym w funkcji autokowariancji (acvf), a w rzeczywistości spektrum można obliczyć matematycznie poprzez transformację akvf. Ale spektrum i aktywność przedstawiają informacje na temat wariancji szeregów czasowych z uzupełniających punktów widzenia. Acf podsumowuje informacje w dziedzinie czasu i widma w dziedzinie częstotliwości. Odpowiedź: Uruchom skrypt geosa4.m i odpowiedz na pytania zawarte w pliku w a4.pdf. Definicje: częstotliwość, okres, długość fali, widmo, częstotliwość Nyquista, częstotliwości Fouriera, szerokość pasma. Przyczyny analizy widma. Jak interpretować spektrum wykreślone pod względem rozkładu wariancji Różnica między spektrum a znormalizowanym widmem Definicja okna opóźnienia w celu oszacowania widma metodą Blackmana-Tukeya Jak wybór okna opóźnienia wpływa na szerokość pasma i wariancję szacowanego widma Jak zdefiniować widmo białego szumu i spektrum autoregresji Jak naszkicować typowe kształty spektralne: biały szum, autoregresyjny, quasi-okresowy, niskiej częstotliwości, wysokiej częstotliwości Jak zastosować geosa4.m do analizy spektrum szeregów czasowych metodą Blackmana-Tukeya Autoregressive-Moving Modelowanie średnie (ARMA) Modele autoregresyjno-ruchome (ARMA) to modele matematyczne trwałości lub autokorelacji w szeregu czasowym. Modele ARMA są szeroko stosowane w hydrologii, dendrochronologii, ekonometrii i innych dziedzinach. Istnieje kilka możliwych powodów dopasowania modeli ARMA do danych. Modelowanie może przyczynić się do zrozumienia fizycznego systemu poprzez ujawnienie czegoś o fizycznym procesie, który buduje wytrwałość w serii. Na przykład, prosty fizyczny model bilansu wodnego, składający się z warunków dla wprowadzania opadów, parowania, infiltracji i magazynowania wód gruntowych, może dostarczyć serii przepływu, która następuje po określonej postaci modelu ARMA. Modele ARMA mogą być również używane do przewidywania zachowania szeregów czasowych z samych tylko przeszłych wartości. Taka prognoza może być wykorzystana jako linia podstawowa do oceny potencjalnego znaczenia innych zmiennych w systemie. Modele ARMA są szeroko stosowane do prognozowania ekonomicznych i przemysłowych szeregów czasowych. Modele ARMA można również stosować do usuwania uporczywości. Na przykład w dendrochronologii modelowanie ARMA jest stosowane rutynowo w celu generowania chronologicznych szeregów czasowych o indeksie szerokości pierścienia bez zależności od przeszłych wartości. Ta operacja, zwana wstępnym bieleniem, ma na celu usunięcie trwałości związanej z biologią z serii, tak aby reszta mogła być bardziej odpowiednia do badania wpływu klimatu i innych zewnętrznych czynników środowiskowych na wzrost drzew. Odpowiedź: Uruchom skrypt geosa5.m i odpowiedz na pytania wymienione w pliku w a5.pdf Funkcjonalna forma najprostszych modeli AR i ARMA Dlaczego takie modele są określane jako autoregresyjne lub ruchome? Trzy kroki w modelowaniu ARMA. Wzorce diagnostyczne funkcje autokorelacji i częściowej autokorelacji dla szeregu czasowego AR (1) Definicja końcowego błędu prognozowania (FPE) oraz sposób wykorzystania FPE do wyboru najlepszego modelu ARMA. Definicja statystyki Portmanteau oraz sposób, w jaki może ona i resztę służy do oceny, czy model ARMA skutecznie modeluje trwałość w szeregu Jak stosuje się zasadę oszczędności w modelowaniu ARMA Definicja przedwitwienia Jak przedwcześnie wpływa na (1) pojawienie się szeregów czasowych i (2) widmo szeregu czasowego Jak zastosować geosa5.m do modelu ARMA w szeregach czasowych Analiza spektralna - wygładzona metoda periodogramowa Istnieje wiele dostępnych metod szacowania widma szeregu czasowego. W lekcji 4 przyjrzeliśmy się metodzie Blackmana-Tukeya, opartej na transformacji Fouriera wygładzonej, skróconej funkcji autokowariancji. Wygładzona metoda periodogramu omija transformację acf poprzez bezpośrednią transformację Fouriera szeregu czasowego i obliczenia surowego periodogramu, funkcji wprowadzonej po raz pierwszy w XIX wieku do badania szeregów czasowych. Surowy periodogram jest wygładzany przez zastosowanie kombinacji lub rozpiętości jednego lub więcej filtrów w celu uzyskania szacowanego widma. Gładkość, rozdzielczość i wariancja estymacji widmowych jest kontrolowana przez wybór filtrów. Bardziej zaakcentowane wygładzenie surowego periodogramu powoduje powstanie płynnie zmieniającego się spektrum lub zerowego kontinuum, wobec którego można badać wartości szczytowe spektralne dla istotności. To podejście jest alternatywą dla specyfikacji funkcjonalnej postaci continuum zerowego (na przykład widma AR). Odpowiedź: Uruchom skrypt geosa6.m i odpowiedz na pytania wymienione w pliku w a6.pdf Definicja: surogram periodyczny, filtr Daniell, zakres filtru, zerowa płynność ciągła, stabilność i rozdzielczość zbieżności widma, wypełnienie, przeciek Cztery główne kroki w oszacowaniu spektrum przez wygładzony periodogram Jak efekt wyboru przęseł filtru na gładkość, stabilność i rozdzielczość widma Jak stosować continuum zerowe w testowaniu znaczenia szczytów spektralnych Jak zastosować geosa6.m do oszacowania spektrum czasu seria przez wygładzoną metodę periodogramu i test okresowości z określoną częstotliwością Trend w szeregu czasowym to powolna, stopniowa zmiana w niektórych właściwościach serii w całym badanym okresie. Trend jest czasami luźno definiowany jako długoterminowa zmiana średniej (rysunek 7.1), ale może również odnosić się do zmian w innych właściwościach statystycznych. Na przykład szeregi pierścienia drzewa o zmierzonej szerokości pierścienia często mają trend w wariancji, jak również średnią (rysunek 7.2). W tradycyjnej analizie szeregów czasowych szereg czasowy został zdekomponowany do trendów, sezonowych lub okresowych składników i nieregularnych fluktuacji, a różne części badano osobno. Nowoczesne techniki analityczne często traktują tę serię bez takiego rutynowego rozkładu, ale często konieczne jest oddzielne rozważenie trendu. Detrending to statystyczna lub matematyczna operacja usuwania trendu z serii. Detrending jest często stosowany w celu usunięcia funkcji, która może zniekształcać lub zaciemniać interesujące relacje. Na przykład w klimatologii trend temperaturowy wywołany miejskim ociepleniem może przesłonić związek między zachmurzeniem a temperaturą powietrza. Detrending jest również czasem wykorzystywany jako etap wstępnego przetwarzania w celu przygotowania szeregów czasowych do analizy metodami, które zakładają stacjonarność. Dostępnych jest wiele alternatywnych metod detrendingu. Prosty trend liniowy w średniej można usunąć, odejmując linię prostą o najmniejszych kwadratach. Bardziej skomplikowane trendy mogą wymagać różnych procedur. Na przykład sześcienny wypust wygładzający jest powszechnie stosowany w dendrochronologii w celu dopasowania i usunięcia trendu szerokości pierścienia, który może nie być liniowy, lub nawet nie monotonicznie zwiększać się lub maleć w czasie. Przy badaniu i usuwaniu trendu ważne jest zrozumienie wpływu znoszenia na właściwości spektralne szeregów czasowych. Efekt ten można podsumować za pomocą odpowiedzi częstotliwościowej funkcji wygaszenia. Odpowiedź: Uruchom skrypt geosa7.m i odpowiedz na pytania wymienione w pliku w a7.pdf Definicje: pasmo przenoszenia, splajn, sześcienny splajn Spline Plusy i minusy stosunku vs różnica detrending Interpretacja terminów w równaniu dla parametru splajnu Jak wybrać splajnuj interaktywnie z pożądaną charakterystyką częstotliwości Jak wpływa na widmo detekcja Jak mierzyć znaczenie komponentu trendów w szeregach czasowych Jak zastosować geosa7.m do interaktywnego wyboru funkcji detekcji splajnu i detrend szeregu czasowego Szacunkowe widmo czasu seria podaje rozkład wariancji jako funkcję częstotliwości. W zależności od celu analizy niektóre częstotliwości mogą być bardziej interesujące niż inne i pomocne może być zmniejszenie amplitudy zmian na innych częstotliwościach poprzez statystyczne filtrowanie ich przed przeglądaniem i analizowaniem serii. Na przykład, zmiany o wysokiej częstotliwości (rok do roku) w ocenianej skali zrzutu wody mogą być stosunkowo nieistotne dla zaopatrzenia w wodę w basenie z dużymi zbiornikami, które mogą przechowywać kilka lat średniego rocznego spływu. Tam, gdzie zmiany o niskiej częstotliwości są w głównym interesie, pożądane jest wygładzenie zapisu absolutorium w celu wyeliminowania lub zmniejszenia krótkotrwałych fluktuacji przed użyciem zapisu absolutorium dla zbadania znaczenia zmian klimatycznych w zaopatrzeniu w wodę. Wygładzanie jest formą filtrowania, która tworzy szereg czasowy, w którym zmniejsza się znaczenie składowych widmowych przy wysokich częstotliwościach. Inżynierowie elektrycy nazywają ten rodzaj filtra filtrem dolnoprzepustowym, ponieważ zmiany o niskiej częstotliwości mogą przechodzić przez filtr. W filtrze dolnoprzepustowym fale o niskiej częstotliwości (długookresowej) są słabo odczuwalne przez wygładzanie. Możliwe jest również filtrowanie szeregu w taki sposób, że zmiany o niskiej częstotliwości są zredukowane, a zmiany o wysokiej częstotliwości niezmienione. Ten rodzaj filtra nazywany jest filtrem górnoprzepustowym. Detrending jest formą filtrowania górnoprzepustowego: dopasowana linia trendu śledzi najniższe częstotliwości, a reszty z linii trendu mają usunięte te niskie częstotliwości. Trzeci rodzaj filtrowania, zwany filtrem pasmowo-przepustowym, zmniejsza lub filtruje zarówno wysokie, jak i niskie częstotliwości, i pozostawia pewne pośrednie pasmo częstotliwości stosunkowo niewrażliwe. W tej lekcji omawiamy kilka metod wygładzania lub filtrowania dolnoprzepustowego. Omówiliśmy już, w jaki sposób sześcienny wypust wygładzający może być przydatny do tego celu. Omówiono cztery inne rodzaje filtrów: 1) prosta średnia ruchoma, 2) dwumianowa, 3) Gaussowska i 4) okienkowanie (metoda Hamminga). W wyborze filtra dolnoprzepustowego należy uwzględnić pożądaną charakterystykę częstotliwościową i rozpiętość lub szerokość filtru. Odpowiedź: Uruchom skrypt geosa8.m i odpowiedz na pytania wymienione w pliku w a8.pdf Definicje: filtr, waga filtru, zakres filtru, filtr dolnoprzepustowy, filtr górnoprzepustowy, filtr pasmowoprzepustowy Odpowiedź częstotliwościowa filtra Jak działa metoda Gaussa filtr jest związany z rozkładem Gaussa Jak zbudować prosty dwumianowy filtr ręcznie (bez komputera) Jak opisać funkcję odpowiedzi częstotliwościowej w kategoriach systemu z wejściami i wyjściami sinusoidalnymi Jak zastosować geosa8.m do interaktywnego projektowania dwumianu Gaussa lub Filtr dolnoprzepustowy okna Hamminga dla szeregu czasowego Współczynnik korelacji Pearsona z wartością produktu jest prawdopodobnie najczęściej używaną statystyką do podsumowania zależności między dwiema zmiennymi. Istotność statystyczną i zastrzeżenia interpretacji współczynnika korelacji w odniesieniu do szeregów czasowych są tematami tej lekcji. Przy pewnych założeniach statystyczna istotność współczynnika korelacji zależy tylko od wielkości próby, zdefiniowanej jako liczba niezależnych obserwacji. Jeżeli szeregi czasowe są autokorelowane, przy ocenie istotności należy stosować efektywny rozmiar próbki, niższy niż rzeczywisty rozmiar próbki. Relacje przejściowe lub pozorne mogą powodować znaczącą korelację w niektórych okresach, a nie w innych. Zmienność czasową siły korelacji liniowej można badać za pomocą wykresów korelacji obliczanych dla okna przesuwnego. Ale jeśli wiele współczynników korelacji jest ocenianych jednocześnie, przedziały ufności powinny być dostosowane (dostosowanie Bonferroniego), aby zrekompensować zwiększone prawdopodobieństwo zaobserwowania pewnych wysokich korelacji, gdy nie istnieje związek. Interpretacja korelacji ślizgowych może być również komplikowana przez zmiany w czasie średniej i wariancji szeregu, ponieważ korelacja przesuwająca odzwierciedla współzmienność w kategoriach standaryzowanych odstępstw od środków w okienku czasowym zainteresowania, które mogą różnić się od środków długoterminowych. Na koniec należy podkreślić, że współczynnik korelacji Pearsona mierzy siłę zależności liniowej. Wykresy rozrzutu są przydatne do sprawdzenia, czy związek jest liniowy. Odpowiedź: Uruchom skrypt geosa9.m ​​i odpowiedz na pytania zawarte w pliku w a9.pdf Matematyczne określenie współczynnika korelacji Założenia i hipotezy dla testu istotności współczynnika korelacji Jak obliczyć poziom istotności współczynnika korelacji i dostosować poziom istotności dla autokorelacji w Poszczególne szeregi czasowe Zastrzeżenia do interpretacji współczynnika korelacji Zmiana Bonferroni do poziomu znaczeniowej korelacji w wielu porównaniach Inflacja wariancji estymowanego współczynnika korelacji w przypadku autokorelacji szeregów czasowych Możliwe efekty transformacji danych na korelacji Jak interpretować wykresy korelacji ślizgowych Jak zastosować geosę9. m do analizy korelacji i przesuwania korelacji między parami szeregów czasowych Opóźnione relacje są charakterystyczne dla wielu naturalnych systemów fizycznych. Opóźniona korelacja odnosi się do korelacji między dwiema szeregami czasowymi przesuniętymi w czasie względem siebie. Opóźniona korelacja jest ważna w badaniu zależności między szeregami czasowymi z dwóch powodów. Po pierwsze, jedna seria może mieć opóźnioną odpowiedź na inną serię lub być może opóźnioną reakcję na wspólny bodziec, który wpływa na obie serie. Po drugie, odpowiedź jednej serii na inną serię lub zewnętrzny bodziec może być rozmazana w czasie, tak że bodziec ograniczony do jednej obserwacji wywołuje odpowiedź przy wielu obserwacjach. Na przykład ze względu na składowanie w zbiornikach, lodowcach itp., Zrzuty objętościowe rzeki w ciągu jednego roku mogą zależeć od opadów w kilku poprzednich latach. Lub z powodu zmian gęstości korony i przechowywania fotosyntatu, szerokość pierścienia drzewa w ciągu jednego roku może zależeć od klimatu z kilku poprzednich lat. Prosty współczynnik korelacji między dwiema seriami prawidłowo wyrównanymi w czasie jest niewystarczający, aby scharakteryzować związek w takich sytuacjach. Przydatne funkcje, które zbadamy jako alternatywę dla prostego współczynnika korelacji, to funkcja korelacji krzyżowej i funkcja odpowiedzi impulsowej. Funkcja korelacji krzyżowej jest korelacją między seriami przesuniętymi względem siebie w funkcji liczby obserwacji przesunięcia. Jeśli poszczególne serie są autokorelowane, oszacowana funkcja korelacji krzyżowej może być zniekształcona i wprowadzająca w błąd jako miara opóźnionej zależności. Przyjrzymy się dwóm podejściom do wyjaśnienia wzoru korelacji wzajemnych. Jednym z nich jest indywidualne usunięcie trwałości z serii przed korektą korelacji krzyżowej lub przed nią. W tym podejściu obie serie są zasadniczo traktowane na równych prawach. Alternatywą jest podejście systemowe: zobacz serię jako dynamiczny system liniowy - jedną serię wejściową i drugą - i oszacuj funkcję odpowiedzi impulsowej. Funkcja odpowiedzi impulsowej jest odpowiedzią wyjścia w chwili obecnej i w przyszłości na hipotetyczny impuls wejściowy ograniczony do bieżącego czasu. Answer: Run script geosa10.m and answer questions listed in the file in a10.pdf Definitions: cross-covariance function, cross-correlation function, impulse response function, lagged correlation, causal, linear How autocorrelation can distort the pattern of cross-correlations and how prewhitening is used to clarify the pattern The distinction between the equal footing and systems approaches to lagged bivariate relationships Which types of situations the impulse response function (irf) is an appropriate tool How to represent the causal system treated by the irf in a flow diagram How to apply geos10.m to analyze the lagged cross-correlation structure of a a pair of time series Multiple linear regression Multiple linear regression (MLR) is a method used to model the linear relationship between a dependent variable and one or more independent variables. The dependent variable is sometimes also called the predictand, and the independent variables the predictors. MLR is based on least squares: the model is fit such that the sum-of-squares of differences of observed and predicted values is minimized. MLR is probably the most widely used method in dendroclimatology for developing models to reconstruct climate variables from tree-ring series. Typically, a climatic variable is defined as the predictand and tree-ring variables from one or more sites are defined as predictors. The model is fit to a period -- the calibration period -- for which climatic and tree-ring data overlap. In the process of fitting, or estimating, the model, statistics are computed that summarize the accuracy of the regression model for the calibration period. The performance of the model on data not used to fit the model is usually checked in some way by a process called validation. Finally, tree-ring data from before the calibration period are substituted into the prediction equation to get a reconstruction of the predictand. The reconstruction is a prediction in the sense that the regression model is applied to generate estimates of the predictand variable outside the period used to fit the data. The uncertainty in the reconstruction is summarized by confidence intervals, which can be computed by various alternative ways. Answer: Run script geosa11.m (Part 1) and answer questions listed in the file in a11.pdf The equation for the MLR model Assumptions for the MLR model Definitions of MLR statistics: coefficient of determination, sums-of-squares terms, overall-F for the regression equation, standard error of the estimate, adjusted R-squared, pool of potential predictors The steps in an analysis of residuals How to apply geosa11.m (part 1) to fit a MLR regression model to predict one variable from a set of several predictor variables Validating the regression model Regression R-squared, even if adjusted for loss of degrees of freedom due to the number of predictors in the model, can give a misleading, overly optimistic view of accuracy of prediction when the model is applied outside the calibration period. Application outside the calibration period is the rule rather than the exception in dendroclimatology. The calibration-period statistics are typically biased because the model is tuned for maximum agreement in the calibration period. Sometimes too large a pool of potential predictors is used in automated procedures to select final predictors. Another possible problem is that the calibration period itself may be anomalous in terms of the relationships between the variables: modeled relationships may hold up for some periods of time but not for others. It is advisable therefore to validate the regression model by testing the model on data not used to fit the model. Several approaches to validation are available. Among these are cross-validation and split-sample validation. In cross-validation, a series of regression models is fit, each time deleting a different observation from the calibration set and using the model to predict the predictand for the deleted observation. The merged series of predictions for deleted observations is then checked for accuracy against the observed data. In split-sample calibration, the model is fit to some portion of the data (say, the second half), and accuracy is measured on the predictions for the other half of the data. The calibration and validation periods are then exchanged and the process repeated. In any regression problem it is also important to keep in mind that modeled relationships may not be valid for periods when the predictors are outside their ranges for the calibration period: the multivariate distribution of the predictors for some observations outside the calibration period may have no analog in the calibration period. The distinction of predictions as extrapolations versus interpolations is useful in flagging such occurrences. Answer: Run script geosa11.m (Part 2) and answer questions listed in the file in a12.pdf Definitions: validation, cross-validation, split-sample validation, mean square error (MSE), root-mean-square error (RMSE) standard error of prediction, PRESS statistic, hat matrix, extrapolation vs interpolation Advantages of cross-validation over alternative validation methods How to apply geosa11.m (part 2) for cross-validated MLR modeling of the relationship between a predictand and predictors, including generation of a reconstruction and confidence bands Downloading Files -- tsfiles. zip The Matlab class scripts and user-written functions are zipped in a file called tsfiles. zip. To get the files, first create an empty directory on your computer. This is where you will store all functions, scripts and data used in the course. Go to D2L, or click on tsfiles. zip to download the zip file to that directory and unzip it there. When you run matlab, be sure that directory is your current matlab working directory. Powerpoint lecture outlines miscellaneous files. Downloadable file other. zip has miscellaneous files used in lectures. Included are Matlab demo scripts, sample data files, user-written functions used by demo scripts, and powerpoint presentations, as pdfs (lect1a. pdf, lect1b. pdf, etc.) used in on-campus lectures. I update other. zip over the semester, and add the presentation for the current lecture within a couple of days after that lecture is given. To run the Matlab scripts for the assignments, you must have your data, the class scripts, and the user-written Matlab functions called by the scripts in a single directory on your computer. The name of this directory is unimportant. Under Windows, it might be something like C:geos585a. The functions and scripts provided for the course should not require any tailoring, but some changes can be made for convenience. For example, scripts and functions will typically prompt you for the name of your input data file and present Spring17 as the default. That is because Ive stored the sample data in Spring17.mat. If you want to avoid having to type over Spring17 with the name of your own data file each time you run the script, edit the matlab script with the Matlab editordebugger to change one line. In the editor, search for the string Spring17 and replace it with the name of your. mat storage file (e. g. Smith2017), then be sure to re-save the edited script.

No comments:

Post a Comment