ECO-STATISTICA: OBIECTIVE: A. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI IN ZONA INVESTIGATA si a ERORII DE ESTIMARE In zona investigata cu o probabilitate de 90% (riscul asumat alfa =10%) presiunea este cuprinsa in intervalul: 771,444-0.011 mmhg 771,444+0.011 mmhg B. EVALUAREA CORELATIILOR DINTRE VALORILE CARACTERISTICILOR MEDIULUI Titlu diagramă 840.00 820.00 800.00 presiune 780.00 760.00 740.00 y = -6.467x + 890.9 presiunea-temperatura Liniară (presiunea-temperatura) 720.00 700.00 0.00 5.00 10.00 15.00 20.00 25.00 30.00 temperatura Presiunea = -6.467* Temperatura + 890.9 Coeficient de corelatie: -0.89028 C. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI INTR-UN ANUMIT PUNCT AL ZONEI INVESTIGATE
1. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI IN ZONA INVESTIGATA si a ERORII DE ESTIMARE care depinde de a. Densitatea punctelor de observatie b. Variabilitatea caracteristicii studiate c. Riscul asumat Ex.: CONTINUTUL DE HUMUS DIN SOL IN PADUREA BANEASA este de 250ppm PLUS /MINUS 15ppm cu un RISC DE 10%. V+/-EROARE T=10GRADE Celsius+/-2 grade Celsius
DATELE UTILIZATE PENTRU PRELUCRARI STATISTICE Variabile/caracteristici ALFANUMERICE Ex.: LITOLOGIA: GRANIT, BAZALT,... Pentru valorile alfanumerice operatiile posibile in cadrul prelucrarilor statistice sunt: COMPARAREA (identice sau diferite) CONCATENAREA (alaturarea celor doua valori) Pentru prelucrari suplimentare, valorile alfanumerice se codifica BINAR utilizand doua cifre: 0 (zero) care semnifica absenta valorii alfanumerice 1 (unu) care semnifica prezenta valorii alfanumerice Variabile/caracteristici NUMERICE Ex.: TEMPERATURA: 10 0 C, 15 0 C,... PRESIUNEA: 760 mm colhg
ETAPELE PRELUCRARILOR STATISTICE 1. ANALIZA VARIABILITATII GLOBALE (A.V.G) DATELE UTILIZATE: VALORILE variabilelor/caracteristicilor mediului: v(i); i=1,2,...n OBIECTIVUL: cea mai probabila valoare a caracteristicii studiate si eroarea de estimare a acestei valori v ± ε ( α ) 10 0 C ± 2 0 C ( 10% )
PRELUCRAREA DATELOR ALFANUMERICE Cea mai simpla varianta de evaluare a celei mai probabile valori alfanumerice se bazeaza pe HISTOGRAMA NOMINALA. Frecventa absoluta a valorilor alfanumerice salcie arin? Valorile alfanumerice intr-o succesiune arbitrara
PRELUCRAREA DATELOR NUMERICE a) Analiza valorilor extreme conduce la doua variante decizionale: a. Eliminarea: daca numarul valorilor extreme este redus b. Prelucrarea separata a grupului de valori extreme: daca grupul este numeros. Eliminarea valorilor extreme conduce la reducerea marimii erorii de estimare pentru cea mai probabila valoare a caracteristicii studiate in zona investigata. Valoarea variabilei Nr.valorii Aplicatie temperatura Tema T7:
Din diagrama de variabilitate a temperaturii rezulta ca nu sunt valori extreme care sa fie eliminate din setul de date original. In continuare se vor prelucra toate cele 40 de valori disponibile. b) Analiza distributiei valorilor de temperatura utilizand HISTOGRAMA VALORILOR TEMPERATURII F.abs.T T Vmin VMAX Normalitatea unei distributii (simetria histogramei) se cuantifica prin COEFICENTUL DE ASIMETRIE: ZERO cand histigrama este SIMETRICA NEGATIV daca asimetria este de STANGA POZITIV daca asimetria este de DREAPTA Dupa aplicarea transformarilor radical (valmax+1-v) si 1/v s-a decis sa se calculeze valoarea cea mai probabila cu valorile netrensformate ale temperaturii deoarece coeficientul de asimetrie corespunzator valorilor originale este cel mai mic: -0,27. c) calculul valorii celei mai probabile si a erorii de estimare a acesteia pentru un risc asumat de 10%.
LABORATOR 1. 1.Crearea fisierului cu date: Date numerice: o Coordonatele punctelor de masura (x,y) [m] o Presiunea aerului [mmhg] o Temperatura aerului [oc] Date alfanumerice: o Litologia: granit, diorit 2. Construirea diagramei de variabilitate pentru identificarea valorilor EXTREME c) Evaluarea distributiei valorilor caracteristicilor numerice Instrumentul utilizat: HISTOGRAMA Frecventa absoluta 4 3 2 1 0 Vmin n1=2 D n2=4 n3=3 n4=1 Vmax V
Frecventa absoluta: numarul de aparitii al unei valori n i Amplitudinea selectiei de valori: A = V max V min Interval de grupare (STURGESS): D = A 1+ 2,33 ln( n) Utilizarea HISTOGRAMEI pentru studiul distributiei valorilor In functie de tipul HISTOGRAMEI se stabileste modul de calcul al celei mai probabile valori din zona investigata:
Tipuri de HISTOGRAME: si modul de prelucrare specific HISTOGRAMA UNIMODALA SI SIMETRICA DISTRIBUTIA VALORILOR ESTE NORMALA Valoarea cea mai probabila se calculeaza cu toate valorile utilizate pentru constructia histogramei HISTOGRAMA ESTE UNIMODALA SI ASIMETRICA Valoarea cea mai probabila se calculeaza cu toate valorile utilizate pentru constructia histogramei DAR
NORMALIZATE CU AJUTORUL UNOR FUNCTII ANALITICE ELEMENTARE (ex.: log(v)=t) DACA NU SE NOMRALIZEAZA DISTRIBUTIA VALORILOR, VALOAREA CEA MAI PROBABILA VA FI SUPRAESTIMATA/SUBESTIMATA IN FUNCTIE DE TIPUL DE ASIMETRIE (DE DREAPTA respectiv de STANGA) ` HISTOGRAMA BIMODALA SIMETRICA Selectia de valori este NEOMOGENA si pentru prelucrare valori sunt separate in doua grupuri OMOGENE pentru care se calculeaza valori diferite ale celei mai probabile valori CU VALORILE ORIGINALE
HISTOGRAMA BIMODALA ASIMETRICA Selectia de valori este NEOMOGENA si pentru prelucrare valori sunt separate in doua grupuri OMOGENE pentru care se calculeaza valori diferite ale celei mai probabile valori CU VALORILE ORIGINALE NORMALIZATE.
CALCULUL CELEI MAI PROBABILE VALORI DIN ZONA INVESTIGATA Cea mai PROBABILA valoarea a unui set de valori cu distributie NORMALA (HISTOGRAMA UNIMODALA-SIMETRICA) este MEDIA ARITMETICA A VALORILOR. v i = n i= = 1 Daca distributia valorilor este NON-NORMALA (HISTOGRAMA este ASIMETRICA) valoarea cea mai probabaila calculata cu formula MEDIEI ARITMETICE va fi SUBESTIMATA/SUPRAESTIMATA in functie de tipul de asimetrie. Pentru eliminaea SUPRAESTIMARII/SUBESTIMARII celei mai probabile valori se NORMALIZEAZA distributia valorilor. n v i
APLICATIE Calculul celei mai probabile valori a PRESIUNII in zona investigata. Etapele de prelucrare (dupa construirea histogramei): 1) Evaluarea tipului de histograma: a. Unimodala b. Asimetrica i. de stanga ii. moderata 2) Calculul mediei aritmetice a valorilor presiunii (nenormalizate), media care va subestima cea mai probabila valoare a presiunii. 3) Normalizarea distributiei valorilor a. Transformarea valorilor folosind functia RADICAL de ordinul 2 ti = 2 vi ; i = 1,2,..., n b. Construirea histogramei cu valorile transformate c. Compararea histogramelor construite cu valorile originale si cu valorile transformate: i. Calitativ/vizual (aproximativ) ii. Cantitativ pe baza coeficientului de asimetrie (SKEWNESS) care este: 1. ZERO pentru histograma SIMETRICA 2. NEGATIV pt.hist. asim. STANGA 3. POZITIV pt.hist.asim. DREAPTA 4) Calculul mediei cu valorile transformate, daca distributia acestora are un coeficient de asimetrie mai mic decat al valorilor originale. v = 771, 444mmHg
2. Calculul erorii de estimate a mediei cu formula: ε s α 2 ( α ) = t( 1, ν ) = 0.011443mmHg n s = i = n i= 1 ( v v ) i n 1 2 = 0.164949mmHg CONCLUZIA analizei variabilitatii globale In zona investigata valoarea cea mai probabila a presiunii este 771,444 mmhg cu o eroare de estimare de 0,011443 mmhg in conditiile unui risc asumat de 10%. Probabilitate a de aparitie a valorii 0,014 0,014 presiunea 771,44mmH g
EVALUAREA CORELATIILOR DINTRE VALORILE CARACTERISTICILOR MEDIULUI Metodologia de evaluare a corelatiilor dintre caracteristicile mediului (numerice/alfanumerice) este constituita din urmatoarea succesiune de prelucrari: Identificarea corelatiei dintre variabilele selectate (exista corelatie in C1 si C2) prin metode grafice. C1 C2 C1 C2 Evaluarea intensitatii corelatiei dintre cele doua variabile selectate: o Standardizarea variabilitatii celor doua variabile selectate pe domeniul valoric [0,1] o Calculul coeficientilor de corelatie dintre cele doua variabile selectate; Coeficientul de corelatie lineara PEARSON
Val minima: -1: indica o corelatie lineara perfecta de tip INVERS PROPORTIONAL. Val medie: 0: indica lipsa corelatiei lineare dintre cele doua variabile selectate Valoarea MAXIMA: +1 indica o corelatie lineara perfecta de tip DIRECT PROPORTIONAL C1 C1 C1 r = -1 r = 0 r = +1 C2 C2 C2 Modelarea matematica a corelatiei dintre cele doua variabile selectate C1 C1 = a + b C2 C1 C1 b = C2 a C2 C2
LABORATOR Se evalueaza/analizeaza corelatia dintre: PRESIUNE si TEMPERATURA 1. Identificarea corlatiei: a. Realizarea diagramei de corelatie: EXISTA CORELATIE 2. Evaluarea intensitatii STANDARDIZAREA DIAGRAMA DE CORELATIE CU VALORILE STANDARDIZATE CALCULUL COEFICIENTULUI PEARSON: -0,89 INTENSITATEA CORELATIEI INVERSE DINTRE PRESIUNE SI TEMPERATURA ESTE F.BUNA! 3. Modelarea MATEMATICA a corelatiei dintre PRESIUNE si TEMPERATURA:
C. EVALUAREA CELEI MAI PROBABILE VALORI A UNEI CARACTERISTICI A MEDIULUI INTR-UN ANUMIT PUNCT AL ZONEI INVESTIGATE DATELE NECESARE Coordonatele punctelor de observatie: Xi,Yi ; i=1,2,...,n Valorile variabilei cercetate in toate punctele de observatie disponibile: Vi; i=1,2,...,n APLICATIA: DATELE utilizate sunt: n =40 puncte de observatie Variabilele investigate: o Alfanumerica: LITOLOGIA cu 2 valori distincte: Calcar Argila o Numerica: Presiunea [mmhg] Temperatura [ o C] METODOLOGIA DE EVALUARE 1. ANALIZA VARIABILITATII GLOBALE are ca obiectiv evaluarea celei mai probabile valori a variabilei in zona investigata. APLICATIA: Evaluarea celei mai probabile valori a LITOLOGIEI in zona investigata.
2. ANALIZA VARIABILITATII SPATIALE a variabilelor investigate OBIECTIV: identificare LEGII DE VARIATIE SPATIALA variabilelor investigate ( x y) V f, =????? APLICATIA: Lege de variatie spatiala pentru Variabila alfanumerica (LITOLOGIA) Variabile numerica (presiunea/temperatura) 3. EVALUAREA VALORII VARIABILEI IN ORICE PUNCT DIN DOMENIUL INVESTIGAT APLICATIA: Evaluarea: Pentru LITOLOGIE Pentru presiune/temperatura 4. EVALUAREA ERORII DE ESTIMARE A VARIABILEI IN ORICE PUNCT DIN DOMENIUL INVESTIGAT.
PROGRAMUL SURFER: Realizeaza doua tipuri de fisiere: i. Worksheet (similare cu fisierele de tip excel) ii. Plot-pentru reprezentari grafice si aplicarea metodologiei de evalure a distributiei spatiale. APLICATIA: Evaluarea celei mai probabile valori a LITOLOGIEI in zona investigata. INSTRUMENTUL UTILIZAT: HISTOGRAMA NOMINALA REZULTAT: PROBABILITATE DE APARITIE CALCAR: 20/40*100=50% PROBABILITATE DE APARITIE ARGILA: 20/40*100=50% FRECVENTA ABSOLUTA VALORILE ALFANUMERICE
APLICATIA: Lege de variatie spatiala pentru Variabila alfanumerica (LITOLOGIA) Variabile numerica (presiunea/temperatura) Metodologia de lucru Reprezentarea distributiei spatiale a punctelor de observatie (SURFER< datele din fisierul excel: sheet: datasurfer (x,y pentru cele 40 de puncte de observatie) File+new Plot+Map+New+Post Map+ Evaluarea legii de variatie spatiala a variabilei alfanumerice:litologie cu doua valori distincte: 1. argila codificarea binara a valorii argilei calculul variogramei experimentale omnidirectionale NOTA_CURS VARIOGRAMA EXPERIMENTALA (V.E.)-forma de exprimare sintetica a legii de variatie spatiala pentru caracteristicile alfanumerice si numerice. DATELE NECESARE pentru calculul V.E. sunt: coordonatele punctelor de observatie (x,y) valorile caracteristicii: o 0/1 pentru cele alfanumerice o Valorile pentru cele numerice
FORMULA DE CALCUL pentru V.E. γ r ( d ) = 2 1 N r ( d ) r N ( d ) v i v j 1 ( ) 2 γ ( d r ) d r Calculul variogramei experimentale cu prg.surfer 1. CREAREA UNUI FISIER DE TIP: PLOT File+New+Plot 2. LANSAREA PROGRAMULUI DE CALCUL AL VARIOGRAMEI Grid+Variogram+New Variogram 3. Selectarea fisierului cu date 4. Selectarea datelor: x, y, Cod_argila 5. Calculul si salvarea variogramei pentru argila:variograma_argila. 6. Calculul variogramei pentru calcar: Variograma_CALCAR OBSERVATIE:
Daca sunt doar DOUA valori alfanumerice DISTINCTE variogramele sunt identice pentru aceste valori. Variogramele pentru variabile/caracteristici ALFANUMERICE se numesc VARIOGRAME INDICATOARE 7. Calculul variogramei experimentale pentru variabilele numerice: Presiune: Variograma_PRESIUNE MODELAREA MATEMATICA A VARIOGRAMEI EXPERIMENTALE consta in identificarea unei functii continui care interpoleaza cu abateri minime valorile variogramei experimentale 1. modelarea matematica a Variogramei ARGILEI 2. etc. EVALUAREA DISTRIBUTIEI SPATIALE PENTRU VARIABILELE ALFANUMERICE NOTA CURS: Harta distributiei spatiale a variabilelor ALFANUMERICE este o harta cu distributia PROBABILITATII DE APARIATIE a valorii afanumerice studiate (ARGILA). De regula pe aceste harti se reprezinta numai zonele cu probabilitati mai mari de 50%. o Aplicatia: Reteaua de interpolare pentru probabilitatea de aparitie a argilei (GRID_ARGILA)
Reprezentarea grafica a distributiei spatiale a probabilitatilor de aparitie pentru ARGILA Definitivarea reprezentarii grafice