len(observed ) 1 (observed[i] predicted[i]) 2

Σχετικά έγγραφα
Μηχανική Μάθηση Hypothesis Testing

Note: Please use the actual date you accessed this material in your citation.

Queensland University of Technology Transport Data Analysis and Modeling Methodologies

k A = [k, k]( )[a 1, a 2 ] = [ka 1,ka 2 ] 4For the division of two intervals of confidence in R +

4.6 Autoregressive Moving Average Model ARMA(1,1)

PENGARUHKEPEMIMPINANINSTRUKSIONAL KEPALASEKOLAHDAN MOTIVASI BERPRESTASI GURU TERHADAP KINERJA MENGAJAR GURU SD NEGERI DI KOTA SUKABUMI

2.019 Design of Ocean Systems. Lecture 6. Seakeeping (II) February 21, 2011

1.575 GHz GPS Ceramic Chip Antenna Ground cleared under antenna, clearance area 4.00 x 4.25 mm / 6.25 mm. Pulse Part Number: W3011 / W3011A

Matrices and Determinants

CHAPTER 12: PERIMETER, AREA, CIRCUMFERENCE, AND 12.1 INTRODUCTION TO GEOMETRIC 12.2 PERIMETER: SQUARES, RECTANGLES,

ΟΔΗΓΟΣ ΓΙΑ ΔΗΜΙΟΥΡΓΙΑ ΣΠΙΤΙΟΥ ΜΟΝΤΕΛΟ-1. Θα δημιουργήσουμε αυτό το μοντέλο με 2 κομμάτια, τη βάση και τη σκεπή.

5.4 The Poisson Distribution.

Generating Set of the Complete Semigroups of Binary Relations

UMI Number: All rights reserved

Bayesian statistics. DS GA 1002 Probability and Statistics for Data Science.


Section 8.3 Trigonometric Equations

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007

ΟΔΗΓΟΣ ΚΑΤΑΣΚΕΥΗΣ ΣΙΔΗΡΟΔΡΟΜΙΚΗΣ ΓΡΑΜΜΗΣ ΓΙΑ ΠΑΙΧΝΙΔΙ

ΜΟΝΤΕΛΑ ΛΗΨΗΣ ΑΠΟΦΑΣΕΩΝ

Statistics 104: Quantitative Methods for Economics Formula and Theorem Review

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 133: ΑΝΤΙΚΕΙΜΕΝΟΣΤΡΕΦΗΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΕΡΓΑΣΤΗΡΙΟ 3 Javadoc Tutorial

Το Εικονογραφημένο Βιβλίο στην Προσχολική Εκπαίδευση

Multilayer Ceramic Chip Capacitors

ΑΓΓΛΙΚΑ Ι. Ενότητα 7α: Impact of the Internet on Economic Education. Ζωή Κανταρίδου Τμήμα Εφαρμοσμένης Πληροφορικής

ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙO ΑΘΗΝΩΝ ΤΜΗΜΑ ΑΞΙΟΠΟΙΗΣΗΣ ΦΥΣΙΚΩΝ ΠΟΡΩΝ & ΓΕΩΡΓΙΚΗΣ ΜΗΧΑΝΙΚΗΣ

Solution Series 9. i=1 x i and i=1 x i.

Trigonometric Formula Sheet

EE512: Error Control Coding

ΠΩΣ ΕΠΗΡΕΑΖΕΙ Η ΜΕΡΑ ΤΗΣ ΕΒΔΟΜΑΔΑΣ ΤΙΣ ΑΠΟΔΟΣΕΙΣ ΤΩΝ ΜΕΤΟΧΩΝ ΠΡΙΝ ΚΑΙ ΜΕΤΑ ΤΗΝ ΟΙΚΟΝΟΜΙΚΗ ΚΡΙΣΗ

Μεταπτυχιακή διατριβή. Ανδρέας Παπαευσταθίου

Lecture 2: Dirac notation and a review of linear algebra Read Sakurai chapter 1, Baym chatper 3

Partial Differential Equations in Biology The boundary element method. March 26, 2013

Test Data Management in Practice

Ανάπτυξη Οντολογικής Γνώσης για Τεκμηρίωση Οπτικοακουστικού Περιεχομένου ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

1, +,*+* + +-,, -*, * : Key words: global warming, snowfall, snowmelt, snow water equivalent. Ohmura,,**0,**

6.003: Signals and Systems. Modulation

Section 9.2 Polar Equations and Graphs

A Bonus-Malus System as a Markov Set-Chain. Małgorzata Niemiec Warsaw School of Economics Institute of Econometrics

Ηλεκτρονικοί Υπολογιστές IV

Μιχάλης Βαφόπουλος, vafopoulos.org

Multilayer Ceramic Chip Capacitors

Lifting Entry 2. Basic planar dynamics of motion, again Yet another equilibrium glide Hypersonic phugoid motion MARYLAND U N I V E R S I T Y O F

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ. «Θεσμικό Πλαίσιο Φωτοβολταïκών Συστημάτων- Βέλτιστη Απόδοση Μέσω Τρόπων Στήριξης»

Instruction Execution Times

ΕΛΕΓΧΟΣ ΚΑΙ ΤΡΟΦΟΔΟΤΗΣΗ ΜΕΛΙΣΣΟΚΟΜΕΙΟΥ ΑΠΟ ΑΠΟΣΤΑΣΗ

Προσωπική Aνάπτυξη. Ενότητα 2: Διαπραγμάτευση. Juan Carlos Martínez Director of Projects Development Department

Elements of Information Theory

Generalized additive models in R

Reminders: linear functions

derivation of the Laplacian from rectangular to spherical coordinates

Από το CUDOS και το Semion στον οργανισμό Creative Commons και στο Open Knowledge Foundation

Jesse Maassen and Mark Lundstrom Purdue University November 25, 2013

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

p n r

Automating Complex Workflows using Processing Modeler

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

Démographie spatiale/spatial Demography

HIV HIV HIV HIV AIDS 3 :.1 /-,**1 +332

SUPERPOSITION, MEASUREMENT, NORMALIZATION, EXPECTATION VALUES. Reading: QM course packet Ch 5 up to 5.6

Analyze/Forecasting/Create Models

Ηλεκτρονικοί Υπολογιστές IV

ΒΗΜΑ 3. Από το πτυσσόμενο μενού (drop-down) που εμφανίζεται στην αριστερή μεριά, επιλέξτε Prism.

9.09. # 1. Area inside the oval limaçon r = cos θ. To graph, start with θ = 0 so r = 6. Compute dr

Αξιολόγηση των Φασματικού Διαχωρισμού στην Διάκριση Διαφορετικών Τύπων Εδάφους ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Σπίγγος Γεώργιος

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΛΛΗΛΟΓΡΑΦΙΑ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΑ ΣΤΗΝ ΑΓΓΛΙΚΗ ΓΛΩΣΣΑ

Homework 3 Solutions

ISM 868 MHz Ceramic Antenna Ground cleared under antenna, clearance area mm x 8.25 mm. Pulse Part Number: W3013

Surface Mount Multilayer Chip Capacitors for Commodity Solutions

3.4 SUM AND DIFFERENCE FORMULAS. NOTE: cos(α+β) cos α + cos β cos(α-β) cos α -cos β

Ανάκτηση Πληροφορίας

This is a repository copy of Persistent poverty and children's cognitive development: Evidence from the UK Millennium Cohort Study.

ΔΙΕΡΕΥΝΗΣΗ ΤΗΣ ΣΕΞΟΥΑΛΙΚΗΣ ΔΡΑΣΤΗΡΙΟΤΗΤΑΣ ΤΩΝ ΓΥΝΑΙΚΩΝ ΚΑΤΑ ΤΗ ΔΙΑΡΚΕΙΑ ΤΗΣ ΕΓΚΥΜΟΣΥΝΗΣ ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΥΓΕΙΑΣ

Math 6 SL Probability Distributions Practice Test Mark Scheme

ΠΕΡΙΕΧΟΜΕΝΑ. Μάρκετινγκ Αθλητικών Τουριστικών Προορισμών 1

Περιοχή διαγωνισμού Rethink Athens

Ηλεκτρονικοί Υπολογιστές IV

Inverse trigonometric functions & General Solution of Trigonometric Equations

Φροντιςτήριο. Linked-List

Congruence Classes of Invertible Matrices of Order 3 over F 2


상대론적고에너지중이온충돌에서 제트입자와관련된제동복사 박가영 인하대학교 윤진희교수님, 권민정교수님

Διάλεξη 2. Μεταβλητές - Δομές Δεδομένων - Eίσοδος δεδομένων - Έξοδος: Μορφοποίηση - Συναρτήσεις. Διοργάνωση : ΚΕΛ ΣΑΤΜ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή εργασία

The purpose of this study is to investigate the attitudes of adolescents toward internet

The Nottingham eprints service makes this work by researchers of the University of Nottingham available open access under the following conditions.

Table A.1 Random numbers (section 1)

An Inventory of Continuous Distributions

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions

ΦυσικόEXTRA ΔκεχριμπαρένιοEXTRA ΔυπόστρωμαEXTRA Δγομαλάκας, κατασκευασμένο από υψηλής

Προσωπική Aνάπτυξη. Ενότητα 4: Συνεργασία. Juan Carlos Martínez Director of Projects Development Department

Numerical Analysis FMN011

Section 7.6 Double and Half Angle Formulas

Lifting Entry (continued)

NPI Unshielded Power Inductors

Finite Field Problems: Solutions

Scrum framework: Γεγονότα

Quadratic Expressions

Διπλωματική Εργασία. Μελέτη των μηχανικών ιδιοτήτων των stents που χρησιμοποιούνται στην Ιατρική. Αντωνίου Φάνης

Supplementary Appendix

Transcript:

len(observed ) 1 (observed[i] predicted[i]) 2 i=0

len(observed ) 1 (observed[i] predicted[i]) 2 i=0

model1 = pylab.polyfit(xvals, yvals, 1) pylab.plot(xvals, pylab.polyval(model1, xvals), 'r--', label = Linear Model') pylab.polyfit pylab.polyval

model2 = pylab.polyfit(xvals, yvals, 2) pylab.plot(xvals, pylab.polyval(model2, l2 xvals), 'r--', label = 'Quadratic Model')

μ

Images of particle trajectory, load-bearing arch, football pass center of mass diagram sources unknown. All rights reserved. This content is excluded from out Creative Commons license. For more information, see https://ocw.mit.edu/help/faq-fair-use/.

def gennoisyparabolicdata(a, b, c, xvals, fname): yvals = [] for x in xvals: theoreticalval = a*x**2 + b*x + c yvals.append(theoreticalval + random.gauss(0, 35)) f = open(fname,'w') f.write('x y\n') for i in range(len(yvals)): f.write(str(yvals[i]) + ' ' + str(xvals[i]) + '\n') f.close() #parameters for generating data xvals = range(-10, 11, 1) a, b, c = 3, 0, 0 gennoisyparabolicdata(a, b, c, xvals, Mystery Data.txt')

degrees = (2, 4, 8, 16) random.seed(0) xvals1, yvals1 = getdata('dataset 1.txt') models1 = genfits(xvals1, yvals1, degrees) testfits(models1, degrees, xvals1, yvals1, 'DataSet 1.txt') pylab.figure() xvals2, yvals2 = getdata('dataset 2.txt') models2 = genfits(xvals2, yvals2, degrees) testfits(models2, degrees, xvals2, yvals2, 'DataSet 2.txt')

pylab.figure() testfits(models1, s1, degrees, xvals2, yvals2, 'DataSet 2/Model 1') pylab.figure() testfits(models2, s2, degrees, xvals1, yvals1, 'DataSet 1/Model 2')

xvals = (0,1,2,3) yvals = xvals pylab.plot(xvals, p yvals, label = 'Actual values') a,b,c = pylab.polyfit(xvals, polyfit(xvals yvals, 2) print('a =', round(a, 4), 'b =', round(b, 4), 'c =', round(c, 4)) estyvals = pylab.polyval((a,b,c), polyval((a b xvals) pylab.plot(xvals, estyvals, 'r--', label ='Predictive values') print('r-squared = ', rsquared(yvals, estyvals))

xvals = xvals + (20,) yvals = xvals pylab.plot(xvals, yvals, label = 'Actual values') estyvals = pylab.polyval((a,b,c), xvals) pylab.plot(xvals, estyvals, 'r--', label = 'Predictive values') print('r-squared = ', rsquared(yvals, estyvals))

xvals = (0,1,2,3),3) yvals = (0,1,2,3.1),3.1) pylab.plot(xvals, als yvals, label = 'Actual values') model = pylab.polyfit(xvals, yvals, 2) print(model) estyvals = pylab.polyval(model, xvals) pylab.plot(xvals, estyvals, 'r--', label = 'Predicted values') print('r-squared = ', rsquared(yvals, estyvals))

xvals = xvals + (20,) yvals = xvals estyvals = pylab.polyval(model, xvals) print('r-squared = ', rsquared(yvals, estyvals)) pylab.figure() pylab.plot(xvals, estyvals)

Let D be the original data set testresults = [] for i in range(len(d)): training = D[:].pop(i) model = buildmodel(training) testresults.append(test(model, D[i])) Average testresults

Let D be the original data set n be the number of random samples usually n between 20% and 50% k be number of trials testresults = [] for i in range(k) randomly select n elements for testset, keep rest for training model = buildmodel(training) testresults.append(test(model, testset)) Average testresults

class tempdatum(object): def init (self, s): info = s.split(',') self.high = float(info[1]) self.year = int(info[2][0:4]) def gethigh(self): return self.high def getyear(self): return self.year

def gettempdata(): infile = open('temperatures.csv') data = [] for l in infile: data.append(tempdatum(l)) return data

def getyearlymeans(data): years = {} for d in data: try: years[d.getyear()].append(d.gethigh()) except: years[d.getyear()] = [d.gethigh()] for y in years: years[y] = sum(years[y])/len(years[y]) return years

data = gettempdata() years = getyearlymeans(data) xvals, yvals = [], [] for e in years: xvals.append(e) yvals.append(years[e]) pylab.plot(xvals, yvals) pylab.xlabel('year') pylab.ylabel('mean Daily High (C)') pylab.title('select U.S. Cities')

numsubsets = 10 dimensions = (1, 2, 3, 4) rsquares = {} for d in dimensions: rsquares[d] = []

def splitdata(xvals, yvals): totrain = random.sample(range(len(xvals)), len(xvals)//2) trainx, trainy, testx, testy = [],[],[],[] for i in range(len(xvals)): if i in totrain: trainx.append(xvals[i]) trainy.append(yvals[i]) else: testx.append(xvals[i]) testy.append(yvals[i]) return trainx, trainy, testx, testy

for f in range(numsubsets): trainx,trainy,testx,testy = splitdata(xvals, yvals) for d in dimensions: model = pylab.polyfit(trainx, trainy, d) #estyvals = pylab.polyval(model, trainx) estyvals = pylab.polyval(model, testx) rsquares[d].append(rsquared(testy, estyvals)) print('mean R-squares for test data') for d in dimensions: mean = round(sum(rsquares[d])/len(rsquares[d]), 4) sd = round(numpy.std(rsquares[d]), 4) print('for dimensionality', d, 'mean =', mean, 'Std =', sd)

Mean R-squares for test data For dimensionality 1 mean = 0.7535 Std = 0.0656 For dimensionality 2 mean = 0.7291 Std = 0.0744 For dimensionality 3 mean = 0.7039 Std = 0.0684 For dimensionality 4 mean = 0.7169 Std = 0.0777

MIT OpenCourseWare https://ocw.mit.edu 6.0002 Introduction to Computational Thinking and Data Science Fall 2016 For information about citing these materials or our Terms of Use, visit: https://ocw.mit.edu/terms.