Η μέθοδος των ελαχίστων τετραγώνων επιτρέπει. Η μέθοδος των ελαχίστων τετραγώνων στο Excel. Ανάλυση παλινδρόμησης. Μερικές ειδικές περιπτώσεις εφαρμογής του LSM στην πράξη

Η μέθοδος των ελαχίστων τετραγώνων επιτρέπει. Η μέθοδος των ελαχίστων τετραγώνων στο Excel. Ανάλυση παλινδρόμησης. Μερικές ειδικές περιπτώσεις εφαρμογής του LSM στην πράξη

Το οποίο βρίσκει την ευρύτερη εφαρμογή σε διάφορους τομείς της επιστήμης και της πρακτικής. Μπορεί να είναι η φυσική, η χημεία, η βιολογία, η οικονομία, η κοινωνιολογία, η ψυχολογία και ούτω καθεξής και ούτω καθεξής. Με τη θέληση της μοίρας, συχνά πρέπει να ασχολούμαι με την οικονομία, και επομένως σήμερα θα κανονίσω για εσάς ένα εισιτήριο για μια καταπληκτική χώρα που ονομάζεται Οικονομετρία=) … Πώς δεν το θέλεις;! Είναι πολύ καλά εκεί - απλά πρέπει να αποφασίσετε! …Αλλά αυτό που πιθανώς σίγουρα θέλετε είναι να μάθετε πώς να λύνετε προβλήματα ελάχιστα τετράγωνα. Και ιδιαίτερα οι επιμελείς αναγνώστες θα μάθουν να τα λύνουν όχι μόνο με ακρίβεια, αλλά και ΠΟΛΥ ΓΡΗΓΟΡΑ ;-) Αλλά πρώτα γενική δήλωση του προβλήματος+ σχετικό παράδειγμα:

Αφήστε τους δείκτες να μελετηθούν σε κάποια θεματική περιοχή που έχουν ποσοτική έκφραση. Ταυτόχρονα, υπάρχει κάθε λόγος να πιστεύουμε ότι ο δείκτης εξαρτάται από τον δείκτη. Αυτή η υπόθεση μπορεί να είναι και μια επιστημονική υπόθεση και να βασίζεται σε στοιχειώδη κοινή λογική. Ας αφήσουμε την επιστήμη στην άκρη, ωστόσο, και ας εξερευνήσουμε πιο ορεκτικές περιοχές - συγκεκριμένα, τα παντοπωλεία. Σημειώστε με:

– χώρος λιανικής παντοπωλείου, τ.μ.,
- ετήσιος κύκλος εργασιών ενός παντοπωλείου, εκατομμύρια ρούβλια.

Είναι ξεκάθαρο ότι όσο μεγαλύτερη είναι η έκταση του καταστήματος, τόσο μεγαλύτερος είναι ο τζίρος του στις περισσότερες περιπτώσεις.

Ας υποθέσουμε ότι μετά από παρατηρήσεις / πειράματα / υπολογισμούς / χορό με ντέφι, έχουμε στη διάθεσή μας αριθμητικά δεδομένα:

Με τα παντοπωλεία, νομίζω ότι όλα είναι ξεκάθαρα: - αυτή είναι η περιοχή του 1ου καταστήματος, - ο ετήσιος τζίρος του, - η περιοχή του 2ου καταστήματος, - ο ετήσιος τζίρος του κ.λπ. Παρεμπιπτόντως, δεν είναι καθόλου απαραίτητο να έχετε πρόσβαση σε ταξινομημένα υλικά - μια αρκετά ακριβής εκτίμηση του κύκλου εργασιών μπορεί να ληφθεί χρησιμοποιώντας μαθηματικές στατιστικές. Ωστόσο, μην αποσπάτε την προσοχή, η πορεία της εμπορικής κατασκοπείας είναι ήδη πληρωμένη =)

Τα δεδομένα πίνακα μπορούν επίσης να γραφτούν με τη μορφή σημείων και να απεικονιστούν με τον συνηθισμένο τρόπο για εμάς. Καρτεσιανό σύστημα .

Ας απαντήσουμε σε μια σημαντική ερώτηση: πόσοι βαθμοί χρειάζονται για μια ποιοτική μελέτη;

Οσο μεγαλύτερο τόσο καλύτερα. Το ελάχιστο αποδεκτό σετ αποτελείται από 5-6 πόντους. Επιπλέον, με έναν μικρό όγκο δεδομένων, τα «μη φυσιολογικά» αποτελέσματα δεν πρέπει να περιλαμβάνονται στο δείγμα. Έτσι, για παράδειγμα, ένα μικρό κατάστημα ελίτ μπορεί να βοηθήσει σε τάξεις μεγέθους περισσότερο από «τους συναδέλφους του», παραμορφώνοντας έτσι το γενικό μοτίβο που πρέπει να βρεθεί!

Αν είναι αρκετά απλό, πρέπει να επιλέξουμε μια συνάρτηση, πρόγραμμαπου περνά όσο πιο κοντά στα σημεία . Μια τέτοια συνάρτηση ονομάζεται προσεγγίζοντας (προσέγγιση - προσέγγιση)ή θεωρητική λειτουργία . Σε γενικές γραμμές, εδώ εμφανίζεται αμέσως ένας προφανής «προσποιητής» - ένα πολυώνυμο υψηλού βαθμού, η γραφική παράσταση του οποίου διέρχεται από ΟΛΑ τα σημεία. Αλλά αυτή η επιλογή είναι περίπλοκη και συχνά απλά λανθασμένη. (επειδή το γράφημα θα «ανεμίζει» συνεχώς και θα αντικατοπτρίζει ελάχιστα την κύρια τάση).

Έτσι, η επιθυμητή συνάρτηση πρέπει να είναι αρκετά απλή και ταυτόχρονα να αντικατοπτρίζει επαρκώς την εξάρτηση. Όπως μπορείτε να μαντέψετε, ονομάζεται μία από τις μεθόδους εύρεσης τέτοιων συναρτήσεων ελάχιστα τετράγωνα. Αρχικά, ας αναλύσουμε την ουσία του με γενικό τρόπο. Αφήστε κάποια συνάρτηση να προσεγγίσει τα πειραματικά δεδομένα:


Πώς να αξιολογήσετε την ακρίβεια αυτής της προσέγγισης; Ας υπολογίσουμε επίσης τις διαφορές (αποκλίσεις) μεταξύ των πειραματικών και λειτουργικών τιμών (μελετούμε το σχέδιο). Η πρώτη σκέψη που έρχεται στο μυαλό είναι να εκτιμήσουμε πόσο μεγάλο είναι το άθροισμα, αλλά το πρόβλημα είναι ότι οι διαφορές μπορεί να είναι αρνητικές. (Για παράδειγμα, ) και οι αποκλίσεις ως αποτέλεσμα μιας τέτοιας άθροισης θα αλληλοεξουδετερωθούν. Επομένως, ως εκτίμηση της ακρίβειας της προσέγγισης, προτείνει τον εαυτό της να λάβει το άθροισμα ενότητεςαποκλίσεις:

ή σε διπλωμένη μορφή: (ξαφνικά, ποιος δεν ξέρει: είναι το εικονίδιο του αθροίσματος και είναι μια βοηθητική μεταβλητή-"μετρητής", που παίρνει τιμές από 1 έως ).

Προσεγγίζοντας τα πειραματικά σημεία με διαφορετικές συναρτήσεις, θα λάβουμε διαφορετικές τιμές του , και είναι προφανές ότι όπου αυτό το άθροισμα είναι μικρότερο, αυτή η συνάρτηση είναι πιο ακριβής.

Μια τέτοια μέθοδος υπάρχει και ονομάζεται μέθοδος ελάχιστου συντελεστή. Ωστόσο, στην πράξη έχει γίνει πολύ πιο διαδεδομένο. μέθοδος ελάχιστου τετραγώνου, όπου οι πιθανές αρνητικές τιμές εξαλείφονται όχι από το μέτρο, αλλά με τον τετραγωνισμό των αποκλίσεων:

, μετά την οποία οι προσπάθειες κατευθύνονται στην επιλογή μιας τέτοιας συνάρτησης ώστε το άθροισμα των τετραγωνικών αποκλίσεων ήταν όσο το δυνατόν μικρότερο. Στην πραγματικότητα, εξ ου και το όνομα της μεθόδου.

Και τώρα επιστρέφουμε σε ένα άλλο σημαντικό σημείο: όπως σημειώθηκε παραπάνω, η επιλεγμένη συνάρτηση θα πρέπει να είναι αρκετά απλή - αλλά υπάρχουν και πολλές τέτοιες λειτουργίες: γραμμικός , υπερβολικός, εκθετικός, λογαριθμική, τετραγωνικός και τα λοιπά. Και, φυσικά, εδώ θα ήθελα αμέσως να «μειώσω το πεδίο δραστηριότητας». Ποια κατηγορία λειτουργιών να επιλέξετε για έρευνα; Πρωτόγονη αλλά αποτελεσματική τεχνική:

- Ο ευκολότερος τρόπος για να τραβήξετε πόντους στο σχέδιο και αναλύστε τη θέση τους. Εάν τείνουν να είναι σε ευθεία γραμμή, τότε θα πρέπει να αναζητήσετε ευθύγραμμη εξίσωση με βέλτιστες τιμές και . Με άλλα λόγια, το καθήκον είναι να βρεθούν ΤΕΤΟΙΟΙ συντελεστές - έτσι ώστε το άθροισμα των τετραγωνικών αποκλίσεων να είναι το μικρότερο.

Εάν τα σημεία βρίσκονται, για παράδειγμα, κατά μήκος υπερβολή, τότε είναι σαφές ότι η γραμμική συνάρτηση θα δώσει κακή προσέγγιση. Σε αυτή την περίπτωση, αναζητούμε τους πιο «ευνοϊκούς» συντελεστές για την εξίσωση της υπερβολής - αυτά που δίνουν το ελάχιστο άθροισμα τετραγώνων .

Προσέξτε τώρα ότι και στις δύο περιπτώσεις μιλάμε συναρτήσεις δύο μεταβλητών, των οποίων τα επιχειρήματα είναι αναζητήθηκαν επιλογές εξάρτησης:

Και στην ουσία, πρέπει να λύσουμε ένα τυπικό πρόβλημα - να βρούμε ελάχιστη συνάρτηση δύο μεταβλητών.

Θυμηθείτε το παράδειγμά μας: ας υποθέσουμε ότι τα σημεία «καταστήματος» τείνουν να βρίσκονται σε ευθεία γραμμή και υπάρχει κάθε λόγος να πιστεύουμε την παρουσία γραμμική εξάρτησηκύκλου εργασιών από την περιοχή συναλλαγών. Ας βρούμε ΤΕΤΟΙΟΥΣ συντελεστές "a" και "be" έτσι ώστε το άθροισμα των τετραγωνικών αποκλίσεων ήταν το μικρότερο. Όλα ως συνήθως - πρώτα επιμέρους παράγωγα 1ης τάξης. Σύμφωνα με κανόνας γραμμικότηταςμπορείτε να διαφοροποιήσετε ακριβώς κάτω από το εικονίδιο άθροισης:

Εάν θέλετε να χρησιμοποιήσετε αυτές τις πληροφορίες για ένα δοκίμιο ή μια εργασία όρου, θα είμαι πολύ ευγνώμων για τον σύνδεσμο στη λίστα των πηγών, δεν θα βρείτε πουθενά τόσο λεπτομερείς υπολογισμούς:

Ας φτιάξουμε ένα τυπικό σύστημα:

Μειώνουμε κάθε εξίσωση κατά ένα «δύο» και, επιπλέον, «χωρίζουμε» τα αθροίσματα:

Σημείωση : αναλύστε ανεξάρτητα γιατί το "a" και το "be" μπορούν να αφαιρεθούν από το εικονίδιο αθροίσματος. Παρεμπιπτόντως, τυπικά αυτό μπορεί να γίνει με το άθροισμα

Ας ξαναγράψουμε το σύστημα σε μια "εφαρμοσμένη" μορφή:

μετά την οποία αρχίζει να σχεδιάζεται ο αλγόριθμος για την επίλυση του προβλήματός μας:

Γνωρίζουμε τις συντεταγμένες των σημείων; Ξέρουμε. Ποσά μπορούμε να βρούμε; Εύκολα. Συνθέτουμε τα πιο απλά σύστημα δύο γραμμικών εξισώσεων με δύο αγνώστους("α" και "μπεχ"). Λύνουμε το σύστημα, για παράδειγμα, Η μέθοδος του Cramer, με αποτέλεσμα ένα ακίνητο σημείο . Ελεγχος επαρκής συνθήκη για εξτρέμ, μπορούμε να επαληθεύσουμε ότι σε αυτό το σημείο η συνάρτηση φτάνει με ακρίβεια ελάχιστο. Η επαλήθευση συνδέεται με πρόσθετους υπολογισμούς και επομένως θα την αφήσουμε στο παρασκήνιο. (εάν είναι απαραίτητο, μπορείτε να δείτε το πλαίσιο που λείπει). Καταλήγουμε στο τελικό συμπέρασμα:

Λειτουργία ο καλύτερος τρόπος (τουλάχιστον σε σύγκριση με οποιαδήποτε άλλη γραμμική συνάρτηση)φέρνει πιο κοντά τα πειραματικά σημεία . Σε γενικές γραμμές, το γράφημά του περνά όσο το δυνατόν πιο κοντά σε αυτά τα σημεία. Στην παράδοση οικονομετρίακαλείται επίσης η συνάρτηση προσέγγισης που προκύπτει ζευγαρωμένη γραμμική εξίσωση παλινδρόμησης .

Το πρόβλημα που εξετάζεται έχει μεγάλη πρακτική σημασία. Στην κατάσταση με το παράδειγμά μας, η εξίσωση σας επιτρέπει να προβλέψετε τι είδους τζίρο ("yig")θα βρίσκεται στο κατάστημα με τη μία ή την άλλη αξία της περιοχής πώλησης (η μία ή η άλλη σημασία του "x"). Ναι, η πρόβλεψη που προκύπτει θα είναι μόνο μια πρόβλεψη, αλλά σε πολλές περιπτώσεις θα αποδειχθεί αρκετά ακριβής.

Θα αναλύσω μόνο ένα πρόβλημα με «πραγματικούς» αριθμούς, αφού δεν υπάρχουν δυσκολίες σε αυτό - όλοι οι υπολογισμοί είναι στο επίπεδο του σχολικού προγράμματος σπουδών στις τάξεις 7-8. Στο 95 τοις εκατό των περιπτώσεων, θα σας ζητηθεί να βρείτε μόνο μια γραμμική συνάρτηση, αλλά στο τέλος του άρθρου θα δείξω ότι δεν είναι πιο δύσκολο να βρείτε τις εξισώσεις για τη βέλτιστη υπερβολή, τον εκθέτη και κάποιες άλλες συναρτήσεις.

Στην πραγματικότητα, μένει να διανείμετε τα καλούδια που υποσχέθηκαν - έτσι ώστε να μάθετε πώς να λύνετε τέτοια παραδείγματα όχι μόνο με ακρίβεια, αλλά και γρήγορα. Μελετάμε προσεκτικά το πρότυπο:

Εργο

Ως αποτέλεσμα της μελέτης της σχέσης μεταξύ δύο δεικτών, προέκυψαν τα ακόλουθα ζεύγη αριθμών:

Χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων, βρείτε τη γραμμική συνάρτηση που προσεγγίζει καλύτερα την εμπειρική (έμπειρος)δεδομένα. Κάντε ένα σχέδιο στο οποίο, σε ένα καρτεσιανό ορθογώνιο σύστημα συντεταγμένων, σχεδιάστε πειραματικά σημεία και μια γραφική παράσταση της συνάρτησης κατά προσέγγιση . Βρείτε το άθροισμα των τετραγωνικών αποκλίσεων μεταξύ εμπειρικών και θεωρητικών τιμών. Μάθετε αν η λειτουργία είναι καλύτερη (όσον αφορά τη μέθοδο των ελαχίστων τετραγώνων)κατά προσέγγιση πειραματικά σημεία.

Σημειώστε ότι οι τιμές "x" είναι φυσικές τιμές και αυτό έχει ένα χαρακτηριστικό νόημα, για το οποίο θα μιλήσω λίγο αργότερα. αλλά φυσικά μπορούν να είναι κλασματικά. Επιπλέον, ανάλογα με το περιεχόμενο μιας συγκεκριμένης εργασίας, και οι δύο τιμές "X" και "G" μπορεί να είναι πλήρως ή μερικώς αρνητικές. Λοιπόν, μας έχει δοθεί μια «απρόσωπη» εργασία και την ξεκινάμε λύση:

Βρίσκουμε τους συντελεστές της βέλτιστης συνάρτησης ως λύση στο σύστημα:

Για τους σκοπούς μιας πιο συμπαγούς σημειογραφίας, η μεταβλητή «counter» μπορεί να παραλειφθεί, καθώς είναι ήδη σαφές ότι η άθροιση πραγματοποιείται από το 1 έως το .

Είναι πιο βολικό να υπολογίσετε τα απαιτούμενα ποσά σε μορφή πίνακα:


Οι υπολογισμοί μπορούν να πραγματοποιηθούν σε μικροϋπολογιστή, αλλά είναι πολύ καλύτερο να χρησιμοποιείτε το Excel - τόσο πιο γρήγορα όσο και χωρίς σφάλματα. δείτε ένα σύντομο βίντεο:

Έτσι, παίρνουμε το εξής Σύστημα:

Εδώ μπορείτε να πολλαπλασιάσετε τη δεύτερη εξίσωση με 3 και αφαιρέστε το 2ο από την 1η εξίσωση όρο προς όρο. Αλλά αυτό είναι τύχη - στην πράξη, τα συστήματα συχνά δεν είναι προικισμένα και σε τέτοιες περιπτώσεις εξοικονομεί Η μέθοδος του Cramer:
, οπότε το σύστημα έχει μια μοναδική λύση.

Ας κάνουμε έναν έλεγχο. Καταλαβαίνω ότι δεν θέλω, αλλά γιατί να παραλείψετε λάθη που δεν μπορείτε να τα χάσετε; Αντικαταστήστε τη λύση που βρέθηκε στην αριστερή πλευρά κάθε εξίσωσης του συστήματος:

Προκύπτουν τα σωστά μέρη των αντίστοιχων εξισώσεων, που σημαίνει ότι το σύστημα έχει λυθεί σωστά.

Έτσι, η επιθυμητή συνάρτηση προσέγγισης: – από όλες τις γραμμικές συναρτήσειςΤα πειραματικά δεδομένα προσεγγίζονται καλύτερα από αυτό.

Διαφορετικός ευθεία εξάρτηση του τζίρου του καταστήματος από την περιοχή του, η διαπιστωθείσα εξάρτηση είναι ΑΝΤΙΣΤΡΟΦΗ (αρχή "όσο περισσότερο - τόσο λιγότερο"), και το γεγονός αυτό αποκαλύπτεται αμέσως από το αρνητικό γωνιακός συντελεστής. Λειτουργία μας πληροφορεί ότι με αύξηση ενός συγκεκριμένου δείκτη κατά 1 μονάδα, η τιμή του εξαρτημένου δείκτη μειώνεται μέση τιμήκατά 0,65 μονάδες. Όπως λένε, όσο υψηλότερη είναι η τιμή του φαγόπυρου, τόσο λιγότερο πωλείται.

Για να σχεδιάσουμε την κατά προσέγγιση συνάρτηση, βρίσκουμε δύο από τις τιμές της:

και εκτελέστε το σχέδιο:


Η κατασκευασμένη γραμμή ονομάζεται γραμμή τάσης (δηλαδή, μια γραμμική γραμμή τάσης, δηλαδή στη γενική περίπτωση, μια τάση δεν είναι απαραίτητα μια ευθεία γραμμή). Όλοι γνωρίζουν την έκφραση «to be in trend», και νομίζω ότι αυτός ο όρος δεν χρειάζεται επιπλέον σχόλια.

Υπολογίστε το άθροισμα των τετραγωνικών αποκλίσεων μεταξύ εμπειρικών και θεωρητικών αξιών. Γεωμετρικά, αυτό είναι το άθροισμα των τετραγώνων των μηκών των «βυσσινί» τμημάτων (δύο από τα οποία είναι τόσο μικρά που δεν μπορείτε καν να τα δείτε).

Ας συνοψίσουμε τους υπολογισμούς σε έναν πίνακα:


Μπορούν και πάλι να πραγματοποιηθούν χειροκίνητα, σε περίπτωση που θα δώσω ένα παράδειγμα για το 1ο σημείο:

αλλά είναι πολύ πιο αποτελεσματικό να κάνουμε τον ήδη γνωστό τρόπο:

Ας επαναλάβουμε: ποιο είναι το νόημα του αποτελέσματος;Από όλες τις γραμμικές συναρτήσειςλειτουργία ο εκθέτης είναι ο μικρότερος, δηλαδή είναι η καλύτερη προσέγγιση στην οικογένειά του. Και εδώ, παρεμπιπτόντως, το τελευταίο ερώτημα του προβλήματος δεν είναι τυχαίο: τι θα συμβεί αν η προτεινόμενη εκθετική συνάρτηση θα είναι καλύτερα να κάνουμε κατά προσέγγιση τα πειραματικά σημεία;

Ας βρούμε το αντίστοιχο άθροισμα των τετραγωνικών αποκλίσεων - για να τις ξεχωρίσω, θα τις προσδιορίσω με το γράμμα «έψιλον». Η τεχνική είναι ακριβώς η ίδια:


Και πάλι για κάθε υπολογισμό πυρκαγιάς για τον 1ο βαθμό:

Στο Excel, χρησιμοποιούμε την τυπική συνάρτηση ΛΗΞΗ (Η σύνταξη βρίσκεται στη Βοήθεια του Excel).

συμπέρασμα: , άρα η εκθετική συνάρτηση προσεγγίζει τα πειραματικά σημεία χειρότερα από την ευθεία .

Πρέπει όμως να σημειωθεί εδώ ότι το «χειρότερο» είναι δεν σημαίνει ακόμα, τι συμβαίνει. Τώρα έφτιαξα ένα γράφημα αυτής της εκθετικής συνάρτησης - και περνάει επίσης κοντά στα σημεία - τόσο πολύ που χωρίς αναλυτική μελέτη είναι δύσκολο να πούμε ποια συνάρτηση είναι πιο ακριβής.

Αυτό ολοκληρώνει τη λύση και επιστρέφω στο ζήτημα των φυσικών αξιών του επιχειρήματος. Σε διάφορες μελέτες, κατά κανόνα, οικονομικές ή κοινωνιολογικές, μήνες, χρόνια ή άλλα ίσα χρονικά διαστήματα αριθμούνται με φυσικό «Χ». Σκεφτείτε, για παράδειγμα, ένα τέτοιο πρόβλημα.

Παράδειγμα.

Πειραματικά δεδομένα για τις τιμές των μεταβλητών ΧΚαι στοδίνονται στον πίνακα.

Ως αποτέλεσμα της ευθυγράμμισής τους, η συνάρτηση

Χρησιμοποιώντας μέθοδος ελάχιστου τετραγώνου, προσεγγίστε αυτά τα δεδομένα με μια γραμμική εξάρτηση y=ax+b(βρες παραμέτρους ΕΝΑΚαι σι). Μάθετε ποια από τις δύο γραμμές είναι καλύτερη (με την έννοια της μεθόδου των ελαχίστων τετραγώνων) ευθυγραμμίζει τα πειραματικά δεδομένα. Κάντε ένα σχέδιο.

Η ουσία της μεθόδου των ελαχίστων τετραγώνων (LSM).

Το πρόβλημα είναι να βρούμε τους γραμμικούς συντελεστές εξάρτησης για τους οποίους η συνάρτηση δύο μεταβλητών ΕΝΑΚαι σι παίρνει τη μικρότερη τιμή. Με δεδομένα δηλαδή ΕΝΑΚαι σιτο άθροισμα των τετραγωνικών αποκλίσεων των πειραματικών δεδομένων από την ευθεία που βρέθηκε θα είναι το μικρότερο. Αυτό είναι το όλο νόημα της μεθόδου των ελαχίστων τετραγώνων.

Έτσι, η λύση του παραδείγματος ανάγεται στην εύρεση του άκρου μιας συνάρτησης δύο μεταβλητών.

Παραγωγή τύπων εύρεσης συντελεστών.

Καταρτίζεται και λύνεται ένα σύστημα δύο εξισώσεων με δύο αγνώστους. Εύρεση μερικών παραγώγων μιας συνάρτησης σε σχέση με μεταβλητές ΕΝΑΚαι σι, εξισώνουμε αυτές τις παραγώγους με μηδέν.

Λύνουμε το προκύπτον σύστημα εξισώσεων με οποιαδήποτε μέθοδο (π.χ μέθοδος αντικατάστασηςή ) και λάβετε τύπους για την εύρεση συντελεστών χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων (LSM).

Με δεδομένα ΕΝΑΚαι σιλειτουργία παίρνει τη μικρότερη τιμή. Η απόδειξη αυτού του γεγονότος δίνεται.

Αυτή είναι η όλη μέθοδος των ελαχίστων τετραγώνων. Τύπος για την εύρεση της παραμέτρου έναπεριέχει τα αθροίσματα , , και την παράμετρο n- ποσότητα πειραματικών δεδομένων. Οι τιμές αυτών των ποσών συνιστάται να υπολογίζονται χωριστά. Συντελεστής σιβρέθηκε μετά τον υπολογισμό ένα.

Ήρθε η ώρα να θυμηθούμε το αρχικό παράδειγμα.

Λύση.

Στο παράδειγμά μας n=5. Συμπληρώνουμε τον πίνακα για τη διευκόλυνση του υπολογισμού των ποσών που περιλαμβάνονται στους τύπους των απαιτούμενων συντελεστών.

Οι τιμές στην τέταρτη σειρά του πίνακα λαμβάνονται πολλαπλασιάζοντας τις τιμές της 2ης σειράς με τις τιμές της 3ης σειράς για κάθε αριθμό Εγώ.

Οι τιμές στην πέμπτη σειρά του πίνακα λαμβάνονται με τον τετραγωνισμό των τιμών της 2ης σειράς για κάθε αριθμό Εγώ.

Οι τιμές της τελευταίας στήλης του πίνακα είναι τα αθροίσματα των τιμών στις σειρές.

Χρησιμοποιούμε τους τύπους της μεθόδου των ελαχίστων τετραγώνων για να βρούμε τους συντελεστές ΕΝΑΚαι σι. Αντικαθιστούμε σε αυτά τις αντίστοιχες τιμές από την τελευταία στήλη του πίνακα:

Ως εκ τούτου, y=0,165x+2,184είναι η επιθυμητή προσεγγιστική ευθεία.

Μένει να μάθουμε ποια από τις γραμμές y=0,165x+2,184ή προσεγγίζει καλύτερα τα αρχικά δεδομένα, δηλαδή να κάνει μια εκτίμηση χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Εκτίμηση του σφάλματος της μεθόδου των ελαχίστων τετραγώνων.

Για να γίνει αυτό, πρέπει να υπολογίσετε τα αθροίσματα των τετραγωνικών αποκλίσεων των αρχικών δεδομένων από αυτές τις γραμμές Και , μια μικρότερη τιμή αντιστοιχεί σε μια γραμμή που προσεγγίζει καλύτερα τα αρχικά δεδομένα όσον αφορά τη μέθοδο των ελαχίστων τετραγώνων.

Από τότε η γραμμή y=0,165x+2,184προσεγγίζει καλύτερα τα αρχικά δεδομένα.

Γραφική απεικόνιση της μεθόδου των ελαχίστων τετραγώνων (LSM).

Όλα φαίνονται υπέροχα στα charts. Η κόκκινη γραμμή είναι η γραμμή που βρέθηκε y=0,165x+2,184, η μπλε γραμμή είναι , οι ροζ κουκκίδες είναι τα αρχικά δεδομένα.

Σε τι χρησιμεύει, σε τι χρησιμεύουν όλες αυτές οι προσεγγίσεις;

Προσωπικά χρησιμοποιώ για την επίλυση προβλημάτων εξομάλυνσης δεδομένων, προβλημάτων παρεμβολής και παρέκτασης (στο αρχικό παράδειγμα, θα μπορούσε να σας ζητηθεί να βρείτε την τιμή της παρατηρούμενης τιμής yστο x=3ή πότε x=6σύμφωνα με τη μέθοδο MNC). Αλλά θα μιλήσουμε περισσότερα για αυτό αργότερα σε άλλη ενότητα του ιστότοπου.

Απόδειξη.

Έτσι όταν βρεθεί ΕΝΑΚαι σιη συνάρτηση παίρνει τη μικρότερη τιμή, είναι απαραίτητο σε αυτό το σημείο ο πίνακας της τετραγωνικής μορφής του διαφορικού δεύτερης τάξης για τη συνάρτηση ήταν θετική οριστική. Ας το δείξουμε.

Η διαφορά δεύτερης τάξης έχει τη μορφή:

Αυτό είναι

Επομένως, ο πίνακας της τετραγωνικής μορφής έχει τη μορφή

και οι τιμές των στοιχείων δεν εξαρτώνται από ΕΝΑΚαι σι.

Ας δείξουμε ότι ο πίνακας είναι θετικός ορισμένος. Αυτό απαιτεί οι δευτερεύουσες γωνίες να είναι θετικές.

Γωνιακό μινόρε πρώτης τάξης . Η ανισότητα είναι αυστηρή, αφού τα σημεία δεν συμπίπτουν. Αυτό θα υπονοηθεί στα ακόλουθα.

Γωνιακό μινόρε δεύτερης τάξης

Ας το αποδείξουμε με τη μέθοδο της μαθηματικής επαγωγής .

συμπέρασμα: βρέθηκαν τιμές ΕΝΑΚαι σιαντιστοιχούν στη μικρότερη τιμή της συνάρτησης , επομένως, είναι οι επιθυμητές παράμετροι για τη μέθοδο των ελαχίστων τετραγώνων.

Μέθοδος ελάχιστου τετραγώνου

Στο τελευταίο μάθημα του θέματος, θα εξοικειωθούμε με την πιο διάσημη εφαρμογή FNP, που βρίσκει την ευρύτερη εφαρμογή σε διάφορους τομείς της επιστήμης και της πρακτικής. Μπορεί να είναι η φυσική, η χημεία, η βιολογία, η οικονομία, η κοινωνιολογία, η ψυχολογία και ούτω καθεξής και ούτω καθεξής. Με τη θέληση της μοίρας, συχνά πρέπει να ασχολούμαι με την οικονομία, και επομένως σήμερα θα κανονίσω για εσάς ένα εισιτήριο για μια καταπληκτική χώρα που ονομάζεται Οικονομετρία=) … Πώς δεν το θέλεις;! Είναι πολύ καλά εκεί - απλά πρέπει να αποφασίσετε! …Αλλά αυτό που πιθανώς σίγουρα θέλετε είναι να μάθετε πώς να λύνετε προβλήματα ελάχιστα τετράγωνα. Και ιδιαίτερα οι επιμελείς αναγνώστες θα μάθουν να τα λύνουν όχι μόνο με ακρίβεια, αλλά και ΠΟΛΥ ΓΡΗΓΟΡΑ ;-) Αλλά πρώτα γενική δήλωση του προβλήματος+ σχετικό παράδειγμα:

Αφήστε τους δείκτες να μελετηθούν σε κάποια θεματική περιοχή που έχουν ποσοτική έκφραση. Ταυτόχρονα, υπάρχει κάθε λόγος να πιστεύουμε ότι ο δείκτης εξαρτάται από τον δείκτη. Αυτή η υπόθεση μπορεί να είναι και μια επιστημονική υπόθεση και να βασίζεται σε στοιχειώδη κοινή λογική. Ας αφήσουμε την επιστήμη στην άκρη, ωστόσο, και ας εξερευνήσουμε πιο ορεκτικές περιοχές - συγκεκριμένα, τα παντοπωλεία. Σημειώστε με:

– χώρος λιανικής παντοπωλείου, τ.μ.,
- ετήσιος κύκλος εργασιών ενός παντοπωλείου, εκατομμύρια ρούβλια.

Είναι ξεκάθαρο ότι όσο μεγαλύτερη είναι η έκταση του καταστήματος, τόσο μεγαλύτερος είναι ο τζίρος του στις περισσότερες περιπτώσεις.

Ας υποθέσουμε ότι μετά από παρατηρήσεις / πειράματα / υπολογισμούς / χορό με ντέφι, έχουμε στη διάθεσή μας αριθμητικά δεδομένα:

Με τα παντοπωλεία, νομίζω ότι όλα είναι ξεκάθαρα: - αυτή είναι η περιοχή του 1ου καταστήματος, - ο ετήσιος τζίρος του, - η περιοχή του 2ου καταστήματος, - ο ετήσιος τζίρος του κ.λπ. Παρεμπιπτόντως, δεν είναι καθόλου απαραίτητο να έχετε πρόσβαση σε ταξινομημένα υλικά - μια αρκετά ακριβής εκτίμηση του κύκλου εργασιών μπορεί να ληφθεί χρησιμοποιώντας μαθηματικές στατιστικές. Ωστόσο, μην αποσπάτε την προσοχή, η πορεία της εμπορικής κατασκοπείας είναι ήδη πληρωμένη =)

Τα δεδομένα πίνακα μπορούν επίσης να γραφτούν με τη μορφή σημείων και να απεικονιστούν με τον συνηθισμένο τρόπο για εμάς. Καρτεσιανό σύστημα .

Ας απαντήσουμε σε μια σημαντική ερώτηση: πόσοι βαθμοί χρειάζονται για μια ποιοτική μελέτη;

Οσο μεγαλύτερο τόσο καλύτερα. Το ελάχιστο αποδεκτό σετ αποτελείται από 5-6 πόντους. Επιπλέον, με έναν μικρό όγκο δεδομένων, τα «μη φυσιολογικά» αποτελέσματα δεν πρέπει να περιλαμβάνονται στο δείγμα. Έτσι, για παράδειγμα, ένα μικρό κατάστημα ελίτ μπορεί να βοηθήσει σε τάξεις μεγέθους περισσότερο από «τους συναδέλφους του», παραμορφώνοντας έτσι το γενικό μοτίβο που πρέπει να βρεθεί!



Αν είναι αρκετά απλό, πρέπει να επιλέξουμε μια συνάρτηση, πρόγραμμαπου περνά όσο πιο κοντά στα σημεία . Μια τέτοια συνάρτηση ονομάζεται προσεγγίζοντας (προσέγγιση - προσέγγιση)ή θεωρητική λειτουργία . Σε γενικές γραμμές, εδώ εμφανίζεται αμέσως ένας προφανής «προσποιητής» - ένα πολυώνυμο υψηλού βαθμού, η γραφική παράσταση του οποίου διέρχεται από ΟΛΑ τα σημεία. Αλλά αυτή η επιλογή είναι περίπλοκη και συχνά απλά λανθασμένη. (επειδή το γράφημα θα «ανεμίζει» συνεχώς και θα αντικατοπτρίζει ελάχιστα την κύρια τάση).

Έτσι, η επιθυμητή συνάρτηση πρέπει να είναι αρκετά απλή και ταυτόχρονα να αντικατοπτρίζει επαρκώς την εξάρτηση. Όπως μπορείτε να μαντέψετε, ονομάζεται μία από τις μεθόδους εύρεσης τέτοιων συναρτήσεων ελάχιστα τετράγωνα. Αρχικά, ας αναλύσουμε την ουσία του με γενικό τρόπο. Αφήστε κάποια συνάρτηση να προσεγγίσει τα πειραματικά δεδομένα:


Πώς να αξιολογήσετε την ακρίβεια αυτής της προσέγγισης; Ας υπολογίσουμε επίσης τις διαφορές (αποκλίσεις) μεταξύ των πειραματικών και λειτουργικών τιμών (μελετούμε το σχέδιο). Η πρώτη σκέψη που έρχεται στο μυαλό είναι να εκτιμήσουμε πόσο μεγάλο είναι το άθροισμα, αλλά το πρόβλημα είναι ότι οι διαφορές μπορεί να είναι αρνητικές. (Για παράδειγμα, ) και οι αποκλίσεις ως αποτέλεσμα μιας τέτοιας άθροισης θα αλληλοεξουδετερωθούν. Επομένως, ως εκτίμηση της ακρίβειας της προσέγγισης, προτείνει τον εαυτό της να λάβει το άθροισμα ενότητεςαποκλίσεις:

ή σε διπλωμένη μορφή: (για όσους δεν γνωρίζουν: είναι το εικονίδιο αθροίσματος και - βοηθητική μεταβλητή - "μετρητής", που παίρνει τιμές από 1 έως ) .

Προσεγγίζοντας τα πειραματικά σημεία με διαφορετικές συναρτήσεις, θα λάβουμε διαφορετικές τιμές και είναι προφανές πού είναι μικρότερο αυτό το άθροισμα - αυτή η συνάρτηση είναι πιο ακριβής.

Μια τέτοια μέθοδος υπάρχει και ονομάζεται μέθοδος ελάχιστου συντελεστή. Ωστόσο, στην πράξη έχει γίνει πολύ πιο διαδεδομένο. μέθοδος ελάχιστου τετραγώνου, όπου οι πιθανές αρνητικές τιμές εξαλείφονται όχι από το μέτρο, αλλά με τον τετραγωνισμό των αποκλίσεων:



, μετά την οποία οι προσπάθειες κατευθύνονται στην επιλογή μιας τέτοιας συνάρτησης ώστε το άθροισμα των τετραγωνικών αποκλίσεων ήταν όσο το δυνατόν μικρότερο. Στην πραγματικότητα, εξ ου και το όνομα της μεθόδου.

Και τώρα επιστρέφουμε σε ένα άλλο σημαντικό σημείο: όπως σημειώθηκε παραπάνω, η επιλεγμένη συνάρτηση θα πρέπει να είναι αρκετά απλή - αλλά υπάρχουν και πολλές τέτοιες λειτουργίες: γραμμικός , υπερβολικός , εκθετικός , λογαριθμική , τετραγωνικός και τα λοιπά. Και, φυσικά, εδώ θα ήθελα αμέσως να «μειώσω το πεδίο δραστηριότητας». Ποια κατηγορία λειτουργιών να επιλέξετε για έρευνα; Πρωτόγονη αλλά αποτελεσματική τεχνική:

- Ο ευκολότερος τρόπος για να τραβήξετε πόντους στο σχέδιο και αναλύστε τη θέση τους. Εάν τείνουν να είναι σε ευθεία γραμμή, τότε θα πρέπει να αναζητήσετε ευθύγραμμη εξίσωση με βέλτιστες τιμές και . Με άλλα λόγια, το καθήκον είναι να βρεθούν ΤΕΤΟΙΟΙ συντελεστές - έτσι ώστε το άθροισμα των τετραγωνικών αποκλίσεων να είναι το μικρότερο.

Εάν τα σημεία βρίσκονται, για παράδειγμα, κατά μήκος υπερβολή, τότε είναι σαφές ότι η γραμμική συνάρτηση θα δώσει κακή προσέγγιση. Σε αυτή την περίπτωση, αναζητούμε τους πιο «ευνοϊκούς» συντελεστές για την εξίσωση της υπερβολής - αυτά που δίνουν το ελάχιστο άθροισμα τετραγώνων .

Προσέξτε τώρα ότι και στις δύο περιπτώσεις μιλάμε συναρτήσεις δύο μεταβλητών, των οποίων τα επιχειρήματα είναι αναζητήθηκαν επιλογές εξάρτησης:

Και στην ουσία, πρέπει να λύσουμε ένα τυπικό πρόβλημα - να βρούμε ελάχιστη συνάρτηση δύο μεταβλητών.

Θυμηθείτε το παράδειγμά μας: ας υποθέσουμε ότι τα σημεία «καταστήματος» τείνουν να βρίσκονται σε ευθεία γραμμή και υπάρχει κάθε λόγος να πιστεύουμε την παρουσία γραμμική εξάρτησηκύκλου εργασιών από την περιοχή συναλλαγών. Ας βρούμε ΤΕΤΟΙΟΥΣ συντελεστές "a" και "be" έτσι ώστε το άθροισμα των τετραγωνικών αποκλίσεων ήταν το μικρότερο. Όλα ως συνήθως - πρώτα επιμέρους παράγωγα 1ης τάξης. Σύμφωνα με κανόνας γραμμικότηταςμπορείτε να διαφοροποιήσετε ακριβώς κάτω από το εικονίδιο άθροισης:

Εάν θέλετε να χρησιμοποιήσετε αυτές τις πληροφορίες για ένα δοκίμιο ή μια εργασία όρου, θα είμαι πολύ ευγνώμων για τον σύνδεσμο στη λίστα των πηγών, δεν θα βρείτε πουθενά τόσο λεπτομερείς υπολογισμούς:

Ας φτιάξουμε ένα τυπικό σύστημα:

Μειώνουμε κάθε εξίσωση κατά ένα «δύο» και, επιπλέον, «χωρίζουμε» τα αθροίσματα:

Σημείωση : αναλύστε ανεξάρτητα γιατί το "a" και το "be" μπορούν να αφαιρεθούν από το εικονίδιο αθροίσματος. Παρεμπιπτόντως, τυπικά αυτό μπορεί να γίνει με το άθροισμα

Ας ξαναγράψουμε το σύστημα σε μια "εφαρμοσμένη" μορφή:

μετά την οποία αρχίζει να σχεδιάζεται ο αλγόριθμος για την επίλυση του προβλήματός μας:

Γνωρίζουμε τις συντεταγμένες των σημείων; Ξέρουμε. Ποσά μπορούμε να βρούμε; Εύκολα. Συνθέτουμε τα πιο απλά σύστημα δύο γραμμικών εξισώσεων με δύο αγνώστους("α" και "μπεχ"). Λύνουμε το σύστημα, για παράδειγμα, Η μέθοδος του Cramer, με αποτέλεσμα ένα ακίνητο σημείο . Ελεγχος επαρκής συνθήκη για εξτρέμ, μπορούμε να επαληθεύσουμε ότι σε αυτό το σημείο η συνάρτηση φτάνει με ακρίβεια ελάχιστο. Η επαλήθευση συνδέεται με πρόσθετους υπολογισμούς και επομένως θα την αφήσουμε στο παρασκήνιο. (εάν είναι απαραίτητο, μπορείτε να δείτε το πλαίσιο που λείπειΕδώ ) . Καταλήγουμε στο τελικό συμπέρασμα:

Λειτουργία ο καλύτερος τρόπος (τουλάχιστον σε σύγκριση με οποιαδήποτε άλλη γραμμική συνάρτηση)φέρνει πιο κοντά τα πειραματικά σημεία . Σε γενικές γραμμές, το γράφημά του περνά όσο το δυνατόν πιο κοντά σε αυτά τα σημεία. Στην παράδοση οικονομετρίακαλείται επίσης η συνάρτηση προσέγγισης που προκύπτει ζευγαρωμένη γραμμική εξίσωση παλινδρόμησης .

Το πρόβλημα που εξετάζεται έχει μεγάλη πρακτική σημασία. Στην κατάσταση με το παράδειγμά μας, η εξίσωση σας επιτρέπει να προβλέψετε τι είδους τζίρο ("yig")θα βρίσκεται στο κατάστημα με τη μία ή την άλλη αξία της περιοχής πώλησης (η μία ή η άλλη σημασία του "x"). Ναι, η πρόβλεψη που προκύπτει θα είναι μόνο μια πρόβλεψη, αλλά σε πολλές περιπτώσεις θα αποδειχθεί αρκετά ακριβής.

Θα αναλύσω μόνο ένα πρόβλημα με «πραγματικούς» αριθμούς, αφού δεν υπάρχουν δυσκολίες σε αυτό - όλοι οι υπολογισμοί είναι στο επίπεδο του σχολικού προγράμματος σπουδών στις τάξεις 7-8. Στο 95 τοις εκατό των περιπτώσεων, θα σας ζητηθεί να βρείτε μόνο μια γραμμική συνάρτηση, αλλά στο τέλος του άρθρου θα δείξω ότι δεν είναι πιο δύσκολο να βρείτε τις εξισώσεις για τη βέλτιστη υπερβολή, τον εκθέτη και κάποιες άλλες συναρτήσεις.

Στην πραγματικότητα, μένει να διανείμετε τα καλούδια που υποσχέθηκαν - έτσι ώστε να μάθετε πώς να λύνετε τέτοια παραδείγματα όχι μόνο με ακρίβεια, αλλά και γρήγορα. Μελετάμε προσεκτικά το πρότυπο:

Εργο

Ως αποτέλεσμα της μελέτης της σχέσης μεταξύ δύο δεικτών, προέκυψαν τα ακόλουθα ζεύγη αριθμών:

Χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων, βρείτε τη γραμμική συνάρτηση που προσεγγίζει καλύτερα την εμπειρική (έμπειρος)δεδομένα. Κάντε ένα σχέδιο στο οποίο, σε ένα καρτεσιανό ορθογώνιο σύστημα συντεταγμένων, σχεδιάστε πειραματικά σημεία και μια γραφική παράσταση της συνάρτησης κατά προσέγγιση . Βρείτε το άθροισμα των τετραγωνικών αποκλίσεων μεταξύ εμπειρικών και θεωρητικών τιμών. Μάθετε αν η λειτουργία είναι καλύτερη (όσον αφορά τη μέθοδο των ελαχίστων τετραγώνων)κατά προσέγγιση πειραματικά σημεία.

Σημειώστε ότι οι τιμές "x" είναι φυσικές τιμές και αυτό έχει ένα χαρακτηριστικό νόημα, για το οποίο θα μιλήσω λίγο αργότερα. αλλά φυσικά μπορούν να είναι κλασματικά. Επιπλέον, ανάλογα με το περιεχόμενο μιας συγκεκριμένης εργασίας, και οι δύο τιμές "X" και "G" μπορεί να είναι πλήρως ή μερικώς αρνητικές. Λοιπόν, μας έχει δοθεί μια «απρόσωπη» εργασία και την ξεκινάμε λύση:

Βρίσκουμε τους συντελεστές της βέλτιστης συνάρτησης ως λύση στο σύστημα:

Για τους σκοπούς μιας πιο συμπαγούς σημειογραφίας, η μεταβλητή «counter» μπορεί να παραλειφθεί, καθώς είναι ήδη σαφές ότι η άθροιση πραγματοποιείται από το 1 έως το .

Είναι πιο βολικό να υπολογίσετε τα απαιτούμενα ποσά σε μορφή πίνακα:


Οι υπολογισμοί μπορούν να πραγματοποιηθούν σε μικροϋπολογιστή, αλλά είναι πολύ καλύτερο να χρησιμοποιείτε το Excel - τόσο πιο γρήγορα όσο και χωρίς σφάλματα. δείτε ένα σύντομο βίντεο:

Έτσι, παίρνουμε το εξής Σύστημα:

Εδώ μπορείτε να πολλαπλασιάσετε τη δεύτερη εξίσωση με 3 και αφαιρέστε το 2ο από την 1η εξίσωση όρο προς όρο. Αλλά αυτό είναι τύχη - στην πράξη, τα συστήματα συχνά δεν είναι προικισμένα και σε τέτοιες περιπτώσεις εξοικονομεί Η μέθοδος του Cramer:
, οπότε το σύστημα έχει μια μοναδική λύση.

Ας κάνουμε έναν έλεγχο. Καταλαβαίνω ότι δεν θέλω, αλλά γιατί να παραλείψετε λάθη που δεν μπορείτε να τα χάσετε; Αντικαταστήστε τη λύση που βρέθηκε στην αριστερή πλευρά κάθε εξίσωσης του συστήματος:

Προκύπτουν τα σωστά μέρη των αντίστοιχων εξισώσεων, που σημαίνει ότι το σύστημα έχει λυθεί σωστά.

Έτσι, η επιθυμητή συνάρτηση προσέγγισης: – από όλες τις γραμμικές συναρτήσειςΤα πειραματικά δεδομένα προσεγγίζονται καλύτερα από αυτό.

Διαφορετικός ευθεία εξάρτηση του τζίρου του καταστήματος από την περιοχή του, η διαπιστωθείσα εξάρτηση είναι ΑΝΤΙΣΤΡΟΦΗ (αρχή "όσο περισσότερο - τόσο λιγότερο"), και το γεγονός αυτό αποκαλύπτεται αμέσως από το αρνητικό γωνιακός συντελεστής. Λειτουργία μας πληροφορεί ότι με αύξηση ενός συγκεκριμένου δείκτη κατά 1 μονάδα, η τιμή του εξαρτημένου δείκτη μειώνεται μέση τιμήκατά 0,65 μονάδες. Όπως λένε, όσο υψηλότερη είναι η τιμή του φαγόπυρου, τόσο λιγότερο πωλείται.

Για να σχεδιάσουμε την κατά προσέγγιση συνάρτηση, βρίσκουμε δύο από τις τιμές της:

και εκτελέστε το σχέδιο:

Η κατασκευασμένη γραμμή ονομάζεται γραμμή τάσης (δηλαδή, μια γραμμική γραμμή τάσης, δηλαδή στη γενική περίπτωση, μια τάση δεν είναι απαραίτητα μια ευθεία γραμμή). Όλοι γνωρίζουν την έκφραση «to be in trend», και νομίζω ότι αυτός ο όρος δεν χρειάζεται επιπλέον σχόλια.

Υπολογίστε το άθροισμα των τετραγωνικών αποκλίσεων μεταξύ εμπειρικών και θεωρητικών αξιών. Γεωμετρικά, αυτό είναι το άθροισμα των τετραγώνων των μηκών των «βυσσινί» τμημάτων (δύο από τα οποία είναι τόσο μικρά που δεν μπορείτε καν να τα δείτε).

Ας συνοψίσουμε τους υπολογισμούς σε έναν πίνακα:


Μπορούν και πάλι να πραγματοποιηθούν χειροκίνητα, σε περίπτωση που θα δώσω ένα παράδειγμα για το 1ο σημείο:

αλλά είναι πολύ πιο αποτελεσματικό να κάνουμε τον ήδη γνωστό τρόπο:

Ας επαναλάβουμε: ποιο είναι το νόημα του αποτελέσματος;Από όλες τις γραμμικές συναρτήσειςλειτουργία ο εκθέτης είναι ο μικρότερος, δηλαδή είναι η καλύτερη προσέγγιση στην οικογένειά του. Και εδώ, παρεμπιπτόντως, το τελευταίο ερώτημα του προβλήματος δεν είναι τυχαίο: τι θα συμβεί αν η προτεινόμενη εκθετική συνάρτηση θα είναι καλύτερα να κάνουμε κατά προσέγγιση τα πειραματικά σημεία;

Ας βρούμε το αντίστοιχο άθροισμα των τετραγωνικών αποκλίσεων - για να τις ξεχωρίσω, θα τις προσδιορίσω με το γράμμα «έψιλον». Η τεχνική είναι ακριβώς η ίδια:


Και πάλι για κάθε υπολογισμό πυρκαγιάς για τον 1ο βαθμό:

Στο Excel, χρησιμοποιούμε την τυπική συνάρτηση ΛΗΞΗ (Η σύνταξη βρίσκεται στη Βοήθεια του Excel).

συμπέρασμα: , άρα η εκθετική συνάρτηση προσεγγίζει τα πειραματικά σημεία χειρότερα από την ευθεία .

Πρέπει όμως να σημειωθεί εδώ ότι το «χειρότερο» είναι δεν σημαίνει ακόμα, τι συμβαίνει. Τώρα έφτιαξα ένα γράφημα αυτής της εκθετικής συνάρτησης - και περνάει επίσης κοντά στα σημεία - τόσο πολύ που χωρίς αναλυτική μελέτη είναι δύσκολο να πούμε ποια συνάρτηση είναι πιο ακριβής.

Αυτό ολοκληρώνει τη λύση και επιστρέφω στο ζήτημα των φυσικών αξιών του επιχειρήματος. Σε διάφορες μελέτες, κατά κανόνα, οικονομικές ή κοινωνιολογικές, μήνες, χρόνια ή άλλα ίσα χρονικά διαστήματα αριθμούνται με φυσικό «Χ». Σκεφτείτε, για παράδειγμα, το ακόλουθο πρόβλημα:

Έχουμε τα ακόλουθα στοιχεία για τον τζίρο του καταστήματος λιανικής για το πρώτο εξάμηνο του έτους:

Χρησιμοποιώντας ευθεία αναλυτική στοίχιση, βρείτε τον όγκο πωλήσεων για τον Ιούλιο.

Ναι, κανένα πρόβλημα: αριθμούμε τους μήνες 1, 2, 3, 4, 5, 6 και χρησιμοποιούμε τον συνηθισμένο αλγόριθμο, ως αποτέλεσμα του οποίου λαμβάνουμε μια εξίσωση - το μόνο πράγμα όταν πρόκειται για ώρα είναι συνήθως το γράμμα "te " (αν και δεν είναι κρίσιμο). Η εξίσωση που προέκυψε δείχνει ότι το πρώτο εξάμηνο του έτους, ο κύκλος εργασιών αυξήθηκε κατά μέσο όρο 27,74 ΝΜ. κάθε μήνα. Πάρτε μια πρόβλεψη για τον Ιούλιο (μήνας #7): ΕΕ.

Και παρόμοιες εργασίες - το σκοτάδι είναι σκοτεινό. Όσοι επιθυμούν μπορούν να χρησιμοποιήσουν μια επιπλέον υπηρεσία, δηλαδή τη δική μου Αριθμομηχανή Excel (έκδοση επίδειξης), οι οποίες λύνει το πρόβλημα σχεδόν αμέσως!Η λειτουργική έκδοση του προγράμματος είναι διαθέσιμη σε αντάλλαγμαή για συμβολική πληρωμή.

Στο τέλος του μαθήματος, μια σύντομη ενημέρωση σχετικά με την εύρεση εξαρτήσεων ορισμένων άλλων τύπων. Στην πραγματικότητα, δεν υπάρχει τίποτα ιδιαίτερο να πούμε, καθώς η θεμελιώδης προσέγγιση και ο αλγόριθμος λύσης παραμένουν οι ίδιοι.

Ας υποθέσουμε ότι η θέση των πειραματικών σημείων μοιάζει με υπερβολή. Στη συνέχεια, για να βρείτε τους συντελεστές της καλύτερης υπερβολής, πρέπει να βρείτε το ελάχιστο της συνάρτησης - όσοι επιθυμούν μπορούν να πραγματοποιήσουν λεπτομερείς υπολογισμούς και να καταλήξουν σε ένα παρόμοιο σύστημα:

Από τυπική τεχνική άποψη, λαμβάνεται από το «γραμμικό» σύστημα (ας το σημειώσουμε με αστερίσκο)αντικαθιστώντας το "x" με . Λοιπόν, τα ποσά υπολογίστε, μετά τους βέλτιστους συντελεστές "a" και "be" στο χέρι.

Αν υπάρχει κάθε λόγος να πιστεύουμε ότι τα σημεία διατάσσονται κατά μήκος μιας λογαριθμικής καμπύλης, στη συνέχεια για αναζήτηση των βέλτιστων τιμών και εύρεση του ελάχιστου της συνάρτησης . Επίσημα, στο σύστημα (*) θα πρέπει να αντικατασταθεί από:

Κατά τον υπολογισμό στο Excel, χρησιμοποιήστε τη συνάρτηση LN. Ομολογώ ότι δεν θα μου είναι δύσκολο να δημιουργήσω αριθμομηχανές για κάθε μία από τις περιπτώσεις που εξετάζουμε, αλλά και πάλι θα είναι καλύτερο να «προγραμματίσεις» μόνος σου τους υπολογισμούς. Οδηγίες βίντεο για βοήθεια.

Με την εκθετική εξάρτηση, η κατάσταση είναι ελαφρώς πιο περίπλοκη. Για να αναγάγουμε την ύλη στη γραμμική περίπτωση, παίρνουμε τον λογάριθμο της συνάρτησης και χρησιμοποιούμε ιδιότητες του λογαρίθμου:

Τώρα, συγκρίνοντας τη συνάρτηση που προκύπτει με τη γραμμική συνάρτηση, καταλήγουμε στο συμπέρασμα ότι στο σύστημα (*) πρέπει να αντικατασταθεί από , και - από . Για ευκολία, αναφέρουμε:

Λάβετε υπόψη ότι το σύστημα επιλύεται σε σχέση με και , και επομένως, αφού βρείτε τις ρίζες, δεν πρέπει να ξεχάσετε να βρείτε τον ίδιο τον συντελεστή.

Για να προσεγγίσετε πειραματικά σημεία βέλτιστη παραβολή , θα πρέπει να βρεθεί τουλάχιστον μια συνάρτηση τριών μεταβλητών . Αφού εκτελέσουμε τυπικές ενέργειες, έχουμε την ακόλουθη "εργασία" Σύστημα:

Ναι, φυσικά, υπάρχουν περισσότερα ποσά εδώ, αλλά δεν υπάρχουν καθόλου δυσκολίες όταν χρησιμοποιείτε την αγαπημένη σας εφαρμογή. Και τέλος, θα σας πω πώς να ελέγξετε γρήγορα χρησιμοποιώντας το Excel και να δημιουργήσετε την επιθυμητή γραμμή τάσης: δημιουργήστε ένα διάγραμμα διασποράς, επιλέξτε οποιοδήποτε από τα σημεία με το ποντίκι και κάντε δεξί κλικ στην επιλογή επιλογής "Προσθήκη γραμμής τάσης". Στη συνέχεια, επιλέξτε τον τύπο του γραφήματος και στην καρτέλα "Επιλογές"ενεργοποιήστε την επιλογή "Εμφάνιση εξίσωσης στο γράφημα". Εντάξει

Όπως πάντα, θέλω να τελειώσω το άρθρο με μια όμορφη φράση και σχεδόν έγραψα "Be in trend!". Όμως με τον καιρό άλλαξε γνώμη. Και όχι επειδή είναι φόρμουλα. Δεν ξέρω πώς κανείς, αλλά δεν θέλω να ακολουθήσω καθόλου την προωθούμενη αμερικανική και ειδικά την ευρωπαϊκή τάση =) Γι' αυτό, εύχομαι ο καθένας από εσάς να μείνει στη δική του γραμμή!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Η μέθοδος των ελαχίστων τετραγώνων είναι μια από τις πιο κοινές και πιο ανεπτυγμένες λόγω της απλότητα και αποτελεσματικότητα των μεθόδων για την εκτίμηση των παραμέτρων των γραμμικών οικονομετρικών μοντέλων. Ταυτόχρονα, θα πρέπει να δίνεται προσοχή κατά τη χρήση του, καθώς τα μοντέλα που κατασκευάζονται με τη χρήση του ενδέχεται να μην πληρούν ορισμένες απαιτήσεις για την ποιότητα των παραμέτρων τους και, ως εκ τούτου, να μην αντικατοπτρίζουν «καλά» τα πρότυπα ανάπτυξης της διαδικασίας.

Ας εξετάσουμε λεπτομερέστερα τη διαδικασία εκτίμησης των παραμέτρων ενός γραμμικού οικονομετρικού μοντέλου χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Ένα τέτοιο μοντέλο σε γενική μορφή μπορεί να αναπαρασταθεί από την εξίσωση (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t .

Τα αρχικά δεδομένα κατά την εκτίμηση των παραμέτρων a 0 , a 1 ,..., a n είναι το διάνυσμα των τιμών της εξαρτημένης μεταβλητής y= (y 1 , y 2 , ... , y T)" και ο πίνακας τιμών των ανεξάρτητων μεταβλητών

στην οποία η πρώτη στήλη, που αποτελείται από ένα, αντιστοιχεί στον συντελεστή του μοντέλου .

Η μέθοδος των ελαχίστων τετραγώνων πήρε το όνομά της με βάση τη βασική αρχή ότι οι εκτιμήσεις παραμέτρων που λαμβάνονται βάσει αυτής πρέπει να ικανοποιούν: το άθροισμα των τετραγώνων του σφάλματος μοντέλου πρέπει να είναι ελάχιστο.

Παραδείγματα επίλυσης προβλημάτων με τη μέθοδο των ελαχίστων τετραγώνων

Παράδειγμα 2.1.Η εμπορική επιχείρηση διαθέτει ένα δίκτυο που αποτελείται από 12 καταστήματα, πληροφορίες για τις δραστηριότητες των οποίων παρουσιάζονται στον Πίνακα. 2.1.

Η διοίκηση της εταιρείας θα ήθελε να μάθει πώς το μέγεθος του ετήσιου τζίρου εξαρτάται από τον χώρο λιανικής του καταστήματος.

Πίνακας 2.1

Αριθμός καταστήματος Ετήσιος κύκλος εργασιών, εκατομμύρια ρούβλια Εμπορική περιοχή, χίλια m 2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Λύση ελάχιστων τετραγώνων.Ας ορίσουμε - τον ετήσιο κύκλο εργασιών του -ου καταστήματος, εκατομμύρια ρούβλια. - περιοχή πώλησης του καταστήματος, χίλια m 2.

Εικ.2.1. Scatterplot για Παράδειγμα 2.1

Να προσδιορίσετε τη μορφή της συναρτησιακής σχέσης μεταξύ των μεταβλητών και να κατασκευάσετε ένα διάγραμμα διασποράς (Εικ. 2.1).

Με βάση το διάγραμμα διασποράς, μπορούμε να συμπεράνουμε ότι ο ετήσιος κύκλος εργασιών εξαρτάται θετικά από την περιοχή πώλησης (δηλαδή, το y θα αυξηθεί με την αύξηση του ). Η πιο κατάλληλη μορφή λειτουργικής σύνδεσης είναι γραμμικός.

Πληροφορίες για περαιτέρω υπολογισμούς παρουσιάζονται στον Πίνακα. 2.2. Χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων, υπολογίζουμε τις παραμέτρους του γραμμικού μονοπαραγοντικού οικονομετρικού μοντέλου

Πίνακας 2.2

t y t x 1t y t 2 x1t2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
μικρό 819,52 10,68 65008,554 11,4058 858,3991
Μέση τιμή 68,29 0,89

Ετσι,

Επομένως, με αύξηση της περιοχής συναλλαγών κατά 1.000 m 2, ενώ τα άλλα πράγματα είναι ίσα, ο μέσος ετήσιος κύκλος εργασιών αυξάνεται κατά 67,8871 εκατομμύρια ρούβλια.

Παράδειγμα 2.2.Η διοίκηση της επιχείρησης παρατήρησε ότι ο ετήσιος κύκλος εργασιών εξαρτάται όχι μόνο από την περιοχή πωλήσεων του καταστήματος (βλ. παράδειγμα 2.1), αλλά και από τον μέσο αριθμό επισκεπτών. Οι σχετικές πληροφορίες παρουσιάζονται στον πίνακα. 2.3.

Πίνακας 2.3

Λύση.Δηλώστε - ο μέσος αριθμός επισκεπτών στο κατάστημα ανά ημέρα, χιλιάδες άτομα.

Να προσδιοριστεί η μορφή της συναρτησιακής σχέσης μεταξύ των μεταβλητών και να κατασκευαστεί ένα διάγραμμα διασποράς (Εικ. 2.2).

Με βάση το διάγραμμα διασποράς, μπορούμε να συμπεράνουμε ότι ο ετήσιος τζίρος σχετίζεται θετικά με τον μέσο αριθμό επισκεπτών ανά ημέρα (δηλαδή, το y θα αυξηθεί με την αύξηση του ). Η μορφή της λειτουργικής εξάρτησης είναι γραμμική.

Ρύζι. 2.2. Scatterplot για παράδειγμα 2.2

Πίνακας 2.4

t x 2t x 2t 2 yt x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
μικρό 127,83 1410,44 9160,9934 118,9728
Μέση τιμή 10,65

Γενικά, είναι απαραίτητος ο προσδιορισμός των παραμέτρων του οικονομετρικού μοντέλου δύο παραγόντων

y t \u003d a 0 + a 1 x 1t + a 2 x 2t + ε t

Οι πληροφορίες που απαιτούνται για περαιτέρω υπολογισμούς παρουσιάζονται στον Πίνακα. 2.4.

Ας υπολογίσουμε τις παραμέτρους ενός γραμμικού οικονομετρικού μοντέλου δύο παραγόντων χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Ετσι,

Η αξιολόγηση του συντελεστή = 61,6583 δείχνει ότι, αν και άλλα πράγματα είναι ίσα, με αύξηση της περιοχής συναλλαγών κατά 1 χιλιάδες m 2, ο ετήσιος κύκλος εργασιών θα αυξηθεί κατά μέσο όρο 61,6583 εκατομμύρια ρούβλια.

Η εκτίμηση του συντελεστή = 2,2748 δείχνει ότι, ενώ τα άλλα πράγματα είναι ίσα, με αύξηση του μέσου αριθμού επισκεπτών ανά 1 χίλια άτομα. ημερησίως, ο ετήσιος κύκλος εργασιών θα αυξάνεται κατά μέσο όρο κατά 2,2748 εκατομμύρια ρούβλια.

Παράδειγμα 2.3.Χρησιμοποιώντας τις πληροφορίες που παρουσιάζονται στον πίνακα. 2.2 και 2.4, υπολογίστε την παράμετρο ενός μονοπαραγοντικού οικονομετρικού μοντέλου

πού είναι η κεντρική αξία του ετήσιου κύκλου εργασιών του -ου καταστήματος, εκατομμύρια ρούβλια. - κεντρική τιμή του μέσου ημερήσιου αριθμού επισκεπτών στο t-th κατάστημα, χιλιάδες άτομα. (βλ. παραδείγματα 2.1-2.2).

Λύση.Πρόσθετες πληροφορίες που απαιτούνται για τους υπολογισμούς παρουσιάζονται στον Πίνακα. 2.5.

Πίνακας 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Αθροισμα 48,4344 431,0566

Χρησιμοποιώντας τον τύπο (2.35), λαμβάνουμε

Ετσι,

http://www.cleverstudents.ru/articles/mnk.html

Παράδειγμα.

Πειραματικά δεδομένα για τις τιμές των μεταβλητών ΧΚαι στοδίνονται στον πίνακα.

Ως αποτέλεσμα της ευθυγράμμισής τους, η συνάρτηση

Χρησιμοποιώντας μέθοδος ελάχιστου τετραγώνου, προσεγγίστε αυτά τα δεδομένα με μια γραμμική εξάρτηση y=ax+b(βρες παραμέτρους ΕΝΑΚαι σι). Μάθετε ποια από τις δύο γραμμές είναι καλύτερη (με την έννοια της μεθόδου των ελαχίστων τετραγώνων) ευθυγραμμίζει τα πειραματικά δεδομένα. Κάντε ένα σχέδιο.

Λύση.

Στο παράδειγμά μας n=5. Συμπληρώνουμε τον πίνακα για τη διευκόλυνση του υπολογισμού των ποσών που περιλαμβάνονται στους τύπους των απαιτούμενων συντελεστών.

Οι τιμές στην τέταρτη σειρά του πίνακα λαμβάνονται πολλαπλασιάζοντας τις τιμές της 2ης σειράς με τις τιμές της 3ης σειράς για κάθε αριθμό Εγώ.

Οι τιμές στην πέμπτη σειρά του πίνακα λαμβάνονται με τον τετραγωνισμό των τιμών της 2ης σειράς για κάθε αριθμό Εγώ.

Οι τιμές της τελευταίας στήλης του πίνακα είναι τα αθροίσματα των τιμών στις σειρές.

Χρησιμοποιούμε τους τύπους της μεθόδου των ελαχίστων τετραγώνων για να βρούμε τους συντελεστές ΕΝΑΚαι σι. Αντικαθιστούμε σε αυτά τις αντίστοιχες τιμές από την τελευταία στήλη του πίνακα:

Ως εκ τούτου, y=0,165x+2,184είναι η επιθυμητή προσεγγιστική ευθεία.

Μένει να μάθουμε ποια από τις γραμμές y=0,165x+2,184ή προσεγγίζει καλύτερα τα αρχικά δεδομένα, δηλαδή να κάνει μια εκτίμηση χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Απόδειξη.

Έτσι όταν βρεθεί ΕΝΑΚαι σιη συνάρτηση παίρνει τη μικρότερη τιμή, είναι απαραίτητο σε αυτό το σημείο ο πίνακας της τετραγωνικής μορφής του διαφορικού δεύτερης τάξης για τη συνάρτηση ήταν θετική οριστική. Ας το δείξουμε.

Η διαφορά δεύτερης τάξης έχει τη μορφή:

Αυτό είναι

Επομένως, ο πίνακας της τετραγωνικής μορφής έχει τη μορφή

και οι τιμές των στοιχείων δεν εξαρτώνται από ΕΝΑΚαι σι.

Ας δείξουμε ότι ο πίνακας είναι θετικός ορισμένος. Αυτό απαιτεί οι δευτερεύουσες γωνίες να είναι θετικές.

Γωνιακό μινόρε πρώτης τάξης . Η ανισότητα είναι αυστηρή, αφού τα σημεία

  • εισαγωγικό μάθημα δωρεάν;
  • Ένας μεγάλος αριθμός έμπειρων δασκάλων (μητρική και ρωσόφωνη).
  • Μαθήματα ΟΧΙ για συγκεκριμένη περίοδο (μήνας, έξι μήνες, έτος), αλλά για συγκεκριμένο αριθμό μαθημάτων (5, 10, 20, 50).
  • Πάνω από 10.000 ικανοποιημένοι πελάτες.
  • Το κόστος ενός μαθήματος με έναν ρωσόφωνο δάσκαλο - από 600 ρούβλια, με μητρική ομιλία - από 1500 ρούβλια

Η ουσία της μεθόδου των ελαχίστων τετραγώνων είναι στην εύρεση των παραμέτρων ενός μοντέλου τάσης που περιγράφει καλύτερα την τάση ανάπτυξης κάποιου τυχαίου φαινομένου σε χρόνο ή χώρο (μια τάση είναι μια γραμμή που χαρακτηρίζει την τάση αυτής της εξέλιξης). Ο στόχος της μεθόδου των ελαχίστων τετραγώνων (OLS) είναι να βρει όχι μόνο κάποιο μοντέλο τάσης, αλλά να βρει το καλύτερο ή βέλτιστο μοντέλο. Αυτό το μοντέλο θα είναι βέλτιστο εάν το άθροισμα των τετραγωνικών αποκλίσεων μεταξύ των παρατηρούμενων πραγματικών τιμών και των αντίστοιχων υπολογισμένων τιμών τάσης είναι ελάχιστο (μικρότερο):

όπου είναι η τυπική απόκλιση μεταξύ της παρατηρούμενης πραγματικής τιμής

και την αντίστοιχη υπολογιζόμενη τιμή τάσης,

Η πραγματική (παρατηρηθείσα) αξία του υπό μελέτη φαινομένου,

Εκτιμώμενη αξία του μοντέλου τάσης,

Ο αριθμός των παρατηρήσεων του υπό μελέτη φαινομένου.

Το MNC σπάνια χρησιμοποιείται μόνο του. Κατά κανόνα, τις περισσότερες φορές χρησιμοποιείται μόνο ως απαραίτητη τεχνική σε μελέτες συσχέτισης. Θα πρέπει να θυμόμαστε ότι η βάση πληροφοριών του LSM μπορεί να είναι μόνο μια αξιόπιστη στατιστική σειρά και ο αριθμός των παρατηρήσεων δεν πρέπει να είναι μικρότερος από 4, διαφορετικά, οι διαδικασίες εξομάλυνσης του LSM μπορεί να χάσουν την κοινή τους λογική.

Η εργαλειοθήκη OLS περιορίζεται στις ακόλουθες διαδικασίες:

Πρώτη διαδικασία. Αποδεικνύεται αν υπάρχει κάποια τάση αλλαγής του προκύπτοντος χαρακτηριστικού όταν αλλάζει ο επιλεγμένος παράγοντας-όρισμα, ή με άλλα λόγια, εάν υπάρχει σύνδεση μεταξύ " στο " Και " Χ ».

Δεύτερη διαδικασία. Καθορίζεται ποια γραμμή (τροχιά) είναι καλύτερα σε θέση να περιγράψει ή να χαρακτηρίσει αυτήν την τάση.

Τρίτη διαδικασία.

Παράδειγμα. Ας υποθέσουμε ότι έχουμε πληροφορίες για τη μέση απόδοση ηλίανθου για το υπό μελέτη αγρόκτημα (Πίνακας 9.1).

Πίνακας 9.1

Αριθμός παρατήρησης

Παραγωγικότητα, c/ha

Δεδομένου ότι το επίπεδο τεχνολογίας στην παραγωγή ηλίανθου στη χώρα μας δεν έχει αλλάξει πολύ τα τελευταία 10 χρόνια, αυτό σημαίνει ότι, πιθανότατα, οι διακυμάνσεις της απόδοσης την εξεταζόμενη περίοδο εξαρτήθηκαν σε μεγάλο βαθμό από τις διακυμάνσεις των καιρικών και κλιματικών συνθηκών. Είναι αλήθεια?

Πρώτη διαδικασία MNC. Δοκιμάζεται η υπόθεση για την ύπαρξη τάσης στην μεταβολή της απόδοσης του ηλίανθου ανάλογα με τις μεταβολές των καιρικών και κλιματικών συνθηκών κατά την αναλυόμενη 10ετία.

Σε αυτό το παράδειγμα, για " y » συνιστάται να παίρνετε την απόδοση του ηλίανθου και για « Χ » είναι ο αριθμός του παρατηρούμενου έτους στην εξεταζόμενη περίοδο. Έλεγχος της υπόθεσης για την ύπαρξη οποιασδήποτε σχέσης μεταξύ " Χ " Και " y » μπορεί να γίνει με δύο τρόπους: χειροκίνητα και με τη βοήθεια προγραμμάτων υπολογιστή. Φυσικά, με τη διαθεσιμότητα της τεχνολογίας υπολογιστών, αυτό το πρόβλημα λύνεται από μόνο του. Όμως, για να κατανοήσουμε καλύτερα την εργαλειοθήκη OLS, είναι σκόπιμο να ελέγξουμε την υπόθεση σχετικά με την ύπαρξη σχέσης μεταξύ " Χ " Και " y » χειροκίνητα, όταν έχετε στη διάθεσή σας μόνο ένα στυλό και μια συνηθισμένη αριθμομηχανή. Σε τέτοιες περιπτώσεις, η υπόθεση της ύπαρξης μιας τάσης ελέγχεται καλύτερα οπτικά από τη θέση της γραφικής εικόνας της αναλυόμενης χρονοσειράς - το πεδίο συσχέτισης:

Το πεδίο συσχέτισης στο παράδειγμά μας βρίσκεται γύρω από μια γραμμή που αυξάνεται αργά. Αυτό από μόνο του υποδηλώνει την ύπαρξη μιας ορισμένης τάσης στη μεταβολή της απόδοσης του ηλίανθου. Είναι αδύνατο να μιλήσουμε για την παρουσία οποιασδήποτε τάσης μόνο όταν το πεδίο συσχέτισης μοιάζει με κύκλο, κύκλο, αυστηρά κάθετο ή αυστηρά οριζόντιο σύννεφο ή αποτελείται από τυχαία διάσπαρτα σημεία. Σε όλες τις άλλες περιπτώσεις, είναι απαραίτητο να επιβεβαιωθεί η υπόθεση της ύπαρξης σχέσης μεταξύ " Χ " Και " y και να συνεχίσει την έρευνα.

Δεύτερη διαδικασία MNC. Καθορίζεται ποια γραμμή (τροχιά) είναι καλύτερα σε θέση να περιγράψει ή να χαρακτηρίσει την τάση των μεταβολών της απόδοσης του ηλίανθου για την αναλυόμενη περίοδο.

Με τη διαθεσιμότητα της τεχνολογίας υπολογιστών, η επιλογή της βέλτιστης τάσης γίνεται αυτόματα. Με τη "χειροκίνητη" επεξεργασία, η επιλογή της βέλτιστης συνάρτησης πραγματοποιείται, κατά κανόνα, με οπτικό τρόπο - από τη θέση του πεδίου συσχέτισης. Δηλαδή, σύμφωνα με τον τύπο του διαγράμματος, επιλέγεται η εξίσωση της γραμμής, η οποία ταιριάζει καλύτερα στην εμπειρική τάση (στην πραγματική τροχιά).

Όπως γνωρίζετε, στη φύση υπάρχει μια τεράστια ποικιλία λειτουργικών εξαρτήσεων, επομένως είναι εξαιρετικά δύσκολο να αναλυθεί οπτικά έστω και ένα μικρό μέρος τους. Ευτυχώς, στην πραγματική οικονομική πρακτική, οι περισσότερες σχέσεις μπορούν να περιγραφούν με ακρίβεια είτε με παραβολή, είτε υπερβολή, είτε με ευθεία γραμμή. Από αυτή την άποψη, με τη "χειροκίνητη" επιλογή για την επιλογή της καλύτερης λειτουργίας, μπορείτε να περιοριστείτε μόνο σε αυτά τα τρία μοντέλα.

Υπερβολή:

Παραβολή δεύτερης τάξης: :

Είναι εύκολο να δούμε ότι στο παράδειγμά μας, η τάση στις μεταβολές της απόδοσης του ηλίανθου κατά τα αναλυόμενα 10 χρόνια χαρακτηρίζεται καλύτερα από μια ευθεία γραμμή, επομένως η εξίσωση παλινδρόμησης θα είναι μια εξίσωση ευθείας γραμμής.

Τρίτη διαδικασία. Υπολογίζονται οι παράμετροι της εξίσωσης παλινδρόμησης που χαρακτηρίζει αυτή τη γραμμή, ή με άλλα λόγια, προσδιορίζεται ένας αναλυτικός τύπος που περιγράφει το καλύτερο μοντέλο τάσης.

Η εύρεση των τιμών των παραμέτρων της εξίσωσης παλινδρόμησης, στην περίπτωσή μας, των παραμέτρων και , είναι ο πυρήνας του LSM. Αυτή η διαδικασία περιορίζεται στην επίλυση ενός συστήματος κανονικών εξισώσεων.

(9.2)

Αυτό το σύστημα εξισώσεων λύνεται αρκετά εύκολα με τη μέθοδο Gauss. Θυμηθείτε ότι ως αποτέλεσμα της λύσης, στο παράδειγμά μας, βρίσκονται οι τιμές των παραμέτρων και. Έτσι, η εξίσωση παλινδρόμησης που βρέθηκε θα έχει την ακόλουθη μορφή:

Χρησιμοποιείται ευρέως στην οικονομετρία με τη μορφή μιας ξεκάθαρης οικονομικής ερμηνείας των παραμέτρων του.

Η γραμμική παλινδρόμηση μειώνεται στην εύρεση μιας εξίσωσης της μορφής

ή

Εξίσωση τύπου επιτρέπει δεδομένες τιμές παραμέτρων Χέχουν θεωρητικές τιμές του αποτελεσματικού χαρακτηριστικού, αντικαθιστώντας τις πραγματικές τιμές του παράγοντα σε αυτό Χ.

Η οικοδόμηση μιας γραμμικής παλινδρόμησης καταλήγει στην εκτίμηση των παραμέτρων της − ΕΝΑΚαι V.Οι εκτιμήσεις παραμέτρων γραμμικής παλινδρόμησης μπορούν να βρεθούν με διαφορετικές μεθόδους.

Η κλασική προσέγγιση για την εκτίμηση των παραμέτρων γραμμικής παλινδρόμησης βασίζεται σε ελάχιστα τετράγωνα(ΜΝΚ).

Το LSM επιτρέπει σε κάποιον να αποκτήσει τέτοιες εκτιμήσεις παραμέτρων ΕΝΑΚαι V,κάτω από το οποίο το άθροισμα των τετραγωνικών αποκλίσεων των πραγματικών τιμών του προκύπτοντος χαρακτηριστικού (y)από υπολογισμένο (θεωρητικό) mini-minimum:

Για να βρεθεί το ελάχιστο μιας συνάρτησης, είναι απαραίτητο να υπολογιστούν οι μερικές παράγωγοι σε σχέση με κάθε μία από τις παραμέτρους ΕΝΑΚαι σικαι να τις εξισώσει με το μηδέν.

Σημειώστε με S και στη συνέχεια:

Μετασχηματίζοντας τον τύπο, λαμβάνουμε το ακόλουθο σύστημα κανονικών εξισώσεων για την εκτίμηση των παραμέτρων ΕΝΑΚαι V:

Επιλύοντας το σύστημα των κανονικών εξισώσεων (3.5) είτε με τη μέθοδο διαδοχικής εξάλειψης μεταβλητών είτε με τη μέθοδο των οριζόντων, βρίσκουμε τις επιθυμητές εκτιμήσεις παραμέτρων ΕΝΑΚαι V.

Παράμετρος Vονομάζεται συντελεστής παλινδρόμησης. Η τιμή του δείχνει τη μέση μεταβολή του αποτελέσματος με μεταβολή του συντελεστή κατά μία μονάδα.

Η εξίσωση παλινδρόμησης συμπληρώνεται πάντα με έναν δείκτη της στενότητας της σχέσης. Όταν χρησιμοποιείται γραμμική παλινδρόμηση, ο συντελεστής γραμμικής συσχέτισης λειτουργεί ως ένας τέτοιος δείκτης. Υπάρχουν διάφορες τροποποιήσεις του τύπου του γραμμικού συντελεστή συσχέτισης. Μερικές από αυτές παρατίθενται παρακάτω:

Όπως γνωρίζετε, ο συντελεστής γραμμικής συσχέτισης είναι εντός των ορίων: -1 1.

Για να εκτιμηθεί η ποιότητα της επιλογής μιας γραμμικής συνάρτησης, υπολογίζεται το τετράγωνο

Ένας γραμμικός συντελεστής συσχέτισης που ονομάζεται συντελεστής προσδιορισμού .Ο συντελεστής προσδιορισμού χαρακτηρίζει την αναλογία της διακύμανσης του ενεργού χαρακτηριστικού y,εξηγείται με παλινδρόμηση, στη συνολική διακύμανση του προκύπτοντος χαρακτηριστικού:

Κατά συνέπεια, η τιμή 1 - χαρακτηρίζει την αναλογία διασποράς y,προκαλείται από την επίδραση άλλων παραγόντων που δεν λαμβάνονται υπόψη στο μοντέλο.

Ερωτήσεις για αυτοέλεγχο

1. Η ουσία της μεθόδου των ελαχίστων τετραγώνων;

2. Πόσες μεταβλητές παρέχουν παλινδρόμηση κατά ζεύγη;

3. Ποιος συντελεστής καθορίζει τη στεγανότητα της σύνδεσης μεταξύ των αλλαγών;

4. Μέσα σε ποια όρια προσδιορίζεται ο συντελεστής προσδιορισμού;

5. Εκτίμηση της παραμέτρου b στην ανάλυση συσχέτισης-παλίνδρομης;

1. Christopher Dougherty. Εισαγωγή στην οικονομετρία. - M.: INFRA - M, 2001 - 402 p.

2. Α.Ε. Borodich. Οικονομετρία. Minsk LLC "New Knowledge" 2001.


3. R.U. Rakhmetova Σύντομο μάθημα στην οικονομετρία. Φροντιστήριο. Αλμάτι. 2004. -78s.

4. Ι.Ι. Eliseeva. Οικονομετρία. - Μ.: «Οικονομικά και στατιστικά», 2002

5. Μηνιαίο ενημερωτικό και αναλυτικό περιοδικό.

Μη γραμμικά οικονομικά μοντέλα. Μοντέλα μη γραμμικής παλινδρόμησης. Μεταβλητή μετατροπή.

Μη γραμμικά οικονομικά μοντέλα..

Μεταβλητή μετατροπή.

συντελεστής ελαστικότητας.

Εάν υπάρχουν μη γραμμικές σχέσεις μεταξύ οικονομικών φαινομένων, τότε αυτές εκφράζονται χρησιμοποιώντας τις αντίστοιχες μη γραμμικές συναρτήσεις: για παράδειγμα, μια ισόπλευρη υπερβολή , παραβολές δευτέρου βαθμού κ.λπ.

Υπάρχουν δύο κατηγορίες μη γραμμικών παλινδρομήσεων:

1. Παλινδρομήσεις που είναι μη γραμμικές ως προς τις επεξηγηματικές μεταβλητές που περιλαμβάνονται στην ανάλυση, αλλά γραμμικές ως προς τις εκτιμώμενες παραμέτρους, για παράδειγμα:

Πολυώνυμα διαφόρων βαθμών - , ;

Ισόπλευρη υπερβολή - ;

Ημιλογαριθμική συνάρτηση - .

2. Παλινδρομήσεις που είναι μη γραμμικές στις εκτιμώμενες παραμέτρους, για παράδειγμα:

Εξουσία - ;

Επιδεικτικό -;

Εκθετική - .

Το συνολικό άθροισμα των τετραγωνικών αποκλίσεων των μεμονωμένων τιμών του προκύπτοντος χαρακτηριστικού στοαπό τη μέση τιμή προκαλείται από την επίδραση πολλών παραγόντων. Χωρίζουμε υπό όρους ολόκληρο το σύνολο των λόγων σε δύο ομάδες: μελετήθηκε ο παράγοντας xΚαι άλλους παράγοντες.

Εάν ο παράγοντας δεν επηρεάζει το αποτέλεσμα, τότε η γραμμή παλινδρόμησης στο γράφημα είναι παράλληλη προς τον άξονα ΩΚαι

Τότε ολόκληρη η διασπορά του χαρακτηριστικού που προκύπτει οφείλεται στην επίδραση άλλων παραγόντων και το συνολικό άθροισμα των τετραγωνικών αποκλίσεων θα συμπίπτει με το υπόλοιπο. Εάν άλλοι παράγοντες δεν επηρεάζουν το αποτέλεσμα, τότε έδεσεςΜε Χλειτουργικά, και το υπολειπόμενο άθροισμα των τετραγώνων είναι μηδέν. Σε αυτήν την περίπτωση, το άθροισμα των τετραγωνικών αποκλίσεων που εξηγείται από την παλινδρόμηση είναι το ίδιο με το συνολικό άθροισμα των τετραγώνων.

Δεδομένου ότι δεν βρίσκονται όλα τα σημεία του πεδίου συσχέτισης στη γραμμή παλινδρόμησης, η διασπορά τους λαμβάνει χώρα πάντα λόγω της επιρροής του παράγοντα Χ, δηλαδή παλινδρόμηση στοΜε Χ,και προκαλείται από τη δράση άλλων αιτιών (ανεξήγητη παραλλαγή). Η καταλληλότητα της γραμμής παλινδρόμησης για την πρόβλεψη εξαρτάται από το μέρος της συνολικής διακύμανσης του χαρακτηριστικού στοεξηγεί την επεξηγημένη παραλλαγή

Προφανώς, εάν το άθροισμα των τετραγωνικών αποκλίσεων λόγω παλινδρόμησης είναι μεγαλύτερο από το υπολειπόμενο άθροισμα των τετραγώνων, τότε η εξίσωση παλινδρόμησης είναι στατιστικά σημαντική και ο παράγοντας Χέχει σημαντικό αντίκτυπο στο αποτέλεσμα. y.

, δηλαδή με τον αριθμό της ελευθερίας ανεξάρτητης παραλλαγής του χαρακτηριστικού. Ο αριθμός των βαθμών ελευθερίας σχετίζεται με τον αριθμό των μονάδων του πληθυσμού n και τον αριθμό των σταθερών που προσδιορίζονται από αυτόν. Σε σχέση με το υπό μελέτη πρόβλημα, ο αριθμός των βαθμών ελευθερίας θα πρέπει να δείχνει από πόσες ανεξάρτητες αποκλίσεις Π

Η εκτίμηση της σημασίας της εξίσωσης παλινδρόμησης στο σύνολό της δίνεται με τη βοήθεια του φά- Το κριτήριο του Fisher. Σε αυτή την περίπτωση, τίθεται μια μηδενική υπόθεση ότι ο συντελεστής παλινδρόμησης είναι ίσος με μηδέν, δηλ. b= 0, και ως εκ τούτου ο παράγοντας Χδεν επηρεάζει το αποτέλεσμα y.

Για τον άμεσο υπολογισμό του κριτηρίου F προηγείται ανάλυση της διακύμανσης. Κεντρικό στοιχείο είναι η επέκταση του συνολικού αθροίσματος των τετραγωνικών αποκλίσεων της μεταβλητής στοαπό τη μέση τιμή στοσε δύο μέρη - "εξήγηση" και "ανεξήγητο":

Συνολικό άθροισμα τετραγωνικών αποκλίσεων.

Άθροισμα τετραγώνων απόκλισης που εξηγείται με παλινδρόμηση.

Υπολειπόμενο άθροισμα τετραγωνικής απόκλισης.

Οποιοδήποτε άθροισμα τετραγωνικών αποκλίσεων σχετίζεται με τον αριθμό των βαθμών ελευθερίας , δηλαδή με τον αριθμό της ελευθερίας ανεξάρτητης παραλλαγής του χαρακτηριστικού. Ο αριθμός των βαθμών ελευθερίας σχετίζεται με τον αριθμό των πληθυσμιακών μονάδων nκαι με τον αριθμό των σταθερών που προσδιορίζεται από αυτό. Σε σχέση με το υπό μελέτη πρόβλημα, ο αριθμός των βαθμών ελευθερίας θα πρέπει να δείχνει από πόσες ανεξάρτητες αποκλίσεις Πείναι δυνατό να σχηματιστεί ένα δεδομένο άθροισμα τετραγώνων.

Διασπορά ανά βαθμό ελευθερίαςρε.

Αναλογίες F (κριτήριο F):

Αν η μηδενική υπόθεση είναι αληθής, τότε ο παράγοντας και οι υπολειπόμενες διακυμάνσεις δεν διαφέρουν μεταξύ τους. Για το H 0, είναι απαραίτητη μια διάψευση έτσι ώστε η διακύμανση του παράγοντα να υπερβαίνει το υπόλοιπο κατά πολλές φορές. Ο Άγγλος στατιστικολόγος Snedecor ανέπτυξε πίνακες κρίσιμων τιμών φά-σχέσεις σε διαφορετικά επίπεδα σημασίας της μηδενικής υπόθεσης και διαφορετικός αριθμός βαθμών ελευθερίας. Τιμή πίνακα φά-κριτήριο είναι η μέγιστη τιμή του λόγου των διακυμάνσεων που μπορεί να προκύψουν εάν αποκλίνουν τυχαία για ένα δεδομένο επίπεδο πιθανότητας παρουσίας μηδενικής υπόθεσης. Υπολογιζόμενη τιμή φά-η σχέση αναγνωρίζεται ως αξιόπιστη εάν το o είναι μεγαλύτερο από τον πίνακα.

Σε αυτήν την περίπτωση, η μηδενική υπόθεση σχετικά με την απουσία σχέσης χαρακτηριστικών απορρίπτεται και εξάγεται συμπέρασμα σχετικά με τη σημασία αυτής της σχέσης: F fact > F πίνακαςΤο H 0 απορρίπτεται.

Αν η τιμή είναι μικρότερη από τον πίνακα F fact ‹, F πίνακας, τότε η πιθανότητα της μηδενικής υπόθεσης είναι υψηλότερη από ένα δεδομένο επίπεδο και δεν μπορεί να απορριφθεί χωρίς σοβαρό κίνδυνο εξαγωγής λανθασμένου συμπεράσματος για την ύπαρξη σχέσης. Σε αυτή την περίπτωση, η εξίσωση παλινδρόμησης θεωρείται στατιστικά ασήμαντη. N o δεν παρεκκλίνει.

Τυπικό σφάλμα του συντελεστή παλινδρόμησης

Για να εκτιμηθεί η σημασία του συντελεστή παλινδρόμησης, η τιμή του συγκρίνεται με το τυπικό σφάλμα του, δηλ. προσδιορίζεται η πραγματική τιμή t-Δοκιμή μαθητή: η οποία στη συνέχεια συγκρίνεται με την τιμή του πίνακα σε ένα ορισμένο επίπεδο σημασίας και τον αριθμό των βαθμών ελευθερίας ( n- 2).

Τυπικό σφάλμα παραμέτρου ΕΝΑ:

Η σημασία του συντελεστή γραμμικής συσχέτισης ελέγχεται με βάση το μέγεθος του σφάλματος συντελεστής συσχέτισης r:

Συνολική διακύμανση ενός χαρακτηριστικού Χ:

Πολλαπλή Γραμμική Παλινδρόμηση

Πρότυπο κτίριο

Πολλαπλή παλινδρόμησηείναι μια παλινδρόμηση ενός αποτελεσματικού χαρακτηριστικού με δύο ή περισσότερους παράγοντες, δηλαδή ένα μοντέλο της μορφής

Η παλινδρόμηση μπορεί να δώσει ένα καλό αποτέλεσμα στη μοντελοποίηση εάν μπορεί να παραμεληθεί η επίδραση άλλων παραγόντων που επηρεάζουν το αντικείμενο μελέτης. Η συμπεριφορά των επιμέρους οικονομικών μεταβλητών δεν μπορεί να ελεγχθεί, δηλαδή, δεν είναι δυνατό να διασφαλιστεί η ισότητα όλων των άλλων συνθηκών για την αξιολόγηση της επιρροής ενός παράγοντα υπό μελέτη. Σε αυτήν την περίπτωση, θα πρέπει να προσπαθήσετε να προσδιορίσετε την επιρροή άλλων παραγόντων εισάγοντάς τους στο μοντέλο, δηλαδή να δημιουργήσετε μια εξίσωση πολλαπλής παλινδρόμησης: y = a+b 1 x 1 +b 2 +…+b p x p + .

Ο κύριος στόχος της πολλαπλής παλινδρόμησης είναι η οικοδόμηση ενός μοντέλου με μεγάλο αριθμό παραγόντων, προσδιορίζοντας παράλληλα την επιρροή καθενός από αυτούς ξεχωριστά, καθώς και τη σωρευτική τους επίδραση στον μοντελοποιημένο δείκτη. Η προδιαγραφή του μοντέλου περιλαμβάνει δύο τομείς ερωτήσεων: την επιλογή των παραγόντων και την επιλογή του τύπου της εξίσωσης παλινδρόμησης

© 2023 hozferma.ru - Οδηγός κηπουρικής. Κρεβάτια κήπου, εξωραϊσμός, γεωργία