Μια σειρά διακριτών παραλλαγών κατασκευάζεται για διακριτά χαρακτηριστικά.

Για να κατασκευάσετε μια διακριτή σειρά παραλλαγών, πρέπει να εκτελέσετε τα ακόλουθα βήματα: 1) να τακτοποιήσετε τις μονάδες παρατήρησης με αύξουσα σειρά της μελετημένης τιμής του χαρακτηριστικού,

2) προσδιορίστε όλες τις πιθανές τιμές του χαρακτηριστικού x i, τακτοποιήστε τις σε αύξουσα σειρά,

την τιμή του χαρακτηριστικού, Εγώ .

συχνότητα τιμής χαρακτηριστικού και δηλώνουν φά Εγώ . Το άθροισμα όλων των συχνοτήτων μιας σειράς είναι ίσο με τον αριθμό των στοιχείων του πληθυσμού που μελετάται.

Παράδειγμα 1 .

Κατάλογος βαθμών που έλαβαν οι μαθητές στις εξετάσεις: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Εδώ είναι ο αριθμός Χ - Βαθμόςείναι μια διακριτή τυχαία μεταβλητή και η προκύπτουσα λίστα εκτιμήσεων είναιστατιστικά (παρατηρήσιμα) δεδομένα .

    τακτοποιήστε τις μονάδες παρατήρησης σε αύξουσα σειρά της μελετημένης χαρακτηριστικής τιμής:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) προσδιορίστε όλες τις πιθανές τιμές του χαρακτηριστικού x i, ταξινομήστε τις με αύξουσα σειρά:

Σε αυτό το παράδειγμα, όλες οι εκτιμήσεις μπορούν να χωριστούν σε τέσσερις ομάδες με τις ακόλουθες τιμές: 2; 3; 4; 5.

Η τιμή μιας τυχαίας μεταβλητής που αντιστοιχεί σε μια συγκεκριμένη ομάδα παρατηρούμενων δεδομένων ονομάζεται την τιμή του χαρακτηριστικού, επιλογή (επιλογή) και ορίστε x Εγώ .

Ένας αριθμός που δείχνει πόσες φορές η αντίστοιχη τιμή ενός χαρακτηριστικού εμφανίζεται σε έναν αριθμό παρατηρήσεων ονομάζεται συχνότητα τιμής χαρακτηριστικού και δηλώνουν φά Εγώ .

Για το παράδειγμά μας

εμφανίζεται το σκορ 2 - 8 φορές,

εμφανίζεται το σκορ 3 - 12 φορές,

εμφανίζεται το σκορ 4 - 23 φορές,

εμφανίζεται το σκορ 5 - 17 φορές.

Υπάρχουν 60 βαθμολογίες συνολικά.

4) γράψτε τα ληφθέντα δεδομένα σε έναν πίνακα δύο σειρών (στήλες) - x i και f i.

Με βάση αυτά τα δεδομένα, είναι δυνατό να κατασκευαστεί μια διακριτή σειρά παραλλαγών

Σειρά διακριτών παραλλαγών - αυτός είναι ένας πίνακας στον οποίο οι εμφανιζόμενες τιμές του χαρακτηριστικού που μελετάται υποδεικνύονται ως μεμονωμένες τιμές σε αύξουσα σειρά και οι συχνότητές τους

  1. Κατασκευή μιας σειράς διαλειμματικής παραλλαγής

Εκτός από τις διακριτές σειρές μεταβλητών, συναντάται συχνά μια μέθοδος ομαδοποίησης δεδομένων, όπως μια σειρά μεταβλητών διαστημάτων.

Μια σειρά διαστημάτων κατασκευάζεται εάν:

    το ζώδιο έχει μια συνεχή φύση αλλαγής.

    Υπήρχαν πολλές διακριτές τιμές (πάνω από 10)

    οι συχνότητες των διακριτών τιμών είναι πολύ μικρές (δεν υπερβαίνουν το 1-3 με σχετικά μεγάλο αριθμό μονάδων παρατήρησης).

    πολλές διακριτές τιμές ενός χαρακτηριστικού με τις ίδιες συχνότητες.

Μια σειρά παραλλαγής διαστήματος είναι ένας τρόπος ομαδοποίησης δεδομένων με τη μορφή πίνακα που έχει δύο στήλες (τις τιμές του χαρακτηριστικού με τη μορφή ενός διαστήματος τιμών και τη συχνότητα κάθε διαστήματος).

Σε αντίθεση με μια διακριτή σειρά τιμών χαρακτηριστικών σειρές μεσοδιαστημάτωναντιπροσωπεύονται όχι από μεμονωμένες τιμές, αλλά από ένα διάστημα τιμών ("από - έως").

Ο αριθμός που δείχνει πόσες μονάδες παρατήρησης έπεσαν σε κάθε επιλεγμένο διάστημα ονομάζεται συχνότητα τιμής χαρακτηριστικού και δηλώνουν φά Εγώ . Το άθροισμα όλων των συχνοτήτων μιας σειράς είναι ίσο με τον αριθμό των στοιχείων (μονάδες παρατήρησης) στον πληθυσμό που μελετάται.

Εάν μια μονάδα έχει χαρακτηριστική τιμή ίση με το ανώτερο όριο του διαστήματος, τότε θα πρέπει να αντιστοιχιστεί στο επόμενο διάστημα.

Για παράδειγμα, ένα παιδί με ύψος 100 cm θα πέσει στο 2ο διάστημα και όχι στο πρώτο. και ένα παιδί με ύψος 130 cm θα πέσει στο τελευταίο διάστημα, και όχι στο τρίτο.

Με βάση αυτά τα δεδομένα, μπορεί να κατασκευαστεί μια σειρά μεταβολών διαστήματος.

Κάθε διάστημα έχει ένα κατώτερο όριο (xn), ένα ανώτερο όριο (xv) και ένα πλάτος διαστήματος ( Εγώ).

Το όριο διαστήματος είναι η τιμή του χαρακτηριστικού που βρίσκεται στο όριο δύο διαστημάτων.

ύψος παιδιών (cm)

ύψος παιδιών (cm)

ποσότητα παιδιών

περισσότερα από 130

Αν ένα διάστημα έχει άνω και κάτω όριο, τότε καλείται κλειστό διάστημα. Εάν ένα διάστημα έχει μόνο ένα κατώτερο ή μόνο ένα ανώτερο όριο, τότε είναι - ανοιχτό διάστημα.Μόνο το πρώτο ή το τελευταίο διάστημα μπορεί να είναι ανοιχτό. Στο παραπάνω παράδειγμα, το τελευταίο διάστημα είναι ανοιχτό.

Πλάτος διαστήματος (Εγώ) – η διαφορά μεταξύ του ανώτερου και του κατώτερου ορίου.

Εγώ = x n - x in

Το πλάτος του ανοιχτού διαστήματος θεωρείται ότι είναι το ίδιο με το πλάτος του διπλανού κλειστού διαστήματος.

ύψος παιδιών (cm)

ποσότητα παιδιών

Πλάτος διαστήματος (i)

για υπολογισμούς 130+20=150

20 (επειδή το πλάτος του διπλανού κλειστού διαστήματος είναι 20)

Όλες οι σειρές διαστήματος χωρίζονται σε σειρές διαστήματος με σε ίσα διαστήματακαι διαστημικές σειρές με άνισα διαστήματα . Σε σειρές σε απόσταση μεταξύ τους με ίσα διαστήματα, το πλάτος όλων των διαστημάτων είναι το ίδιο. Σε διαστημικές σειρές με άνισα διαστήματα, το πλάτος των διαστημάτων είναι διαφορετικό.

Στο υπό εξέταση παράδειγμα - μια σειρά διαστημάτων με άνισα διαστήματα.

Εργαστηριακή εργασία Νο 1

Σύμφωνα με τα μαθηματικά στατιστικά

Θέμα: Πρωτογενής επεξεργασία πειραματικών δεδομένων

3. Βαθμολογήστε σε πόντους. 1

5. Ερωτήσεις τεστ.. 2

6. Μέθοδος εκτέλεσης εργαστηριακές εργασίες.. 3

Στόχος της εργασίας

Απόκτηση δεξιοτήτων στην πρωτογενή επεξεργασία εμπειρικών δεδομένων με χρήση μεθόδων μαθηματικής στατιστικής.

Με βάση το σύνολο των πειραματικών δεδομένων, ολοκληρώστε τις ακόλουθες εργασίες:

Ασκηση 1.Κατασκευάστε μια σειρά κατανομής διαστημάτων παραλλαγής.

Εργασία 2.Κατασκευάστε ένα ιστόγραμμα συχνοτήτων μιας σειράς διαστημάτων μεταβολής.

Εργασία 3.Δημιουργήστε μια εμπειρική συνάρτηση κατανομής και σχεδιάστε ένα γράφημα.

α) τρόπος και διάμεσος·

β) υπό όρους αρχικές ροπές.

γ) μέσος όρος δείγματος.

δ) διακύμανση δείγματος, διορθωμένη διακύμανση πληθυσμός, διορθώθηκε μέσος όρος τυπική απόκλιση;

ε) συντελεστής διακύμανσης.

στ) ασυμμετρία.

ζ) κύρτωση.

Εργασία 5.Προσδιορίστε τα όρια των πραγματικών τιμών των αριθμητικών χαρακτηριστικών της τυχαίας μεταβλητής που μελετάται με δεδομένη αξιοπιστία.

Εργασία 6.Ερμηνεία με βάση το περιεχόμενο των αποτελεσμάτων της πρωτογενούς επεξεργασίας σύμφωνα με τις συνθήκες της εργασίας.

Σκορ σε πόντους

Εργασίες 1-56 βαθμοί

Εργασία 62 βαθμοί

Προστασία εργαστηριακών εργασιών(προφορική συνέντευξη για ερωτήσεις εξετάσεων και εργαστηριακές εργασίες) - 2 βαθμοί

Η εργασία πρέπει να υποβληθεί σε γραπτή μορφή σε φύλλα Α4 και περιλαμβάνει:

1) Τίτλος σελίδας(Παράρτημα 1)

2) Αρχικά στοιχεία.

3) Υποβολή εργασιών σύμφωνα με το καθορισμένο δείγμα.

4) Αποτελέσματα υπολογισμού (γίνονται χειροκίνητα ή/και χρησιμοποιώντας MS Excel) με την καθορισμένη σειρά.

5) Συμπεράσματα - ουσιαστική ερμηνεία των αποτελεσμάτων της πρωτογενούς επεξεργασίας σύμφωνα με τις συνθήκες του προβλήματος.

6) Προφορική συνέντευξη για ερωτήσεις εργασίας και ελέγχου.



5. Ερωτήσεις τεστ


Μεθοδολογία για την εκτέλεση εργαστηριακών εργασιών

Εργασία 1. Κατασκευάστε μια σειρά μεταβλητής κατανομής διαστήματος

Προκειμένου να παρουσιαστούν στατιστικά δεδομένα με τη μορφή σειράς παραλλαγών με ίσες επιλογές, είναι απαραίτητο:

1.Στον αρχικό πίνακα δεδομένων, βρείτε τις μικρότερες και μεγαλύτερες τιμές.

2.Ορίστε εύρος παραλλαγής :

3. Προσδιορίστε το μήκος του διαστήματος h, εάν το δείγμα περιέχει έως και 1000 δεδομένα, χρησιμοποιήστε τον τύπο: , όπου n – μέγεθος δείγματος – η ποσότητα των δεδομένων στο δείγμα. για υπολογισμούς πάρτε lgn).

Ο υπολογισμένος λόγος στρογγυλοποιείται σε βολική ακέραια τιμή .

4. Για να προσδιορίσετε την αρχή του πρώτου διαστήματος για ζυγό αριθμό διαστημάτων, συνιστάται να λάβετε την τιμή ; και για περιττό αριθμό διαστημάτων .

5. Γράψτε τα διαστήματα ομαδοποίησης και τακτοποιήστε τα με αύξουσα σειρά ορίων

, ,………., ,

όπου είναι το κατώτερο όριο του πρώτου διαστήματος. Λαμβάνεται ένας βολικός αριθμός που δεν είναι μεγαλύτερος από , το ανώτερο όριο του τελευταίου διαστήματος δεν πρέπει να είναι μικρότερο από . Συνιστάται τα διαστήματα να περιέχουν τις αρχικές τιμές της τυχαίας μεταβλητής και να διαχωρίζονται από αυτά 5 έως 20διαστήματα.

6. Καταγράψτε τα αρχικά δεδομένα στα διαστήματα ομαδοποίησης, π.χ. χρησιμοποιήστε τον πίνακα πηγής για να υπολογίσετε τον αριθμό των τιμών τυχαίων μεταβλητών που εμπίπτουν στα καθορισμένα διαστήματα. Εάν ορισμένες τιμές συμπίπτουν με τα όρια των διαστημάτων, τότε αποδίδονται είτε μόνο στο προηγούμενο είτε μόνο στο επόμενο διάστημα.

Σημείωση 1.Τα διαστήματα δεν χρειάζεται να είναι ίσα σε μήκος. Σε περιοχές όπου οι τιμές είναι πιο πυκνές, είναι πιο βολικό να παίρνετε μικρότερα, σύντομα διαστήματα και όπου υπάρχουν λιγότερο συχνά, μεγαλύτερα.

Σημείωση 2.Εάν για ορισμένες τιμές προκύψουν τιμές "μηδέν" ή μικρές τιμές συχνότητας, τότε είναι απαραίτητο να ομαδοποιήσετε εκ νέου τα δεδομένα, διευρύνοντας τα διαστήματα (αυξάνοντας το βήμα).

Σε πολλές περιπτώσεις, ο στατιστικός πληθυσμός της γάτας περιλαμβάνει μεγάλο ή και περισσότερο άπειρος αριθμόςεπιλογή, η οποία συναντάται συχνότερα με συνεχή παραλλαγή, είναι πρακτικά αδύνατο και μη πρακτικό να σχηματιστεί μια ομάδα μονάδων για κάθε επιλογή. Σε τέτοιες περιπτώσεις, ο συνδυασμός στατιστικών μονάδων σε ομάδες είναι δυνατός μόνο με βάση ένα διάστημα, δηλ. μια τέτοια ομάδα που έχει ορισμένα όρια για τις τιμές ενός ποικίλου χαρακτηριστικού. Αυτά τα όρια υποδεικνύονται με δύο αριθμούς που υποδεικνύουν τα άνω και κάτω όρια κάθε ομάδας. Η χρήση των διαστημάτων οδηγεί στο σχηματισμό μιας σειράς κατανομής διαστημάτων.

Διαλειμματικό radείναι μια σειρά παραλλαγών, οι παραλλαγές της οποίας παρουσιάζονται με τη μορφή διαστημάτων.

Μια σειρά διαστημάτων μπορεί να σχηματιστεί με ίσα και άνισα διαστήματα, ενώ η επιλογή της αρχής για την κατασκευή αυτής της σειράς εξαρτάται κυρίως από τον βαθμό αντιπροσωπευτικότητας και ευκολίας του στατιστικού πληθυσμού. Εάν ο πληθυσμός είναι αρκετά μεγάλος (αντιπροσωπευτικός) ως προς τον αριθμό των μονάδων και είναι εντελώς ομοιογενής στη σύνθεσή του, τότε καλό είναι να βασιστεί ο σχηματισμός μιας σειράς διαστημάτων στην ισότητα των διαστημάτων. Συνήθως, χρησιμοποιώντας αυτή την αρχή, σχηματίζεται μια σειρά διαστημάτων για εκείνους τους πληθυσμούς όπου το εύρος διακύμανσης είναι σχετικά μικρό, δηλ. η μέγιστη και η ελάχιστη επιλογή συνήθως διαφέρουν μεταξύ τους αρκετές φορές. Στην περίπτωση αυτή, η τιμή των ίσων διαστημάτων υπολογίζεται από τον λόγο του εύρους μεταβολής ενός χαρακτηριστικού προς έναν δεδομένο αριθμό σχηματισμένων διαστημάτων. Για να καθοριστεί ίσος Καιμεσοδιάστημα, μπορεί να χρησιμοποιηθεί ο τύπος Sturgess (συνήθως με μικρή απόκλιση χαρακτηριστικών διαστήματος και μεγάλο αριθμό μονάδων στον στατιστικό πληθυσμό):

όπου x i - ίση τιμή διαστήματος. X max, X min - μέγιστες και ελάχιστες επιλογές σε ένα στατιστικό σύνολο. n . - τον αριθμό των μονάδων στο σύνολο.

Παράδειγμα. Συνιστάται να υπολογιστεί το μέγεθος ενός ίσου διαστήματος σύμφωνα με την πυκνότητα της ραδιενεργής μόλυνσης με καίσιο - 137 σε 100 οικισμούς της περιοχής Krasnopolsky της περιοχής Mogilev, εάν είναι γνωστό ότι η αρχική (ελάχιστη) επιλογή είναι ίση με 1 km / km 2, ο τελικός (μέγιστο) - 65 ki/km 2. Χρησιμοποιώντας τον τύπο 5.1. παίρνουμε:

Κατά συνέπεια, για να σχηματιστεί μια σειρά διαστημάτων με ίσα διαστήματα ως προς την πυκνότητα μόλυνσης με καίσιο - 137 οικισμοί στην περιοχή Krasnopolsky, το μέγεθος του ίσου διαστήματος μπορεί να είναι 8 ki/km 2 .

Υπό συνθήκες ανομοιόμορφης κατανομής, δηλ. όταν οι μέγιστες και ελάχιστες επιλογές είναι εκατοντάδες φορές, όταν σχηματίζετε μια σειρά διαστημάτων, μπορείτε να εφαρμόσετε την αρχή άνισοςδιαστήματα. Τα άνισα διαστήματα συνήθως αυξάνονται καθώς προχωράμε μεγάλες αξίεςσημάδι.

Το σχήμα των διαστημάτων μπορεί να είναι κλειστό ή ανοιχτό. ΚλειστόΕίναι σύνηθες να καλούμε διαστήματα που έχουν και κατώτερα και ανώτερα όρια. ΑνοιξεΤα διαστήματα έχουν μόνο ένα όριο: στο πρώτο διάστημα υπάρχει ένα ανώτερο όριο, στο τελευταίο υπάρχει ένα κατώτερο όριο.

Συνιστάται η αξιολόγηση των σειρών διαστήματος, ειδικά με άνισα διαστήματα, λαμβάνοντας υπόψη πυκνότητα κατανομής, ο απλούστερος τρόπος για να υπολογίσετε ποια είναι η αναλογία της τοπικής συχνότητας (ή συχνότητας) προς το μέγεθος του διαστήματος.

Για να σχηματίσετε πρακτικά μια σειρά διαστημάτων, μπορείτε να χρησιμοποιήσετε τη διάταξη πίνακα. 5.3.

Πίνακας 5.3. Η διαδικασία για το σχηματισμό μιας διαλειμματικής σειράς οικισμών στην περιοχή Krasnopolsky σύμφωνα με την πυκνότητα της ραδιενεργής μόλυνσης με καίσιο –137

Το κύριο πλεονέκτημα της σειράς διαστήματος είναι το μέγιστο συμπαγές.ταυτόχρονα στη σειρά κατανομής διαστήματος μεμονωμένες επιλογέςχαρακτηριστικά κρύβονται στα αντίστοιχα διαστήματα

Όταν απεικονίζεται γραφικά μια σειρά διαστημάτων σε ένα σύστημα ορθογώνιων συντεταγμένων, τα άνω όρια των διαστημάτων σχεδιάζονται στον άξονα της τετμημένης και οι τοπικές συχνότητες της σειράς στον άξονα τεταγμένων. Η γραφική κατασκευή μιας σειράς διαστήματος διαφέρει από την κατασκευή ενός πολυγώνου κατανομής στο ότι κάθε διάστημα έχει κάτω και άνω όρια και δύο τετμημένες αντιστοιχούν σε μια τεταγμένη τιμή. Επομένως, στο γράφημα μιας σειράς διαστήματος, δεν σημειώνεται ένα σημείο, όπως σε ένα πολύγωνο, αλλά μια γραμμή που συνδέει δύο σημεία. Αυτές οι οριζόντιες γραμμές συνδέονται μεταξύ τους με κατακόρυφες γραμμές και προκύπτει το σχήμα ενός βαθμιδωτού πολυγώνου, το οποίο συνήθως ονομάζεται ιστόγραμμακατανομή (Εικ. 5.3).

Κατά την γραφική κατασκευή μιας σειράς διαστημάτων για έναν αρκετά μεγάλο στατιστικό πληθυσμό, το ιστόγραμμα προσεγγίζει συμμετρικόςμορφή διανομής. Στις περιπτώσεις όπου ο στατιστικός πληθυσμός είναι μικρός, κατά κανόνα, ασύμμετρηραβδόγραμμα.

Σε ορισμένες περιπτώσεις, είναι σκόπιμο να σχηματιστεί ένας αριθμός συσσωρευμένων συχνοτήτων, π.χ. σωρευτικόςσειρά. Μια αθροιστική σειρά μπορεί να σχηματιστεί με βάση μια διακριτή ή διαλειμματική σειρά διανομής. Όταν απεικονίζεται γραφικά μια αθροιστική σειρά σε ένα σύστημα ορθογώνιων συντεταγμένων, οι παραλλαγές σχεδιάζονται στον άξονα της τετμημένης και οι συσσωρευμένες συχνότητες (συχνότητες) απεικονίζονται στον άξονα τεταγμένων. Η καμπύλη γραμμή που προκύπτει συνήθως ονομάζεται σωρευτικόςκατανομή (Εικ. 5.4).

Σχηματισμός και γραφική παράσταση διάφοροι τύποιΗ σειρά παραλλαγής συμβάλλει σε έναν απλοποιημένο υπολογισμό των κύριων στατιστικών χαρακτηριστικών, τα οποία συζητούνται λεπτομερώς στο θέμα 6, συμβάλλει στην καλύτερη κατανόηση της ουσίας των νόμων κατανομής του στατιστικού πληθυσμού. Η ανάλυση μιας σειράς παραλλαγών αποκτά ιδιαίτερη σημασία σε περιπτώσεις όπου είναι απαραίτητο να εντοπιστεί και να εντοπιστεί η σχέση μεταξύ επιλογών και συχνοτήτων (συχνότητες). Αυτή η εξάρτηση εκδηλώνεται στο γεγονός ότι ο αριθμός των περιπτώσεων ανά επιλογή σχετίζεται κατά κάποιο τρόπο με το μέγεθος αυτής της επιλογής, δηλ. με αυξανόμενες τιμές του ποικίλου χαρακτηριστικού, οι συχνότητες (συχνότητες) αυτών των τιμών υφίστανται ορισμένες, συστηματικές αλλαγές. Αυτό σημαίνει ότι οι αριθμοί στη στήλη συχνότητας (συχνότητα) δεν υπόκεινται σε χαοτικές διακυμάνσεις, αλλά αλλάζουν προς μια συγκεκριμένη κατεύθυνση, σε με μια ορισμένη σειράκαι συνέπεια.

Εάν οι συχνότητες δείχνουν μια ορισμένη συστηματικότητα στις αλλαγές τους, τότε αυτό σημαίνει ότι βρισκόμαστε στο δρόμο για την αναγνώριση ενός μοτίβου. Το σύστημα, η σειρά, η αλληλουχία στις αλλαγές στις συχνότητες είναι μια αντανάκλαση γενικών αιτιών, γενικών συνθηκών χαρακτηριστικών ολόκληρου του πληθυσμού.

Δεν πρέπει να υποθέσουμε ότι το μοτίβο διανομής δίνεται πάντα σε έτοιμη μορφή. Υπάρχουν πολλές σειρές παραλλαγών στις οποίες οι συχνότητες πηδούν παράξενα, μερικές φορές αυξάνοντας, μερικές φορές μειώνοντας. Σε τέτοιες περιπτώσεις, είναι σκόπιμο να μάθετε με ποιο είδος κατανομής έχει να κάνει ο ερευνητής: είτε αυτή η κατανομή δεν έχει καθόλου εγγενή πρότυπα, είτε η φύση της δεν έχει ακόμη αποκαλυφθεί: Η πρώτη περίπτωση είναι σπάνια, αλλά η δεύτερη περίπτωση είναι ένα αρκετά συχνό και πολύ διαδεδομένο φαινόμενο.

Έτσι, όταν σχηματίζετε μια σειρά διαστημάτων συνολικός αριθμόςΟι στατιστικές μονάδες μπορεί να είναι μικρές και κάθε διάστημα περιέχει μικρό αριθμό επιλογών (για παράδειγμα, 1-3 μονάδες). Σε τέτοιες περιπτώσεις, δεν μπορεί κανείς να υπολογίζει στην εκδήλωση οποιουδήποτε προτύπου. Για να προκύψει ένα φυσικό αποτέλεσμα με βάση τυχαίες παρατηρήσεις, είναι απαραίτητο να τεθεί σε ισχύ ο νόμος μεγάλοι αριθμοί, δηλ. ώστε για κάθε διάστημα να μην υπάρχουν πολλές, αλλά δεκάδες και εκατοντάδες στατιστικές μονάδες. Για το σκοπό αυτό, πρέπει να προσπαθήσουμε να αυξήσουμε όσο το δυνατόν περισσότερο τον αριθμό των παρατηρήσεων. Αυτό είναι το πιο ο σωστός τρόποςανίχνευση προτύπων σε μαζικές διαδικασίες. Αν δεν φαίνεται πραγματική ευκαιρίααυξήστε τον αριθμό των παρατηρήσεων και, στη συνέχεια, ο προσδιορισμός ενός σχεδίου μπορεί να επιτευχθεί με τη μείωση του αριθμού των διαστημάτων στη σειρά διανομής. Με τη μείωση του αριθμού των διαστημάτων σε μια σειρά παραλλαγών, αυξάνεται ο αριθμός των συχνοτήτων σε κάθε διάστημα. Αυτό σημαίνει ότι οι τυχαίες διακυμάνσεις κάθε στατιστικής μονάδας υπερτίθενται η μία πάνω στην άλλη, «εξομαλύνονται», μετατρέπονται σε μοτίβο.

Ο σχηματισμός και η κατασκευή σειρών παραλλαγών μας επιτρέπει να αποκτήσουμε μόνο μια γενική, κατά προσέγγιση εικόνα της κατανομής του στατιστικού πληθυσμού. Για παράδειγμα, ένα ιστόγραμμα μόνο σε πρόχειρη μορφή εκφράζει τη σχέση μεταξύ των τιμών ενός χαρακτηριστικού και των συχνοτήτων του (συχνότητες).Επομένως, οι σειρές μεταβολών είναι ουσιαστικά μόνο η βάση για περαιτέρω, σε βάθος μελέτη της εσωτερικής κανονικότητας του στατικού διανομή.

ΕΡΩΤΗΣΕΙΣ ΤΕΣΤ ΓΙΑ ΤΟ ΘΕΜΑ 5

1. Τι είναι η παραλλαγή; Τι προκαλεί διακύμανση σε ένα χαρακτηριστικό σε έναν στατιστικό πληθυσμό;

2. Ποιοι τύποι διαφορετικών χαρακτηριστικών μπορούν να εμφανιστούν στις στατιστικές;

3. Τι είναι μια σειρά παραλλαγής; Τι τύποι σειρών παραλλαγών μπορεί να υπάρχουν;

4. Τι είναι μια σειρά κατάταξης; Ποια είναι τα πλεονεκτήματα και τα μειονεκτήματά του;

5. Τι είναι διακριτές σειρέςκαι ποια είναι τα πλεονεκτήματα και τα μειονεκτήματά του;

6. Ποια είναι η διαδικασία σχηματισμού μιας σειράς διαστήματος, ποια είναι τα πλεονεκτήματα και τα μειονεκτήματά της;

7. Τι είναι μια γραφική αναπαράσταση ταξινομημένων, διακριτών, διαλειμματικών σειρών διανομής;

8. Ποια είναι η σώρευση κατανομής και τι χαρακτηρίζει;

Στατιστικά μαθηματικών- ένας κλάδος των μαθηματικών αφιερωμένος σε μαθηματικές μεθόδουςεπεξεργασία, συστηματοποίηση και χρήση στατιστικών δεδομένων για επιστημονικά και πρακτικά συμπεράσματα.

3.1. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΜΑΘΗΜΑΤΙΚΗΣ ΣΤΑΤΙΣΤΙΚΗΣ

Σε ιατρικά και βιολογικά προβλήματα είναι συχνά απαραίτητο να μελετηθεί η κατανομή ενός συγκεκριμένου χαρακτηριστικού για πολύ μεγάλος αριθμόςτα άτομα. Σε διαφορετικά άτομα αυτό το ζώδιο έχει διαφορετική σημασία, άρα είναι μια τυχαία μεταβλητή. Για παράδειγμα, οποιοδήποτε φαρμακευτικό φάρμακοέχει ποικίλη αποτελεσματικότητα όταν εφαρμόζεται σε διαφορετικούς ασθενείς. Ωστόσο, για να έχετε μια ιδέα για την αποτελεσματικότητα αυτού του φαρμάκου, δεν χρειάζεται να το εφαρμόσετε Ολοιάρρωστος. Είναι δυνατό να εντοπιστούν τα αποτελέσματα της χρήσης του φαρμάκου σε μια σχετικά μικρή ομάδα ασθενών και, με βάση τα δεδομένα που ελήφθησαν, να εντοπιστούν τα βασικά χαρακτηριστικά (αποτελεσματικότητα, αντενδείξεις) της θεραπευτικής διαδικασίας.

Πληθυσμός- ένα σύνολο ομοιογενών στοιχείων που χαρακτηρίζονται από κάποιο χαρακτηριστικό που πρέπει να μελετηθεί. Αυτό το σημάδι είναι συνεχήςτυχαία μεταβλητή με πυκνότητα κατανομής f(x).

Για παράδειγμα, εάν μας ενδιαφέρει ο επιπολασμός μιας ασθένειας σε μια συγκεκριμένη περιοχή, τότε ο γενικός πληθυσμός είναι ολόκληρος ο πληθυσμός της περιοχής. Αν θέλουμε να μάθουμε την ευαισθησία ανδρών και γυναικών σε αυτήν την ασθένεια ξεχωριστά, τότε θα πρέπει να εξετάσουμε δύο γενικούς πληθυσμούς.

Για τη μελέτη των ιδιοτήτων ενός γενικού πληθυσμού, επιλέγεται ένα ορισμένο μέρος των στοιχείων του.

Δείγμα- μέρος του γενικού πληθυσμού που επιλέχθηκε για εξέταση (θεραπεία).

Εάν αυτό δεν προκαλεί σύγχυση, τότε ένα δείγμα ονομάζεται ως ένα σύνολο αντικειμένων,επιλέχθηκαν για την έρευνα και ολότητα

αξίεςτο μελετημένο χαρακτηριστικό που αποκτήθηκε κατά την εξέταση. Αυτές οι τιμές μπορούν να αναπαρασταθούν με διάφορους τρόπους.

Απλή στατιστική σειρά -οι τιμές του χαρακτηριστικού που μελετάται, καταγράφονται με τη σειρά με την οποία ελήφθησαν.

Ένα παράδειγμα μιας απλής στατιστικής σειράς που ελήφθη με τη μέτρηση της ταχύτητας των επιφανειακών κυμάτων (m/s) στο δέρμα του μετώπου σε 20 ασθενείς δίνεται στον Πίνακα. 3.1.

Πίνακας 3.1.Απλές στατιστικές σειρές

Μια απλή στατιστική σειρά είναι η κύρια και η πιο πλήρης διαδρομήαρχεία των αποτελεσμάτων των εξετάσεων. Μπορεί να περιέχει εκατοντάδες στοιχεία. Είναι πολύ δύσκολο να ρίξεις μια ματιά σε μια τέτοια ολότητα με μια ματιά. Ως εκ τούτου, τα μεγάλα δείγματα χωρίζονται συνήθως σε ομάδες. Για να γίνει αυτό, η περιοχή αλλαγής του χαρακτηριστικού χωρίζεται σε πολλά (N) διαστήματαίσου πλάτους και να υπολογίσετε τις σχετικές συχνότητες (n/n) του χαρακτηριστικού που εμπίπτουν σε αυτά τα διαστήματα. Το πλάτος κάθε διαστήματος είναι:

Τα όρια διαστήματος έχουν τις ακόλουθες έννοιες:

Εάν οποιοδήποτε στοιχείο δείγματος είναι το όριο μεταξύ δύο γειτονικών διαστημάτων, τότε ταξινομείται ως αριστεράδιάστημα. Τα δεδομένα που ομαδοποιούνται με αυτόν τον τρόπο καλούνται διαστημικές στατιστικές σειρές.

είναι ένας πίνακας που δείχνει τα διαστήματα των τιμών των χαρακτηριστικών και τις σχετικές συχνότητες εμφάνισης του χαρακτηριστικού μέσα σε αυτά τα διαστήματα.

Στην περίπτωσή μας, μπορούμε να σχηματίσουμε, για παράδειγμα, την ακόλουθη στατιστική σειρά διαστημάτων (N = 5, ρε= 4), πίνακας. 3.2.

Πίνακας 3.2.Διαστημικές στατιστικές σειρές

Εδώ, το διάστημα 28-32 περιλαμβάνει δύο τιμές ίσες με 28 (Πίνακας 3.1) και το διάστημα 32-36 περιλαμβάνει τιμές 32, 33, 34 και 35.

Μια στατιστική σειρά διαστημάτων μπορεί να απεικονιστεί γραφικά. Για να γίνει αυτό, σχεδιάζονται διαστήματα τιμών χαρακτηριστικών κατά μήκος του άξονα της τετμημένης και σε καθένα από αυτά, όπως σε μια βάση, χτίζεται ένα ορθογώνιο με ύψος ίσο με τη σχετική συχνότητα. Το ραβδόγραμμα που προκύπτει ονομάζεται ιστόγραμμα.

Ρύζι. 3.1.ραβδόγραμμα

Στο ιστόγραμμα, τα στατιστικά μοτίβα κατανομής του χαρακτηριστικού είναι ορατά αρκετά καθαρά.

Με μεγάλο μέγεθος δείγματος (πολλές χιλιάδες) και μικρά πλάτη στηλών, το σχήμα του ιστογράμματος είναι κοντά στο σχήμα του γραφήματος πυκνότητα κατανομήςσημάδι.

Ο αριθμός των στηλών ιστογράμματος μπορεί να επιλεγεί χρησιμοποιώντας τον ακόλουθο τύπο:

Η κατασκευή ενός ιστογράμματος με το χέρι είναι μια μακρά διαδικασία. Αναπτύχθηκε επομένως προγράμματα υπολογιστήγια την αυτόματη κατασκευή τους.

3.2. ΑΡΙΘΜΗΤΙΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΣΤΑΤΙΣΤΙΚΩΝ ΣΕΙΡΩΝ

Πολλές στατιστικές διαδικασίες χρησιμοποιούν δειγματοληπτικές εκτιμήσεις για τις προσδοκίες και τη διακύμανση του πληθυσμού (ή MSE).

Δείγμα μέσου όρουΤο (X) είναι ο αριθμητικός μέσος όρος όλων των στοιχείων μιας απλής στατιστικής σειράς:

Για το παράδειγμά μας Χ= 37,05 (m/s).

Ο μέσος όρος του δείγματος είναιτο καλύτερογενική μέση εκτίμησηΜ.

Δείγμα διακύμανσης s 2ίσο με το άθροισμα των τετραγωνικών αποκλίσεων των στοιχείων από τη μέση τιμή του δείγματος, διαιρούμενο με n- 1:

Στο παράδειγμά μας, s 2 = 25,2 (m/s) 2.

Λάβετε υπόψη ότι κατά τον υπολογισμό της διακύμανσης του δείγματος, ο παρονομαστής του τύπου δεν είναι το μέγεθος δείγματος n, αλλά n-1. Αυτό οφείλεται στο γεγονός ότι κατά τον υπολογισμό των αποκλίσεων στον τύπο (3.3), αντί της άγνωστης μαθηματικής προσδοκίας, χρησιμοποιείται η εκτίμησή του - δείγμα μέσου όρου.

Η δειγματική διακύμανση είναι το καλύτεροεκτίμηση γενικής διακύμανσης (σ 2).

Δείγμα τυπικής απόκλισης(s) είναι Τετραγωνική ρίζααπό διακύμανση δείγματος:

Για το παράδειγμά μας μικρό= 5,02 (m/s).

Εκλεκτικός ρίζα μέσο τετράγωνοη απόκλιση είναι η καλύτερη εκτίμηση της γενικής τυπικής απόκλισης (σ).

Με απεριόριστη αύξηση του μεγέθους του δείγματος, όλα τα χαρακτηριστικά του δείγματος τείνουν στα αντίστοιχα χαρακτηριστικά του γενικού πληθυσμού.

Οι τύποι υπολογιστών χρησιμοποιούνται για τον υπολογισμό των χαρακτηριστικών του δείγματος. Στο Excel, αυτοί οι υπολογισμοί εκτελούν τις στατιστικές συναρτήσεις AVERAGE, VARIANCE. ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ

3.3. ΑΞΙΟΛΟΓΗΣΗ ΔΙΑΣΤΗΜΑΤΩΝ

Όλα τα χαρακτηριστικά του δείγματος είναι τυχαίες μεταβλητές.Αυτό σημαίνει ότι για ένα άλλο δείγμα του ίδιου μεγέθους, οι τιμές των χαρακτηριστικών του δείγματος θα είναι διαφορετικές. Έτσι, επιλεκτικά

χαρακτηριστικά είναι μόνο υπολογίζεισχετικά χαρακτηριστικά του πληθυσμού.

Τα μειονεκτήματα της επιλεκτικής αξιολόγησης αντισταθμίζονται από εκτίμηση διαστήματος,αντιπροσωπεύοντας αριθμητικό διάστημαεντός του οποίου με δεδομένη πιθανότητα R dβρίσκεται η πραγματική τιμή της εκτιμώμενης παραμέτρου.

Αφήνω U r - κάποια παράμετρος του γενικού πληθυσμού (γενικός μέσος όρος, γενική διακύμανση κ.λπ.).

Εκτίμηση διαστήματοςΗ παράμετρος U r ονομάζεται διάστημα (U 1, U 2),ικανοποιεί την προϋπόθεση:

P(U < Ur < U2) = Рд. (3.5)

Πιθανότητα R dπου ονομάζεται πιθανότητα εμπιστοσύνης.

Πιθανότητα εμπιστοσύνης Πρε - η πιθανότητα ότι η πραγματική αξία της εκτιμώμενης ποσότητας είναι μέσατο καθορισμένο διάστημα.

Σε αυτή την περίπτωση, το διάστημα (U 1, U 2)που ονομάζεται διάστημα εμπιστοσύνηςγια την παράμετρο που εκτιμάται.

Συχνά, αντί για την πιθανότητα εμπιστοσύνης, χρησιμοποιείται η σχετική τιμή α = 1 - Р d, η οποία ονομάζεται επίπεδο σημασίας.

Επίπεδο σημασίαςείναι η πιθανότητα ότι η πραγματική τιμή της εκτιμώμενης παραμέτρου είναι εξω αποδιάστημα εμπιστοσύνης.

Μερικές φορές τα α και P d εκφράζονται ως ποσοστά, για παράδειγμα, 5% αντί για 0,05 και 95% αντί για 0,95.

Στην εκτίμηση διαστήματος, επιλέξτε πρώτα το κατάλληλο πιθανότητα εμπιστοσύνης (συνήθως 0,95 ή 0,99) και στη συνέχεια βρείτε το κατάλληλο εύρος τιμών για την παράμετρο που εκτιμάται.

Ας σημειώσουμε μερικά γενικές ιδιότητεςεκτιμήσεις διαστήματος.

1. Όσο χαμηλότερο είναι το επίπεδο σημαντικότητας (τόσο περισσότερο Ε δ),τόσο ευρύτερη είναι η εκτίμηση του διαστήματος. Έτσι, εάν σε επίπεδο σημαντικότητας 0,05 η εκτίμηση του διαστήματος του γενικού μέσου όρου είναι 34,7< Μ< 39,4, то для уровня 0,01 она будет гораздо шире: 33,85 < Μ< 40,25.

2. Όσο μεγαλύτερο είναι το μέγεθος του δείγματος n,τόσο στενότερη είναι η εκτίμηση του διαστήματος με το επιλεγμένο επίπεδο σημαντικότητας. Έστω, για παράδειγμα, 5 η εκατοστιαία εκτίμηση του γενικού μέσου όρου (β = 0,05) που λαμβάνεται από ένα δείγμα 20 στοιχείων, μετά 34,7< Μ< 39,4.

Αυξάνοντας το μέγεθος του δείγματος σε 80, έχουμε μια πιο ακριβή εκτίμηση στο ίδιο επίπεδο σημαντικότητας: 35,5< Μ< 38,6.

ΣΕ γενική περίπτωσηΗ κατασκευή αξιόπιστων εκτιμήσεων εμπιστοσύνης απαιτεί γνώση του νόμου σύμφωνα με τον οποίο το εκτιμώμενο τυχαίο χαρακτηριστικό κατανέμεται στον πληθυσμό. Ας δούμε πώς κατασκευάζεται μια εκτίμηση διαστήματος γενικός μέσος όροςχαρακτηριστικό που κατανέμεται στον πληθυσμό σύμφωνα με κανονικόςνόμος.

3.4. ΔΙΑΣΤΗΜΑΤΙΚΗ ΕΚΤΙΜΗΣΗ ΤΟΥ ΓΕΝΙΚΟΥ ΜΕΣΟΥ ΓΙΑ ΤΟΝ ΝΟΜΟ ΚΑΝΟΝΙΚΗΣ ΔΙΑΝΟΜΗΣ

Κατασκευή διαστήματος εκτίμησης του γενικού μέσου όρου Μ για πληθυσμό με κανονικός νόμοςΗ διανομή βασίζεται στην ακόλουθη ιδιότητα. Για όγκο δειγματοληψίας nστάση

υπακούει στην κατανομή Student με τον αριθμό των βαθμών ελευθερίας ν = n- 1.

Εδώ Χ- μέσος όρος δείγματος, και μικρό- επιλεκτική τυπική απόκλιση.

Χρησιμοποιώντας πίνακες κατανομής Student ή το ισοδύναμο υπολογιστή τους, μπορείτε να βρείτε μια οριακή τιμή τέτοια ώστε, με δεδομένη πιθανότητα εμπιστοσύνης, να ισχύει η ακόλουθη ανισότητα:

Αυτή η ανισότητα αντιστοιχεί στην ανισότητα για το M:

Οπου ε - το μισό πλάτος του διαστήματος εμπιστοσύνης.

Έτσι, η κατασκευή ενός διαστήματος εμπιστοσύνης για το Μ πραγματοποιείται με την ακόλουθη σειρά.

1. Επιλέξτε μια πιθανότητα εμπιστοσύνης Р d (συνήθως 0,95 ή 0,99) και για αυτήν, χρησιμοποιώντας τον πίνακα κατανομής Student, βρείτε την παράμετρο t

2. Υπολογίστε το μισό πλάτος του διαστήματος εμπιστοσύνης ε:

3. Λάβετε μια εκτίμηση διαστήματος του γενικού μέσου όρου με την επιλεγμένη πιθανότητα εμπιστοσύνης:

Συνοπτικά γράφεται ως εξής:

Έχουν αναπτυχθεί διαδικασίες υπολογιστών για την εύρεση εκτιμήσεων διαστημάτων.

Ας εξηγήσουμε πώς να χρησιμοποιήσετε τον πίνακα κατανομής Student. Αυτός ο πίνακας έχει δύο «εισόδους»: την αριστερή στήλη, που ονομάζεται αριθμός βαθμών ελευθερίας ν = n- 1, και η πάνω γραμμή είναι το επίπεδο σημαντικότητας α. Στη διασταύρωση της αντίστοιχης γραμμής και στήλης, βρείτε τον συντελεστή Student t.

Ας εφαρμόσουμε αυτή τη μέθοδο στο δείγμα μας. Ένα τμήμα του πίνακα κατανομής Student παρουσιάζεται παρακάτω.

Πίνακας 3.3. Τμήμα του πίνακα κατανομής των μαθητών

Μια απλή στατιστική σειρά για δείγμα 20 ατόμων = 20, ν =19) παρουσιάζεται στον πίνακα. 3.1. Για αυτή τη σειρά, οι υπολογισμοί με χρήση των τύπων (3.1-3.3) δίνουν: Χ= 37,05; μικρό= 5,02.

Ας διαλέξουμε α = 0,05 (Р d = 0,95). Στη διασταύρωση της σειράς "19" και της στήλης "0,05" βρίσκουμε t= 2,09.

Ας υπολογίσουμε την ακρίβεια της εκτίμησης χρησιμοποιώντας τον τύπο (3.6): ε = 2.09?5.02/λ /20 = 2.34.

Ας κατασκευάσουμε μια εκτίμηση διαστήματος: με πιθανότητα 95%, ο άγνωστος γενικός μέσος όρος ικανοποιεί την ανισότητα:

37,05 - 2,34 < Μ< 37,05 + 2,34, или Μ= 37,05 ± 2,34 (m/s), Rd = 0,95.

3.5. ΜΕΘΟΔΟΙ ΔΟΚΙΜΗΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ

Στατιστικές υποθέσεις

Πριν διατυπώσετε τι είναι μια στατιστική υπόθεση, εξετάστε το ακόλουθο παράδειγμα.

Για να συγκριθούν δύο μέθοδοι θεραπείας μιας συγκεκριμένης ασθένειας, επιλέχθηκαν δύο ομάδες ασθενών των 20 ατόμων η καθεμία και αντιμετωπίστηκαν με αυτές τις μεθόδους. Για κάθε ασθενή καταγράφηκε αριθμός διαδικασιών,μετά την οποία επετεύχθη θετική επίδραση. Με βάση αυτά τα δεδομένα, οι μέσοι όροι του δείγματος (Χ), οι διακυμάνσεις του δείγματος βρέθηκαν για κάθε ομάδα (s 2)και δείγμα τυπικών αποκλίσεων (μικρό).

Τα αποτελέσματα παρουσιάζονται στον πίνακα. 3.4.

Πίνακας 3.4

Ο αριθμός των διαδικασιών που απαιτούνται για τη λήψη θετικού αποτελέσματος είναι μια τυχαία μεταβλητή, όλες οι πληροφορίες για την οποία είναι ενεργοποιημένες αυτή τη στιγμήπου περιέχονται στο δεδομένο δείγμα.

Από το τραπέζι Το 3.4 δείχνει ότι ο μέσος όρος του δείγματος στην πρώτη ομάδα είναι μικρότερος από ό,τι στη δεύτερη. Σημαίνει αυτό ότι η ίδια σχέση ισχύει για τους γενικούς μέσους όρους: M 1< М 2 ? Достаточно ли статистических данных для такого вывода? Ответы на эти вопросы и дает στατιστικός έλεγχος υποθέσεων.

Στατιστική υπόθεση- είναι μια υπόθεση για τις ιδιότητες των πληθυσμών.

Θα εξετάσουμε υποθέσεις για τις ιδιότητες δύογενικούς πληθυσμούς.

Αν οι πληθυσμοί έχουν διάσημος, πανομοιότυποςκατανομή της αξίας που εκτιμάται και οι παραδοχές αφορούν τις αξίες κάποια παράμετροςαυτής της κατανομής, τότε καλούνται οι υποθέσεις παραμετρική.Για παράδειγμα, λαμβάνονται δείγματα από πληθυσμούς με κανονικός νόμοςκατανομή και ίση διακύμανση. Πρέπει να μάθετε είναι τα ίδιαγενικούς μέσους όρους αυτών των πληθυσμών.

Εάν τίποτα δεν είναι γνωστό για τους νόμους κατανομής των γενικών πληθυσμών, τότε ονομάζονται υποθέσεις για τις ιδιότητές τους μη παραμετρική.Για παράδειγμα, είναι τα ίδιανόμους κατανομής των γενικών πληθυσμών από τους οποίους αντλούνται τα δείγματα.

Μηδενικές και εναλλακτικές υποθέσεις.

Το έργο του ελέγχου υποθέσεων. Επίπεδο σημασίας

Ας εξοικειωθούμε με την ορολογία που χρησιμοποιείται κατά τον έλεγχο υποθέσεων.

H 0 - η μηδενική υπόθεση (υπόθεση του σκεπτικιστή) είναι μια υπόθεση για την απουσία διαφορώνμεταξύ των συγκριτικών δειγμάτων. Ο σκεπτικιστής πιστεύει ότι οι διαφορές μεταξύ των δειγματοληπτικών εκτιμήσεων που λαμβάνονται από τα αποτελέσματα της έρευνας είναι τυχαίες.

H 1- η εναλλακτική υπόθεση (optimist hypothesis) είναι μια υπόθεση σχετικά με την παρουσία διαφορών μεταξύ των συγκριτικών δειγμάτων. Ένας αισιόδοξος πιστεύει ότι οι διαφορές μεταξύ των εκτιμήσεων του δείγματος προκαλούνται από αντικειμενικούς λόγους και αντιστοιχούν σε διαφορές στους γενικούς πληθυσμούς.

Η δοκιμή στατιστικών υποθέσεων είναι εφικτή μόνο όταν είναι δυνατή η κατασκευή ορισμένων Μέγεθος(κριτήριο), ο νόμος διανομής του οποίου σε περίπτωση δικαιοσύνης H 0διάσημος. Τότε για αυτήν την ποσότητα μπορούμε να καθορίσουμε διάστημα εμπιστοσύνης,στο οποίο με δεδομένη πιθανότητα R dπέφτει η αξία του. Αυτό το διάστημα ονομάζεται κρίσιμη περιοχή.Εάν η τιμή του κριτηρίου εμπίπτει στην κρίσιμη περιοχή, τότε η υπόθεση γίνεται αποδεκτή Ν 0.Διαφορετικά, η υπόθεση H 1 γίνεται αποδεκτή.

Στην ιατρική έρευνα χρησιμοποιούνται Pd = 0,95 ή P d = 0,99. Αυτές οι τιμές αντιστοιχούν επίπεδα σημασίαςα = 0,05 ή α = 0,01.

Κατά τον έλεγχο στατιστικών υποθέσεωνεπίπεδο σημασίας(α) είναι η πιθανότητα απόρριψης της μηδενικής υπόθεσης όταν είναι αληθής.

Σημειώστε ότι, στον πυρήνα της, στοχεύει η διαδικασία ελέγχου υποθέσεων εντοπισμός διαφορώνκαι όχι για να επιβεβαιώσει την απουσία τους. Όταν η τιμή του κριτηρίου υπερβαίνει την κρίσιμη περιοχή, μπορούμε να πούμε με καθαρή καρδιά στον «σκεπτικιστή» - καλά, τι άλλο θέλετε;! Εάν δεν υπήρχαν διαφορές, τότε με πιθανότητα 95% (ή 99%) η υπολογιζόμενη τιμή θα ήταν εντός των καθορισμένων ορίων. Αλλά όχι!..

Λοιπόν, εάν η τιμή του κριτηρίου εμπίπτει στην κρίσιμη περιοχή, τότε δεν υπάρχει λόγος να πιστεύουμε ότι η υπόθεση H 0 είναι σωστή. Αυτό πιθανότατα υποδεικνύει έναν από τους δύο πιθανούς λόγους.

1. Τα μεγέθη των δειγμάτων δεν είναι αρκετά μεγάλα για να ανιχνεύσουν διαφορές. Είναι πιθανό ότι ο συνεχιζόμενος πειραματισμός θα φέρει επιτυχία.

2. Υπάρχουν διαφορές. Αλλά είναι τόσο μικρά που δεν έχουν καμία πρακτική σημασία. Σε αυτή την περίπτωση, η συνέχιση των πειραμάτων δεν έχει νόημα.

Ας προχωρήσουμε στην εξέταση ορισμένων στατιστικών υποθέσεων που χρησιμοποιούνται στην ιατρική έρευνα.

3.6. ΔΟΚΙΜΑΣΜΟΣ ΥΠΟΘΕΣΕΩΝ ΓΙΑ ΤΗΝ ΙΣΟΤΗΤΑ ΔΙΑΦΟΡΩΝ, ΚΡΙΤΗΡΙΟ F FISCHER

Σε ορισμένες κλινικές μελέτες, η θετική επίδραση δεν αποδεικνύεται τόσο πολύ μέγεθοςτης παραμέτρου που μελετάται, πόσο από αυτήν σταθεροποίηση,μειώνοντας τις διακυμάνσεις του. Σε αυτή την περίπτωση, τίθεται το ερώτημα σχετικά με τη σύγκριση δύο γενικών αποκλίσεων με βάση τα αποτελέσματα μιας δειγματοληπτικής έρευνας. Αυτό το πρόβλημα μπορεί να λυθεί χρησιμοποιώντας Το τεστ του Fisher.

Διατύπωση του προβλήματος

κανονικός νόμοςδιανομές. Μεγέθη δειγμάτων -

ν 1Και n2,ΕΝΑ αποκλίσεις δείγματοςίσος s 1 και s 2 2 γενικές αποκλίσεις.

Δοκιμήσιμες υποθέσεις:

H 0- γενικές αποκλίσεις είναι τα ίδια;

H 1- γενικές αποκλίσεις είναι διαφορετικά.

Εμφανίζεται εάν τα δείγματα λαμβάνονται από πληθυσμούς με κανονικός νόμοςκατανομή, τότε εάν η υπόθεση είναι αληθής H 0ο λόγος των αποκλίσεων του δείγματος ακολουθεί την κατανομή Fisher. Ως κριτήριο λοιπόν για τον έλεγχο της δικαιοσύνης H 0λαμβάνεται η τιμή ΦΑ,υπολογίζεται με τον τύπο:

Οπου Τα s 1 και s 2 είναι δειγματοληπτικές διακυμάνσεις.

Αυτή η αναλογία υπακούει στην κατανομή Fisher με τον αριθμό των βαθμών ελευθερίας του αριθμητή ν 1 = ν 1- 1 και ο αριθμός των βαθμών ελευθερίας του παρονομαστή ν 2 = n 2 - 1. Τα όρια της κρίσιμης περιοχής βρίσκονται χρησιμοποιώντας πίνακες κατανομής Fisher ή χρησιμοποιώντας τη συνάρτηση υπολογιστή BRASPOBR.

Για το παράδειγμα που παρουσιάζεται στον πίνακα. 3.4, παίρνουμε: ν 1 = ν 2 = 20 - 1 = 19; φά= 2,16/4,05 = 0,53. Στο α = 0,05, τα όρια της κρίσιμης περιοχής είναι αντίστοιχα: = 0,40, = 2,53.

Η τιμή του κριτηρίου εμπίπτει στην κρίσιμη περιοχή, επομένως η υπόθεση γίνεται αποδεκτή H 0:γενικές αποκλίσεις δείγματος είναι τα ίδια.

3.7. ΔΟΚΙΜΑΣΜΟΣ ΥΠΟΘΕΣΕΩΝ ΟΣΟΝ ΑΦΟΡΑ ΙΣΟΤΗΤΑ ΜΕΣΩΝ, ΜΑΘΗΤΙΚΟ t-ΚΡΙΤΗΡΙΟ

Εργασία σύγκρισης μέση τιμήδύο γενικοί πληθυσμοί προκύπτουν όταν η πρακτική σημασία είναι ακριβώς μέγεθοςτο χαρακτηριστικό που μελετάται. Για παράδειγμα, όταν συγκρίνετε τη διάρκεια της θεραπείας με δύο διαφορετικές μεθόδους ή τον αριθμό των επιπλοκών που προκύπτουν από τη χρήση τους. Σε αυτήν την περίπτωση, μπορείτε να χρησιμοποιήσετε το Student's t-test.

Διατύπωση του προβλήματος

Ελήφθησαν δύο δείγματα (Χ 1) και (Χ 2), που εξήχθησαν από γενικούς πληθυσμούς με κανονικός νόμοςδιανομή και πανομοιότυπες αποκλίσεις.Μεγέθη δειγμάτων - n 1 και n 2, δείγμα μέσουείναι ίσα με Χ 1 και Χ 2, και αποκλίσεις δείγματος- s 1 2 και s 2 2αντίστοιχα. Χρειάζεται σύγκριση γενικούς μέσους όρους.

Δοκιμήσιμες υποθέσεις:

H 0- γενικοί μέσοι όροι είναι τα ίδια;

H 1- γενικοί μέσοι όροι είναι διαφορετικά.

Αποδεικνύεται ότι εάν η υπόθεση είναι αληθής H 0Η τιμή t υπολογίζεται με τον τύπο:

κατανέμεται σύμφωνα με το νόμο του Student με τον αριθμό των βαθμών ελευθερίας ν = ν 1 + + ν2 - 2.

Εδώ όπου ν 1 = n 1 - 1 - αριθμός βαθμών ελευθερίας για το πρώτο δείγμα. ν 2 = n 2 - 1 - αριθμός βαθμών ελευθερίας για το δεύτερο δείγμα.

Τα όρια της κρίσιμης περιοχής βρίσκονται χρησιμοποιώντας πίνακες κατανομής t ή χρησιμοποιώντας τη συνάρτηση υπολογιστή STUDRIST. Η κατανομή Student είναι συμμετρική ως προς το μηδέν, επομένως τα αριστερά και δεξιά όρια της κρίσιμης περιοχής είναι ίδια σε μέγεθος και αντίθετα στο πρόσημο: -και

Για το παράδειγμα που παρουσιάζεται στον πίνακα. 3.4, παίρνουμε:

ν 1 = ν 2 = 20 - 1 = 19; ν = 38, t= -2,51. Στο α = 0,05 = 2,02.

Η τιμή του κριτηρίου υπερβαίνει το αριστερό όριο της κρίσιμης περιοχής, επομένως αποδεχόμαστε την υπόθεση H 1:γενικούς μέσους όρους είναι διαφορετικά.Παράλληλα, ο μέσος όρος του πληθυσμού πρώτο δείγμαΠΙΟ ΛΙΓΟ.

Εφαρμογή του Student's t-test

Το τεστ Student's t ισχύει μόνο για δείγματα από κανονικόςαδρανή με πανομοιότυπες γενικές αποκλίσεις.Εάν παραβιαστεί τουλάχιστον μία από τις προϋποθέσεις, τότε αμφισβητείται η δυνατότητα εφαρμογής του κριτηρίου. Η απαίτηση της κανονικότητας του γενικού πληθυσμού συνήθως αγνοείται, παραθέτοντας κεντρικό οριακό θεώρημα.Πράγματι, η διαφορά μεταξύ των μέσων του δείγματος στον αριθμητή (3.10) μπορεί να θεωρηθεί ότι κατανέμεται κανονικά για ν > 30. Αλλά το ζήτημα της ισότητας των διακυμάνσεων δεν μπορεί να επαληθευτεί και δεν μπορούν να ληφθούν αναφορές στο γεγονός ότι η δοκιμή Fisher δεν ανίχνευσε διαφορές υπόψη. Ωστόσο, το t-test χρησιμοποιείται ευρέως για την ανίχνευση διαφορών στους μέσους όρους πληθυσμού, αν και χωρίς επαρκή στοιχεία.

Παρακάτω συζητείται μη παραμετρικό κριτήριο,η οποία χρησιμοποιείται με επιτυχία για τους ίδιους σκοπούς και η οποία δεν απαιτεί καμία κανονικότητα,κανενα απο τα δυο ισότητα διακυμάνσεων.

3.8. ΜΗ ΠΑΡΑΜΕΤΡΙΚΗ ΣΥΓΚΡΙΣΗ ΔΥΟ ΔΕΙΓΜΑΤΩΝ: ΚΡΙΤΗΡΙΟ MANN-WHITNEY

Οι μη παραμετρικές δοκιμές έχουν σχεδιαστεί για να ανιχνεύουν διαφορές στους νόμους κατανομής δύο πληθυσμών. Κριτήρια που είναι ευαίσθητα στις διαφορές γενικά μέση τιμή,που ονομάζονται κριτήρια βάρδιαΚριτήρια που είναι ευαίσθητα στις διαφορές γενικά διασπορές,που ονομάζονται κριτήρια κλίμακα.Το τεστ Mann-Whitney αναφέρεται στα κριτήρια βάρδιακαι χρησιμοποιείται για την ανίχνευση διαφορών στους μέσους όρους δύο πληθυσμών, δείγματα από τα οποία παρουσιάζονται στο κλίμακα κατάταξης.Τα μετρούμενα χαρακτηριστικά βρίσκονται σε αυτήν την κλίμακα με αύξουσα σειρά, και στη συνέχεια αριθμούνται με ακέραιους αριθμούς 1, 2... Αυτοί οι αριθμοί ονομάζονται τάξεις.Σε ίσες ποσότητες αποδίδονται ίσοι βαθμοί. Δεν είναι η αξία του ίδιου του χαρακτηριστικού που έχει σημασία, αλλά μόνο τακτικός τόποςτις οποίες κατατάσσει μεταξύ άλλων ποσοτήτων.

Στον πίνακα 3.5. η πρώτη ομάδα από τον Πίνακα 3.4 παρουσιάζεται σε διευρυμένη μορφή (γραμμή 1), κατατάσσεται (γραμμή 2) και στη συνέχεια οι τάξεις των ίδιων τιμών αντικαθίστανται από αριθμητικούς μέσους όρους. Για παράδειγμα, στα στοιχεία 4 και 4 στην πρώτη σειρά δόθηκαν οι τάξεις 2 και 3, οι οποίες στη συνέχεια αντικαταστάθηκαν από ίδιες αξίες 2,5.

Πίνακας 3.5

Διατύπωση του προβλήματος

Ανεξάρτητα δείγματα (X 1)Και (X 2)εξάγεται από γενικούς πληθυσμούς με άγνωστους νόμους κατανομής. Μεγέθη δειγμάτων ν 1Και ν 2αντίστοιχα. Οι τιμές των δειγματοληπτικών στοιχείων παρουσιάζονται στο κλίμακα κατάταξης.Είναι απαραίτητο να ελεγχθεί εάν αυτοί οι γενικοί πληθυσμοί διαφέρουν μεταξύ τους;

Δοκιμήσιμες υποθέσεις:

H 0- τα δείγματα ανήκουν στον ίδιο γενικό πληθυσμό. H 1- τα δείγματα ανήκουν σε διαφορετικούς γενικούς πληθυσμούς.

Για τον έλεγχο τέτοιων υποθέσεων, χρησιμοποιείται το τεστ (/-Mann-Whitney.

Αρχικά, συντάσσεται ένα συνδυασμένο δείγμα (Χ) από τα δύο δείγματα, τα στοιχεία του οποίου ταξινομούνται. Στη συνέχεια βρίσκεται το άθροισμα των βαθμών που αντιστοιχούν στα στοιχεία του πρώτου δείγματος. Αυτό το ποσό είναι το κριτήριο για τον έλεγχο των υποθέσεων.

U= Άθροισμα βαθμών του πρώτου δείγματος. (3.11)

Για ανεξάρτητα δείγματα των οποίων οι όγκοι είναι μεγαλύτεροι από 20, η τιμή Uυπακούει στην κανονική κατανομή, η μαθηματική προσδοκία και η τυπική απόκλιση της οποίας είναι ίσες με:

Επομένως, τα όρια της κρίσιμης περιοχής βρίσκονται σύμφωνα με κανονικούς πίνακες κατανομής.

Για το παράδειγμα που παρουσιάζεται στον πίνακα. 3.4, παίρνουμε: ν 1 = ν 2 = 20 - 1 = 19, U= 339, μ = 410, σ = 37. Για α = 0,05 παίρνουμε: αριστερά = 338 και δεξιά = 482.

Η τιμή του κριτηρίου υπερβαίνει το αριστερό όριο της κρίσιμης περιοχής, επομένως η υπόθεση H 1 γίνεται αποδεκτή: οι γενικοί πληθυσμοί έχουν διαφορετικούς νόμους κατανομής. Παράλληλα, ο μέσος όρος του πληθυσμού πρώτο δείγμαΠΙΟ ΛΙΓΟ.

Τι είναι μια ομαδοποίηση στατιστικών δεδομένων και πώς σχετίζεται με τις σειρές διανομής, συζητήθηκε σε αυτήν τη διάλεξη, όπου μπορείτε επίσης να μάθετε τι είναι μια διακριτή και μεταβλητή σειρά διανομής.

Οι σειρές διανομής είναι μία από τις ποικιλίες στατιστικών σειρών (επιπλέον αυτών, οι σειρές δυναμικής χρησιμοποιούνται στις στατιστικές), χρησιμοποιούνται για την ανάλυση δεδομένων σχετικά με τα φαινόμενα της κοινωνικής ζωής. Η κατασκευή σειρών παραλλαγών είναι μια αρκετά εφικτή εργασία για όλους. Ωστόσο, υπάρχουν κανόνες που πρέπει να θυμόμαστε.

Πώς να κατασκευάσετε μια διακριτή σειρά μεταβλητής διανομής

Παράδειγμα 1. Υπάρχουν στοιχεία για τον αριθμό των παιδιών σε 20 οικογένειες που συμμετείχαν στην έρευνα. Κατασκευάστε μια διακριτή σειρά παραλλαγών οικογενειακή διανομήκατά αριθμό παιδιών.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Λύση:

  1. Ας ξεκινήσουμε με μια διάταξη πίνακα, στην οποία στη συνέχεια θα εισάγουμε δεδομένα. Δεδομένου ότι οι σειρές διανομής έχουν δύο στοιχεία, ο πίνακας θα αποτελείται από δύο στήλες. Η πρώτη στήλη είναι πάντα μια επιλογή - αυτό που μελετάμε - παίρνουμε το όνομά της από την εργασία (το τέλος της πρότασης με την εργασία στις συνθήκες) - κατά αριθμό παιδιών– αυτό σημαίνει ότι η επιλογή μας είναι ο αριθμός των παιδιών.

Η δεύτερη στήλη είναι η συχνότητα - πόσο συχνά εμφανίζεται η παραλλαγή μας στο υπό μελέτη φαινόμενο - παίρνουμε επίσης το όνομα της στήλης από την εργασία - οικογενειακή διανομή – αυτό σημαίνει ότι η συχνότητά μας είναι ο αριθμός των οικογενειών με τον αντίστοιχο αριθμό παιδιών.

  1. Τώρα από τα δεδομένα πηγής επιλέγουμε εκείνες τις τιμές που εμφανίζονται τουλάχιστον μία φορά. Στην περίπτωσή μας είναι

Και ας τακτοποιήσουμε αυτά τα δεδομένα στην πρώτη στήλη του πίνακα μας με λογική σειρά, σε αυτήν την περίπτωση αυξάνοντας από το 0 στο 4. Παίρνουμε

Και τέλος, ας μετρήσουμε πόσες φορές εμφανίζεται κάθε τιμή της παραλλαγής.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

Ως αποτέλεσμα, λαμβάνουμε έναν συμπληρωμένο πίνακα ή την απαιτούμενη σειρά κατανομής των οικογενειών κατά αριθμό παιδιών.

Ασκηση . Υπάρχουν στοιχεία για τους μισθούς 30 εργαζομένων στην επιχείρηση. Κατασκευάστε μια διακριτή σειρά παραλλαγών για την κατανομή των εργαζομένων ανά κατηγορία τιμολογίων. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Πώς να κατασκευάσετε μια σειρά μεταβλητής κατανομής διαστήματος

Ας κατασκευάσουμε μια σειρά διανομής διαστήματος και ας δούμε πώς διαφέρει η κατασκευή της από μια διακριτή σειρά.

Παράδειγμα 2. Υπάρχουν στοιχεία για το ποσό του κέρδους που έλαβαν 16 επιχειρήσεις, εκατομμύρια ρούβλια. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Κατασκευάστε μια σειρά μεταβολών διαστήματος της κατανομής των επιχειρήσεων ανά όγκο κέρδους, προσδιορίζοντας 3 ομάδες με ίσα διαστήματα.

Η γενική αρχή της κατασκευής της σειράς, φυσικά, θα παραμείνει οι ίδιες δύο στήλες, οι ίδιες επιλογές και συχνότητα, αλλά σε αυτήν την περίπτωση οι επιλογές θα βρίσκονται στο διάστημα και οι συχνότητες θα μετρηθούν διαφορετικά.

Λύση:

  1. Ας ξεκινήσουμε με τον ίδιο τρόπο με την προηγούμενη εργασία δημιουργώντας μια διάταξη πίνακα, στην οποία στη συνέχεια θα εισάγουμε δεδομένα. Δεδομένου ότι οι σειρές διανομής έχουν δύο στοιχεία, ο πίνακας θα αποτελείται από δύο στήλες. Η πρώτη στήλη είναι πάντα μια επιλογή - αυτό που μελετάμε - παίρνουμε το όνομά της από την εργασία (το τέλος της πρότασης με την εργασία στις συνθήκες) - κατά το ποσό του κέρδους - που σημαίνει ότι η επιλογή μας είναι το ποσό του κέρδους που ελήφθη .

Η δεύτερη στήλη είναι η συχνότητα - πόσο συχνά εμφανίζεται η παραλλαγή μας στο υπό μελέτη φαινόμενο - παίρνουμε επίσης το όνομα της στήλης από την εργασία - κατανομή των επιχειρήσεων - που σημαίνει ότι η συχνότητά μας είναι ο αριθμός των επιχειρήσεων με το αντίστοιχο κέρδος, σε αυτή η περίπτωση εμπίπτει στο μεσοδιάστημα.

Ως αποτέλεσμα, η διάταξη του πίνακα μας θα μοιάζει με αυτό:

όπου i είναι η τιμή ή το μήκος του διαστήματος,

Xmax και Xmin – μέγιστη και ελάχιστη τιμή του χαρακτηριστικού,

n είναι ο απαιτούμενος αριθμός ομάδων σύμφωνα με τις συνθήκες του προβλήματος.

Ας υπολογίσουμε το μέγεθος του διαστήματος για το παράδειγμά μας. Για να γίνει αυτό, μεταξύ των αρχικών δεδομένων θα βρούμε το μεγαλύτερο και το μικρότερο

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 - η μέγιστη τιμή είναι 118 εκατομμύρια ρούβλια και η ελάχιστη είναι 9 εκατομμύρια ρούβλια. Ας κάνουμε τον υπολογισμό χρησιμοποιώντας τον τύπο.

Στον υπολογισμό πήραμε τον αριθμό 36, (3) τρία στην περίοδο, σε τέτοιες περιπτώσεις η τιμή του διαστήματος πρέπει να στρογγυλοποιείται προς τα πάνω ώστε μετά τους υπολογισμούς να μην χάνονται τα μέγιστα δεδομένα, γι' αυτό στον υπολογισμό η τιμή του το διάστημα είναι 36,4 εκατομμύρια ρούβλια.

  1. Τώρα ας κατασκευάσουμε διαστήματα - τις επιλογές μας σε αυτό το πρόβλημα. Το πρώτο διάστημα αρχίζει να δημιουργείται από την ελάχιστη τιμή, προστίθεται η τιμή του διαστήματος και προκύπτει το ανώτερο όριο του πρώτου διαστήματος. Στη συνέχεια, το ανώτερο όριο του πρώτου διαστήματος γίνεται το κατώτερο όριο του δεύτερου διαστήματος, η τιμή του διαστήματος προστίθεται σε αυτό και προκύπτει το δεύτερο διάστημα. Και ούτω καθεξής όσες φορές απαιτείται για την κατασκευή διαστημάτων ανάλογα με την κατάσταση.

Ας σημειώσουμε ότι αν δεν είχαμε στρογγυλοποιήσει την τιμή του διαστήματος στο 36,4, αλλά το αφήναμε στο 36,3, τότε η τελευταία τιμή θα ήταν 117,9. Προκειμένου να αποφευχθεί η απώλεια δεδομένων είναι απαραίτητο να στρογγυλοποιηθεί η τιμή του διαστήματος σε μεγαλύτερη τιμή.

  1. Ας μετρήσουμε τον αριθμό των επιχειρήσεων που εμπίπτουν σε κάθε συγκεκριμένο διάστημα. Κατά την επεξεργασία δεδομένων, πρέπει να θυμάστε ότι η ανώτερη τιμή του διαστήματος σε ένα δεδομένο διάστημα δεν λαμβάνεται υπόψη (δεν περιλαμβάνεται σε αυτό το διάστημα), αλλά λαμβάνεται υπόψη στο επόμενο διάστημα (περιλαμβάνεται το κατώτερο όριο του διαστήματος σε αυτό το διάστημα, και δεν περιλαμβάνεται το ανώτερο), με εξαίρεση το τελευταίο διάστημα.

Κατά την επεξεργασία δεδομένων, είναι καλύτερο να υποδεικνύονται τα επιλεγμένα δεδομένα με σύμβολα ή χρώματα για απλοποίηση της επεξεργασίας.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Δηλώνουμε το πρώτο διάστημα κίτρινος- και προσδιορίστε πόσα δεδομένα εμπίπτουν στο διάστημα από το 9 έως το 45,4, ενώ αυτό το 45,4 θα ληφθεί υπόψη στο δεύτερο διάστημα (με την προϋπόθεση ότι είναι στα δεδομένα) - στο τέλος παίρνουμε 7 επιχειρήσεις στο πρώτο διάστημα. Και ούτω καθεξής σε όλα τα διαστήματα.

  1. (πρόσθετη δράση) Ας υπολογίσουμε το συνολικό ποσό του κέρδους που εισπράττουν οι επιχειρήσεις για κάθε διάστημα και γενικά. Για να το κάνετε αυτό, προσθέστε τα δεδομένα που επισημαίνονται διαφορετικά χρώματακαι λάβετε τη συνολική αξία κέρδους.

Για το πρώτο διάστημα - 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 εκατομμύρια ρούβλια.

Για το δεύτερο διάστημα - 48 + 57 + 48 + 56 + 63 = 272 εκατομμύρια ρούβλια.

Για το τρίτο διάστημα - 118 + 87 + 98 + 88 = 391 εκατομμύρια ρούβλια.

Ασκηση . Υπάρχουν στοιχεία για το ποσό των καταθέσεων στην τράπεζα 30 καταθετών, χιλιάδες ρούβλια. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Χτίζω σειρές παραλλαγής διαστήματοςκατανομή των καταθετών, ανάλογα με το μέγεθος της κατάθεσης, προσδιορίζοντας 4 ομάδες με ίσα διαστήματα. Για κάθε ομάδα, υπολογίστε το συνολικό ποσό των καταθέσεων.