Ένα άτομο μπορεί να αναγνωρίσει τις ικανότητές του μόνο προσπαθώντας να τις εφαρμόσει. (Σενεκάς)

Διαστήματα εμπιστοσύνης

γενική αναθεώρηση

Λαμβάνοντας ένα δείγμα από τον πληθυσμό, λαμβάνουμε μια σημειακή εκτίμηση της παραμέτρου που μας ενδιαφέρει και υπολογίζουμε το τυπικό σφάλμα για να υποδείξουμε την ακρίβεια της εκτίμησης.

Ωστόσο, για τις περισσότερες περιπτώσεις το τυπικό σφάλμα δεν είναι αποδεκτό. Είναι πολύ πιο χρήσιμο να συνδυαστεί αυτό το μέτρο ακρίβειας με μια εκτίμηση διαστήματος για την παράμετρο πληθυσμού.

Αυτό μπορεί να γίνει χρησιμοποιώντας τη γνώση της θεωρητικής κατανομής πιθανοτήτων του στατιστικού δείγματος (παράμετρος) προκειμένου να υπολογιστεί ένα διάστημα εμπιστοσύνης (CI - Διάστημα εμπιστοσύνης, CI - Διάστημα εμπιστοσύνης) για την παράμετρο.

Γενικά, ένα διάστημα εμπιστοσύνης επεκτείνει τις εκτιμήσεις και στις δύο κατευθύνσεις κατά ένα ορισμένο πολλαπλάσιο του τυπικού σφάλματος (μιας δεδομένης παραμέτρου). Οι δύο τιμές (όρια εμπιστοσύνης) που ορίζουν το διάστημα συνήθως χωρίζονται με κόμμα και περικλείονται σε παρενθέσεις.

Διάστημα εμπιστοσύνης για το μέσο όρο

Χρήση Κανονικής Κατανομής

Ο μέσος όρος του δείγματος κατανέμεται κανονικά εάν το μέγεθος του δείγματος είναι μεγάλο, επομένως μπορείτε να εφαρμόσετε τη γνώση της κανονικής κατανομής κατά την εξέταση του μέσου όρου του δείγματος.

Συγκεκριμένα, το 95% της κατανομής των μέσων δειγμάτων βρίσκεται εντός 1,96 τυπικών αποκλίσεων (SD) του μέσου όρου του πληθυσμού.

Όταν έχουμε μόνο ένα δείγμα, το ονομάζουμε τυπικό σφάλμα του μέσου όρου (SEM) και υπολογίζουμε το διάστημα εμπιστοσύνης 95% για τον μέσο όρο ως εξής:

Εάν επαναλάβουμε αυτό το πείραμα πολλές φορές, το διάστημα θα περιέχει τον πραγματικό μέσο πληθυσμό στο 95% του χρόνου.

Συνήθως αυτό είναι ένα διάστημα εμπιστοσύνης, όπως το διάστημα των τιμών εντός του οποίου ο πραγματικός μέσος όρος πληθυσμού (γενικός μέσος όρος) βρίσκεται με πιθανότητα εμπιστοσύνης 95%.

Αν και δεν είναι εντελώς αυστηρό (ο μέσος όρος του πληθυσμού είναι μια σταθερή τιμή και επομένως δεν μπορεί να συνδεθεί με μια πιθανότητα) να ερμηνεύσουμε ένα διάστημα εμπιστοσύνης με αυτόν τον τρόπο, είναι εννοιολογικά ευκολότερο να το κατανοήσουμε.

Χρήση t-διανομή

Μπορείτε να χρησιμοποιήσετε την κανονική κατανομή εάν γνωρίζετε την τιμή της διακύμανσης στον πληθυσμό. Επίσης, όταν το μέγεθος του δείγματος είναι μικρό, ο μέσος όρος του δείγματος ακολουθεί μια κανονική κατανομή εάν τα υποκείμενα δεδομένα πληθυσμού κατανέμονται κανονικά.

Εάν τα δεδομένα στα οποία βασίζεται ο πληθυσμός δεν είναι κανονικά κατανεμημένα και/ή η διακύμανση του πληθυσμού είναι άγνωστη, ο μέσος όρος του δείγματος υπακούει Κατανομή t του μαθητή.

Υπολογίζουμε το διάστημα εμπιστοσύνης 95% για το μέσο όρο του γενικού πληθυσμού ως εξής:

Πού είναι η ποσοστιαία μονάδα (εκατοστη εκατοστιαία μονάδα) t-Κατανομή t του Student με (n-1) βαθμούς ελευθερίας, η οποία δίνει πιθανότητα διπλής όψης 0,05.

Γενικά, παρέχει ευρύτερο εύρος από ό,τι όταν χρησιμοποιείται η κανονική κατανομή, καθώς λαμβάνει υπόψη την πρόσθετη αβεβαιότητα που εισάγεται κατά την εκτίμηση τυπική απόκλισηπληθυσμού ή/και λόγω μικρού μεγέθους δείγματος.

Όταν το μέγεθος του δείγματος είναι μεγάλο (της τάξης του 100 ή περισσότερο), η διαφορά μεταξύ των δύο κατανομών ( τ-Μαθητήςκαι κανονικό) είναι ασήμαντο. Ωστόσο, χρησιμοποιούν πάντα t-κατανομή κατά τον υπολογισμό των διαστημάτων εμπιστοσύνης, ακόμη και αν το μέγεθος του δείγματος είναι μεγάλο.

Συνήθως αναφέρεται το 95% CI. Μπορούν να υπολογιστούν και άλλα διαστήματα εμπιστοσύνης, όπως το 99% CI για τη μέση τιμή.

Αντί για το γινόμενο του τυπικού σφάλματος και της τιμής του πίνακα t-κατανομή, η οποία αντιστοιχεί σε πιθανότητα διπλής όψης 0,05, πολλαπλασιάστε την (τυπικό σφάλμα) με την τιμή που αντιστοιχεί σε πιθανότητα διπλής όψης 0,01. Αυτό είναι ένα ευρύτερο διάστημα εμπιστοσύνης από το διάστημα εμπιστοσύνης 95%, επειδή αντανακλά αυξημένη εμπιστοσύνη ότι το διάστημα περιλαμβάνει πραγματικά τον μέσο όρο του πληθυσμού.

Διάστημα εμπιστοσύνης για την αναλογία

Η δειγματοληπτική κατανομή των αναλογιών έχει διωνυμική κατανομή. Ωστόσο, εάν το μέγεθος του δείγματος nείναι αρκετά μεγάλο, τότε η δειγματοληπτική κατανομή της αναλογίας είναι περίπου κανονική με τη μέση τιμή .

Αξιολογούμε με επιλεκτική αναλογία p=r/n(Οπου r- τον αριθμό των ατόμων στο δείγμα με αυτά που μας ενδιαφέρουν ιδιαίτερα χαρακτηριστικά), και το τυπικό σφάλμα εκτιμάται:

Το διάστημα εμπιστοσύνης 95% για την αναλογία εκτιμάται:

Εάν το μέγεθος του δείγματος είναι μικρό (συνήθως όταν n.p.ή n(1-p)πιο λιγο 5 ), τότε είναι απαραίτητο να χρησιμοποιηθεί η διωνυμική κατανομή προκειμένου να υπολογιστούν ακριβή διαστήματα εμπιστοσύνης.

Σημειώστε ότι εάν Πεκφράζεται ως ποσοστό, λοιπόν (1-p)αντικαταστάθηκε από (100-p).

Ερμηνεία των διαστημάτων εμπιστοσύνης

Κατά την ερμηνεία ενός διαστήματος εμπιστοσύνης, μας ενδιαφέρουν οι ακόλουθες ερωτήσεις:

Πόσο μεγάλο είναι το διάστημα εμπιστοσύνης;

Ένα μεγάλο διάστημα εμπιστοσύνης δείχνει ότι η εκτίμηση είναι ανακριβής. narrow υποδηλώνει ακριβή εκτίμηση.

Το πλάτος του διαστήματος εμπιστοσύνης εξαρτάται από το μέγεθος του τυπικού σφάλματος, το οποίο με τη σειρά του εξαρτάται από το μέγεθος του δείγματος και, όταν εξετάζουμε μια αριθμητική μεταβλητή, η μεταβλητότητα των δεδομένων παράγει μεγαλύτερα διαστήματα εμπιστοσύνης από τις μελέτες ενός μεγάλου συνόλου δεδομένων λίγων μεταβλητών .

Το CI περιλαμβάνει αξίες ιδιαίτερου ενδιαφέροντος;

Μπορείτε να ελέγξετε εάν η πιθανή τιμή για μια παράμετρο πληθυσμού εμπίπτει στο διάστημα εμπιστοσύνης. Εάν ναι, τα αποτελέσματα είναι συνεπή με αυτήν την πιθανή τιμή. Εάν όχι, τότε είναι απίθανο (για ένα διάστημα εμπιστοσύνης 95%, η πιθανότητα είναι σχεδόν 5%) η παράμετρος να έχει αυτήν την τιμή.

Υπάρχουν δύο τύποι εκτιμήσεων στις στατιστικές: σημειακή και μεσοδιάστημα. Σημειακή εκτίμησηείναι ένα ενιαίο δείγμα στατιστικής που χρησιμοποιείται για την εκτίμηση μιας παραμέτρου πληθυσμού. Για παράδειγμα, ο μέσος όρος του δείγματος είναι μια βαθμολογική εκτίμηση μαθηματική προσδοκίαπληθυσμό και διακύμανση δείγματος S 2- σημειακή εκτίμηση της διακύμανσης του πληθυσμού σ 2. Έχει αποδειχθεί ότι ο μέσος όρος του δείγματος είναι μια αμερόληπτη εκτίμηση των μαθηματικών προσδοκιών του πληθυσμού. Ένας μέσος όρος δείγματος ονομάζεται αμερόληπτος επειδή ο μέσος όρος όλων των δειγμάτων σημαίνει (με το ίδιο μέγεθος δείγματος) n) ισούται με τη μαθηματική προσδοκία του γενικού πληθυσμού.

Για τη διακύμανση του δείγματος S 2έγινε μια αμερόληπτη εκτίμηση της διακύμανσης του πληθυσμού σ 2, ο παρονομαστής της διακύμανσης του δείγματος πρέπει να οριστεί ίσος με n – 1 , αλλά όχι n. Με άλλα λόγια, η διακύμανση του πληθυσμού είναι ο μέσος όρος όλων των πιθανών διακυμάνσεων του δείγματος.

Κατά την εκτίμηση των παραμέτρων πληθυσμού, θα πρέπει να λαμβάνεται υπόψη ότι δειγματοληπτικά στατιστικά στοιχεία όπως , εξαρτώνται από συγκεκριμένα δείγματα. Για να λάβουμε υπόψη αυτό το γεγονός, να αποκτήσουμε εκτίμηση διαστήματοςμαθηματική προσδοκία του γενικού πληθυσμού, αναλύστε την κατανομή των μέσων δειγμάτων (για περισσότερες λεπτομέρειες, βλ.). Το κατασκευασμένο διάστημα χαρακτηρίζεται από ένα ορισμένο επίπεδο εμπιστοσύνης, το οποίο αντιπροσωπεύει την πιθανότητα να εκτιμηθεί σωστά η πραγματική παράμετρος πληθυσμού. Παρόμοια διαστήματα εμπιστοσύνης μπορούν να χρησιμοποιηθούν για την εκτίμηση της αναλογίας ενός χαρακτηριστικού Rκαι η κύρια κατανεμημένη μάζα του πληθυσμού.

Κατεβάστε τη σημείωση σε ή μορφή, παραδείγματα σε μορφή

Κατασκευή ενός διαστήματος εμπιστοσύνης για τη μαθηματική προσδοκία του πληθυσμού με γνωστή τυπική απόκλιση

Κατασκευή ενός διαστήματος εμπιστοσύνης για το μερίδιο ενός χαρακτηριστικού στον πληθυσμό

Αυτή η ενότητα επεκτείνει την έννοια του διαστήματος εμπιστοσύνης σε κατηγορικά δεδομένα. Αυτό μας επιτρέπει να εκτιμήσουμε το μερίδιο του χαρακτηριστικού στον πληθυσμό Rχρησιμοποιώντας κοινόχρηστο δείγμα Rμικρό= X/n. Όπως αναφέρεται, εάν οι ποσότητες nRΚαι n(1 – p)υπερβείτε τον αριθμό 5, η διωνυμική κατανομή μπορεί να προσεγγιστεί ως κανονική. Επομένως, για να εκτιμηθεί το μερίδιο ενός χαρακτηριστικού στον πληθυσμό Rείναι δυνατό να κατασκευαστεί ένα διάστημα του οποίου το επίπεδο εμπιστοσύνης είναι ίσο με (1 – α)χ100%.


Οπου Πμικρό- αναλογία δείγματος του χαρακτηριστικού ίση με Χ/n, δηλ. αριθμός επιτυχιών διαιρούμενος με μέγεθος δείγματος, R- το μερίδιο του χαρακτηριστικού στο γενικό πληθυσμό, Ζ- κρίσιμη τιμή της τυποποιημένης κανονικής κατανομής, n- το μέγεθος του δείγματος.

Παράδειγμα 3.Ας υποθέσουμε ότι ένα δείγμα αποτελούμενο από 100 τιμολόγια που συμπληρώθηκαν τον τελευταίο μήνα εξάγεται από το πληροφοριακό σύστημα. Ας πούμε ότι 10 από αυτά τα τιμολόγια συντάχθηκαν με λάθη. Ετσι, R= 10/100 = 0,1. Το επίπεδο εμπιστοσύνης 95% αντιστοιχεί στην κρίσιμη τιμή Z = 1,96.

Έτσι, η πιθανότητα μεταξύ 4,12% και 15,88% των τιμολογίων να περιέχουν σφάλματα είναι 95%.

Για ένα δεδομένο μέγεθος δείγματος, το διάστημα εμπιστοσύνης που περιέχει την αναλογία του χαρακτηριστικού στον πληθυσμό φαίνεται ευρύτερο από ό,τι για ένα συνεχές τυχαία μεταβλητή. Αυτό συμβαίνει επειδή οι μετρήσεις μιας συνεχούς τυχαίας μεταβλητής περιέχουν περισσότερες πληροφορίες από τις μετρήσεις κατηγορικών δεδομένων. Με άλλα λόγια, τα κατηγορικά δεδομένα που λαμβάνουν μόνο δύο τιμές περιέχουν ανεπαρκείς πληροφορίες για την εκτίμηση των παραμέτρων της κατανομής τους.

ΣΕυπολογισμός εκτιμήσεων που εξάγονται από έναν πεπερασμένο πληθυσμό

Εκτίμηση μαθηματικής προσδοκίας.Διορθωτικός συντελεστής για τον τελικό πληθυσμό ( fpc) χρησιμοποιήθηκε για τη μείωση του τυπικού σφάλματος κατά έναν παράγοντα. Κατά τον υπολογισμό των διαστημάτων εμπιστοσύνης για εκτιμήσεις παραμέτρων πληθυσμού, εφαρμόζεται ένας συντελεστής διόρθωσης σε περιπτώσεις όπου τα δείγματα λαμβάνονται χωρίς να επιστραφούν. Έτσι, ένα διάστημα εμπιστοσύνης για τη μαθηματική προσδοκία που έχει ένα επίπεδο εμπιστοσύνης ίσο με (1 – α)χ100%, υπολογίζεται με τον τύπο:

Παράδειγμα 4.Για να δείξουμε τη χρήση του συντελεστή διόρθωσης για έναν πεπερασμένο πληθυσμό, ας επιστρέψουμε στο πρόβλημα του υπολογισμού του διαστήματος εμπιστοσύνης για το μέσο ποσό των τιμολογίων, που συζητήθηκε παραπάνω στο Παράδειγμα 3. Ας υποθέσουμε ότι μια εταιρεία εκδίδει 5.000 τιμολόγια το μήνα και Χ=110,27 δολάρια, μικρό= 28,95 $, Ν = 5000, n = 100, α = 0,05, t 99 = 1,9842. Χρησιμοποιώντας τον τύπο (6) παίρνουμε:

Εκτίμηση του μεριδίου ενός χαρακτηριστικού.Όταν επιλέγετε χωρίς επιστροφή, το διάστημα εμπιστοσύνης για την αναλογία του χαρακτηριστικού που έχει επίπεδο εμπιστοσύνης ίσο με (1 – α)χ100%, υπολογίζεται με τον τύπο:

Διαστήματα εμπιστοσύνης και ηθικά ζητήματα

Κατά τη δειγματοληψία ενός πληθυσμού και την εξαγωγή στατιστικών συμπερασμάτων, συχνά προκύπτουν ηθικά ζητήματα. Το κυριότερο είναι το πώς συμφωνούν τα διαστήματα εμπιστοσύνης και οι σημειακές εκτιμήσεις των δειγματοληπτικών στατιστικών. Οι εκτιμήσεις σημείων δημοσίευσης χωρίς να προσδιορίζονται τα σχετικά μεσοδιαστήματα εμπιστοσύνης (συνήθως στο επίπεδο εμπιστοσύνης 95%) και το μέγεθος του δείγματος από το οποίο προέρχονται μπορεί να δημιουργήσουν σύγχυση. Αυτό μπορεί να δώσει στον χρήστη την εντύπωση ότι η σημειακή εκτίμηση είναι ακριβώς αυτή που χρειάζεται για να προβλέψει τις ιδιότητες ολόκληρου του πληθυσμού. Επομένως, είναι απαραίτητο να γίνει κατανοητό ότι σε οποιαδήποτε έρευνα η εστίαση δεν πρέπει να είναι σε σημειακές εκτιμήσεις, αλλά σε εκτιμήσεις διαστήματος. Εκτός, Ιδιαίτερη προσοχήπρέπει να δοθεί η σωστή επιλογήμεγέθη δειγμάτων.

Τις περισσότερες φορές, τα αντικείμενα της στατιστικής χειραγώγησης είναι τα αποτελέσματα κοινωνιολογικών ερευνών του πληθυσμού για ορισμένα πολιτικά ζητήματα. Σε αυτή την περίπτωση, τα αποτελέσματα της έρευνας δημοσιεύονται στα πρωτοσέλιδα των εφημερίδων, και το λάθος δείγμα έρευναςκαι μεθοδολογία Στατιστική ανάλυσητυπωμένο κάπου στη μέση. Για να αποδειχθεί η εγκυρότητα των ληφθέντων σημειακών εκτιμήσεων, είναι απαραίτητο να υποδειχθεί το μέγεθος του δείγματος βάσει του οποίου ελήφθησαν, τα όρια του διαστήματος εμπιστοσύνης και το επίπεδο σημαντικότητάς του.

Επόμενη σημείωση

Χρησιμοποιούνται υλικά από το βιβλίο Levin et al Statistics for Managers. – Μ.: Williams, 2004. – Σελ. 448–462

Κεντρικό οριακό θεώρημαδηλώνει ότι με ένα αρκετά μεγάλο μέγεθος δείγματος, η κατανομή του δείγματος των μέσων μπορεί να προσεγγιστεί με μια κανονική κατανομή. Αυτή η ιδιότητα δεν εξαρτάται από τον τύπο κατανομής του πληθυσμού.

Ας έχουμε ένας μεγάλος αριθμός απόαντικείμενα με κανονική κατανομή ορισμένων χαρακτηριστικών (για παράδειγμα, μια πλήρης αποθήκη λαχανικών του ίδιου τύπου, το μέγεθος και το βάρος της οποίας ποικίλλει). Θέλετε να μάθετε τα μέσα χαρακτηριστικά ολόκληρης της παρτίδας αγαθών, αλλά δεν έχετε ούτε τον χρόνο ούτε την επιθυμία να μετρήσετε και να ζυγίσετε κάθε λαχανικό. Καταλαβαίνετε ότι αυτό δεν είναι απαραίτητο. Αλλά πόσα κομμάτια θα πρέπει να ληφθούν για έναν επιτόπιο έλεγχο;

Πριν δώσουμε διάφορους τύπους χρήσιμους για αυτήν την κατάσταση, ας θυμηθούμε κάποια σημειογραφία.

Πρώτον, αν όντως μετρούσαμε ολόκληρη την αποθήκη λαχανικών (αυτό το σύνολο στοιχείων ονομάζεται γενικός πληθυσμός), τότε θα γνωρίζαμε με όλη την ακρίβεια που έχουμε στη διάθεσή μας το μέσο βάρος ολόκληρης της παρτίδας. Ας το ονομάσουμε αυτό μέσο όρο Χ μέσος όρος .g en . - γενικός μέσος όρος. Γνωρίζουμε ήδη τι καθορίζεται πλήρως εάν η μέση τιμή και η απόκλιση είναι γνωστές . Αλήθεια, ενώ δεν είμαστε ούτε Χ μέσος όρος γενμικρό Δεν γνωρίζουμε τον γενικό πληθυσμό. Μπορούμε να πάρουμε μόνο ένα συγκεκριμένο δείγμα, να μετρήσουμε τις τιμές που χρειαζόμαστε και να υπολογίσουμε για αυτό το δείγμα τόσο τη μέση τιμή X μέσο όρο όσο και την τυπική απόκλιση S που επιλέξαμε.

Είναι γνωστό ότι εάν ο δειγματοληπτικός μας έλεγχος περιέχει μεγάλο αριθμό στοιχείων (συνήθως το n είναι μεγαλύτερο από 30) και λαμβάνονται πραγματικά τυχαίο, μετά s ο γενικός πληθυσμός δύσκολα θα διαφέρει από την επιλογή S ..

Επιπλέον, για την περίπτωση της κανονικής κατανομής μπορούμε να χρησιμοποιήσουμε τους ακόλουθους τύπους:

Με πιθανότητα 95%


Με πιθανότητα 99%



ΣΕ γενική εικόναμε πιθανότητα P (t)


Η σχέση μεταξύ της τιμής t και της τιμής πιθανότητας P (t), με την οποία θέλουμε να γνωρίζουμε το διάστημα εμπιστοσύνης, μπορεί να ληφθεί από τον ακόλουθο πίνακα:


Έτσι, προσδιορίσαμε σε ποιο εύρος βρίσκεται η μέση τιμή για τον πληθυσμό (με δεδομένη πιθανότητα).

Αν δεν έχουμε αρκετά μεγάλο δείγμα, δεν μπορούμε να πούμε ότι ο πληθυσμός έχει s = S επιλέξτε Επιπλέον, σε αυτή την περίπτωση η εγγύτητα του δείγματος στην κανονική κατανομή είναι προβληματική. Σε αυτήν την περίπτωση, χρησιμοποιούμε επίσης S select αντί s στον τύπο:




αλλά η τιμή του t για μια σταθερή πιθανότητα P(t) θα εξαρτηθεί από τον αριθμό των στοιχείων στο δείγμα n. Όσο μεγαλύτερο είναι το n, τόσο πιο κοντά θα είναι το προκύπτον διάστημα εμπιστοσύνης στην τιμή που δίνεται από τον τύπο (1). Οι τιμές t σε αυτήν την περίπτωση λαμβάνονται από άλλον πίνακα ( Student's t-test), που παρουσιάζουμε παρακάτω:

Τιμές t-test του Student για πιθανότητα 0,95 και 0,99


Παράδειγμα 3.Επιλέχθηκαν τυχαία 30 άτομα από τους υπαλλήλους της εταιρείας. Σύμφωνα με το δείγμα, αποδείχθηκε ότι ο μέσος μισθός (ανά μήνα) είναι 30 χιλιάδες ρούβλια με τυπική απόκλιση 5 χιλιάδες ρούβλια. Προσδιορίστε τον μέσο μισθό στην εταιρεία με πιθανότητα 0,99.

Λύση:Με συνθήκη έχουμε n = 30, X μέσο. =30000, S=5000, P = 0,99. Για να βρούμε το διάστημα εμπιστοσύνης, θα χρησιμοποιήσουμε τον τύπο που αντιστοιχεί στο τεστ του Student. Από τον πίνακα για n = 30 και P = 0,99 βρίσκουμε t = 2,756, επομένως,


εκείνοι. περιζήτητος διαχειριστήςδιάστημα 27484< Х ср.ген < 32516.

Άρα, με πιθανότητα 0,99 μπορούμε να πούμε ότι το διάστημα (27484; 32516) περιέχει μέσα του τον μέσο μισθό στην εταιρεία.

Ελπίζουμε ότι θα χρησιμοποιήσετε αυτήν τη μέθοδο και δεν είναι απαραίτητο να έχετε ένα τραπέζι μαζί σας κάθε φορά. Οι υπολογισμοί μπορούν να πραγματοποιηθούν αυτόματα στο Excel. Ενώ βρίσκεστε στο αρχείο Excel, κάντε κλικ στο κουμπί fx στο επάνω μενού. Στη συνέχεια, επιλέξτε τον «στατιστικό» τύπο μεταξύ των συναρτήσεων και από την προτεινόμενη λίστα στο παράθυρο - STUDAR DISCOVER. Στη συνέχεια, στην προτροπή, τοποθετώντας τον κέρσορα στο πεδίο "πιθανότητα", εισαγάγετε την τιμή της αντίστροφης πιθανότητας (δηλαδή στην περίπτωσή μας, αντί για την πιθανότητα 0,95, πρέπει να πληκτρολογήσετε την πιθανότητα 0,05). Προφανώς, το υπολογιστικό φύλλο έχει σχεδιαστεί με τέτοιο τρόπο ώστε το αποτέλεσμα να απαντά στο ερώτημα πόσο πιθανό είναι να κάνουμε λάθος. Ομοίως, στο πεδίο Degree of Freedom, εισαγάγετε μια τιμή (n-1) για το δείγμα σας.

Διάστημα εμπιστοσύνηςοριακές τιμέςμια στατιστική ποσότητα που, με δεδομένη πιθανότητα εμπιστοσύνης γ, θα βρίσκεται σε αυτό το διάστημα κατά τη δειγματοληψία μεγαλύτερου όγκου. Συμβολίζεται ως P(θ - ε. Στην πράξη, επιλέξτε πιθανότητα εμπιστοσύνηςγ από τιμές αρκετά κοντά στη μονάδα: γ = 0,9, γ = 0,95, γ = 0,99.

Σκοπός της υπηρεσίας. Χρησιμοποιώντας αυτήν την υπηρεσία, μπορείτε να προσδιορίσετε:

  • διάστημα εμπιστοσύνης για τον γενικό μέσο όρο, διάστημα εμπιστοσύνης για τη διακύμανση.
  • διάστημα εμπιστοσύνης για την τυπική απόκλιση, διάστημα εμπιστοσύνης για τη γενική μετοχή.
Η λύση που προκύπτει αποθηκεύεται σε ένα αρχείο Word (βλ. παράδειγμα). Ακολουθεί μια οδηγία βίντεο σχετικά με τον τρόπο συμπλήρωσης των αρχικών δεδομένων.

Παράδειγμα Νο. 1. Σε συλλογικό αγρόκτημα, από ένα συνολικό κοπάδι 1000 προβάτων, 100 πρόβατα υποβλήθηκαν σε κούρεμα επιλεκτικού ελέγχου. Ως αποτέλεσμα, καθιερώθηκε ένα μέσο κούρεμα μαλλιού 4,2 kg ανά πρόβατο. Προσδιορίστε με πιθανότητα 0,99 το μέσο τετραγωνικό σφάλμα του δείγματος κατά τον προσδιορισμό της μέσης κοπής μαλλιού ανά πρόβατο και τα όρια εντός των οποίων περιέχεται η τιμή διάτμησης εάν η απόκλιση είναι 2,5. Το δείγμα δεν είναι επαναλαμβανόμενο.
Παράδειγμα Νο. 2. Από μια παρτίδα εισαγόμενων προϊόντων στο ταχυδρομείο του Βόρειου Τελωνείου της Μόσχας, λήφθηκαν 20 δείγματα του προϊόντος "Α" με τυχαία επαναλαμβανόμενη δειγματοληψία. Ως αποτέλεσμα της δοκιμής, καθορίστηκε η μέση περιεκτικότητα σε υγρασία του προϊόντος "Α" στο δείγμα, η οποία αποδείχθηκε ίση με 6% με τυπική απόκλιση 1%.
Προσδιορίστε με πιθανότητα 0,683 τα όρια της μέσης περιεκτικότητας σε υγρασία του προϊόντος σε ολόκληρη την παρτίδα των εισαγόμενων προϊόντων.
Παράδειγμα Νο. 3. Μια έρευνα σε 36 μαθητές έδειξε ότι ο μέσος αριθμός των σχολικών βιβλίων που διαβάζουν ανά έτος ακαδημαϊκό έτος, αποδείχθηκε ίσο με 6. Λαμβάνοντας υπόψη ότι ο αριθμός των σχολικών βιβλίων που διαβάζει ένας φοιτητής ανά εξάμηνο έχει κανονικός νόμοςκατανομές με τυπική απόκλιση ίση με 6, βρείτε: Α) με αξιοπιστία 0,99, μια εκτίμηση διαστήματος για τη μαθηματική προσδοκία αυτής της τυχαίας μεταβλητής. Β) με ποια πιθανότητα μπορούμε να πούμε ότι ο μέσος αριθμός των σχολικών βιβλίων που διαβάζει ένας φοιτητής ανά εξάμηνο, υπολογιζόμενος από ένα δεδομένο δείγμα, θα αποκλίνει από τη μαθηματική προσδοκία σύμφωνα με απόλυτη τιμήόχι περισσότερο από 2.

Ταξινόμηση διαστημάτων εμπιστοσύνης

Ανά τύπο παραμέτρου που αξιολογείται:

Ανά τύπο δείγματος:

  1. Διάστημα εμπιστοσύνης για άπειρο δείγμα.
  2. Διάστημα εμπιστοσύνης για το τελικό δείγμα.
Το δείγμα ονομάζεται επαναδειγματοληψία, εάν το επιλεγμένο αντικείμενο επιστραφεί στον πληθυσμό πριν από την επιλογή του επόμενου. Το δείγμα ονομάζεται μη επαναλαμβανόμενο, εάν το επιλεγμένο αντικείμενο δεν επιστραφεί στον πληθυσμό. Στην πράξη, συνήθως έχουμε να κάνουμε με μη επαναλαμβανόμενα δείγματα.

Υπολογισμός του μέσου δειγματοληπτικού σφάλματος για τυχαία δειγματοληψία

Η ασυμφωνία μεταξύ των τιμών των δεικτών που λαμβάνονται από το δείγμα και των αντίστοιχων παραμέτρων του γενικού πληθυσμού ονομάζεται σφάλμα αντιπροσωπευτικότητας.
Προσδιορισμοί των κύριων παραμέτρων του γενικού πληθυσμού και του πληθυσμού δείγματος.
Τύποι μέσου δειγματοληπτικού σφάλματος
επανεπιλογήεπανάληψη της επιλογής
για το μέσο όρογια μερίδιογια το μέσο όρογια μερίδιο
Η σχέση μεταξύ του ορίου σφάλματος δειγματοληψίας (Δ) είναι εγγυημένη με κάποια πιθανότητα Р(t),και το μέσο δειγματοληπτικό σφάλμα έχει τη μορφή: ή Δ = t·μ, όπου t– συντελεστής εμπιστοσύνης, που προσδιορίζεται ανάλογα με το επίπεδο πιθανότητας P(t) σύμφωνα με τον πίνακα της ολοκληρωτικής συνάρτησης Laplace.

Τύποι για τον υπολογισμό του μεγέθους του δείγματος χρησιμοποιώντας μια καθαρά τυχαία μέθοδο δειγματοληψίας