Quiz – Wstępna analiza danych
>Strona główna<
Wylosuj 1 pytanie
📘 Pytania z PDF 1
1. Która z poniższych miar położenia jest odporna na wartości odstające?
a) Średnia arytmetyczna
b) Modalna
c) Mediana
d) Średnia harmoniczna
2. Co oznacza symbol
ni
w szeregu punktowym?
a) Wartość cechy
b) Liczebność względna
c) Liczebność absolutna
d) Liczba przedziałów
3. W jakim przypadku stosujemy średnią harmoniczną?
a) Gdy cechy są dynamiczne
b) Gdy dane są procentowe
c) Gdy analizujemy natężenie (np. prędkość)
d) Gdy dane mają wiele modalnych
4. Co najlepiej reprezentuje przeciętną wartość, gdy występują zarobki skrajnie wysokie?
a) Średnia arytmetyczna
b) Modalna
c) Mediana
d) Średnia geometryczna
5. Które z poniższych twierdzeń o średniej arytmetycznej jest prawdziwe?
a) Średnia arytmetyczna zawsze znajduje się poza zakresem danych
b) Suma odchyleń od średniej wynosi 0
c) Średnia nie zmienia się pod wpływem wartości odstających
d) Średnia jest zawsze większa od mediany
6. Kiedy stosujemy średnią geometryczną?
a) Gdy dane są w formie przedziałowej
b) Gdy analizujemy tempo zmian
c) Gdy dane zawierają wartości odstające
d) Gdy dane mają wiele mod
7. Co najlepiej opisuje modalną?
a) Wartość średnią
b) Wartość cechy, która występuje najczęściej
c) Mediana zestawu danych
d) Odchylenie standardowe
8. Jaką wadę ma modalna?
a) Jest trudna do obliczenia
b) Jest wrażliwa na wartości odstające
c) Jest niestabilna przy drobnych zmianach danych
d) Zawsze wymaga szeregu przedziałowego
9. Jak poprawnie obliczyć medianę?
a) Jako wartość największą w zbiorze
b) Bez sortowania danych
c) Po posortowaniu danych i wybraniu wartości środkowej
d) Jako średnią arytmetyczną dwóch największych wartości
10. Ile przedziałów klasowych zaleca się używać w histogramie?
a) 3
b) 5
c) Około √n (pierwiastek z liczby obserwacji)
d) Zawsze 10
📙 Pytania z PDF 2
11. Które z poniższych oznacza wariancję dla próby?
a) σ²
b) s²
c) μ²
d) Var(X)
12. Co mierzy odchylenie standardowe?
a) Zmienność względem średniej
b) Liczbę przedziałów klasowych
c) Wartość maksymalną
d) Liczebność próby
13. Czym jest rozstęp?
a) Suma kwadratów odchyleń
b) Różnica między średnią a medianą
c) Różnica między największą a najmniejszą wartością
d) Połowa przedziału klasowego
14. Która z poniższych miar jest najbardziej wrażliwa na wartości odstające?
a) Mediana
b) Modalna
c) Rozstęp
d) Odchylenie ćwiartkowe
15. Jak obliczyć współczynnik zmienności?
a) Odchylenie standardowe × średnia
b) Odchylenie standardowe ÷ średnia × 100%
c) Średnia ÷ odchylenie standardowe
d) Odchylenie ćwiartkowe ÷ średnia
16. Które oznaczenie odpowiada wariancji populacji?
a) s²
b) σ²
c) μ²
d) Var(s)
17. Czym jest odchylenie ćwiartkowe (QD)?
a) Różnica między medianą a średnią
b) Połowa różnicy między kwartylem górnym i dolnym
c) Średnia z odchyleń standardowych
d) Różnica między wartością maksymalną a minimalną
18. Która z poniższych miar jest najbardziej odporna na wartości odstające?
a) Wariancja
b) Odchylenie standardowe
c) Rozstęp
d) Odchylenie ćwiartkowe
19. Która miara zróżnicowania nie ma jednostki?
a) Wariancja
b) Odchylenie standardowe
c) Współczynnik zmienności
d) Rozstęp
20. Co oznacza, że zestaw danych jest bardziej rozproszony?
a) Dane są bliżej średniej
b) Wariancja i odchylenie standardowe są niższe
c) Wariancja i odchylenie standardowe są wyższe
d) Średnia jest bliska mediany
📗 Pytania z PDF 3
21. Co przedstawia wykres pudełkowy (boxplot)?
a) Tylko wartości średnie i rozstęp
b) Kwartyle, medianę i wartości odstające
c) Rozkład normalny
d) Wariancję i odchylenie standardowe
22. Jakie dane można łatwo porównać na wykresie pudełkowym?
a) Liczność prób
b) Średnie arytmetyczne
c) Zróżnicowanie i rozstęp między grupami
d) Korelacje między zmiennymi
23. Gdzie znajduje się mediana na wykresie pudełkowym?
a) Na górze pudełka
b) Pośrodku pudełka jako linia
c) Jako lewy koniec wąsa
d) Jako wartość odstająca
24. Co oznacza asymetria w wykresie pudełkowym?
a) Dane są jednolicie rozłożone
b) Mediana nie jest pośrodku pudełka
c) Wariancja jest równa 0
d) Wszystkie dane są wartościami odstającymi
25. Co możemy wyczytać z długości „wąsów” w boxplocie?
a) Liczbę wartości modalnych
b) Zakres rozrzutu poza kwartylem
c) Liczność próby
d) Średnią ważoną
📕 Pytania z PDF 4
26. Co przedstawia histogram?
a) Liczność prób w poszczególnych klasach
b) Wariancję w grupach
c) Rozkład korelacji
d) Zależność dwóch zmiennych
27. Czym różni się histogram od wykresu słupkowego?
a) Histogram ma przerwy między słupkami
b) Wykres słupkowy przedstawia dane ciągłe
c) Histogram dotyczy danych ciągłych, a słupkowy dyskretnych
d) Histogram pokazuje zależność dwóch zmiennych
28. Co to jest wykres Pareto?
a) Wykres pokazujący tylko średnie
b) Histogram z linią skumulowaną, uporządkowany malejąco
c) Wykres rozrzutu wartości odstających
d) Boxplot z dodatkowymi osiami
29. Kiedy stosujemy wykres Pareto?
a) Gdy chcemy znaleźć najczęstsze przyczyny problemu
b) Gdy chcemy sprawdzić zależność dwóch zmiennych
c) Gdy badamy rozkład normalny
d) Gdy szukamy wartości odstających
30. Co wyróżnia wykres Pareto?
a) Pokazuje kumulację wpływu najważniejszych kategorii
b) Przedstawia dane tylko procentowo
c) Ma przerwy między słupkami
d) Dotyczy tylko rozkładów normalnych
📔 Pytania z PDF 5
31. Co to jest korelacja?
a) Zależność między wartościami nominalnymi
b) Miara związku między dwiema zmiennymi ilościowymi
c) Liczba klas w histogramie
d) Suma błędów średnich
32. Jak interpretujemy współczynnik korelacji bliski 1?
a) Brak związku między zmiennymi
b) Słaba ujemna korelacja
c) Silna dodatnia korelacja
d) Silna ujemna korelacja
33. Kiedy występuje brak korelacji?
a) Gdy korelacja wynosi 0
b) Gdy dane są proporcjonalne
c) Gdy korelacja jest bliska 1
d) Gdy wykres pokazuje liniowy trend
34. Który wykres najlepiej obrazuje korelację?
a) Boxplot
b) Histogram
c) Wykres rozrzutu (scatterplot)
d) Wykres słupkowy
35. Co oznacza korelacja ujemna?
a) Gdy jedna zmienna rośnie, druga też rośnie
b) Gdy jedna zmienna rośnie, druga maleje
c) Brak związku między zmiennymi
d) Gdy obie zmienne są niezależne statystycznie
📒 Pytania z PDF 6
36. Co to jest regresja liniowa?
a) Analiza wariancji między kilkoma zmiennymi
b) Wyznaczenie linii najlepszego dopasowania dla danych
c) Obliczanie mediany z prób
d) Grupowanie danych według klas
37. Co oznacza współczynnik kierunkowy w równaniu regresji?
a) Punkt przecięcia z osią Y
b) Nachylenie prostej regresji – zmiana Y przy jednostkowej zmianie X
c) Liczność danych
d) Współczynnik korelacji
38. Jakie jest równanie prostej regresji liniowej?
a) y = ax² + b
b) y = a/x + b
c) y = ax + b
d) y = √x + b
39. Co to jest punkt przecięcia z osią Y (wyraz wolny b)?
a) Wartość Y, gdy X = 1
b) Wartość Y, gdy X = 0
c) Różnica między Y a X
d) Iloczyn X i Y
40. Do czego służy regresja liniowa?
a) Do badania wariancji próbki
b) Do prognozowania wartości jednej zmiennej na podstawie drugiej
c) Do liczenia wartości odstających
d) Do tworzenia histogramu
📓 Pytania z PDF 7
41. Czym jest wartość przewidywana?
a) Średnia wszystkich wartości
b) Wartość zmiennej Y obliczona z równania regresji dla danego X
c) Najczęstsza wartość w zbiorze danych
d) Wartość odpowiadająca medianie
42. Co to jest wartość resztowa?
a) Różnica między wartością zmiennej zależnej a wartością przewidywaną
b) Iloczyn zmiennych niezależnych
c) Liczba obserwacji pomniejszona o odchylenie
d) Wariancja populacji
43. Jak wygląda wykres wartości resztowych przy dobrze dopasowanym modelu?
a) Tworzy linię prostą
b) Ma strukturę losową, bez wyraźnego wzorca
c) Jest wykresem kwadratowym
d) Ma postać sinusoidy
44. Jaki wniosek można wyciągnąć z wykresu wartości resztowych z widocznym wzorcem?
a) Model jest dobrze dopasowany
b) Model nie uwzględnia jakiejś istotnej zależności
c) Wszystkie dane są niezależne
d) Współczynnik korelacji wynosi 1
45. Co świadczy o jakości dopasowania modelu regresji?
a) Wartość resztowa bliska zeru
b) Współczynnik kierunkowy większy od 1
c) Suma wartości przewidywanych
d) Liczność próbki
📕 Pytania z PDF 8
46. Do czego służy analiza regresji?
a) Do losowego przyporządkowywania danych
b) Do określenia związku między zmienną zależną a niezależną
c) Do analizy wartości odstających
d) Do obliczania średniej
47. Czym jest zmienna zależna w regresji?
a) Zmienna, którą kontrolujemy
b) Zmienna, której wartość próbujemy przewidzieć
c) Zmienna przyczynowa
d) Zmienna klasyfikacyjna
48. Co to jest estymacja parametrów modelu regresji?
a) Proces wyznaczania błędów resztowych
b) Proces wyznaczania wartości współczynników równania regresji
c) Proces testowania normalności danych
d) Proces tworzenia wykresu rozrzutu
49. Który współczynnik w regresji odpowiada za nachylenie prostej?
a) b
b) a
c) r
d) x
50. Co oznacza wartość b w równaniu regresji y = ax + b?
a) Liczność próby
b) Wartość y, gdy x = 0
c) Nachylenie prostej
d) Odchylenie standardowe
📔 Pytania z PDF 9
51. Na czym polega reguła empiryczna?
a) Dotyczy rozkładu Poissona
b) Mówi, że większość wartości w rozkładzie normalnym mieści się w określonych zakresach odchylenia standardowego
c) Zakłada, że dane są symetryczne
d) Ustalana jest eksperymentalnie dla każdego zbioru danych
52. Ile procent danych mieści się w przedziale μ ± σ wg reguły empirycznej?
a) 50%
b) 68%
c) 95%
d) 99.7%
53. Czym jest wartość oczekiwana?
a) Mediana zbioru danych
b) Średnia ważona wszystkich możliwych wyników
c) Najczęściej występująca wartość
d) Odchylenie od średniej
54. Jaka jest rola wariancji w analizie danych?
a) Pokazuje centralną tendencję
b) Mierzy rozproszenie danych wokół średniej
c) Wskazuje kierunek zależności
d) Umożliwia tworzenie histogramów
55. Co oznacza, że dane są bardziej rozproszone?
a) Mają mniejsze odchylenie standardowe
b) Są bardziej skupione wokół średniej
c) Mają większe odchylenie standardowe i wariancję
d) Są to dane skategoryzowane
📕 Pytania z PDF 10
56. Czym jest Centralne Twierdzenie Graniczne?
a) Mówi o symetrii wykresu rozrzutu
b) Twierdzi, że rozkład średnich z dużych prób zbliża się do normalnego
c) Opisuje błąd standardowy
d) Dotyczy tylko zmiennych kategorycznych
57. Kiedy można stosować Centralne Twierdzenie Graniczne?
a) Tylko przy normalnym rozkładzie populacji
b) Gdy próbka jest mała
c) Przy wystarczająco dużej liczbie obserwacji niezależnie od rozkładu populacji
d) Tylko przy zmiennych nominalnych
58. Co się dzieje z odchyleniem standardowym średnich próbek przy rosnącej liczbie obserwacji?
a) Rośnie
b) Maleje
c) Pozostaje bez zmian
d) Znika
59. Czym jest dystrybucja średnich próbek?
a) Histogram wyników pojedynczej próby
b) Rozkład wszystkich możliwych średnich z prób danej liczności
c) Wariancja próby
d) Średnia arytmetyczna populacji
60. Jak zmienia się kształt rozkładu średnich przy wzroście liczności próby?
a) Staje się bardziej płaski
b) Zbliża się do rozkładu normalnego
c) Staje się dwumodalny
d) Staje się wykładniczy
📘 Pytania z PDF 11
61. Jakie są cechy rozkładu normalnego?
a) Rozkład niesymetryczny z jedną dominantą
b) Dwa wierzchołki, moda różna od średniej
c) Symetryczny, średnia = mediana = moda
d) Wariancja zawsze 0
62. Co oznacza dzwonowaty kształt rozkładu normalnego?
a) Że dane są losowe
b) Że dane skupiają się wokół wartości średniej
c) Że rozkład jest bimodalny
d) Że wszystkie dane mają tę samą wartość
63. Co opisuje funkcja gęstości rozkładu normalnego?
a) Wartość średnią danych
b) Prawdopodobieństwo konkretnej wartości zmiennej ciągłej
c) Liczbę prób
d) Rozrzut próbek wokół mediany
64. Jak obliczyć wartość standaryzowaną Z?
a) Z = x + μ / σ
b) Z = (x − μ) / σ
c) Z = (μ − x) / σ
d) Z = σ / x
65. Gdzie wykorzystywany jest rozkład normalny?
a) Tylko w informatyce
b) W statystyce, psychologii, biologii i wielu innych dziedzinach
c) Tylko do tworzenia wykresów
d) Tylko w analizie korelacji
📙 Pytania z PDF 12
66. Kiedy stosujemy rozkład t Studenta?
a) Gdy próbka ma więcej niż 100 obserwacji
b) Gdy próbka jest mała i nie znamy σ
c) Zawsze, niezależnie od warunków
d) Tylko przy zmiennych kategorycznych
67. Jaką cechą NIE różni się rozkład t od rozkładu normalnego?
a) Symetria
b) Wariancja
c) Kształt zależny od liczności próby
d) Zbieżność do rozkładu wykładniczego
68. Jak wygląda poprawny wzór na wariancję próby?
a) s² = (1/n) Σ(xi − x̄)²
b) s² = (1/n−1) Σ(xi − x̄)²
c) s² = Σ(xi − x̄) / (n+1)
d) s² = Σ(xi − μ)²
69. Jak wygląda wzór na statystykę testową T?
a) T = (x̄ − μ) / σ
b) T = (x̄ − μ) / (s/√n)
c) T = s / (x̄ − μ)
d) T = (μ − x̄) / √n
70. Co oznacza kwantyl t
α,ν
?
a) Średnia rozkładu normalnego
b) Wartość krytyczna rozkładu t dla poziomu istotności α i ν stopni swobody
c) Prawdopodobieństwo błędu typu II
d) Liczność próby pomnożona przez wariancję
Sprawdź odpowiedzi