Odchylenie standardowe to liczba opisująca, jak bardzo rozpraszają się wyniki wokół średniej; im większe, tym bardziej dane są „rozsiane”, im mniejsze, tym bardziej skupione. W statystyce szkolnej spotyka się dwie bardzo podobne definicje: dla całej populacji, gdy mamy komplet danych, oraz dla próby, gdy analizujemy wycinek i chcemy oszacować zmienność populacji. Dla populacji przyjmujemy symbol σ i wzór σ = √(Σ(xi − μ)² / N), gdzie xi to kolejne wartości, μ to średnia z populacji, N to liczebność, a Σ oznacza sumę. Dla próby stosujemy estymator nieobciążony s = √(Σ(xi − x̄)² / (n − 1)), gdzie x̄ to średnia próby, a n liczebność próby; różnica w mianowniku, czyli n − 1 zamiast n, koryguje fakt, że średnią policzyliśmy z tych samych danych i w naturalny sposób „zaniżylibyśmy” rozproszenie, gdybyśmy dzielili przez n. Interpretacja jest prosta: odchylenie standardowe ma te same jednostki co pomiar, więc jeśli liczymy je dla centymetrów, wynik również będzie w centymetrach; liczba mówi, o ile przeciętnie odchylają się wartości od średniej, przy czym „przeciętnie” rozumiemy w sensie pierwiastka z uśrednionych kwadratów odchyleń, co zabezpiecza przed znoszeniem się plusów i minusów. Ćwiczenie na konkretnych liczbach łatwo przeprowadzić opisowo. Weźmy dane 3, 5, 7, 7, 10; średnia x̄ to (3 + 5 + 7 + 7 + 10) / 5 = 32/5 = 6,4. Odchylenia od średniej to kolejno −3,4, −1,4, 0,6, 0,6 i 3,6. Po podniesieniu do kwadratu dostajemy 11,56, 1,96, 0,36, 0,36 i 12,96; suma kwadratów wynosi 27,2. Dla próby liczymy s = √(27,2 / (5 − 1)) = √(27,2 / 4) = √6,8 ≈ 2,6077; dla populacji, gdyby traktować te pięć liczb jako kompletny zbiór, σ = √(27,2 / 5) = √5,44 = 2,332. Te wyniki mówią, że typowe odchylenie od średniej 6,4 wynosi około 2,6 jednostki, jeśli myślimy o próbie, oraz około 2,33, jeśli myślimy o pełnym zbiorze. W praktyce szkolnej łatwiej liczyć, tworząc tabelkę z trzema wierszami myślowymi: wartości, odchylenia, kwadraty odchyleń; w tekście można to zrobić sekwencyjnie, zawsze pilnując, by sumę liczyć dokładnie, bo pojedynczy błąd w kwadracie psuje całość. Po co to wszystko? Odchylenie standardowe jest miarą zmienności ocen, wyników testów, czasów biegu, masy plonów w eksperymencie, a także jakości pomiaru; pozwala porównywać grupy, w których średnie są podobne, ale rozproszenie inne, oraz ocenić, czy pojedynczy wynik jest typowy, czy skrajny. Bardzo przydatna jest normalizacja, czyli przekształcenie z-score z = (x − x̄) / s, które mówi, o ile odchyleń standardowych dany wynik leży od średniej; jeśli z = 1,5, to wynik jest o półtora s powyżej średniej, co w wielu rozkładach oznacza dość dobre osiągnięcie. W zadaniach trzeba uważać na dwie pułapki: mieszanie definicji próby i populacji oraz zapominanie o pierwiastku na końcu; kiedy liczymy wariancję, mamy licznik Σ(xi − x̄)², ale dopiero pierwiastek daje odchylenie w tych samych jednostkach co dane. Druga częsta trudność to zaokrąglenia; najlepiej trzymać więcej miejsc po przecinku w rachunkach pośrednich, a sensownie zaokrąglać dopiero wynik końcowy, na przykład do dwóch miejsc, o ile nie podano inaczej. Jeśli pojawia się waga lub częstość, zamiast surowych danych liczymy sumy ważone, ale idea pozostaje identyczna: odchylenie to pierwiastek z uśrednionych kwadratów odchyleń. Od strony intuicji warto wyobrazić sobie gumkę recepturkę rozciąganą wokół słupków na wykresie; im słupki bardziej się rozchodzą, tym większy „luźny luz” gumki i większe s. W życiu szkolnym wskaźnik pomaga nauczycielom budować sprawiedliwe progi, a uczniom porównać przygotowanie: jeśli dwie klasy mają tę samą średnią z kartkówki, ale w jednej odchylenie jest mniejsze, to rozkład jest bardziej wyrównany; jeżeli większe, to w grupie występuje więcej skrajnych ocen. Umiejętność policzenia s lub σ oraz interpretowania go w kontekście zadania podnosi punktację w arkuszach i buduje zrozumienie, dlaczego sama średnia nie wystarcza, by opisać zjawisko.