[spec] start hypothesis testing
[notes.git] / methods / statistics.tex
index 56cd566e151553f4d58f293dae4b6a6fc016c311..3a205e575c41e43881b0fe4e00e51d62c26437a0 100644 (file)
@@ -69,7 +69,8 @@
       \begin{align*}
         \sigma^2=\operatorname{Var}(x) &= \sum_{i=1}^n p_i (x_i-\mu)^2 \\
         &= \sum (x-\mu)^2 \times \Pr(X=x) \\
-        &= \sum x^2 \times p(x) - \mu^2
+        &= \sum x^2 \times p(x) - \mu^2 \\
+        &= \operatorname{E}(X^2) - [\operatorname{E}(X)]^2
       \end{align*}
     \item \textbf{Standard deviation $\sigma$} - measure of spread in the original magnitude of the data. Found by taking square root of the variance:
       \begin{align*}
@@ -90,6 +91,9 @@
     E(X+Y) &= E(X) + E(Y) \tag{for two random variables}
   \end{align*}
 
+  \subsubsection*{Variance theorems}
+
+  \[ \operatorname{Var}(aX \pm bY \pm c) = a^2 \operatorname{Var}(X) + b^2 \operatorname{Var}(Y) \]
 
   \section{Binomial Theorem}
 
 
   \[ \Pr(X \ge a) = 1 - \Pr(X < a) \]
 
+  \section{Continuous probability}
+
+  \subsection*{Continuous random variables}
+
+  \begin{itemize}
+    \item a variable that can take any real value in an interval
+  \end{itemize}
+
+  \subsection*{Probability density functions}
+
+  \begin{itemize}
+    \item area under curve \( = 1 \implies \int f(x) \> dx = 1\)
+    \item \(f(x) \ge 0 \forall x\)
+    \item pdfs may be linear
+    \item must show sections where \(f(x) = 0\) (use open/closed circles)
+  \end{itemize}
+
+  \[ Pr(a \le X \le b) = \int^b_a f(x) \> dx \]
+
+  \colorbox{cas}{On CAS:} Interactive \(\rightarrow\) Distribution \(\rightarrow\) \verb;normCdf;.
+
+  For function in domain \(a \le x \le b\):
+
+  \[ \operatorname{E}(X) = \int^b_a x f(x) \> dx \]
+
+  \[ \operatorname{sd}(X) = \sqrt{\operatorname{Var}(X)} = \sqrt{\oepratorname{E}(X^2)-[\operatorname{E}(X)]^2} \]
+
 \end{document}