Заняття 2. Математика та статистика для аналізу даних
⮚
Лінійна алгебра, n-вимірний векторний простір
- Базові поняття: матриця, визначник, n-вимірний лінійний векторний простір
- Матричні операції; обернена матриця
- Векторна алгебра: вектор, норма вектора, кут між векторами, скалярний добуток
- Розв’язання задач з використанням модуля NumPy
⮚ Основи математичного аналізу, методи оптимізації. Модуль SciPy
- Функція, способи задання, графік; види функцій
- Поняття похідної, формули та правила диференціювання; застосування похідної
- Функція багатьох змінних; частинні похідні, похідна за напрямом, градієнт
- Методи оптимізації: градієнтний спуск та його модифікації
- Модуль SciPy: чисельні методи, оптимізація
⮚ Основи теорії ймовірностей
- Випадкові події, ймовірність, основні формули
- Випадкові величини, числові характеристики
- Основні закони розподілу: біноміальний, рівномірний, нормальний, експоненційний
- Двовимірна випадкова величина; числові характеристики, поняття коваріації та кореляції
⮚ Статистичний аналіз та візуалізація
- Види даних, генеральна сукупність і вибірка. Обробка первинного статистичного матеріалу, графічне представлення
- Числові характеристики: центральної тенденції (середнє, мода, медіана), положення (квантилі), розсіювання (дисперсія, стандартне відхилення, розмах, інтерквартильний розмах, коефіцієнт варіації), форми (асиметрія, ексцес); коробчаста діаграма
- Математична статистика вивідна: оцінка параметрів та перевірка статистичних гіпотез
⮚ Практичний блок: статистичний аналіз та візуалізація даних з допомогою пакетів Pandas, SciPy, Matplotlib, Seaborn на прикладі заданого датасету