Что такое ковариация? Узнайте об этом больше

Руководства

Ковариация Карьера в области Data Science — это еще и открытие своей страсти к данным и анализу. Если у вас есть опыт работы в области статистики или математики, то выбор обучения в области Data Science может стать естественным продолжением ваших карьерных планов. Вы уже знакомы с фундаментальными концепциями, поэтому повышение квалификации может оказаться для вас не сложной задачей. Однако если вы принадлежите к какому-либо другому направлению, вам может быть интересно, что включает в себя обучение наукам о данных? Можете ли вы выбрать курс по Data Science без глубокого понимания основ?

Что такое ковариация? Узнайте об этом больше

Поскольку большинство собеседований при приеме на работу в этой области проверяют вас на знание основ, ваш курс по Data Science будет включать в себя подробное изучение некоторых ключевых теорий статистики. Возможно, вы захотите ознакомиться с этими понятиями, начиная с ковариации. Итак, давайте рассмотрим ковариацию: что это такое и ее значение в статистике и Data Science.

Оглавление

  • Что такое ковариация?
  • Ковариация против корреляции
  • Что такое ковариация в статистике
  • Важность ковариации в Data Science
  • Проблемы реальной жизни, где используется ковариация

Что такое ковариация?

Ковариация измеряет связь между двумя случайными переменными в наборе данных, где переменные изменяются одновременно. Она оценивает общее отклонение от ожидаемых значений.

Ковариация между двумя элементами может быть положительной или отрицательной. Как следует из термина, положительная ковариациядемонстрирует положительную взаимосвязь между двумя переменными. Любые изменения происходят в одном направлении. И наоборот, отрицательная ковариация указывает на обратную взаимосвязь между двумя переменными, когда они изменяются в противоположных направлениях.

Ковариация используется для определения направления изменения переменных, движутся ли они вместе в одном направлении или в обратном. Однако она не указывает на силу связи или зависимость между переменными.

Он демонстрирует определенные характеристики, перечисленные ниже:

  • Ковариация может принимать любые положительные или отрицательные значения.
  • Ковариация не является стандартизированной, так как ее значения варьируются от отрицательной бесконечности до положительной бесконечности.
  • Ковариация измеряется в единицах, путем умножения единицы одной переменной на единицу другой переменной.
  • Ковариация вычисляет переменные даже с разными единицами измерения.
  • Знак ковариации (+ve, -ve) также иллюстрирует линейную связь между переменными.
  • Ковариацию наборов данных с разным масштабом нельзя сравнивать, так как слабая ковариация в одном наборе данных может быть сильной или положительной для другого набора данных с другим масштабом.

Ковариация против корреляции

Как фундаментальные понятия в статистике и теории вероятности, ковариацию часто сравнивают с корреляцией. Они обе оценивают взаимосвязь между заданным набором параметров.переменных и иллюстрируют меры линейной связи между двумя переменными.

Однако коэффициенты ковариации и корреляции отличаются по своим значениям. В то время как ковариация может быть положительной или отрицательной, корреляция может быть положительной, отрицательной или нулевой для некоррелированных переменных.

Другое различие заключается в их размерности. Ковариация вычисляет единицы двух переменных, тогда как Корреляция вычисляет взаимосвязь между двумя переменными или наборами данных.

Поскольку значения ковариации не стандартизированы, мера идеальной линейной связи зависит от данных. Корреляции стандартизированы и способны отображать идеально линейную связь.

Что такое ковариация в статистике

В статистике ковариация определяет, насколько сильно две случайные переменные изменяются вместе, демонстрируя схожее или контрастное поведение. Она измеряет степень, в которой две переменные линейно связаны.

Ковариация измеряет совместные изменения двух переменных при их совместном движении. Если между двумя переменными существует связь, она определяет, в каком направлении эта связь.

Рассмотрим таблицу данных с двумя столбцами, X и Y, где переменная X представляет собой температуру в градусах по Фаренгейту, а переменная Y — количество продаж мороженого в рупиях. Ковариация X и Y рассчитывается как COV(X, Y). Она равна сумме произведений разностей каждого элемента и среднего значенияего переменных, все из которых делятся на единицу меньше, чем общее количество предметов в наборе. Поскольку ковариация положительна или больше 1, мы считаем, что существует сильная положительная линейная корреляция между температурой и продажами мороженого.

Аналогично, случаями отрицательной корреляции являются более высокие показатели COVID при меньшем количестве надетых масок и более высокие продажи комнатных обогревателей при снижении температуры.

Важность ковариации в Data Science

В Data Science знания о ковариации используются для манипулирования независимыми переменными с целью наблюдения их влияния на зависимые переменные. Необработанные данные преобразуются в характеристики, которые наилучшим образом представляют рассматриваемую проблему, и используются в качестве переменных-предсказателей, которые хорошо работают с алгоритмами машинного обучения или статистическими моделями.

Например, моделирование влияния скидок выходного дня на поведение покупателей, где независимой переменной является размер скидки, а реакция покупателей — зависимая переменная.

В мире Data Science это называется Feature Engineering, поскольку признаки обычно изображаются в виде столбца в двумерном наборе данных, имеют определенное значение и преобразуются в предикторы.

Реальные проблемы, где используется ковариация

Концепция ковариации используется для решения реальных проблем во многих областях.

В финансах ковариация используется при построении инвестиционных портфелей. Например, ковариация между двумя активами в портфеле используется для балансировкириски путем выбора активов, которые не имеют высокой положительной ковариации друг с другом, так что высокие риски одного актива компенсируют низкие риски другого актива.

Ковариация также используется в повседневном отслеживании эффективности инвестиций путем измерения направленной зависимости между выбранной акцией и эталонным показателем фондового рынка NIFTY 50. Положительная ковариация, которая указывает на то, что цена акции и NIFTY 50 предрасположены к движению в одном направлении, является стандартом, используемым для выбора акций или удержания активов.

В психологии ковариация используется как мера позитивных отношений. Например, взрослая фигура, которая оказывает поддержку, показывает положительную ковариацию с хорошей успеваемостью ребенка в школе. Это объясняется тем, что когда взрослый проявляет больше сочувствия, психическое здоровье и уверенность ребенка повышаются, и его оценки растут; а когда взрослый проявляет меньше поддержки, оценки, скорее всего, снижаются.

Оцените статью
IT советы и лайфхаки, windows, технологии