Линейная алгебра для исследователей данных
Иллюстрация: UCI
«Наша [Ирвинга Капланского и Пола Халмоша] общая философия в отношении линейной алгебры такова: мы думаем в безбазисных терминах, пишем в безбазисных терминах, но когда доходит до серьезного дела, мы запираемся в офисе и вовсю считаем с помощью матриц».
Ирвинг Капланский
Для многих начинающих исследователей данных линейная алгебра становится камнем преткновения на пути к достижению мастерства в выбранной ими профессии.
kdnuggets
В этой статье я попытался собрать основы линейной алгебры, необходимые в повседневной работе специалистам по машинному обучению и анализу данных.
Произведения векторов
Для двух векторов x, y ∈ ℝⁿ их скалярным или внутренним произведением xᵀy
называется следующее вещественное число:
Как можно видеть, скалярное произведение является особым частным случаем произведения матриц. Также заметим, что всегда справедливо тождество
Для двух векторов x ∈ ℝᵐ, y ∈ ℝⁿ (не обязательно одной размерности) также можно определить внешнее произведение xyᵀ ∈ ℝᵐˣⁿ. Это матрица, значения элементов которой определяются следующим образом: (xyᵀ)ᵢⱼ = xᵢyⱼ, то есть
Следом квадратной матрицы A ∈ ℝⁿˣⁿ, обозначаемым tr(A) (или просто trA), называют сумму элементов на ее главной диагонали:
След обладает следующими свойствами:
Для любой матрицы A ∈ ℝⁿˣⁿ: trA = trAᵀ.
Для любой матрицы A ∈ ℝⁿˣⁿ и любого числа t ∈ ℝ: tr(tA) = t trA.
Для любых матриц A,B, таких, что их произведение AB является квадратной матрицей: trAB = trBA.
Для любых матриц A,B,C, таких, что их произведение ABC является квадратной матрицей: trABC = trBCA = trCAB (и так далее — данное свойство справедливо для любого числа матриц).
Нормы
Норму ∥x∥ вектора x можно неформально определить как меру «длины» вектора. Например, часто используется евклидова норма, или норма l₂:
Заметим, что ‖x‖₂²=xᵀx.
Более формальное определение таково: нормой называется любая функция f : ℝn → ℝ, удовлетворяющая четырем условиям:
Для всех векторов x ∈ ℝⁿ: f(x) ≥ 0 (неотрицательность).
f(x) = 0 тогда и только тогда, когда x = 0 (положительная определенность).
Для любых вектора x ∈ ℝⁿ и числа t ∈ ℝ: f(tx) = |t|f(x) (однородность).
Для любых векторов x, y ∈ ℝⁿ: f(x + y) ≤ f(x) + f(y) (неравенство треугольника)
Другими примерами норм являются норма l₁
Все три представленные выше нормы являются примерами норм семейства lp, параметризуемых вещественным числом p ≥ 1 и определяемых как
Нормы также могут быть определены для матриц, например норма Фробениуса:
Линейная независимость и ранг
Множество векторов <x₁, x₂, . xₙ> ⊂ ℝₘ называют линейно независимым, если никакой из этих векторов не может быть представлен в виде линейной комбинации других векторов этого множества. Если же такое представление какого-либо из векторов множества возможно, эти векторы называют линейно зависимыми. То есть, если выполняется равенство
для некоторых скалярных значений α₁,…, αₙ-₁ ∈ ℝ, то мы говорим, что векторы x₁, . x ₙ линейно зависимы; в противном случае они линейно независимы. Например, векторы
линейно зависимы, так как x₃ = −2xₙ + x₂.
Столбцовым рангом матрицы A ∈ ℝᵐˣⁿ называют число элементов в максимальном подмножестве ее столбцов, являющемся линейно независимым. Упрощая, говорят, что столбцовый ранг — это число линейно независимых столбцов A. Аналогично строчным рангом матрицы является число ее строк, составляющих максимальное линейно независимое множество.
Оказывается (здесь мы не будем это доказывать), что для любой матрицы A ∈ ℝᵐˣⁿ столбцовый ранг равен строчному, поэтому оба этих числа называют просто рангом A и обозначают rank(A) или rk(A); встречаются также обозначения rang(A), rg(A) и просто r(A). Вот некоторые основные свойства ранга:
Для любой матрицы A ∈ ℝᵐˣⁿ: rank(A) ≤ min(m,n). Если rank(A) = min(m,n), то A называют матрицей полного ранга.
Для любой матрицы A ∈ ℝᵐˣⁿ: rank(A) = rank(Aᵀ).
Для любых матриц A ∈ ℝᵐˣⁿ, B ∈ ℝn×p: rank(AB) ≤ min(rank(A),rank(B)).
Ортогональные матрицы
Два вектора x, y ∈ ℝⁿ называются ортогональными, если xᵀy = 0. Вектор x ∈ ℝⁿ называется нормированным, если ||x||₂ = 1. Квадратная м
атрица U ∈ ℝⁿˣⁿ называется ортогональной, если все ее столбцы ортогональны друг другу и нормированы (в этом случае столбцы называют ортонормированными). Заметим, что понятие ортогональности имеет разный смысл для векторов и матриц.
Непосредственно из определений ортогональности и нормированности следует, что
Другими словами, результатом транспонирования ортогональной матрицы является матрица, обратная исходной. Заметим, что если U не является квадратной матрицей (U ∈ ℝᵐˣⁿ, n < m), но ее столбцы являются ортонормированными, то UᵀU = I, но UUᵀ ≠ I. Поэтому, говоря об ортогональных матрицах, мы будем по умолчанию подразумевать квадратные матрицы.
Еще одно удобное свойство ортогональных матриц состоит в том, что умножение вектора на ортогональную матрицу не меняет его евклидову норму, то есть
для любых вектора x ∈ ℝⁿ и ортогональной матрицы U ∈ ℝⁿˣⁿ.
TimoElliott
Область значений и нуль-пространство матрицы
Линейной оболочкой множества векторов <x₁, x₂, . xₙ> является множество всех векторов, которые могут быть представлены в виде линейной комбинации векторов <x₁, . xₙ>, то есть
Областью значений R(A) (или пространством столбцов) матрицы A ∈ ℝᵐˣⁿ называется линейная оболочка ее столбцов. Другими словами,
Нуль-пространством, или ядром матрицы A ∈ ℝᵐˣⁿ (обозначаемым N(A) или ker A), называют множество всех векторов, которые при умножении на A обращаются в нуль, то есть
Квадратичные формы и положительно полуопределенные матрицы
Для квадратной матрицы A ∈ ℝⁿˣⁿ и вектора x ∈ ℝⁿ квадратичной формой называется скалярное значение xᵀ Ax. Распишем это выражение подробно:
Симметричная матрица A ∈ ⁿ называется положительно определенной, если для всех ненулевых векторов x ∈ ℝⁿ справедливо неравенство xᵀAx > 0. Обычно это обозначается как
(или просто A > 0), а множество всех положительно определенных матриц часто обозначают
Симметричная матрица A ∈ ⁿ называется положительно полуопределенной, если для всех векторов справедливо неравенство xᵀ Ax ≥ 0. Это записывается как
(или просто A ≥ 0), а множество всех положительно полуопределенных матриц часто обозначают
Аналогично симметричная матрица A ∈ ⁿ называется отрицательно определенной
, если для всех ненулевых векторов x ∈ ℝⁿ справедливо неравенство xᵀAx < 0.
Далее, симметричная матрица A ∈ ⁿ называется отрицательно полуопределенной (
), если для всех ненулевых векторов x ∈ ℝⁿ справедливо неравенство xᵀAx ≤ 0.
Наконец, симметричная матрица A ∈ ⁿ называется неопределенной, если она не является ни положительно полуопределенной, ни отрицательно полуопределенной, то есть если существуют векторы x₁, x₂ ∈ ℝⁿ такие, что
Собственные значения и собственные векторы
Для квадратной матрицы A ∈ ℝⁿˣⁿ комплексное значение λ ∈ ℂ и вектор x ∈ ℂⁿ будут соответственно являться собственным значением и собственным вектором, если выполняется равенство
На интуитивном уровне это определение означает, что при умножении на матрицу A вектор x сохраняет направление, но масштабируется с коэффициентом λ. Заметим, что для любого собственного вектора x ∈ ℂⁿ и скалярного значения с ∈ ℂ справедливо равенство A(cx) = cAx = cλx = λ(cx). Таким образом, cx тоже является собственным вектором. Поэтому, говоря о собственном векторе, соответствующем собственному значению λ, мы обычно имеем в виду нормализованный вектор с длиной 1 (при таком определении все равно сохраняется некоторая неоднозначность, так как собственными векторами будут как x, так и –x, но тут уж ничего не поделаешь).
Перевод статьи был подготовлен в преддверии старта курса «Математика для Data Science». Также приглашаем всех желающих посетить бесплатный демоурок, в рамках которого рассмотрим понятие линейного пространства на примерах, поговорим о линейных отображениях, их роли в анализе данных и порешаем задачи.
Значение словосочетания «симметричная матрица»
Это означает, что она равна её транспонированной матрице:
симметричная матрица
1. матем. квадратная матрица, сохраняющая свой вид при транспонировании
Делаем Карту слов лучше вместе
/>Привет! Меня зовут Лампобот, я компьютерная программа, которая помогает делать Карту слов. Я отлично умею считать, но пока плохо понимаю, как устроен ваш мир. Помоги мне разобраться!
Спасибо! Я стал чуточку лучше понимать мир эмоций.
Вопрос: сбитенщик — это что-то нейтральное, положительное или отрицательное?
Ассоциации к слову «матрица»
Синонимы к словосочетанию «симметричная матрица»
Сочетаемость слова «симметричный»
Сочетаемость слова «матрица»
Понятия, связанные со словосочетанием «симметричная матрица»
В математике (общей алгебре) многочлен от нескольких переменных над полем называется гармоническим, если лапласиан этого многочлена равен нулю.
В классической механике ско́бки Пуассо́на (также возможно ско́бка Пуассо́на и скобки Ли) — это оператор, играющий центральную роль в определении эволюции во времени динамической системы. Эта операция названа в честь С.-Д. Пуассона.
Симметричная матрица
Симметричной называют квадратную матрицу, элементы которой симметричны относительно A <\displaystyle A>, что ∀ i , j : a i j = a j i <\displaystyle \forall i,j:a_
Это означает, что она равна её транспонированной матрице:
Примеры [ ]
Свойства [ ]
Симметричная матрица всегда:
- квадратная
- имеет действительные a i j ∗ a j i = 0 <\displaystyle a_
*a_ =0>
![]() |
Это незавершённая статья по алгебре. Вы можете помочь проекту, исправив и дополнив её. |
Эта страница использует содержимое раздела Википедии на русском языке. Оригинальная статья находится по адресу: Симметричная матрица. Список первоначальных авторов статьи можно посмотреть в истории правок. Эта статья так же, как и статья, размещённая в Википедии, доступна на условиях CC-BY-SA .
Симметричная матрица
Матрица имеет вид $$ A=\left( \begin
Теорема. Для любой матрицы $ A_<> $ матрицы $ A_<>A^ <\top>$ и $ A^ <\top>A $ — симметричны. Для любой квадратной матрицы $ A_<> $ матрица $ A_<>+A^ <\top>$ — симметрична.
Определитель
Теорема [Кэли]. В полном разложении определителя симметричной матрицы порядка $ n $ обозначим $ \mathfrak s_n $ число слагаемых, $ \mathfrak s_n^ <(+)>$ — число слагаемых с положительным знаком, $ \mathfrak s_n^ <(-)>$ — число слагаемых с отрицательным знаком, а $ \mathfrak d_n =\mathfrak s_n^ <(+)>— \mathfrak s_n^ <(-)>$. Имеют место соотношения:
$$ \mathfrak s_
Имеют место пределы:
Миноры: тождества Кронекера
Теорема [Кронекер]. Для симметричной матрицы $ A_<> $ порядка $ n \ge k+1 $ имеет место тождество
$$ A\left(\begin
Пример. Для $ k=4 $:
В настоящем разделе минор матрицы $ A $ $$ A\left( \begin
Теорема. Если $ \mathfrak r = \operatorname
Произведение
Теорема. Для того, чтобы произведение симметричных матриц $ A $ и $ B $ было симметричной матрицей необходимо и достаточно, чтобы матрицы $ A $ и $ B $ коммутировали: $ AB = BA $.
Обратная матрица
Теорема. Обратная к симметричной матрице (если существует) будет симметричной матрицей.
Характеристический полином, собственные числа, собственные векторы
Теорема 1. Все собственные числа симметричной матрицы вещественны.
Доказательство ☞ ЗДЕСЬ.
Если $ \lambda=0 $ корень кратности $ \mathfrak m $ характеристического полинома симметричной матрицы $ A $, т.е.
$$ \det (A-\lambda E)\equiv(-1)^n \lambda^n+a_1\lambda^
Если в характеристическом полиноме некоторый коэффициент $ a_j $ при $ j \not\in \ <0,n\>$ обращается в нуль, то соседние с ним в нуль не обращаются и имеют различные знаки: $ a_
Теорема 2. Собственные векторы, принадлежащие различным собственным числам симметричной матрицы $ A_<> $, ортогональны, т.е. если $ \mathfrak X_1 $ принадлежит собственному числу $ \lambda_ <1>$, а $ \mathfrak X_2 $ принадлежит собственному числу $ \lambda_ <2>$ и $ \lambda_1 \ne \lambda_2 $, то
Локализация собственных чисел
Теорема 3 [Коши]. Для симметричной матрицы $ A_<> $ число ее собственных чисел, лежащих на интервале $ ]a,b_<>[ $, определяется по формуле:
Доказательство и примеры ☞ ЗДЕСЬ.
Согласно этой теореме, главные миноры матрицы $ A-\lambda\, E $ играют роль системы полиномов Штурма для характеристического полинома симметричной матрицы $ A_<> $.
$$ A_1,A_2,\dots,A_
Численные методы нахождения собственных чисел
QR-алгоритм поиска всех собственных чисел ☞ ЗДЕСЬ.
Часто в приложениях требуется вычислить значения не всех собственных чисел симметричной матрицы, а только небольшого (по сравнению с порядком матрицы) количества максимальных по модулю. Численный метод решения этой задачи изложен ☞ ЗДЕСЬ.
Диагонализуемость
Теорема 4. Существует ортогональная матрица $ P_<> $, приводящая симметричную матрицу $ A_<> $ к диагональному виду:
Доказательство особенно просто в случае когда все собственные числа $ \lambda_1,\dots, \lambda_n $ различны. На основании теоремы 1 матрица $ A_<> $ диагонализуема над множеством вещественных чисел и на основании теоремы 2 матрица $ P $, приводящая к диагональному виду, может быть выбрана ортогональной.
Для общего случая доказательство производится индукцией по порядку $ n $ матрицы $ A $. Окончание доказательства ☞ ЗДЕСЬ. ♦
Теорема утверждает что даже при наличии кратных корней у характеристического полинома $$ f(\lambda)=(-1)^n(\lambda — \lambda_1)^<<\mathfrak m>_1> \times \dots \times (\lambda — \lambda_<\mathfrak r>)^<<\mathfrak m>_<\mathfrak r>>, \quad <\mathfrak m>_1+\dots+<\mathfrak m>_<<\mathfrak r>>=n, \ \lambda_k \ne \lambda_ <\ell>\ npu \ k \ne \ell $$ алгебраическая кратность собственного числа $ \lambda_j $ совпадает с его геометрической кратностью: $$\operatorname
Пример. Диагонализовать матрицу
Решение. Имеем: $$ \det (A-\lambda E) \equiv (\lambda-3)(\lambda+3)(\lambda-1)^3(\lambda+1)^3 \, . $$ Ищем собственные векторы. Для простых собственных чисел: $$ \lambda_1=-3 \ \Rightarrow \ \mathfrak X_1=\left[1,-1,1,,-1,-1,1,-1,1\right]^ <\top>\ ; $$ $$ \lambda_2=3 \ \Rightarrow \ \mathfrak X_2=\left[-1,-1,-1,-1,1,1,1,1\right]^ <\top>\ . $$ Эти столбцы войдут в состав матрицы $ P $, только их надо нормировать: $ \mathfrak X_
Квадратичная форма
Экстремальное свойство собственных чисел
Пусть уравнение $ X^<^<\top>>A X=1 $ задает эллипсоид в $ \mathbb R^3 $, т.е. квадратичная форма положительно определена. Построить посылочный ящик минимального объема (минимальный параллелепипед), содержащий данный эллипсоид.
Замеченное свойство собственных чисел симметричной матрицы распространяется и в многомерное пространство. Традиционно его формулируют в несколько ином виде — хотя и менее наглядном, но более ориентированном на приложения в задачах механики и статистики.
Задача. Найти условные экстремумы квадратичной формы $ F(X)=X^<^<\top>>A X $ на единичной сфере $$ \mathbb S= \< X\in \mathbb R^n \mid x_1^2+\dots+ x_n^2=1 \>\, . $$
В курсе математического анализа показывается, что, во-первых, указанные экстремумы существуют 2) , и, во-вторых, могут быть найдены применением метода множителей Лагранжа.
Теорема. Если $ \lambda_ <\max>$ — максимальное, а $ \lambda_ <\min>$ — минимальное собственные числа матрицы $ A $, то
$$ \max_
Доказательство. Применяем метод множителей Лагранжа, т.е. составляем функцию $$L(X,\lambda) = F(X)- \lambda (X^<\top>X-1)$$ и ищем ее абсолютные экстремумы (как функции $ (n+1) $-го аргумента). На основании теоремы о стационарных точках полинома эти экстремумы должны достигаться на вещественных решениях системы уравнений $$ \left\< \begin
Еще один вариант экстремального свойства симметричной матрицы излагается ☞ ЗДЕСЬ.
Кососимметричная матрица
Эрмитова матрица
Обобщение понятия симметричной матрицы на матрицы с комплексными элементами можно было бы формально произвести по той же определяющей формуле $ A=A^ <\top>$. Однако такое обобщение практически не используется ввиду потери ряда полезных свойств вещественных симметричных матриц. Вместо этого используют матрицы вида $$ A=P+ \mathbf i Q \quad \mbox <при>\ \
\in \mathbb R^