Ортогональное дополнение
Теория- Автор
- Издательство
Как следует из теоремы 2.7, в произвольном линейном пространстве L любое линейное подпространство H имеет прямое дополнение, т.е. такое линейное подпространство H', что H ⊕ H' = L. Такое линейное подпространство H' не является единственным. Однако в случае евклидова пространства среди всех возможных прямых дополнений к данному линейному подпространству одно выделяется.
Определение 3.8. Ортогональным дополнением линейного подпространства H в евклидовом пространстве Ε называют множество H⊥ всех векторов х ∈ Ε, ортогональных каждому вектору линейного подпространства H.
Пример 3.15. В евклидовом пространстве V3 свободных векторов рассмотрим линейное подпространство H векторов, параллельных данной плоскости (см. пример 2.1). Тогда ортогональным дополнением H⊥ будет множество векторов, перпендикулярных к этой плоскости (рис. 3.6, а), в то время как в качестве прямого дополнения H1 можно взять подпространство векторов, коллинеарных произвольной прямой, пересекающей плоскость в единственной точке, т.е. не параллельной плоскости и не лежащей в этой плоскости (рис. 3.6,6). Отметим, что в данном случае H⊥ является линейным подпространством в V3.
Теорема 3.6. Ортогональное дополнение H⊥ линейного подпространства Н в евклидовом подпространстве Ε является линейным подпространством в Ε, причем Ε = Н ⊕ H⊥ и dimH + dimH⊥ = dimΕ.
◄ Чтобы доказать, что H⊥ является линейным подпространством в Ε, нужно проверить условия 1) и 2) определения 2.1. Взяв два произвольных вектора x и у, принадлежащих H⊥, умножим скалярно их сумму на произвольный вектор h ∈ Н. Получим:
(x + у, h) - (x, h) + (у, h) = 0 + 0 = 0,
т.е. для любых векторов x и у из множества H⊥ их сумма x + у принадлежит тому же множеству.
Теперь рассмотрим произведение вектора x ∈ H⊥ на про-извольное действительное число λ. Для произвольного вектора h ∈ H
(λx, h) = λ (x, h) = λ • 0 = 0,
и поэтому λx ∈ H⊥ если x ∈ H⊥. Следовательно, H⊥ является линейным подпространством в Ε.
Отметим, что любой вектор x, принадлежащий пересечению Н ∩ H⊥, ортогонален самому себе: (x, x) = 0, так как любой вектор из H⊥ ортогонален любому вектору подпространства H. Но вектор ортогонален самому себе лишь в том случае, когда он нулевой (аксиома г) скалярного умножения). Поэтому Н ∩ H⊥ = {0}, а сумма Н + H⊥ рассматриваемых линейных подпространств является прямой (см. теорему 2.3). Докажем, что эта прямая сумма совпадает со всем евклидовым пространством Ε.
Выберем некоторый ортонормированный базис f1, ... , fm в линейном подпространстве H и дополним его до базиса f1, ..., fm, fm+1, ... , fn во всем евклидовом пространстве Ε, dimΕ = n. Исходя из этого базиса построим при помощи процесса Грама - Шмидта ортонормированный базис е = (e1 ... еm em+1 ... еn) в Ε. Так как первые m векторов f1, ... , fm исходного базиса попарно ортогональны и имеют единичную длину, процесс ортогонализации оставит их без изменения, т.е. е1 = f1, i = 1,m. Векторы em+1, ..., еn ортогональны каждому из векторов e1, ..., еm базиса линейного подпространства Н и, следовательно, ортогональны Н, так как H = span{e1,... ,еm}. Поэтому все они попадают в ортогональное дополнение H⊥.
Рассмотрим произвольный вектор х ∈ Ε и запишем его разложение по базису е:
x = x1e1+ ... + xnen.
Легко увидеть, что х1 = x1e1 + ... + хmеm есть вектор из Н, x2 = xm+1em+1 + ... + хnеn есть вектор из H⊥, при этом x = x1 + x2. Следовательно, x ∈ H ⊕ H⊥, и так как вектор х выбирался произвольно, то H ⊕ H⊥ = Ε.
Согласно следствию из теоремы 2.5, из соотношения H ⊕ H⊥ = Ε вытекает следующее равенство для размерностей: dimΕ = dimH + dimH⊥ . ►
Следствие 3.1. Каково бы ни было линейное подпространство Н в евклидовом пространстве Ε, любой вектор x ∈ Ε можно однозначно представить в виде
x = h + h⊥ (3.11)
где h ∈ H, h⊥ ∈ H⊥.
◄ Действительно, это утверждение означает, что Ε = H ⊕ H⊥. ►
Вектор h в разложении (3.11) называют ортогональной проекцией вектора х на линейное подпространство H, а вектор h⊥ - ортогональной составляющей вектора х относительно линейного подпространства H.
Как построить ортогональное дополнение к данному линейному подпространству? Пусть линейное подпространство H определено наиболее распространенным способом - как линейная оболочка некоторой системы векторов a1,... , аm. Согласно определению 3.8 ортогонального дополнения, любой вектор х ∈ H⊥ должен быть ортогонален каждому из векторов аi:
(ai,x)=0, i = l,m. (3.12)
Наоборот, если вектор х удовлетворяет системе равенств (3.12), т.е. он ортогонален каждому из векторов аi, то этот вектор ортогонален и любой линейной комбинации системы векторов a1, ..., am (см. 3.5). Значит, х ортогонален каждому вектору линейного подпространства H = span{a1,... ,am} и принадлежит линейному подпространству H⊥.
Итак, система уравнений (3.12) описывает ортогональное дополнение линейного подпространства Н. Запишем эту систему в координатах в некотором ортонормированием базисе е = (e1 ... еn). Пусть векторы аi в этом базисе имеют разложения
a1 = a11e1 + ... + a1nen,
...............................
ai = ai1e1 + ... + ainen,
...............................
am = am1e1 + ... + amnen.
Координаты произвольного вектора х в том же базисе обозначим х1, ..., хn т.е. полагаем, что
х = х1e1 + ... + хnеn.
Тогда в ортонормированном базисе е
(a1,x) = (ai1e1 + ... + ainen, x1e1 + ... + xnen) = ai1x1 + ... + ainxn, i = 1,m.
Таким образом, система (3.12), записанная в координатах относительно ортонормированного базиса е, имеет вид
a11x1 + ... + a1nxn = 0,
.................... (3.13)
am1x1 + ... + amnxn = 0,
т.е. представляет собой однородную систему из m линейных алгебраических уравнений с п неизвестными. Строки матрицы А этой системы совпадают с наборами координат векторов a1, ..., аm. Поэтому матрица А имеет ранг, равный рангу системы векторов a1, ..., am, т.е. этот ранг совпадает с размерностью линейного подпространства Н.
Каждое решение системы (3.13) представляет собой набор координат некоторого вектора из H⊥ и наоборот, любой вектор из H⊥ описывает решение системы (3.13). Поэтому можно сказать, что множество всех решений этой системы есть линейное подпространство H⊥. Согласно теореме 3.6, это подпространство имеет размерность n - dimH = n - RgА. Множество решений однородной системы линейных алгебраических уравнений (СЛАУ) описывается при помощи фундаментальной системы решений. Напомним, что столбцы фундаментальной системы решений линейно независимы, а любое решение однородной СЛАУ представляется в виде линейной комбинации столбцов фундаментальной системы решений. Другими словами, фундаментальная система решений - это базис в подпространстве всех решений данной однородной СЛАУ. Каждый столбец фундаментальной системы решений представляет собой координатную запись вектора линейного подпространства Н⊥ в выбранном базисе е евклидова пространства Ε, при этом такие векторы в совокупности образуют базис подпространства H⊥. Мы здесь можем не различать фундаментальную систему решений системы (3.13) и соответствующий ей базис ортогонального дополнения H⊥.
Пример 3.16. Пусть линейное подпространство Н представляет собой линейную оболочку системы векторов, заданных координатами в некотором фиксированном ортонормированием базисе е четырехмерного евклидова пространства Ε:
Найдем какой-либо базис ортогонального дополнения H⊥.
Записываем систему вида (3.13), используя координаты векторов ai.
и находим ее фундаментальную систему решений. Это можно сделать, например, с помощью приведения матрицы системы к ступенчатому виду методом элементарных преобразований [III]. В качестве базисных переменных выберем x1 и x2. Тогда фундаментальная система решений будет содержать два решения, например:
Cтолбцы найденной фундаментальной системы решений представляют собой координаты двух векторов f1, f2 из Ε, образующих базис линейного подпространства H⊥, но этот базис не является ортонормированным. Чтобы получить ор-онормированный базис H⊥, достаточно применить процесс ортогонализации Грама - Шмидта. Сделав это, находим векторы g1 = f1,
и ортонормированный базис в линейном пространстве H⊥:
Дополнение 3.1. Нормы матриц
В линейном пространстве Мn(R) квадратных матриц порядка n норму можно задавать различными способами. Например, это линейное пространство можно трактовать как n2-мерное линейное арифметическое пространство со стандартным скалярным умножением, которому соответствует евклидова норма. Для матрицы А = (aij) ∈ Мn(R) эта норма имеет вид
Ее называют евклидовой нормой или l2-нормой.
Евклидова норма матрицы никак не связана с расположением элементов матрицы по строкам и столбцам. Это обычно нежелательно, и поэтому она используется редко. Больший интерес представляют нормы матриц, использующие специфику записи матриц. Такая норма может быть связана с некоторой нормой, заданной для столбцов матрицы. Важно также и то, как норма связала с операцией умножения матриц. В этом разделе векторы линейных арифметических пространств удобно записывать как матрицы-столбцы, отождествляя векторы со столбцами их координат в стандартном базисе (см. замечание 1.4).
Определение 3.9. Пусть в линейном арифметическом пространстве Rn задана норма ||•||*. Норму ||•||m в линейном пространстве Мn(R) называют согласованной с нормой ||•||*, если для любой матрицы А ∈ Мn(R) и любого столбца x ∈ Rn выполняется соотношение
||Ax||* ≤ ||Ax||m||x||* (3.14)
Каждая ли норма в Rn имеет согласованную с ней норму в Мn(R)? Ответ на этот вопрос утвердительный. Приведем пример такой нормы. Пусть в Rn задана норма ||•||*. На линейном пространстве матриц Мn(R) рассмотрим функцию
Из формулы не ясно, всегда ли определена указанная функция, т.е. всегда ли точная верхняя грань имеет конечное значение. Отметим, что, согласно аксиомам нормы и свойствам матричного умножения,
Следовательно, значение ||А||i равно точной верхней грани функции ||Ax||*, на множестве {x ∈ Rn: ||x||* = 1}. Можно покаказать, что это множество замкнутое и ограниченное (в частных случаях это показывает пример 3.8), а функция ||Ax||* непрерывна на нем. На замкнутом ограниченном множестве непрерывная функция ограничена и достигает точной верхней грани [V]. Значит, величина ||Ax||i конечна, причем существует такой вектор у ∈ Rn единичной нормы, что ||А||i = ||Ау||*.
Итак, соотношение (3.15) корректно задает функцию на линейном пространстве Мn(R). Покажем, что эта функция является нормой, т.е. верны три аксиомы нормы. Выполнение аксиомы а) очевидно. Проверим аксиому б):
Аксиома в) нормы также верна:
Норму, определенную соотношением (3.15), называют индуцированной (или подчиненной, операторной) и используют для нее то же обозначение, что и для порождающей ее исходной нормы в Rn:
Индуцированная норма всегда согласована с исходной нормой в Rn, так как для любой матрицы А и любого x ≠ 0
что эквивалентно (3.14) при ||А||m = ||A||*. Индуцированная норма является наименьшей из всех норм, согласованных с данной нормой в Rn. Действительно, пусть задана норма ||•|| в линейном пространстве матриц Мn(R), согласованная с нормой ||•||* в Rn. Выберем произвольную матрицу А, а в качестве вектора х выберем тот, на котором функция ||Аx||* достигает наибольшего значения на множестве {||x|| = 1} всех векторов единичной нормы. Тогда
||A||* = ||Ax||* ≤ ||A||||x||* = ||A||,
так как норма ||•||согласована с нормой ||•||*.
Говорят, что норма ||•|| в линейном пространстве матриц Mn(R) является матричной, или кольцевой, если
||AB||≤||A||||B||.
Первый термин не совсем удачен, так как более естественно назвать матричной любую норму, заданную в линейном пространстве матриц. Отметим, что любая индуцированная норма является кольцевой, так как
для любого ненулевого столбца x в силу согласованности индуцированной нормы. Поэтому
Задавая различные нормы в Rn, мы получаем индуцированные нормы в линейном пространстве матриц Мn(R). Выберем в Rn евклидову норму ||•||2:
||x||2 = √(x21 + ... + x2n)
где х = (x1, ... , хn). Индуцированную ею норму в линейном пространстве матриц Мn(R) называют спектральной нормой. Это название вызвано тем, что спектральная норма ||A||2 матрицы А равна √λ, где λ - максимальное собственное значение матрицы АTА.
Задав в Rn l1 - норму
||x||1 = |x1| + ... + |xn|,
в качестве индуцированной получим следующую норму:
т.е. нормой матрицы А = (аij) ∈ Мn(R) является максимальная из l1 - норм столбцов этой матрицы. Поэтому ее называют максимальной столбцевой или октаэдрической.
В качестве нормы в Rn выберем l∞-норму
||x||∞ = max{|x1|,...,|xn|}.
Тогда индуцированной нормой будет функция
т.е. нормой матрицы А = (aij) ∈ Мn(R) будет максимальная из l1-норм строк этой матрицы. Поэтому ее называют максимальной строчной или кубической.
Особо стоит евклидова норма матриц ||A||2, которая не является индуцированной. Действительно, непосредственно из определения (3.15) индуцированной нормы следует, что, какова бы ни была норма в Rn, индуцированная норма единичной матрицы всегда равна единице. Однако нетрудно убедиться, что евклидова норма единичной матрицы Е ∈ Мn(R) равна √n > 1 (при n > 1).
Евклидова норма матриц является кольцевой. Действительно, пусть даны квадратные матрицы А = (aij) и В = (bjk) порядка n. Их произведением будет матрица С = (сikx) с элементами cik = аi1b1k + аi2b2k + ... +аinbnk. Так как, согласно неравенству Коши,
c2ik ≤ (а2i1+ ... + а2in)(b21k+ ... + b2nk),
заключаем, что
В линейном пространстве матриц Мn(R), интерпретируя его как линейное арифметическое пространство Rn , можно задать l1-норму
и l∞ -норму
где А = (aij) ∈ Mn(R). В приложениях теории матриц первая норма заметного интереса не представляет. Вторая норма оце-нивает величину матрицы по максимальному из абсолютных значений ее элементов и необходима при изучении свойств различных методов вычислений. Можно показать, что l∞-норма в Мn(R) не является кольцевой, а потому она не согласована ни с какой нормой в Rn. Этот недостаток можно нейтрализовать, модифицировав эту норму. Новая норма
отличающаяся от старой корректирующим множителем n, равным порядку матрицы, уже является кольцевой и согласована с тремя основными нормами в Rn: евклидовой, l1-нормой и l∞-нормой.
Дополнение 3.2. Метод наименьших квадратов
Постановка задачи. Рассмотрим систему из n линейных алгебраических уравнений (СЛАУ) относительно к неизвестных
или в матричной записи
Ax = b. (3.17)
Каждому набору значений неизвестных сопоставим числа
di = bi - (a1ix1 + ... + akixk), i = 1,n,
которые называют невязками уравнений системы для задан-ного набора значений неизвестных. Очевидно, что набор зна-чений неизвестных является решением системы тогда и только тогда, когда соответствующие ему невязки всех уравнений си-стемы равны нулю.
Отметим, что функция
на решениях системы равна нулю и положительна в остальных случаях. Поэтому ее можно рассматривать как оценку отклоне-ния набора значений неизвестных от точного решения системы. Если система несовместна, то часто возникает задача найти вместо отсутствующих решений такой набор значений неизвестных, который приводит к наименьшему значению функции f. Такой подход в решении некорректной (т.е. не имеющей решений) задачи называют методом наименьших квадратов, поскольку ищется минимум функции, являющейся суммой квадратов.
Сформулированная задача по своему типу относится к классу задач минимизации функций многих переменных [V] и мо-жет быть решена общими методами поиска минимума. Однако ей можно придать алгебро-геометрическую интерпретацию и полностью решить методами линейной алгебры. Для придания задаче такой интерпретации будем трактовать столбцы коэф-фициентов при неизвестных, столбец правых частей уравнений (3.16) как столбцы координат векторов a1, ..., аk;, b евклидова арифметического пространства Rn в стандартном базисе, отождествляя при этом векторы с их столбцами координат (см. замечание 1.4). Тогда и набор невязок уравнений системы мож-но рассматривать как вектор d = (d1, ..., dn) ∈ Rn, который, согласно определению невязок, определяется соотношением
d = b - (x1a1 + ... + xkak).
Число ||d|| назовем невязкой СЛАУ (3.17). Вычислив скалярный квадрат вектора d, находим
||d||2 = f (x1, ... , xk)
Следовательно, задача сводится к определению таких действи-тельных коэффициентов х1, ..., xk при которых величина ||d|| имеет наименьшее значение.
Решение задачи. Введем линейное подпространство H = span{a1,...,ak} и его ортогональное дополнение H⊥. Разложим вектор b на его ортогональную проекцию на линейное подпространство Н и соответствующую ортогональную составляющую:
b = h + h⊥, h ∈ H, h⊥ ∈ H⊥.
Тогда
d = h + h⊥ - (x1a1 + ... + xkak) = h⊥ + (h - x1a1 - ... - xkak) = h⊥ + d0,
где
d0 = h - x1a1 - ... - xkak ∈ H.
Так как d0 ⊥ h⊥,то по теореме Пифагора заключаем, что
||d||2 = ||d0||2 + ||h⊥||2
Ортогональная составляющая h⊥ вектора невязок постоянна и от выбора коэффициентов хi не зависит. Поэтому минимизация величины ||d||2 сводится к поиску минимума величины ||d0||2. Эта величина является неотрицательной и достигает минимума, если обращается в нуль, т.е. при условии, что d0 = 0. А это равносильно тому, что d = h⊥, т.е. вектор невязок принадлежит ортогональному дополнению H⊥ и поэтому является решением системы
(aj, d) = 0, j = 1,k, (3.18)
или
(аj, b - x1a1 - ... - хkаk) = 0, j = 1,k,
(см. 3.9). После преобразований получаем СЛАУ
относительно неизвестных х1, ..., хk. Матрица этой системы Г = ((аi,аj)) - это квадратная матрица порядка k, представляющая собой матрицу Грама для системы векторов a1, ..., ak.
Теорема 3.7. Если система векторов а1, ..., аk линейно независима, то ее матрица Грама является невырожденной.
◄ Докажем равносильное утверждение, что если матрица Грама системы векторов а1, ..., аk вырождена, то эта система векторов линейно зависима. Вырожденность матрицы Грама означает, что ее столбцы линейно зависимы и один из них, например первый, является линейной комбинацией остальных [III]:
Следовательно, вектор f принадлежит ортогональному дополнению линейного подпространства span{a1,...,ak}, а поскольку f ∈ span{a1,...,ak}, то f = 0, т.е.
Это равенство означает, что векторы a1, ... , ak линейно зависимы, так как коэффициент при a1 не равен нулю. ►
Отметим, что система линейных алгебраических уравнений (3.19) всегда совместна: ее решениями являются коэффициенты разложения вектора h ∈ H = span{a1,... ,ak} по системе векторов a1, ..., аk, так как в этом случае вектор d = b - h = h⊥ - решение системы (3.18). Если система векторов a1, ..., аk линейно независима, то, согласно доказанной теореме, матрица СЛАУ (3.19) невырождена и эта система имеет единственное решение, которое дает решение исходной задачи. Если же указанная система векторов линейно зависима, то матрица СЛАУ (3.19) вырождена. В этом случае квадратная СЛАУ (3.19), будучи совместной, имеет бесконечно много решений и каждое из них дает решение исходной задачи. Среди этих решений можно выбирать те, которые удовлетворяют каким-то дополнительным условиям.
Дополнение 3.3. Псевдорешения и псевдообратная матрица
Рассмотрим систему линейных алгебраических уравнений (СЛАУ) Ах = b, вообще говоря, несовместную, с матрицей А типа n × k. Мы остановимся на тех столбцах x, которые для рассматриваемой системы дают минимальную невязку. Если СЛАУ Ах = b совместна, то такие столбцы представляют собой ее решения. Если же СЛАУ несовместна, то столбцы, дающие минимальную невязку, можно находить при помощи метода наименьших квадратов. В этом разделе изложим другой метод их нахождения, используя отождествление векторов евклидова арифметического пространства Rn с матрицами-столбцами их координат в стандартном базисе.
СЛАУ Ах = b соответствует СЛАУ АTАх = АTb, которую называют нормальной.
Пусть a1, ..., ak ∈ Rn - столбцы матрицы А. СЛАУ Ах = b может быть записана в векторной форме:
x1a1 + ... + xkаk = b.
Совместность СЛАУ Ах = b означает, что вектор b ∈ Rn попадает в линейную оболочку H системы векторов a1, ..., аk. Пусть b ∉ Н. Разложим вектор b в сумму b = h + h⊥, где h - ортогональная проекция вектора b на линейное подпространство H, a h⊥ - ортогональная составляющая этого вектора. Введенные обозначения используем в формулировках и доказательстве следующих трех теорем.
Теорема 3.8. Для любой СЛАУ Ах = b следующие множества совпадают:
- множество столбцов, дающих минимальную невязку для этой СЛАУ;
- множество решений СЛАУ Ах = h;
- множество решений нормальной СЛАУ АTАх = АTb.
◄ Норма вектора h⊥ представляет собой минимальную невязку СЛАУ Ах = b (см. Д.3.2), а множество векторов, дающих такую невязку, представляют собой решения СЛАУ Ах = h.
Условие h⊥ ∈ Н⊥ равносильно тому, что вектор h⊥ ортогонален каждому из векторов a1, ..., ak, т.е.
(ai,h⊥) = 0, i = 1,k.
Мы имеем СЛАУ относительно компонент столбца h⊥, которая в матричной форме имеет вид ATh⊥ = 0.
Умножим СЛАУ Ах = h, решения которой дают для си-стемы Ах = b минимальную невязку, на матрицу АT слева. Учитывая, что АTА = 0, получим
АTАх = ATh = ATh + ATh⊥ = А⊥b.
Значит, все векторы х, дающие для СЛАУ Ах = b минимальную невязку, являются решениями СЛАУ АTАх = АTb. Верно и обратное: если вектор х является решением системы ATАх = АTb, то для СЛАУ Ах = b он дает минимальную невязку. Действительно, если АTАх = АTb, то АT(b - Ах) = 0, а это означает, что вектор b' = b - Ах ортогонален векторам a1, ..., аk и, следовательно, принадлежит линейному пространству, НT. Поскольку b" = Ах ∈ Н, то b = b" + b'. Согласно следствию 3.1, последнее равенство совпадает с разложением b = h + h⊥. Поэтому b' = h⊥, а норма вектора b', представляющая собой невязку, будет минимальной. ►
Теорема 3.9. Нормальная система линейных алгебраических уравнений всегда совместна.
◄ СЛАУ Ах = b соответствует нормальная СЛАУ АTАх = АTb. Решениями нормальной СЛАУ являются векторы х, дающие минимальную невязку для исходной СЛАУ Ах = b и являющиеся решениями СЛАУ Ах = h. Последняя же система всегда имеет решения, так как в векторной форме она имеет вид x1a1 + ... + xkak = h, где h ∈ H = span{a1,... ,ak}. ►
Теорема 3.10. Для того чтобы нормальная СЛАУ АTАх = АTb имела единственное решение, необходимо и достаточно, чтобы:
- однородная СЛАУ Ах = 0 была определенной;
- ранг матрицы А совпадал с количеством ее столбцов;
- векторы a1, ..., аk были линейно независимы.
◄ Так как множества решений систем Ах = h и АTАх = АTb совпадают, то из теоремы о структуре общего решения СЛАУ [III] следует, что тогда совпадают и множества решений соответствующих однородных систем Ах = 0 и АT Ах = 0. Если эти однородные системы определенны, т.е. имеют единственное решение, то СЛАУ Ах = b имеет единственный вектор с минимальной невязкой и наоборот. Для того чтобы однородная система Ах = 0 имела единственное решение, необходимо и достаточно, чтобы ранг матрицы А был равен количеству столбцов в ней, или, другими словами, чтобы столбцы матрицы были линейно независимы [III]. ►
Псевдорешения и их свойства. Если для системы Ах = b бесконечное количество векторов х дает минимальную невязку, то обычно выбор останавливают на том из них, который имеет минимальную норму. Такой вектор называют нормальным псевдорешением (или просто псевдорешением) СЛАУ Ах = b. Таким образом, псевдорешение системы линейных ал-гебраических уравнений - это такой вектор, который дает минимальную невязку в этой системе и среди таких векторов имеет минимальную норму.
Теорема 3.11. Любая СЛАУ имеет псевдорешение, и притом единственное.
◄ Множество всех векторов х, дающих минимальную невязку для СЛАУ Ах = b, описывается формулой
x = xx + xо, (3.20)
где хч - некоторое частное решение соответствующей нормальной СЛАУ; хо - общее решение однородной СЛАУ АTАх = 0, которое является общим решением и однородной СЛАУ Ах = 0 (см. доказательство теоремы 3.10).
Обозначим через K линейное подпространство всех решений однородной СЛАУ Ах = 0. Тогда имеет место представление хч = х⊥ч + х°ч, где х°ч ∈ K, х⊥ч ∈ K⊥, и поскольку х°ч + хо ∈ K, то для любого x вида (3.20), согласно теореме Пифагора, имеем
||x||2 = ||xч + xо||2 = ||x⊥ч + (xоч + xо)||2 + ||x⊥ч||2 + ||xоч + xо||2 ≥ ||x⊥ч||2
Равенство ||x|| = ||x⊥ч||2 возможно и притом лишь в единственном случае, когда x°ч + хo = 0, или х = х 1/ч. Следовательно, среди векторов, дающих минимальную невязку СЛАУ Ах = b, минимальную норму будет иметь вектор и только он. Этот вектор является ортогональной составляющей (любого) частного решения нормальной СЛАУ относительно линейного подпространства K всех решений соответствующей однородной СЛАУ Ах = 0. ►
Оказывается, что для любой СЛАУ можно построить такую другую СЛАУ, единственным решением которой является псевдорешение исходной СЛАУ. Для нахождения такой СЛАУ воспользуемся тем, что, согласно доказательству теоремы 3.11, условие минимальности нормы псевдорешения СЛАУ Ах = b означает его ортогональность всем векторам линейного подпространства K решений соответствующей однородной системы Ах = 0. Ортогональность линейному подпространству K равносильна тому, что псевдорешение ортогонально каждому из векторов произвольно выбранной фундаментальной системы решений СЛАУ Ах = 0. Условия ортогональности представляют собой линейные уравнения, добавив которые к нормальной СЛАУ, мы и получим такую СЛАУ, единственным решением которой будет псевдорешение системы Ах = b.
Пример 3.17. Если матрица А нулевая, то псевдорешением СЛАУ Ах = b является нулевой вектор. Действительно,в этом случае невязка не зависит от выбора вектора х и равна ||b||. Минимальную же норму среди всех векторов линейного арифметического пространства имеет нулевой вектор.
Пример 3.18. Если матрица А является квадратной и невырожденной, то псевдорешение СЛАУ Ах = b совпадает с ее обычным решением, так как минимальная невязка, равная нулю, будет достигаться на единственном векторе, являющемся решением этой системы. Псевдорешение совпадет с решением и в случае, когда матрица А не является квадратной, но имеет ранг, совпадающий с количеством столбцов. Это возможно в том случае, когда число строк превышает число столбцов. Такую систему можно заменить эквивалентной ей квадратной, отбрасывая лишние уравнения.
Пример 3.19. Рассмотрим простейшую систему
двух уравнений с двумя неизвестными. Видно, что эта система несовместна. Последовательно вычисляем
Таким образом, нормальная СЛАУ в этом случае состоит из двух одинаковых уравнений:
Множество решений нормальной системы, т.е. множество пар х, у, дающих минимальную невязку в исходной системе, на плоскости изображается прямой х + у = 0,5 (рис. 3.7), а псевдорешением будет точка этой прямой, ближайшая к началу координат, т.е. точка с координатами х = 0,25, у = 0,25. Этой точке соответствует радиус-вектор с наименьшей нормой среди всех радиус-векторов точек прямой х + у = 0,5.
Если одно из уравнений исходной системы умножить на ко-эффициент, то и множество решений нормальной системы, и псевдорешение данной системы изменятся. Это достаточно очевидно, так как умножение уравнения на коэффициент изме-няет, вообще говоря, его невязку. Например, умножив второе уравнение рассматриваемой системы на 2:
и вычислив
находим, что нормальная СЛАУ и в этом случае будет состоять из двух идентичных уравнений 5х + 5у = 4, но они уже другие. Псевдорешением рассматриваемой системы будет х = 0,4, y = 0,4.
Пример 3.20. Рассмотрим на плоскости треугольник с вершинами (1; 1), (2;2), (3;1) (рис. 3.8). Прямые, на которых лежат стороны этого треугольника, опишем при помощи нормальных уравнений и составим из них систему
Полученная система несовместна, так как три прямых не имеют общей точки.
Определим для полученной системы нормальную СЛАУ. Для этого последовательно находим:
Нормальная СЛАУ AT Ax = ATb имеет единственное решение х = 2, у = 1,5, являющееся (в силу единственности) псевдорешением исходной системы.
Так как прямые плоскости заданы нормальными уравнени-ями, квадрат невязки системы для вектора (х0, у0) будет равен сумме квадратов расстояний от точки (x0;y0) до трех прямых. Найденному псевдорешению на плоскости соответствует точка (2;1,5), сумма квадратов расстояний от которой до трех сторон треугольника является минимальной. #
Псевдорешения сохраняют линейные свойства решений ли-нейных систем.
Теорема 3.12. Если х1 - псевдорешение системы Ах = b1, x2 - псевдорешение системы Ах = b1, то λ1x1 + λ2x2 - псевдорешение системы Ах = λ1b1 + λ2b2.
◄ Из условий теоремы вытекает, что xi является решением нормальной СЛАУ АTАх = ATbi, i = 1,2. Значит, λ1x1 + λ2x2 является решением нормальной СЛАУ АTАх = АTλ1b1 + АTλ2b2, и нам остается показать, что при этом λ1x1 + λ2x2 имеет минимальную норму или, что то же самое, λ1x1 + λ2x2 и любое решение у однородной СЛАУ Ау = 0 ортогональны.
Отметим, что псевдорешения xi ортогональны всем решениям СЛАУ Ау = 0 как псевдорешения систем, различающихся лишь правыми частями. Это значит, что (у, xi) = 0, если Ау = 0. Поэтому
(у, λ1x1 + λ2x2) = λ1(у, x1) + λ2 (у, x2) = 0,
если Ау = 0. ►
Псевдообратная матрица. Решение СЛАУ Ах = b с квадратной невырожденной матрицей А может быть записано с помощью обратной матрицы в виде x = А-1b [III]. Обратная матрица А-1 является решением матричного уравнения АХ = Е, где Е - единичная матрица, а столбцы сi обратной матрицы являются решениями систем Agi = еi, i = 1,n, где е1, ..., еn - стандартный базис в линейном пространстве Rn (столбец еi является также i-м столбцом единичной матрицы). Для b = (b1 ... bn)T справедливо разложение b = b1e1 + ... + bnen, и поэтому формула x = А-1b в векторной форме записывается в виде x = b1g1 + ... + bngn т.е. в виде линейной комбинации решений gi, коэффициентами в которой служат правые части bi уравнений системы.
Этот подход позволяет обобщить понятие обратной матрицы и использовать это обобщение для нахождения псевдорешений примерно так же, как обратную матрицу для построения обычных решений.
Рассмотрим СЛАУ Ах = b с произвольной матрицей А типа n × k. Пусть gi - псевдорешение системы Ах = еi, где е1, ..., еn - стандартный базис в Rn. Матрицу А+ = (g1 ... gn), составленную из столбцов gi, называют псевдообратной к матрице А. Отметим, что матрица А+ имеет тип k×n, т.е. тот же, что и транспонированная матрица АT.
Теорема 3.13. Псевдорешением СЛАУ Ах = b является вектор х = А+b.
◄ Действительно, если gi - псевдорешение системы Ах = еi, i = 1,n, то, согласно теореме 3.12, х = b1g1 +... + bngn является псевдорешением системы с той же матрицей и правой частью b1e1 +... + bnеn = b , т.е. рассматриваемой системы Аx = b. ►
Как вытекает из изложенного, любая матрица имеет псевдообратную. Если матрица А квадратная невырожденная, то ее псевдообратная матрица А+ совпадает с обратной А-1, так как в этом случае псевдорешения gi систем Аx = еi будут совпадать с обычными решениями и, следовательно, будут столбцами обратной матрицы.
Пример 3.21. Если А - нулевая матрица типа n × k, то А+ - также нулевая, но типа k × n. В этом случае псевдорешением системы Аx = еi, i = 1,n, будет нулевой столбец высоты k (см. пример 3.17).
Пример 3.22. Рассмотрим матрицу
Эта матрица имеет ранг 2, а соответствующая СЛАУ при любой правой части, согласно теореме Кронекера - Капелли, будет совместна, так как ранг расширенной матрицы не может превышать двух и потому совпадает с рангом матрицы системы. Поэтому псевдорешение СЛАУ Аx = b является одним и
Линейные операции над векторами
Базис. Cкалярное произведение
Векторное и смешанное произведения векторов
Декартова система координат. прямая на плоскости
Плоскость в пространстве
Прямая в пространстве
Кривые второго порядка — I
Кривые второго порядка — II
Поверхности второго порядка
Матрицы и операции с ними
Обратная матрица
Ранг матрицы
Системы линейных алгебраических уравнений
Свойства решений однородных и неоднородных СЛАУ