Критерий Сильвестра

Теория
Автор
Издательство

Квадратичные формы подразделяют на различные типы в зависимости от множества их значений.

Определение 8.3. Квадратичную форму f(x) = хTАх, х = (х1 ... хn)T , будем называть:

- положительно (отрицательно) определенной, если для любого ненулевого столбца х выполняется неравенство f(x) > 0 (f(x) < 0);

- неотрицательно (неположительно) определенной, если f(x) ≥ 0 (f(x) ≤ 0) для любого столбца х, причем существует ненулевой столбец х, для которого f(x) = 0;

- знакопеременной (неопределенной), если существуют такие столбцы x и у, что f(x) > 0 и f(y) < 0.

Пример 8.6. Рассмотрим четыре квадратичные формы от трех переменных:

f1(x1,x2,x3) = x21 + x22 + x23,

f2(x1,x2,x3) = x21 + x22,

f3(x1,x2,x3) = x21 - x22 + x23,

f3(x1,x2,x3) = x1x2.

Квадратичная форма f1 положительно определена, так как представляет собой сумму трех квадратов и потому принимает только положительные значения, если переменные одновременно не обращаются в нуль. Квадратичная форма f2 неотрицательно определена: будучи суммой двух квадратов она не принимает отрицательных значений, но при х1 = x2 = 0 и х3 ≠ 0 она принимает нулевые значения. Квадратичные формы f3 и f4 знакопеременны. Первая из них положительна при х = (1 0 0) и отрицательна при х = (0 1 0)T . Вторая положительна при x = (1 1 0)T и отрицательна при х = (1 -1 0)T. Квадратичные формы f2 и f4 являются вырожденными, так как ранг каждой из них равен двум. #

Как следует из определения 8.3, тип квадратичной формы зависит только от множества значений, которые она принимает, но не зависит от переменных, в которых она записана. Поэтому, представив квадратичную форму в каноническом виде, сразу получаем следующие критерии для типа квадратичной формы в зависимости от множества собственных значений ее матрицы.

Таблица. Тип квадратичной формы. Множество собственных значений

Хотя эта таблица дает удобную характеристику типам квадратичных форм, ее использование для определения типа конкретной квадратичной формы связано с вычислением соб-ственных значений матрицы. А это достаточно трудоемкая операция. На самом деле во многих случаях тип квадратичной формы можно определить, не вычисляя собственных значений ее матрицы. Метод состоит в вычислении и проверке знаков некоторых миноров матрицы квадратичной формы. Введем следующие обозначения.

Пусть матрица квадратичной формы f(x) = хTАх имеет вид

Матрица квадратичной формы f(x)

где aij = aji, i,j = 1,n. Рассмотрим угловые миноры этой матрицы (которые также называют главными минорами):

Угловые миноры матрицы

Как видим, угловой минор порядка k расположен на пересечении первых k строк и первых k столбцов матрицы. Угловой минор максимального, n-го порядка представляет собой определитель матрицы.

Теорема 8.6 (критерий Сильвестра). Для того чтобы квадратичная форма от n переменных была положительно определена, необходимо и достаточно, чтобы выполнялись неравенства Δ1 > 0, Δ2 > 0, Δ3 > 0, ..., Δn > 0.

◄ Необходимость. Если квадратичная форма положительно определена, то в ее каноническом виде все коэффициенты должны быть положительны. Значит, и определитель матрицы квадратичной формы канонического вида положителен. Невырожденное преобразование квадратичной формы не меняет знака определителя, так как, согласно формуле преобразования (8.4), det(UTAU) = (detU)2detА. Поэтому определитель матрицы исходной канонической формы тоже положителен, т.е. Δn > 0

Если квадратичная форма f(x1, ... ,хn) от n переменных положительно определена, то квадратичная форма fk(x1,... ,xk) = f(x1,...,xk,0,...,0) от k переменных также положительно определена и, следовательно, определитель ее матрицы положителен. Но этот определитель совпадает с Δk, т.е. Δk > 0 при k = 1,n.

Достаточность. Используем метод математической индукции по количеству n переменных квадратичной формы. При n = 1 утверждение очевидно. Пусть утверждение верно для всех квадратичных форм от k переменных, k ≤ n - 1. Рассмотрим произвольную квадратичную форму f(x) с матрицей А = (aij) в базисе е = (e1 ... еn), у которой все угловые миноры положительны. Квадратичная форма fn-1(x1,...,xn-1) = f(x1,... ,xn-1,0) от n - 1 переменных определена на линейном подпространстве Hn-1= span{e1,...,en-1} и имеет матрицу, совпадающую с матрицей минора Δn-1. Так как все угловые миноры для Δn-1, они же угловые миноры матрицы А, положительны, согласно предположению математической индукции квадратичная форма fn-1 является положительно определенной. Заменой базиса (e1 ... en-1) подпространства Hn-1 новым базисом (f1 ... fn-1) мы можем привести квадратичную форму fn-1 к диагональному виду:

fn-1(x) = λ1x21 + ... + λn-1x2n-1, λi > 0, i = 1,n-1. (8.9)

В базисе (f1 ... fn-1 en) квадратичная форма f(x) имеет вид

Квадратичная форма f(x)

так как при хn = 0 она совпадает с квадратичной формой fn-1. Преобразуем последнее выражение для f(x), выделяя квадраты по переменным х1, хn-1:

Квадратичная форма f(x)

где μ = bini, i = 1,n-1, λn = bnn - λ1μ21 - ... - λn-1μ2n-1 Выполнив линейную замену переменных х'i = хi + μixn, i = 1,n-1, х'n = хn с невырожденной матрицей, приходим к квадратичной форме канонического вида

f(x) = λ1(x'1)2 + ... + λn(x'n)2, (8.10)

в которой, согласно (8.9), коэффициенты λ1, ..., λn-1 положительны. У определителя матрицы квадратичной формы знак не зависит от выбора базиса. Поэтому в представлении (8.10) имеем λ1... λn-1λn > 0, так как Дп > 0. Отсюда следует, что Ап > 0, так как все остальные коэффициенты А* положительны. Таким образом, в представлении (8.10) все коэффициенты положительны и квадратичная форма f(x) положительно определена. ►

Следствие 8.1. Для того чтобы квадратичная форма п переменных была отрицательно определена, необходимо и достаточно, чтобы выполнялись неравенства -Δ1 > 0, Δ2 > 0, -Δ3 > 0, ..., (-1)n Δn > 0 (знаки угловых миноров чередуются начиная с минуса).

◄ Если квадратичная форма f(x) отрицательно определена, то квадратичная форма -f(x) положительно определена, и наоборот. Матрицей квадратичной формы -f(x) является матрица -А, противоположная матрице А квадратичной формы f(x). Согласно критерию Сильвестра, для положительной определенности квадратичной формы -f(x) необходимо и достаточно, чтобы все угловые миноры Δ'r, r = 1,n, матрицы -А были положительны. Но при умножении матрицы А на число - 1 все ее элементы умножаются на это число и поэтому Δ'r = (-1)r Δr, где Δr - угловой минор порядка r матрицы А. Таким образом, квадратичная форма -f(x) положительно определена тогда и только тогда, когда выполнены неравенства (-1)r Δr > 0, r = 1,n, и это условие эквивалентно тому, что квадратичная форма f(x) отрицательно определена. ►

Следствие 8.2. Невырожденная квадратичная форма знакопеременна тогда и только тогда, когда для матрицы квадратичной формы выполнено хотя бы одно из условий:

- один из угловых миноров равен нулю;

- один из угловых миноров четного порядка отрицателен;

- два угловых минора нечетного порядка имеют разные знаки.

◄ Невырожденная квадратичная форма может быть либо положительно определенной, либо отрицательно определенной, либо знакопеременной - в зависимости от знаков коэффициентов в ее каноническом виде. Если имеется нулевой угловой минор или один из угловых миноров четного порядка отрицателен, то, согласно теореме 8.6 и следствию 8.1, эта квадратичная форма не является ни положительно, ни отрицательно определенной. То же можно утверждать и в случае, когда есть два угловых минора нечетного порядка с разными знаками. Значит, в этих случаях квадратичная форма знакопеременная. ►

Критерий Сильвестра и его следствия показывают, что тип квадратичной формы полностью определяется свойствами ее матрицы. Поэтому термины, введенные определением 8.3, можно перенести на симметрические матрицы. В частности, симметрическую матрицу А называют положительно (отрицательно) определенной и пишут А > 0 (А < 0), если положительно (отрицательно) определена соответствующая квадратичная форма. Согласно теореме 8.6 и ее следствиям, симметрическая матрица положительно определена, если все ее угловые миноры положительны. Симметрическая матрица отрицательно определена, если у ее угловых миноров знаки чередуются начиная со знака минус.

Следствие 8.3. Если симметрическая матрица положи-тельно определена, то все ее диагональные элементы положительны.

◄ Если А = (aij) - симметрическая положительно определенная матрица порядка n, то ее первый угловой минор положителен, т.е. а11 = Δ1 > 0. Воспользовавшись тем, что утверждение следствия верно для диагонального элемента а11, докажем что и аii > 0 при i > 1. В квадратичной форме хTАх, x = (x1,...,xn)T сделаем замену переменных

х1 = уi, xi = y1, xj = yj при j ≠ 1,i.

В новых переменных матрица А' = (а'ij) квадратичной формы такова, что аii = а'11 > 0. ►

Рассмотрим примеры на применение критерия Сильвестра.

Пример 8.7. Квадратичная форма хTАх от трех переменных с матрицей

Квадратичная форма от трех переменных с матрицей

положительно определена, так как Δ1 = Δ2 = Δ3 = 1 > 0.

Пример 8.8. Квадратичная форма хTАх от трех переменных с матрицей

Квадратичная форма от трех переменных с матрицей

является знакопеременной, так как она невырождена (Δ3 ≠ 0) и Δ1 = 1 > 0, а Δ2 = -8 < 0.

Пример 8.9. Квадратичная форма 2x1x2 от двух переменных является знакопеременной, так как она невырождена (Δ2 = -1 ≠ 0), a Δ1 = 0.

Пример 8.10. Квадратичная форма f(x1, x2, x3, x4) = 4х1х3 + 2x2x4 + х24 имеет угловые миноры Δ1 = Δ2 = Δ3 = 0, Δ4 = 4 и, согласно следствию 8.2, является знакопеременной. В этом можно убедиться, используя несложное преобразование вида квадратичной формы:

f(x1,x2,x3,x4) = (х1 + x3)2 - х22 - (х1 - x3)2 + (x2 + x4)2.


Дополнение 8.1. Билинейные формы

Функцию b(х,у) от двух переменных, определенную в линейном пространстве L, называют билинейной формой, если эта функция линейна по каждому из своих аргументов, т.е. для любых действительных α и β и любых векторов x,y,z ∈ L выполняются равенства

b(αx + βy,z) = αab(x,z) + βb(y,z),

b(x,αy + βz) = αb(x,y) + βb{x,z).

Пример 8.11. Частным случаем билинейной формы является скалярное произведение. Действительно, аксиомы в) и г) скалярного умножения означают, что скалярное произведение как функция от двух переменных линейно по первому аргументу, а в силу аксиомы а) скалярное произведение линейно и по второму аргументу. #

Выберем в n-мерном линейном пространстве L некоторый базис е = (e1 ... еn). Для билинейной формы b(х,у) обозначим bij = b(ei,ej), i,j = 1,n. Тогда для любых векторов х и у со столбцами координат х = (х1 ... xn)T и у = (у1 ... уn)T в базисе е

Некоторый базис е для билинейной формы b(х,у)

Используя квадратную матрицу В = (bij) порядка n, можем записать полученное представление в матричном виде:

b(х,у) = хTВу. (8.11)

Матрицу В называют матрицей билинейной формы.

Тройное произведение, стоящее в правой части (8.11), нам уже встречалось (см., например, лемму на с. 185). Кстати, эта лемма показывает, что разным билинейным формам соответствуют разные матрицы. Таким образом, билинейная форма однозначно определяется своей матрицей в произвольно выбранном базисе. Кроме того, из леммы следует, что любая функция b, имеющая представление (8.11), является билинейной формой, и В является матрицей этой билинейной формы. Основываясь на этом, выясним, как изменяется матрица билинейной формы при изменении базиса.

Пусть билинейная форма b имеет в базисе b матрицу Вb, а в базисе е матрицу Вe. Обозначим через U матрицу перехода из базиса b в базис е. Тогда для любых двух векторов х, у со столбцами координат хb, уb в базисе b и хe, уe в базисе е имеем

b(x,y) = xTbAbyb = (Uxe)TAb(Uye) = xTe(UTAbU)ye.

Сравнивая полученное представление с (8.11), делаем вывод, что матрица UTAbU является матрицей билинейной формы в базисе е, т.е.

Аe = UTAbU. (8.12)

Представление (8.11) билинейной формы в базисе похоже на запись (8.2) квадратичной формы в матричном виде. Кроме того, матрица билинейной формы преобразуется по тому же закону, что и матрица квадратичной формы (ср. (8.4) и (8.12)). Но матрица квадратичной формы симметрическая, в то время как матрица билинейной формы, вообще говоря, нет. Для того чтобы матрица билинейной формы b(x,у) в базисе е являлась симметрической, должны выполняться условия

b(ei,ej) = b(ej,ei), i,j = 1,n.

Если b(x,y) - билинейная форма, то функция b(х,х) в заданном базисе записывается в виде b(х, x) = хTВх. Это матричное произведение представляет собой квадратичную форму от координат вектора х. Матрицей этой квадратичной формы является матрица А = 0,5(B + ВT). Матрицы билинейной и квадратичной форм совпадут, если матрица В билинейной формы симметрическая.

Пример 8.12. Функция b(x,y) = x1y1, заданная через координаты х = (x1 x2)T и у = (y1 y2)T векторов х и у в некотором базисе е двумерного линейного пространства, является билинейной формой с матрицей

Билинейная форма с матрицей

Соответствующая ей квадратичная форма имеет вид f(x) = x1x2 и матрицу

Билинейная форма с матрицей

Отметим, что квадратичная форма f(x) порождается так-же и билинейной формой bs(x,y) = 0,5x1y2 + 0,5x2y1, имеющей матрицу А.

Определение 8.4. Билинейную форму b(х,у) называют симметрической (кососимметрической), если b(х,у) = = b(у,х) (b(х,у) = -b(у,х)) для любых векторов х и у.

Пример 8.13. Примером симметрической билинейной формы является скалярное произведение. По существу, определение 3.1 говорит, что скалярное произведение - это билинейная симметрическая форма, порождающая положительно определенную квадратичную форму (последнее - содержание аксиомы г) скалярного произведения). #

Если в билинейной форме b(х,у) поменять местами переменные, то получим новую билинейную форму b'(x,у) = b(у,x), матрица которой будет транспонированной к исходной. Действительно, если в некотором базисе b(х,у) = хTBy, то в том же базисе

b'(х,у) = b(у,х) = уTВх = (yTBx)T = хTВTу,

так как уTВх - это число и транспонирование его не меняет.

Если билинейная форма b(у,х) симметрическая, то перестановка аргументов не меняет ее. В этом случае b'(x, у) = b(х, у) и ВT = В, т.е. матрица симметрической билинейной формы является симметрической. Верно и обратное утверждение: если матрица В билинейной форма b(у,х) симметрическая, то и сама билинейная форма симметрическая. Это следует из равенств

b(х,у) = хTВу = (хTВу)T = уTВTх = уTВх = b(у,х).

Итак, для симметричности билинейной формы необходима и достаточна симметричность ее матрицы. Отметим, что если билинейная форма имеет симметрическую матрицу в одном базисе, то ее матрица будет симметрической и в любом другом базисе. Случай косимметрической билинейной формы аналогичен. Для того чтобы билинейная форма была кососимметрической, необходимо и достаточно, чтобы ее матрица в каком-либо базисе была кососимметрической.

Теорема 8.7. Для любой квадратичной формы f(x) существует, и притом единственная, симметрическая билинейная форма В(х,у), для которой f(x) = В(х,х) для любого вектора х.

◄ Выберем произвольный базис е и запишем в нем матрицу А квадратичной формы f(x). Билинейная форма b(х,у) с симметрической матрицей А в этом же базисе является сим-метрической и порождает квадратичную форму f(x) с той же матрицей А. Разные симметрические билинейные формы порождают квадратичные формы с разными матрицами. Значит, нмкакой квадратичной форме не могут соответствовать две различные симметрические билинейные формы. ►

Замечание 8.2. По квадратичной форме соответствующая ей билинейная форма легко восстанавливается, при этом не нужно прибегать к записи функций в каком-либо базисе. Рассмотрим функцию

b(x,у) = 0,5(f(x + y) - f(x) - f(y)).

Это билинейная симметрическая форма, что следует из ее записи в произвольном базисе:

b(х, у) = 0,5 ((x + y)T А(х + у) - хTАх - уTАу) = 0,5 (хTАу + уTАх) = 0,5(хTАу + (уTАх)T) = 0,5 (хTАу + хTАTу)/2 = хTАу,

где А - матрица квадратичной формы f(x) в этом же базисе. При этом

b( х,х) - хTАх = f(x).

Вопросы и задачи

  1. Найдите ранг квадратичных форм от трех переменных: а) х2 + у2 + 2xz; б) 2ху + 2xz + 2yz; в) (х + у)2 - (х - у - z)2; г) (x - y - 2z)2.
  2. Приведите к каноническому виду методом Лагранжа следующие квадратичные формы от трех переменных: а) х2 + 2у2 + 2xz + 2yz; б) 2ху + 2xz + 2yz; в) х2 - у2 + 2z2 + 2 ху + 2xz.
  3. Приведите к каноническому виду при помощи ортогонального преобразования следующие квадратичные формы от двух переменных: а) х2 + ху + у2; б) ху; в) 2х2 + 3у2 + 2ху.
  4. Какой ранг может иметь положительно определенная квадратичная форма от n переменных?
  5. Определите тип следующих квадратичных форм от двух переменных: а) х2 - ху + у2; б) 2ху; в) х2 + 4ху + 4у2.
  6. Квадратичная форма от двух переменных имеет вид ах2 + bху + су2, т.е. является квадратным трехчленом относительно любой из переменных. Как тип квадратичной формы связан с дискриминантом этого квадратного трехчлена?
  7. Выясните, являются ли положительно определенными следующие квадратичные формы от трех переменных: а) х2 + у2 - z2 + 2ху + 2xz + 2yz; б) ху + xz + yz; в) х2 + у2 + z2 + 2ху; г) х2 + у2 + z2 + ху + xz + yz.
  1. Линейные операции над векторами

  2. Базис. Cкалярное произведение

  3. Векторное и смешанное произведения векторов

  4. Декартова система координат. прямая на плоскости

  5. Плоскость в пространстве

  6. Прямая в пространстве

  7. Кривые второго порядка — I

  8. Кривые второго порядка — II

  9. Поверхности второго порядка

  10. Матрицы и операции с ними

  11. Обратная матрица

  12. Ранг матрицы

  13. Системы линейных алгебраических уравнений

  14. Свойства решений однородных и неоднородных СЛАУ