uzluga.ru
добавить свой файл



Сушков В.И. Критерий Сильвестра: короткое доказательство.

В помощь студенту


Сушков В.И.


Критерий Сильвестра: короткое доказательство. Кто сделает короче?


Профессор В.М. Калинин однажды, принимая меня у себя дома, радостно сообщил, что нашел простое - "на полстранички" - доказательство критерия Сильвестра. Нашел, как всегда, в уме, в своей рабочей позе - лежа на тахте. На бумагу не записал. Он хотел включить его в третье издание "Моих формул".


Тяжелая болезнь и смерть не дали осуществиться его планам. А я, будучи недавно вновь привлечен к преподаванию линейной алгебры, поневоле вспомнил этот эпизод. Неужели и вправду столь элегантный результат можно получить только громоздким вычислением? Нельзя ли дать доказательство "на полстранички"?


И придумал я доказательство. Наверняка не столь изящное, как оставшееся мне неизвестным доказательство В.М. Калинина. По сути своей не очень-то и отличающееся от классического. Но зато - короткое. Всего два шага. Два умножения матриц. В обычно рекомендуемых студентам книжках я его не вижу, потому привожу здесь.


Укорочения доказательства я добился использованием результатов других теорем и матричных обозначений. Всюду в дальнейшем все переменные и числа вещественны, матрица A коэффициентов квадратичной формы XTAX вещественна и симметрична ( т.е. AT=A), столбцы переменных обозначаются той же буквой, но большой X = (x1,x2,...xn)T ; U = (u1,u2,...un)T и т.п.


Но вот с обозначениями для блочных матриц у нас плохо. Очень плохо!

Пришлось недостаток обозначений компенсировать обилием слов. Потому весьма короткое доказательство (всего лишь двухходовка) может кому-то показаться длинным. Увы.


Для доказательства мне понадобятся следующие факты, которые студенту надо изучить раньше этого доказательства.


1. Определитель матрицы равен произведению ее собственных чисел.

det(A) = λ1 λ2... λn

Этот факт легко получить из формулы Виета (свободный член полинома степени n равен произведению его корней, умноженному на (-1)n и старший коэффициент полинома) и определения характеристического полинома Pn (λ) = det(A-λE), в котором задать λ=0 и учесть, что старший коэффициент равен как раз (-1)n.


2. Квадратичную форму XTAX ортогональным преобразованием X=SU (здесь S - матрица, столбцы которой - координаты ортонормированных собственных векторов матрицы A) можно привести к сумме квадратов новых переменных UTΛU = λ1u12 + λ2u22 + ...+ λn un2 , коэффициентами в которой будут собственные числа λ1 , λ2 , ... λn. Вообще, любое линейное преобразование X=SU с невырожденной матрицей S равноценно замене базиса (системы координат) в пространстве аргументов x1,x2,...xn. Старые координаты новых базисных векторов расположены в столбцах матрицы S (столбец = новый базисный вектор). Если новые базисные векторы ортогональны и нормированы (имеют длину 1), то матрица, столбцы которой состоят из координат таких векторов, называется ортогональной.


3. Следовательно, квадратичная форма XTAX положительно определена - (т.е. во всех точках принимает положительные значения, кроме точки (0,0,...0) , в которой равна 0), - тогда и только тогда, когда у матрицы A все собственные числа λ1 , λ2 , ... λn положительны.


4. Если квадратичная форма положительно определена, то, выполнив после ортогонального преобразования еще одно преобразование ui = vi / sqrt(λi), i =1,..n, т.е. растяжение (сжатие) вдоль новых осей u1, u2, ... un, приведем форму к сумме квадратов v12+ v22+...+ vn2 с коэффициентами, равными 1. Обозначим матрицу этого нового преобразования буквой D за то, что она диагональна (на диагонали стоят выше указанные числа): VTDTSTASDV = v12+ v22+...+ vn2 . Итоговое преобразование SD уже не будет ортогональным - хотя новые базисные векторы и являются взаимно ортогональными, но длина у них уже не обязана быть равна 1.


5. Хорошо всем знакомый метод Гаусса преобразования матрицы коэффициентов системы линейных уравнений можно применять и к квадратичным формам. Если применять одинаковые элементарные преобразования и к строкам и столбцам, то это равноценно некоторой линейной замене переменных, и, кроме того, полученная матрица опять симметрична. Обоснуем это.


a) Элементарное преобразование пары строк (одну из строк заменить на ее сумму с копией другой строки, умноженной на какое-либо число) в матрице A равноценно ее умножению слева на некую матрицу C. Нужная для этого матрица C получается из матрицы E таким же элементарным преобразованием. Например, прибавление копии первой строки, умноженной на число 3, ко второй строке матрицы A равноценно умножению матрицы A слева на матрицу C, полученную из E тем же способом (ко второй строке в E прибавлена копия первой строки, умноженной на 3). Это легко увидеть из правила умножения матриц.


b) Точно так же элементарное преобразование столбцов матрицы A равноценно ее умножению справа на матрицу, полученную из E таким же преобразованием столбцов.


c) Следовательно, проведение пары одинаковых элементарных преобразований над столбцами и строками матрицы A равноценно ее умножению слева и справа CTAC, где матрица C получается из E таким же преобразованием ее столбцов. Новая матрица квадратичной формы будет опять симметричной: (CTAC)T=CTATCTT=CTAC


d) Такое преобразование матрицы A равноценно невырожденной замене переменных X = CU в квадратичной форме XTAX, потому что XTAX=(CU)TACU=UTCTACU= UT(CTAC)U, а симметричная матрица коэффициентов квадратичной формы соответствует ей взаимно однозначно. Критерий Сильвестра работает только для симметричных матриц коэффициентов. Матрица коэффициентов A квадратичной формы XTAX не обязана быть симметричной, но если мы насильственно ее симметризуем (т.е. симметричные относительно главной диагонали числа возьмем равными друг другу и половине соответствующего коэффициента), то на самой функции XTAX это никак не отразится. Например: квадратичная форма x12+4x1x2+5x22 в матричной записи может использовать матрицы



и лишь последняя из них, симметричная относительно главной диагонали, нас устраивает.


Все перечисленные сведения важны сами по себе, независимо от того, собираемся ли мы доказывать критерий Сильвестра. Настоятельно рекомендую студентам овладеть ими.


Ну а теперь само доказательство.


Критерий Сильвестра:

для положительной определенности квадратичной формы необходима и достаточна положительность n чисел - миноров симметричной матрицы коэффициентов A:



Для глаз приятнее и понятнее следующая картинка расположения миноров в матрице A:








Необходимость критерия доказать очень легко.

Если кв. форма от n переменных x1,x2,...xn положительно определена, то все собственные числа матрицы коэффициентов A положительны, а определитель Δn = det(A) равен произведению собственных чисел матрицы A, потому тоже положителен.

Если теперь положить переменную xn = 0, то получим кв. форму от (n-1) переменной, тоже положительно определенную (легко от противного доказать), у которой свои собственные числа (уже другие), тоже больше нуля и потому определитель ее матрицы тоже больше нуля. А матрица ее как раз получается вычеркиванием из A последних столбца и строки, так что ее определитель - это и есть Δn-1.

Ну и так далее, вплоть до кв. формы от одной переменной a11x12 и матрицы, состоящей из одного числа a11.


Доказательство достаточности критерия будем строить по индукции.


Очевидно, что форма y = a11x12 условием Сильвестра a11 > 0 положительно определена.

Отсюда мы собираемся получить, что следующее условие Δ2 >0 гарантирует положительную определенность формы y = a11x12 + 2a12x1x2 + a22x22 (матрица которой как раз и написана в миноре Δ2 - см. выше).

Затем отсюда собираемся получить, что условие Δ3 >0 гарантирует положительную определенность соответствующей кв. формы от трех переменных x1,x2,x3.

И так далее.


Но вместо того, чтобы все эти шаги осуществлять отдельно, мы их рассмотрим в общем виде.

Дано: положительно определенная форма k переменных. Ее матрица A симметрична и имеет, естественно, k строк и столбцов.

Добавим к этой матрице (k+1)-ые одинаковые между собой строку и столбец такие, что получившаяся при этом симметричная матрица B имеет положительный определитель.

Рассмотрим соответствующую ей квадратичную форму XT BX от (k+1) переменной x1,x2,...xk,xk+1.

В матрице B левая верхняя подматрица k порядка есть матрица A коэффициентов положительно определенной квадратичной формы от к переменных. Положительно определенную форму можно невырожденной заменой переменных превратить в сумму квадратов с коэффициентами при них, равными 1. Обозначим S матрицу этого преобразования k переменных x1,x2,...xk.

Теперь составим матрицу C замены (k+1) переменной x1,x2,...xk , xk+1 на новые переменные u1,u2,...uk , uk+1 . В качестве левой верхней подматрицы k порядка возьмем S. Справа и снизу к S допишем нули (добавим одну строку нулей снизу и один столбец нулей справа), а последний диагональный элемент (правый нижний) в матрице C возьмем равным 1.





Построенная нами матрица C соответствует преобразованию S над первыми k переменными и простой замене буквы для последней, k+1 переменной.


Используем C для замены переменных X=CU в квадратичной форме XTBX

Вычисляя новую матрицу D= CTBC, используя при этом навык умножения блочных матриц, получим матрицу D следующей структуры:





Т.е. левая верхняя подматрица k порядка - единичная. Это за счет подматрицы S. Она обеспечивает STAS=E. За ней справа идет столбец высоты k, полученный умножением ST на первые k чисел последнего столбца матрицы B. Под ней идет строка, равная транспонированному столбцу, описанному только что. И наконец число в правом нижнем углу унаследовано от матрицы B без изменений. Все это можно получить отслеживанием что на что умножается по хорошо известному нам правилу умножения матриц "строка на столбец".

Для нас важно то, что знак определителя матрицы D такой же, как знак определителя матрицы B, потому что det(D)= det(CTBC) = det(B)(det(C))2.

Отсюда делаем вывод, что det(D) > 0.


Дальнейшее очевидно. Методом Гаусса по строкам и столбцам (см. выше) обнуляем все числа в последних столбце и строке матрицы D, кроме правого нижнего числа. Оно в итоге будет равно определителю det (D), поскольку прибавление к строке (столбцу) копии другой строки (столбца), умноженной на любое число, не меняет определителя матрицы. А с другой стороны матрица-то получится диагональная, причем первые k чисел на диагонали = 1.

В итоге получается, что мы привели нашу квадратичную форму двумя последовательными невырожденными преобразованиями (т.е. взаимнооднозначной заменой переменных) к сумме квадратов, в которой первые k квадратов имеют коэффициент 1, а последнее слагаемое имеет коэффициент det(D)=det(B)(det(C))2 >0

Т.е. кв. форма от k+1 переменной положительно определена.


База индукции выполнена.

Шаг индукции доказан в общем виде.

Ч.Т.Д.