Неравенство йенсена неравенства о средних сообщение

Обновлено: 17.05.2024

Будем рассматривать отрезок [math][a; b][/math] , набор чисел [math]x_1, x_2, x_3, \ldots x_n \in [a; b][/math] и коэффициенты [math]\alpha_1, \alpha_2, \ldots, \alpha_n \ge 0[/math] такие, что [math]\sum\limits_^n \alpha_i = 1[/math] .


Частный случай — [math]\alpha_k = \frac1n[/math] . В этом случае [math]\bar x[/math] — среднее арифметическое.

Обозначим за [math]x_* = \min \[/math] , а [math]x^* = \max \[/math] . Тогда [math]x_* \leq \bar x \leq x^*[/math] , а так как [math]x_* \in [a; b][/math] и [math]x^* \in [a; b]$, то $\bar x \in [a; b][/math] .

В этом смысле отрезок — выпуклое множество, так как он содержит выпуклую комбинацию любых своих чисел.

(типа определение) Выпуклое множество вместе с парой своих точек содержит отрезок, их соединяющий.

[math]\forall x_1, x_2 \in [a; b] \forall \alpha \in [0; 1] \quad \alpha f(x_1) + (1 - \alpha) f(x_2) \leq f(\alpha x_1 + (1 - \alpha)x_2)[/math] .


В силу того, что было сказано о выпуклой комбинации, определение корректно: [math]\alpha x_1 + (1 - \alpha)x_2 \in [a; b][/math] .

Геометрической смысл этого факта состоит в том, что для выпуклой вверх функции её график будет лежать выше хорды.

Замечание: если [math]f(x)[/math] выпукла вниз, то [math]-f(x)[/math] выпукла вверх.

Пусть [math]f(x)[/math] выпукла вверх на [math][a; b][/math] . Тогда [math]\forall x_1, x_2 \ldots x_n \in [a; b][/math] и их выпуклой комбинации выполнено неравенство [math]\sum\limits_^n \alpha_k f(x_k) \leq f\left(\sum\limits_^n \alpha_k x_k\right)[/math] .

Докажем по индукции.

База: [math]n = 2[/math] . Неравенство превращается в определение выпуклой вверх функции, для которой это, очевидно, выполняется.

Переход. Пусть это верно для [math]n[/math] . Докажем, что это верно для [math]n + 1[/math] :

[math]\sum\limits_^ \alpha_k = 1[/math] , обозначим за [math]s_n = \sum\limits_^n \alpha_k[/math]

Пусть [math]\beta_k = \frac[/math] . Тогда получаем: [math]\sum\limits_^ \beta_k = 1[/math] .

[math] \sum\limits_^ \alpha_k f(x_k) = s_n \sum\limits_^n \beta_k f(x_k) + \alpha_f(x_) \leq[/math] (по предположению индукции) [math] s_n f\left(\sum\limits_^n \beta_k x_k \right) + \alpha_f(x_) \leq [/math] (так как [math]s_n + \alpha_ = 1[/math] ) [math] f\left(\sum\limits_^ \alpha_k x_k\right)[/math]

Применим линейную интерполяцию (в случае [math]2[/math] узлов) чтобы выяснить связь между выпуклостью и дифференцируемостью функции [math]f[/math] . Будем считать, что [math]f[/math] дифференцируема столько раз, сколько нам нужно. Имея [math]2[/math] узла на [math]\langle a; b\rangle[/math] и [math]y_0 = f(x_0)[/math] , [math]y_1 = f(x_1)[/math] , составим [math]L_n(x)[/math] :

[math]L_n(x) = y_0 \frac + y_1\frac[/math] — прямая, проходящая через точки [math](x_0, y_0)[/math] и [math](x_1, y_1)[/math] . Значит, между [math]x_0[/math] и [math]x_1[/math] получаем хорду, соединяющую две точки графика.

В вопросе о выпуклости надо проверять знак такой разности: [math]f(x) - L_n(x) = \frac(c_x)>(x - x_0)(x - x_1)[/math] , [math]x_0 \leq x \leq x_1[/math] .

Если [math]f^ \leq 0[/math] на [math]\langle a; b\rangle[/math] то правая часть будет неотрицательная, так как [math]x \in [x_0; x_1][/math] , поэтому [math]f(x) - L_n(x) \geq 0[/math] , и т. к. [math]x_0[/math] и [math]x_1[/math] произвольны, то [math]f[/math] выпукла вверх.

Итак, [math]f^ \leq 0 \Rightarrow f [/math] — выпукла вверх.

Пусть [math]f[/math] выпукла вверх. Будем считать, что [math]f^[/math] — непрерывна. [math]x \in \langle a; b\rangle[/math] .

Пусть [math]x_0 = x - \Delta x[/math] , [math]x_1 = x + \Delta x[/math] , где [math]\Delta x[/math] — малое положительное число. Рассмотрим полином Лагранжа [math]L_n[/math] для системы узлов [math](x_0, x_1)[/math] :

[math]f(t) - L_n(t) = \frac(c_t)> (t - x_0)(t - x_1) \geq 0, \, (t - x_0)(t - x_1) \lt 0 \Rightarrow f^(c_t) \leq 0[/math]

[math]c_t \in \langle x - \Delta x; x + \Delta x \rangle[/math]

[math]\Delta x \to 0 : c_t \to x : f^(x) \leq 0[/math]

Итак, если [math]f[/math] выпукла вверх, то [math]f^ \leq 0[/math] .

В качестве примера рассмотрим [math]y = \ln x[/math] , [math]y'' = \frac \leq 0 \Rightarrow \ln x[/math] выпукла вверх. Это мы применим в следующем параграфе.

\[f(\alpha x_1+(1-\alpha )x_2)\le\alpha f(x_1)+(1-\alpha )f(x_2).\]

Геометрически это означает, что всякая хорда, соединяющая две точки на графике, лежит выше соответствующей части графика.

Итак, сформулируем неравенство Иенсена.

Пусть — выпуклая функция. Тогда

\[f\left(\sum_</p>
<p>^n\alpha_ix_i\right)\le\sum_^n\alpha_if(x_i),\]

где — числа из области определения функции , — положительные числа, сумма которых равна единице.

Доказательство проведем методом математической индукции. База при справедлива по определению выпуклой функции. Совершим индукционный переход от к :

\[\begin</p>
<p> \displaystyle f\left(\sum_^\alpha_ix_i\right)=f\left( (1-\alpha_) \sum_^n<\alpha_i\over 1-\alpha_>x_i+\alpha_x_ \right)\le \\[5mm] \displaystyle \le (1-\alpha_)f\left(\sum_^n<\alpha_i\over 1-\alpha_>x_i\right)+\alpha_f(x_)\le \\[5mm] \displaystyle \le (1-\alpha_)\sum_^n<\alpha_i\over 1-\alpha_>f(x_i) +\alpha_f(x_)=\sum_^\alpha_if(x_i). \end\]

Для эффективного применения неравенства Йенсена необходим простой критерий, позволяющий определить, является ли данная функция выпуклой. Такой критерий существует: дважды дифференцируемая функция, у которой вторая производная неотрицательна, выпуклая.

Покажем теперь, как из неравенства Йенсена можно получить классические неравенства (их можно получить все, приведем здесь лишь доказательство неравенства между средним арифметическим и средним геометрическим, и тех, что не были доказаны ранее).

1. Неравенство между средним арифметическим и средним геометрическим:


Прологарифмировав обе части неравенства, получим

\[\ln<\sum_</p>
<p>^na_i\over n>\ge\sum_^n<1\over n>\ln a_i.\]

Функция выпуклая, так как производная . Поэтому полученное неравенство — это неравенство Йенсена для функции и

\[\alpha_1=\alpha_2=\ldots =\alpha_n=\displaystyle <1\over n></p>
<p>.\]

2. Неравенство между взвешенным средним арифметическим и средним геометрическим:


Так же, как и в предыдущем доказательстве, прологарифмируем обе части неравенства:

\[\displaystyle\ln\left(\sum_</p>
<p>^nq_ia_i\right)\ge\sum_^nq_i\ln a_i.\]

Это неравенство Йенсена для функции .


Логарифмируя обе части первого неравенства, получаем

\[\ln (1+x)\ge<1\over\alpha></p>
<p>\ln (1+\alpha x) .\]

Используя выпуклость функции , имеем

\[\begin</p>
<p> \displaystyle <1\over\alpha>\ln (1+\alpha x)=<1\over\alpha>\ln (1+\alpha x)+\left( 1-<1\over\alpha>\right)\ln 1\le \\[5mm] \displaystyle \le \ln \left(<1\over\alpha>(1+\alpha x)+\left( 1-<1\over\alpha>\right)\cdot 1\right)=\ln (1+x). \end\]

Записывая второе неравенство в виде

аналогично предыдущему получаем

\[\begin</p>
<p> \alpha\ln (1+x)=\alpha\ln (1+x)+(1-\alpha )\ln 1\le \\[4mm] \le\ln (\alpha (1+x)+(1-\alpha )\cdot 1)=\ln (1+\alpha x). \end\]

Если в определении выпуклой функции знак неравенства изменить на противоположный, то соответствующая функция называется вогнутой. Ясно, что функция вогнута тогда и только тогда, когда функция выпукла. Поэтому критерием вогнутости для дважды дифференцируемой функции является неположительность ее второй производной. Неравенство Йенсена для вогнутой функции выглядит так:


Задачи.

1. Доказать, что


2. Пусть — числа из промежутка . Доказать, что

\[\sqrt<1-a^2></p>
<p>+\sqrt\le\sqrt.\]

3. Пусть — положительные числа. Доказать, что

\[\displaystyle \prod_<i=1></p>
<p>^na_i^\ge\left(^na_i\over n>\right)^^na_i>.\]

4. Пусть — стороны треугольника. Доказать, что

\displaystyle<\sum_<i=1></p>
<p>5. Пусть  — положительные числа, ^n>a_i^2=1
. Доказать, что

\[\sum_<i=1></p>
<p>^n\left(<1\over a_i>-a_i\right)\ge (n-1)\sqrt n.\]

Пусть >,\mathbb )>" width="" height="" />
- вероятностное пространство, и >" width="" height="" />
- определённая на нём случайная величина. Пусть также \to \mathbb >" width="" height="" />
- выпуклая (вниз) борелевская функция. Тогда если (\Omega ,<\mathcal >,\mathbb )>" width="" height="" />
, то

<\displaystyle \phi (\mathbb </p>
<p> [X])\leq \mathbb [\phi (X)]>
,

<\displaystyle \mathbb <E></p>
<p>где [\cdot ]>
означает математическое ожидание.

Замечание

<\displaystyle \phi ></p>
<p><ul>
  <li>Если функция
вогнута (выпукла вверх), то знак в неравенстве меняется на противоположный.

Конечномерный вариант

<\displaystyle X></p>
<p>Предположим, что
имеет дискретное распределение, задаваемое функцией вероятности

<\displaystyle \mathbb <P></p>
<p> (X=x_)=\alpha _\geq 0,\;i=1,\ldots ,n;\;\sum \limits _^\alpha _=1.>

Тогда неравенство Йенсена принимает вид:

<\displaystyle \phi \left(\sum _</p>
<p>^\alpha _x_\right)\leq \sum _^\alpha _\phi (x_)>
.

Следствия

  • Теорема Рао — Блекуэлла — Колмогорова в математической статистике.

Неравенство Йенсена для условного математического ожидания

<\displaystyle <\mathcal <G></p>
<p>Пусть в дополнение к предположениям, перечисленным выше, >\subset <\mathcal <F>>>
- под-σ-алгебра событий. Тогда

<\displaystyle \phi (\mathbb </p>
<p> [X\mid <\mathcal <G>>])\leq \mathbb [\phi (X)\mid <\mathcal <G>>]>
,

<\displaystyle \mathbb <E></p>
<p>где [\cdot \mid <\mathcal <G>>]>
обозначает условное математическое ожидание относительно σ-алгебры >>" width="" height="" />
.


Эта статья содержит материал из статьи Неравенство Йенсена русской Википедии.

Материалы сообщества доступны в соответствии с условиями лицензии CC-BY-SA, если не указано иное.

Функция, определенная в интервале , называется выпуклой (снизу) в , если для любых двух значений из имеем:

Если имеет место неравенство, где знак заменен на , то функция называется вогнутой (снизу). Если, кроме того, равенство достигается лишь в том случае, когда то функция называется выпуклой (соответственно вогнутой) в узком смысле.

Докажем теперь следующее неравенство Иенсена.

Если функция выпукла в некотором интервале, то для любых значений из этого интервала

Если при этом функция выпукла в узком смысле, то равенство достигается только при

Для вогнутой функции имеет место такое же неравенство, где знак заменен на

Сначала докажем (1) для :

С помощью этого неравенства и определения выпуклости выводится подобное же неравенство для и затем, аналогичным образом, для и

Покажем теперь, что из справедливости неравенства (1) для определенного значения вытекает его справедливость для . Действительно, положив

В таком случае из (1) следует:

Этим уже полностью доказано общее неравенство (1). Случай равенства здесь очевиден.

Если выпуклая функция является также непрерывной (что обязательно имеет место, ) ограниченна то выполняется более общее неравенство:

где — любые положительные значения. Действительно, в силу непрерывности достаточно убедиться, что это неравенство выполняется для рациональных значений q, ил i, что то же самое, что оно выполняется для целых q. Но это непосредственно следует из венства (1), где среди величин некоторые совпадают.

Достаточным (но не необходимым!) условием выпуклости функции является монотонный рост в данном интервале производной Это условие заведомо выполняется, если

В случае неравенство Иенсена совпадает с доказанной Коши теоремой о том, что среднее геометрическое каких-либо положительных величин не превосходит их среднего арифметического. Также и неравенства (I, 3, 1) и (I, 3, 2) представляют собой простые следствия неравенства Иенсена (1). Так, например, периметр L вписанного в единичный круг выпуклого -угольника равен , где - дуги окружности, отвечающее сторонам многоугольника. Так как есть выпуклая функция, то имеем

Применим теперь неравенство Иенсена для доказательства формулы (1, 5, 7).

Мы докажем даже более общее утверждение: если суть расстояния от некоторой внутренней точки О выпуклого -угольника до его вершин, — расстояния от О до сторон -угольника, то

Обозначим последовательные вершины «-угольника через (расстояние от 0 до равно - Р; расстояние от 0 до равно ); угол обозначим через Сдвинем точки Р и вдоль прямых так, чтобы площадь треугольника осталась неизменной; все возможные прямые будут огибать гиперболу с асимптотами ОР, и Так как из всех касательных гиперболы от ее центра более всего удалена та, которая образует с асимптотам i равные углы, то Отсюла следует:

сложив эти неравенства для , получим:

Так как в 0, есть вогнутая функция, то имеем:

что и требовалось доказать.

В датьнейшем мы будем также часто иметь дело с неравенством Иенсена для выпуклых функций двух переменных. Функцию , определенную в выпуклой области В плоскости , мы называем выпуклой, если любых двух точек из В имеет место неравенство

аналогично определяется вогнутость функции двух переменных.

Из этого определения аналогично изложенному выводится, что если — выпуклая функция, то для любых точек из В имеет место неравенство

Достаточным условием выпуклости или вогнутостн функции является существование непрерывных вторых производных и положительность составленного из них определителя Выполнение неравенства означает, что точки поверхности являются эллиптическими [31]. Для того чтобы выяснить, выпукла или вогнута в этом случае функция надо исследовать знак или Если (а следовательно, также и ), то функция выпукла; напротив, если то функция вогнута. Если эти последние условия выполнены, то выпукла, соответственно вогнута, также и в случае, когда Рассмотрим функцию

в этом случае , и следовательно, функция z вогнута:

Если положить , то получим неравенство

которое в случае переходит в неравенство Коши

Упомянем еще интегральное неравенство

которое можно получить, если применить неравенство (2) к соответствующим интегральным суммам.

Важнейшим частным случаем последнего неравенства является неравенство Шварца [32]

Читайте также: