おもしろ数学

【3次方程式の解の公式の導出】
難解な部分を丁寧に解説!

調べたらいくらでも出てくる、カルダノの3次方程式の解の公式の証明。
しかし、皆さんはその証明の過程で「ここって何故こうなるんだ?」とか、「いきなり何故こんなことするんだ?」とかの感想を持った方もいるのではないでしょうか。

そんな方向けに、本記事ではカルダノの公式の証明の中で難解な部分にスポットを当てて、できる限りわかりやすく説明してみようと思います。

本記事の構成について

  1. まずはカルダノの公式を一度証明しよう
  2. なぜ \(x=y-\frac{b}{3a}\) と変換することを思いついたの?
  3. \(u\)と\(v\)を求める時、その2つの式で決定したのはなぜ?
  4. 突然出てきた、\(\omega\) って何?

■まずはカルダノの公式を一度証明しよう

詳細な説明は省き、3次方程式の解の公式を一旦導出してみよう。
 ※途中赤文字の部分については、後ほど詳しく解説します。

\begin{eqnarray}
\displaystyle ax^3+bx^2+cx+d=0 \tag{1}
\end{eqnarray}

ただし、ここでは\(a\neq0\)とする。両辺を\(a\)で割ると、

\begin{eqnarray}
\displaystyle x^3+\frac{b}{a}x^2+\frac{c}{a}x+\frac{d}{a}=0 \tag{2}
\end{eqnarray}

となり、ここで\(x=y-\frac{b}{3a}\)を(2)式に代入すると、

\begin{eqnarray}
\displaystyle \biggl(y-\frac{b}{3a}\biggr)^3+\frac{b}{a}\biggl(y-\frac{b}{3a}\biggr)^2+\frac{c}{a}\biggl(y-\frac{b}{3a}\biggr)+\frac{d}{a}=0 \tag{3}
\end{eqnarray}

となるため、これを\(y\)について整理すると

\begin{eqnarray}
\displaystyle y^3+\biggl(-\frac{b^2}{3a^2}+\frac{c}{a}\biggr)y+\biggl(\frac{2b^3}{27a^3}-\frac{bc}{3a^2}+\frac{d}{a}\biggr)=0 \tag{4}
\end{eqnarray}

となる。ここで、

\begin{eqnarray}
\displaystyle -\frac{b^2}{3a^2}+\frac{c}{a} =: 3p,\hspace{10pt} \frac{2b^3}{27a^3}-\frac{bc}{3a^2}+\frac{d}{a} =: 2q \tag{5}
\end{eqnarray}

と定義すると、(4)式は以下のようにシンプルな形で表現できる。

\begin{eqnarray}
\displaystyle y^3+3py+2q=0 \tag{6}
\end{eqnarray}

(6)式の形ではラチがあかないので、

\begin{eqnarray}
\displaystyle y := u+v \tag{7}
\end{eqnarray}

という2変数で表せると仮定し、(6)式に代入し整理すると、

\begin{eqnarray}
\displaystyle u^3+v^3+2q+3(u+v)(uv+p)=0 \tag{8}
\end{eqnarray}

となる。(8)式は、以下の2式

\begin{eqnarray}
\left\{
\begin{array}{l}
u^3 + v^3 + 2q = 0 \tag{9} \\
uv + p = 0
\end{array}
\right.
\end{eqnarray}

を満たす\(u,v\)であれば成立するので、ここから\(u,v\)を求めていく。
(9)式の上式で「\(+2q\)」を右辺に移項して、下式で「\(+p\)」を右辺に移項し両辺を3乗してみると、

\begin{eqnarray}
\left\{
\begin{array}{l}
u^3 + v^3 = -2q \tag{10} \\
u^3v^3 = -p^3
\end{array}
\right.
\end{eqnarray}

となる。
(10)式において、2次方程式の解と係数の関係より、\(u^3,v^3\)の値は以下の \(t\) の2次方程式の解で表現される。

\begin{eqnarray}
\displaystyle t^2+2qt-p^3=0 \tag{11}
\end{eqnarray}

(11)式より、\(t\) の値は

\begin{eqnarray}
\displaystyle t=-q \pm \sqrt{q^2+p^3}
\end{eqnarray}

となるため、これより\(u^3,v^3\)の値は

\begin{eqnarray}
\left\{
\begin{array}{l}
u^3 = -q + \sqrt{q^2+p^3} \tag{12} \\
v^3 = -q - \sqrt{q^2+p^3}
\end{array}
\right.
\end{eqnarray}

と求まる。
 ※ただし、上では \(u,v\) の対称性より、2つ求まった \(t\) の値はどちらを\(u^3,v^3\)と決めても問題ないことを用いた。

(12)式より、\(u,v\)は以下の通り3つずつ求まる。

\begin{eqnarray}
u
=
\left\{
\begin{array}{l}
\sqrt[3]{-q+\sqrt{q^2+p^3}} \tag{13} \\
\omega \sqrt[3]{-q+\sqrt{q^2+p^3}} \\
\omega^2 \sqrt[3]{-q+\sqrt{q^2+p^3}}
\end{array}
\right.
\end{eqnarray}

\begin{eqnarray}
v
=
\left\{
\begin{array}{l}
\sqrt[3]{-q-\sqrt{q^2+p^3}} \tag{14} \\
\omega \sqrt[3]{-q-\sqrt{q^2+p^3}} \\
\omega^2 \sqrt[3]{-q-\sqrt{q^2+p^3}}
\end{array}
\right.
\end{eqnarray}

 ※ただし、\(\omega\) は1の3乗根の虚数解であり、\(\omega^3=1\) を満たす。

(13)と(14)の\(u,v\)の組み合わせのうち、(9)の下の式を満たす組み合わせは

\begin{eqnarray}
(u, v)
=
\left\{
\begin{array}{l}
\biggl(\sqrt[3]{-q+\sqrt{q^2+p^3}}, \sqrt[3]{-q-\sqrt{q^2+p^3}} \biggr) \tag{15} \\
\biggl(\omega \sqrt[3]{-q+\sqrt{q^2+p^3}}, \omega^2 \sqrt[3]{-q-\sqrt{q^2+p^3}} \biggr) \\
\biggl(\omega^2 \sqrt[3]{-q+\sqrt{q^2+p^3}}, \omega \sqrt[3]{-q-\sqrt{q^2+p^3}} \biggr)
\end{array}
\right.
\end{eqnarray}

の3通りのため、これが\(u,v\)の最終的な解となる。

ここまで材料を揃えたら、あとは以下の順番で求めていけば、3次方程式の解が求まる。

3次方程式の解を求める手順:まとめ

①(5)式を用いて、\(p,q\) の値を求める
②\(p,q\) が求まれば、(15)式から \(u,v\) の値を求める
③\(u,v\) が求まれば、(7)式から \(y\) の値を求める
④最後に \(x=y-\frac{b}{3a}\) の式から \(x\) の値を求める

以上が、3次方程式の導出までの過程である。

さて、ここまでの過程で、理解が難しい部分もあったと思います。
以降は、上の導出の過程で赤文字で示した箇所について、できるだけ皆さんが納得できるように説明してみたいと思います!


■なぜ \(x=y-\frac{b}{3a}\) と変換することを思いついたの?

上の導出の過程では、自然とこれを使用しました。
皆さんお気づきの通り、この変換を実施した意図としては「3次方程式から2次の項を消去すること」です。
 ※実際、(4)式を見ていただくと、\(y^2\) の項が消去されていることがわかると思います。

では、なぜ\(x=y-\frac{b}{3a}\)を代入することで2次の項を消去できるとすぐにわかるのでしょうか?
結論を言ってしまうと、すぐにわかるわけではありません。

\(x=y-\frac{b}{3a}\)への変換に気づくための手順として、まず(2)式に\(x=y+A\)を代入してみることを考えます。

\begin{eqnarray}
\displaystyle (y+A)^3+\frac{b}{a}(y+A)^2+\frac{c}{a}(y+A)+\frac{d}{a}=0 \tag{16}
\end{eqnarray}

(16)式を \(y\) について整理すると、

\begin{eqnarray}
\displaystyle y^3+\biggl(3A+\frac{b}{a} \biggr)y^2+\biggl(3A^2+\frac{2b}{a}A+\frac{c}{a} \biggr)y+A^3+\frac{b}{a}A^2+\frac{c}{a}A+\frac{d}{a}=0 \tag{17}
\end{eqnarray}

となります。(17)式の \(y^2\) の項に着目すると、\(A\)の値が\(-\frac{b}{3a}\)であれば、\(y^2\) の項が消去できることがわかるので、(3)式の導出の際はこのあたりの手続きを省略し、いきなり \(x=y-\frac{b}{3a}\) と変換しているのです。
 ※(17)式で \(A=-\frac{b}{3a}\) を代入しても、(4)式が導けます。


■\(u\)と\(v\)を求める時、その2つの式で決定したのはなぜ?

ここでは、なぜ(8)式から(9)式を考えているのかを説明してみます。
 ※カルダノの公式の導出の中で、おそらくここが最難関かと思います。

この部分を完全に理解するためには「代数学の知識」が必要となってくるのですが、ここではできる限り皆さんが納得できるように説明してみたいと思います。

まず納得がしづらい部分としては、以下の部分かと思います。

おろち
おろち

(8)式を満たすのは、(9)の2式だけではないのでは?

ここに尽きると思います。
より具体的に言うと、以下2パターンのケースの場合でも(8)式は成立しそうに見えるわけです。

\begin{eqnarray}
\displaystyle u^3+v^3+2q=-3(u+v)(uv+p) \tag{18}
\end{eqnarray}

\begin{eqnarray}
\left\{
\begin{array}{l}
u^3 + v^3 + 2q = 0 \tag{19} \\
u + v = 0
\end{array}
\right.
\end{eqnarray}

 ※(18)式は、(8)式の一部の項を右辺に移項しただけの式です。

以下では、この(18)式と(19)式について考察してみます。

まずは理解しやすい(19)式から見ていきます。
こちらはよくよく考えてみればわかるのですが、\(u + v = 0\) を満たすとき、\(y = 0\) となり、このとき\(x = -\frac{b}{3a}\) となります。

もし \(x = -\frac{b}{3a}\) が3次方程式の解の1つであるならば、これを(2)式に代入したときの左辺の値は0となるはずですが、実際に代入してみると

\begin{eqnarray}
(2)式の左辺 = \frac{2b^3}{27a^3}-\frac{bc}{3a^2}+\frac{d}{a} \tag{20}
\end{eqnarray}

となり、0とはなりません。ゆえに、(19)式は成立しないことがわかります。

次に(18)式を見ていきます。
(18)式は、\(u\) と \(v\) という2変数に対し、式が1つしかありません。
そのため、(18)式を満たす\(u\) と \(v\) の値は、一般的に無限個存在することになります。
 ※例外的に2変数でも1つの式で一意に求められるような場合も存在するため、「一般的に」と書いています。

ここで、そもそもの \(u\) と \(v\) とは何であったか、思い出してみましょう。
\(u\) と \(v\) とは、\(y\) がその2変数の和で表現できると仮定した際に現れた変数です。
\(y\) が決まると \(x\) も定まりますが、今回は3次方程式の解を考えているため、 \(x\) の個数としては最大で3つしか存在し得ません。

おろち
おろち

n次方程式の解の個数は最大でn個である」という
代数学の基本的な定理があるのです!!

ゆえに、考え方としては、
(9)式を考えた際に(8)式を満たす \(u\) と \(v\) の組み合わせが綺麗に3個見つかったため、(18)式を考慮する必要がなかった、ということになります。


■突然出てきた、\(\omega\) って何?

最後に、\(\omega\) の正体を明かして終わりにしたいと思います。
 ※「もう知ってるよ!」という方は読み飛ばしてください。

\(\omega\) は文章で説明すると、「3乗したら値が1となる、1以外の複素数」です。

文章だと理解が難しいと思うので、数式で説明します。
まず、以下のシンプルな3次方程式を考えます。

\begin{eqnarray}
\displaystyle x^3 = 1 \tag{21}
\end{eqnarray}

右辺を左辺に移項し、因数分解すると以下のようになります。

\begin{eqnarray}
\displaystyle (x-1)(x^2+x+1) = 0 \tag{22}
\end{eqnarray}

複素数の範囲だと、(22)式の解は以下3つ求まります。

\begin{eqnarray}
\displaystyle x=1,\hspace{5pt} \frac{-1 \pm \sqrt{3}i}{2} \tag{23}
\end{eqnarray}

上の3つの解のうち、\(\dfrac{-1+\sqrt{3}i}{2}\) もしくは \(\dfrac{-1-\sqrt{3}i}{2}\) のいずれかを、今回 \(\omega\) と定義しています。

「、、、え?結局どっちを \(\omega\) としたの?」を思われるかもしれませんが、どちらを \(\omega\) と定義しても問題ないです。
どちらを \(\omega\) と定義しても、 \(\omega\) は以下の性質を満たします。

\begin{eqnarray}
\left\{
\begin{array}{l}
\omega^3 = 1 \tag{24} \\
\omega^2 + \omega +1 = 0 \\
\omega^2 = \bar{\omega}
\end{array}
\right.
\end{eqnarray}


\(\omega\) の基本性質の説明も終えたので、(12)式から(13)式と(14)式の結果を得た流れについて最後に解説します。

(12)式の右辺を一旦 \(B\) とおくと、

\begin{eqnarray}
\displaystyle u^3=B \tag{25}
\end{eqnarray}

となります。
 ※ここでは \(u\) でだけ考えますが、 \(v\)も同様です。

(25)式の両辺を \(B\) で割り、 左辺を3乗の形に合わせると

\begin{eqnarray}
\displaystyle \biggl(\frac{u}{\sqrt[3]{B}}\biggr)^3 = 1 \tag{26}
\end{eqnarray}

となり、(21)式の同様の形になります。なので(26)式も同様に解いていくと、

\begin{eqnarray}
\displaystyle \frac{u}{\sqrt[3]{B}}=1,\hspace{5pt} \frac{u}{\sqrt[3]{B}}=\omega,\hspace{5pt} \frac{u}{\sqrt[3]{B}}=\omega^2 \tag{27}
\end{eqnarray}

となります。(ただし、上では(24)式の \(\omega\) の性質を用いています。)

あとは(27)式の両辺に \(\sqrt[3]{B}\) をかけて、\(B\) を元に戻すと、(13)式のような形となります。


■まとめ

ここまで、いかがでしたでしょうか?
本記事では、私が個人的に悩んだ部分にスポットを当てて解説をしているため、中には「まだ納得いかないな~」とか、「知りたいのそこじゃなかったな~」という方もいらっしゃるかと思います。

もしそういったご意見を持たれた方がいらっしゃいましたら、後学とさせていただきたいので、是非是非コメントいただけますと幸いに存じます。

本記事が少しでも、皆さんの疑問を解決する為の記事となっていれば幸いです。
ここまで記事をお読みいただき、ありがとうございました!

-おもしろ数学