\begingroup

AAA是正方形的。这个问题有点个人观点,除非有技术答案。但我认为这很有帮助。此外,这个问题与这个问题密切相关:

根据答案,目前还没有已知的方法可以确定地图的对角化程度AA \mapsto {{\{真假}}\}. (另见注释)

这不会发生在可逆性(行列式测度)或实数/复数上,存在垂直对角化/酉对角化A =AA=AA = A^{t}或者AA = AAAA=AAA^*A = AA^*状况。

我的问题是,为什么没有已知的方法来检查对角化能力?我想人们一定尝试过,尽管这可能是一项非常艰巨的任务。但考虑到行列式也是一个非常复杂的函数,但为什么上面的映射从未被明确地找到呢??

注意:简单的答案是“太难了”,但更好的答案是“是什么让它成为一项艰巨的任务”。比如,那张地图的理论真的和我们所知道的任何东西都没有太大联系吗?

注意:我选择了这种地图形式A { 0 , 1 }A{01}A\mapsto\{0,1\}主要是因为我认为“代数方法”这个词不太明确。我正在寻找一个明确可写的函数作为代码AAA(即有限的,并且只需要计算但不需要条件参数)。

注意:某些算法中的某些条件参数可以写成计算(如果x > 0X>0x>0: 返回XXx否则返回000可以明确写成 max(0 , x0X0,x)但如果​​代数重数> 1>1>1显然是不可能的)。我承认这很难形式化,但只要检查是否存在多项式或连续函数就足够了。AAA当等于000确定可对角化性。

\endgroup

15

  • 1
    \begingroup
    从技术上讲,对于复数,酉对角化等同于AA=AAAA=AAAA^\ast = A^\ast A, 不是A =AA=AA = A^\ast. 在正交对角化实数上等同于A =AA=AA = A^t, 尽管。
    \endgroup


    – 

  • 1
    \begingroup
    补充一下 MSEU 的评论,Jordan 范式是正确的做法。它可以通过算法计算,并且当且仅当 Jordan 范式是对角矩阵时,矩阵才是可对角化的。
    \endgroup


    – 

  • 1
    \begingroup
    要计算 Jordan 范式,您可以计算特征多项式,然后对其进行因式分解。然后,对于每个特征值,可以计算相关的特征向量。有一个 Jordan 块大于1 × 11×11 \times 1当且仅当特征多项式中特征值的重数严格大于与该特征值相关的线性独立特征向量的数量。所有这些都可以通过算法计算出来。(不确定计算效率如何,但对于小矩阵,这可以手工完成。)
    \endgroup


    – 

  • 3
    \begingroup
    如果最小多项式是λ−λλλ\prod (\lambda-\lambda_i)^{m_i}那么对应的最大 Jordan 块的大小λλ\lambda_im_i。因此,一个等价条件是AAA当且仅当最小多项式分裂且所有根都具有重数时才是可对角化的111。因此,如果你考虑最小多项式(由矩阵唯一确定),那么你也会得到一个完整的答案。现在,如果你问这些是否有一个简单的“显式”公式m_i那么答案是 99.999999% 是否定的。
    \endgroup


    – 


  • 2
    \begingroup
    这意味着不存在多项式函数(甚至不存在连续函数,因为在欧几里得拓扑中集合甚至不是封闭的/开放的)AAA_{ij}st 对角化等价于函数000或者非零,如可逆性或幺正对角化。
    \endgroup


    – 



最佳答案
3

\begingroup

没有连续函数FFf在矩阵 st 的条目中AAA当且仅当FA = 0FA=0f(A) = 0或当且仅当FA 0FA0f(A) \neq 0. (就像可逆性的情况一样,AAA当且仅当det A 0确定A0\det(A) \neq 0;或者是幺正对角化的情况,其中AAA当且仅当AAAA = 0AAAA=0AA^\ast – A^\ast A = 0)事实上,如果这样的FFf存在,那么可对角化矩阵集要么是封闭的,要么是开放的。两者都不是。我们有,

1ϵ1111ϵ1

\begin{pmatrix}
1 & 1 \\
\epsilon & 1
\end{pmatrix}

ϵ 0ϵ0\epsilon \neq 0(在实际情况下,ϵ > 0ϵ>0\epsilon > 0)但如果ϵ = 0ϵ=0\epsilon = 0。因此,可对角化矩阵的集合不是封闭的。此外,

10ϵ11ϵ01

\begin{pmatrix}
1 & \epsilon \\
0 & 1
\end{pmatrix}

如果ϵ 0ϵ0\epsilon \neq 0,但如果ϵ = 0ϵ=0\epsilon = 0。因此,可对角化矩阵的集合也不是开放的。

(我曾在2 × 22×22 \times 2矩阵,但它可以很容易地适应n × nn×nn \times n对于任意n≥2n2n \geq 2

\endgroup

10

  • 2
    \begingroup
    @PaulFrost 我不是这个意思。我的意思不是FFf英石AAA当且仅当FA = 0FA=0f(A) = 0 一个GGg英石AAA当且仅当GA 0GA0g(A) \neq 0。我的意思既不是这样的FFf也不是这样的GGg可以存在。(我之所以讨论这两个,是因为 OP 的两个例子,可逆矩阵和可酉对角化矩阵,是不同的。第一个集合是开放的,而第二个集合是封闭的。)
    \endgroup


    – 


  • 2
    \begingroup
    @user3716267 不确定你到底是什么意思。我很确定你可以调整这些例子来表明可对角化矩阵集是密集的但没有内部(至少在复杂情况下),所以从这个意义上讲,从拓扑学上讲,它的表现非常糟糕。
    \endgroup


    – 

  • 3
    \begingroup
    @DavidGao 该套装距离s\mathrm{Dist}复杂的n × nn×nn\times n矩阵nnn不同的特征值是开放且密集的,并且每个这样的矩阵都是可对角化的。因此,可对角化矩阵集的内部是非空的,并且确实是密集的。非对角化矩阵集包含在距离s\mathrm{Dist},是特征多项式具有判别零的矩阵集。这是复空间的一个子簇n × nn×nn\times n具有(复数)余维数为一的矩阵。
    \endgroup


    – 


  • 3
    \begingroup
    @user3716267 更正一下,正如 Jim Belk 指出的:可对角化矩阵的集合确实有内部。它的内部正是所有特征值不同的矩阵的集合,它在所有矩阵中已经是稠密的。
    \endgroup


    – 

  • 3
    \begingroup
    对我来说,第一部分更容易理解,因为1011 + ϵ1101+ϵ\begin{pmatrix}1&1\\0&1+\epsilon\end{pmatrix} 当且仅当ϵ 0ϵ0\epsilon\ne 0
    \endgroup


    – 


\begingroup

这是一个救援:有一个连续函数FA FAf(A)矩阵AAA,甚至是多项式函数,它检查特征值AAA是不同的(在代数闭包上)。任何这样的矩阵都是可对角化的,尽管反过来不行,这通常是证明中可对角化条件的有用替代品,因为它意味着可对角化,而且通常更容易证明。

也就是说,我们可以采取FA FAf(A)作为 ΔΔ\Delta多项式AAA. 这是一个次数为n n 1 nn1n(n-1)在系数中AAA等于i jλλλλ\prod_{i \neq j} (\lambda_i – \lambda_j)在哪里λλ\lambda_i是的特征值AAA,所以它非零当且仅当AAA具有不同的特征值。例如,当n = 2n=2n = 2,如果我们写下AAA作为

:ACbd]A=[AbCd]

A = \begin{bmatrix} a & b \\ c & d \end{bmatrix}

那么特征多项式是χA=2a + d) t + ( a db c )χA=2A+d+AdbC\chi_A(t) = t^2 – (a + d) t + (ad – bc),其判别式为

Δ = a + d24 ( a db c ) =a d2+ 4bcΔ=A+d24AdbC=Ad2+4bC

\Delta = (a + d)^2 – 4(ad – bc) = \boxed{ (a – d)^2 + 4bc }.

你可以检查它在所有 Jordan 块上是否消失,更一般地,当且仅当特征多项式有重复的根时它才为零一个+ d2A+d2\frac{a+d}{2}

正如 David 所解释的那样,这些问题都源于具有重复特征值的可对角化矩阵,这些矩阵很难与不可对角化矩阵区分开来(如此困难以至于没有连续函数可以区分它们)。如果我们必须以有限的精度进行数值计算,那么实际上不可能区分这些矩阵,甚至不可能在数值上区分不可对角化矩阵和具有不同特征值的可对角化矩阵,其中一些特征值非常接近。

编辑:这里还有一些讨论。我们可以考虑 Hagen von Eitzen 的矩阵示例

Xε = [1011 + ε]Xε=[1101+ε]

X(\varepsilon) = \begin{bmatrix} 1 & 1 \\ 0 & 1 + \varepsilon \end{bmatrix}

具有不同的特征值ε 0ε0\varepsilon \neq 0但突然变得不可对角化ε = 0ε=0\varepsilon = 0。这很有趣,因为如果一个矩阵具有不同的特征值,那么它的特征向量基在缩放之前是唯一的(请注意,如果它是可对角化的,但具有重复的特征值,则情况并非如此,但非可对角化的矩阵没有特征向量基。那么,特征向量会发生什么Xε XεX(\varepsilon)作为ε 0ε0\varepsilon \to 0

其中一个根本没有改变,即1= [10]1=[10]v_1 = \begin{bmatrix} 1 \\ 0 \end{bmatrix},并且这个仍然是特征向量ε 0ε0\varepsilon \to 0。因此,所有有趣的动作都必须发生在与特征值相关的另一个特征向量上1 + ε1+ε1 + \varepsilon。该特征向量可以表示为

1 + ε= [1ε]1+ε=[1ε]

v_{1 + \varepsilon} = \begin{bmatrix} 1 \\ \varepsilon \end{bmatrix}.

现在我们可以看到发生了什么:ε 0ε0\varepsilon \to 0不仅特征值会碰撞,特征向量也会碰撞!我们还可以看到,如果我们必须以有限的精度进行数值计算,εε\varepsilon非常小,从数字上区分这些特征向量将非常困难。

这表明了这样一种普遍的观点:我们可以认为,如果矩阵的特征值彼此非常接近,那么其特征向量也彼此非常接近,如果我们使它们的特征值发生碰撞,它们就会发生碰撞。像这样的矩阵“几乎不能对角化”;很难区分这些非常接近的特征向量,而且特征值越接近,区分起来就越困难。

\endgroup

\begingroup

矩阵可对角化当且仅当其最小多项式具有不同的根,且实矩阵可对角化RR\mathbb{R}当且仅当所有根都是实数。但给定一个实数或复数多项式FX FXf(x)这两个标准都可以毫不费力地进行检查:

  • FFf有多个根CC\mathbb{C}当且仅当最大公约数(F1最大公约数FF1\gcd(f, f’) \ne 1可以使用欧几里得算法来验证。
  • 假如FFf是真实的,并且有明显的根源CC\mathbb{C}描述了一个查找其有多少个实根的过程,从而检查所有根是否都是实数。

因此,给定一个n × nn×nn \times n矩阵AAA说完了F= RF=RF = \mathbb{R}或者CC\mathbb{C},其最小多项式FX FXf(x),即首一多项式FX FXf(x)程度最小,FA = 0FA=0f(A) = 0. 此类多项式k是线性相关的1 A A2AFn21AA2AFn21, A, A^2, \dots, A^{k} \in F^{n^2}系数为AAA^{k}等于111对于给定的k,高斯消元法要么表明不存在线性相关性,要么产生线性相关性。除以最高幂的系数AAA由此可见,任何非平凡依赖关系都可以转化为次数为≤k\le k. 尤其是检查每一个k = 1 , 2 , =12k = 1, 2, \dots(事实上​​有些k≤nnk \le n由于特征多项式而必须起作用)。

这可能不是最有效的算法,例如高斯消元法可能可以被更快的算法所取代,并且最好进行二分搜索k而不是一个一个地检查。

\endgroup