\begingroup

,B, B’是向量空间的基,设[][]v_{[B]}是坐标v作为基础中的列向量B. 是基础变化矩阵PBB’定义为

[]= P[](1)(1)[]=[]

v_{[B’]} = Pv_{[B]}\tag{1}或者

[]=1[](2)(2)[]=1[]

v_{[B’]} = P^{-1}v_{[B]}\tag{2}

我觉得两个定义都在用。例如,在,被接受的答案使用定义 (1),但 OP 似乎认为应该是定义 (2)。

更权威的是,Artin 写道

Artin 似乎正在使用定义 (2)!

在我看来,根据 Artin 的定义,确实是正确的!

有趣的是,Artin 在前一页有一个脚注

如果是这样:

  • 以下哪一个定义是首选或标准的?
  • 他们为什么改变呢?
  • 最重要的是:我们如何保持它们清晰?

但至少:

  • 您能否确认确实存在两个相互冲突(相反)的正在使用的基变换矩阵定义?

\endgroup

6

  • 1
    \begingroup
    不同的作者会使用不同的惯例。据我所知,“标准”惯例(特别是我在书中使用的惯例)是让矩阵P给出新 ^basis* 向量相对于旧 ^basis* 向量的坐标。这与 Artin 的观点一致,并得出约定 (2)。
    \endgroup


    – 


  • 1
    \begingroup

    \endgroup


    – 

  • 3
    \begingroup
    将基变换矩阵写成恒等映射的矩阵表示会更加清楚,即把它们写成[ ID][ID]{}_{B’}[\operatorname{id}]_B或者[ ID][ID]{}_{B}[\operatorname{id}]_{B’}。如果采用这种明确的符号,惯例就无关紧要了。我总是想知道为什么没有作者这样做。
    \endgroup


    – 

  • \begingroup
    术语“转换矩阵”也经常出现,但在我看来,它的含义含糊不清。
    \endgroup


    – 

  • \begingroup
    @MartinBrandenburg 我一般不使用图像,但认为在这里逐字逐句地显示符号和来源很重要。
    \endgroup


    – 


最佳答案
4

\begingroup

这两个(两者P11P^{-1}) 显然是基变换矩阵,按照任何人的定义!将向量转换为基B转化为基础向量B’,并将向量转换为基础B’转化为基础向量B冲突似乎不在于基矩阵变换的定义,而在于我们对所指的基矩阵变换的混淆。

我已经看到使用符号P_{B \gets B’}P_{B’ \gets B}对于两个矩阵(互为逆),使得

[]=[][]=[][]=[][]=[]

v_{[B’]} = P_{B’ \gets B} v_{[B]}\qquad v_{[B]} = P_{B \gets B’} v_{[B’]}.

一旦你习惯了,这个符号就不会产生歧义。链式法则
一个B=一个C一个=一个P_{A \gets B} P_{B \gets C} = P_{A \gets C}成立,这有助于我们通过分解因式写出基矩阵变换公式P_{B\gets B’}作为B EP_{B \gets E} P_{E\gets B’}或者11(P_{E \gets B})^{-1} P_{E \gets B’}

\endgroup

2

  • 1
    \begingroup
    我认为这种表示法仍然同样含糊不清,因为没有指示P_{B \gets B’}改变基础向量 B’基础向量 B或改变坐标中的矢量 B’坐标 B
    \endgroup


    – 

  • \begingroup
    我认为这种混淆来自于这样一个事实:向量空间自然同构于它们的对偶的对偶,因此一个空间的一个基变化矩阵对应于其对偶空间的另一个基变化矩阵,两者之间没有自然的选择。
    \endgroup


    – 

\begingroup

你可能是对的。

我发现有一件事很容易记住,那就是具有给定列的矩阵将把该基中的向量转化为这些列所表达的任何基中的表达式。这仅仅是因为将矩阵应用于标准基向量会返回列。

当然,文献对此可能令人困惑。

当他们谈论逆方差和协方差时也令人困惑。

这更有理由使用这个经验法则。

\endgroup

\begingroup

这里确实有两个相反的定义。现在,数学中相互矛盾的定义很常见000自然数?常数序列是递增的吗?),但这里的独特之处——我知道的唯一例子——是这两个定义完全相反。除了将基础更改为自身的简单情况外,它们永远不会一致。

这个问题的根源似乎不是缺乏惯例,而是一种固有属性。正如所解释的那样,如果P改变基础向量B到基础向量B’, 然后P也改变坐标中的矢量B’到坐标B

相反,如果Q改变坐标中的矢量B到坐标B’, 然后Q改变基向量本身B’到基向量B

改变基向量是一种无坐标操作。我们不需要指定坐标系或特定的基。在我们的抽象向量空间中,B是一组向量,B’是另一个,并且都可以用作基础。 P更改BB’。 和P可以简单地定义为映射每个向量的唯一线性变换B到其对应的向量B’.也许正是由于这个原因,许多人更喜欢定义(2)。

另一方面,我认为改变坐标是更实际、更有用的操作,这表明定义 (1)。定义Q这样做,但是,一旦我们这样做了,Q更接近我们将要使用的方式。我们需要更改坐标的频率比实际更改基础本身的频率要高得多。

鉴于这个问题已经令人困惑,也许最好的办法是完全避免使用这个词,而只是说出你的意思(例如“让Q是改变坐标向量的矩阵B到坐标B’“。”)

\endgroup

\begingroup

在向量空间中V如果(在我看来,这是唯一一致的选择)基础变更矩阵P B = (i = 1 , , n==1nB=(e_i)_{i=1,\dots,n} = (i = 1 , , n==1nB’=(e’_i)_{i=1,\dots,n}由位置定义(求和约定

=i = 1 n  (1)(1)=  =1n

e’_i=P_i^je_j,\space\space i=1,\dots,n\tag1
然后,给定任何(“列”)向量v∈Vv\in V,我们得到:

==

v’^ie’_i=v^je_j
即(通过
1 1(1)):

==

v’^iP_i^je_j=v^je_j
因此(根据基向量的线性独立性):

=, j = 1 , , n  =  =1n

v^j=P_i^jv’^i,\space\space j=1,\dots,n
最后:

= (1, j = 1 , , n  (2)(2)=1  =1n

v’^j=(P^{-1})_i^jv^i,\space\space j=1,\dots,n\tag2
因此,如果要选择一个,我肯定会选择你的
2 2(2)/Artin 的第二版。关键点在于,基向量和(“列”)向量的分量(正确地说是“相反变量”)彼此反向变化。(顺便说一句,这正是物理量的优良特性:它们的测量单位越大,它们所表示的数字就越小,以这些 UOM 为单位。)

\endgroup

2

  • \begingroup
    你能更清楚地解释一下为什么你认为该定义是“唯一连贯的选择”吗?
    \endgroup


    – 

  • \begingroup
    …从…到…”提醒你“开始”从未启动的情况到启动的情况。如果P完成这个任务,那么1 1(1)似乎(仅从语言上来说)是最连贯的选择,这反过来又会引导我们到达终点2 2(2)当然,这是因为我更重视基向量而不是向量分量。
    \endgroup


    –