数据结构入门----数组和广义表的概念及应用

已经学过的线性表:数据元素都是非结构的原子类型。

数组和广义表的特点:一种特殊的线性表

① 元素的值并非原子类型,可以再分解,表中元素也是一个线性表(即广义的线性表)。即数据元素本身也是一个数据结构。

② 所有数据元素仍属同一数据类型。

数组的定义

数组: 由一组名字相同、下标不同的变量构成。

一维数组的特点:1个下标,ai 是ai+1的直接前驱

二维数组的特点:2个下标,每个元素ai,j受到两个关系(行关系和列关系)的约束:

《数据结构入门----数组和广义表的概念及应用》

一个m×n的二维数组可以看成是m行的一维数组,或者n列的一维数组。

N维数组的特点:n个下标,每个元素受到n个关系约束。

一个n维数组可以看成是由若干个n-1维数组组成的线性表。

N维数组的数据类型定义

n_ARRAY = (D, R)

其中:数据对象:《数据结构入门----数组和广义表的概念及应用》

数据关系:《数据结构入门----数组和广义表的概念及应用》《数据结构入门----数组和广义表的概念及应用》

基本操作:构造数组、销毁数组、读数组元素、写数组元素

数组的顺序表示和实现

问题:计算机的存储结构是一维的,而数组一般是多维的,怎样存放?

解决办法:事先约定按某种次序将数组元素排成一列序列,然后将这个线性序列存入存储器中。

例如:在二维数组中,我们既可以规定按行存储,也可以规定按列存储。

注意: 若规定好了次序,则数组中任意一个元素的存放地址便有规律可寻,可形成地址计算公式;

约定的次序不同,则计算元素地址的公式也有所不同;

C和PASCAL中一般采用行优先顺序;FORTRAN采用列优先。

行优先顺序推广到多维数组,可规定为先排最右的下标。

按行优先存储的寻址

《数据结构入门----数组和广义表的概念及应用》《数据结构入门----数组和广义表的概念及应用》

二维数组,第一维的长度是b1,第二维的长度是b2.LOC(aij)=LOC(a00)+(i×b2+j) ×L

无论规定行优先或列优先,只要知道以下三要素便可随时求出任一元素的地址(这样数组中的任一元素便可以随机存取!):

①开始结点的存放地址(即基地址) ②维数和每维的上、下界; ③每个数组元素所占用的单元数

《数据结构入门----数组和广义表的概念及应用》

补充:计算二维数组元素地址的通式 设一般的二维数组是A[c1..d1, c2..d2],这里c1,c2不一定是0。

则行优先存储时的地址公式为:

 《数据结构入门----数组和广义表的概念及应用》

二维数组列优先存储的通式为: 《数据结构入门----数组和广义表的概念及应用》

顺序存储方式:按低地址优先(或高地址优先)顺序存入一维数组。(难点是多维数组与一维数组的地址映射关系)

《数据结构入门----数组和广义表的概念及应用》

该式称为n维数组的映像函数:

《数据结构入门----数组和广义表的概念及应用》

《数据结构入门----数组和广义表的概念及应用》《数据结构入门----数组和广义表的概念及应用》

N维数组的顺序存储表示

#define MAX_ARRAY_DIM   8   //假设最大维数为8
 typedef struct{
      ELemType *base;       //数组元素基址
      int            dim;             //数组维数
      int          *bound;        //数组各维长度信息保存区基址
      int         *constants;   //数组映像函数常量的基址,即Ci信息保存区,C1到Cn

   }Array;,

< stdarg.h > :利用函数va_start、va_arg和va_end提供遍历未知数目和类型的函数参数表的功能。

Va_start ( va_list  ap,  x ):初始化ap,使其指向所在函数的参数x之后的第一个参数。

Va_arg ( va_list  ap ,  类型):返回ap当前指向的参数的值,并修改ap,使得ap指向下一个参数(“类型”为参数类型)。

Va_end ( va_list  ap):用在所有的参数处理完毕之后,表示ap使用完毕。

数组的基本操作函数说明(5个)

Status InitArray (Array &A, int dim,…){    
//若维数dim和各维长度合法,则构造相应的数组A并返回OK
   if (dim<1||dim>MAX_ARRAY_DIM)  return ERROR;
   A.dim=dim;
   A.bounds=(int *)malloc(dim * sizeof(int)); 
    if(!a.bounds) exit(OVERFLOW); // 分配存放“各维长度”的空间
 //若各维长度合法,则存入A.bounds,并求出A的元素总数elemtotal
  elemtotal=1;
   va_start(ap, dim); 
           //ap为va_list类型,是存放变长参数表信息的   类型,将ap指向dim后的第一个参数
   for(i=0;i<dim;++i) {
       A.bounds[i]=va_arg (ap, int);   
              // 返回ap当前指向的参数,并按参数类型将ap指向下一个参数
       if (A.bounds[i]<0) return UNDERFLOW;
       elemtotal *=A.bounds[i];   }
    va_end(ap);     //  ap使用完毕
   A.base=(ElemType * )malloc(elemtotal * sizeof(ElemType));
   if(!A.base) exit(OVERFLOW);  //  分配数组元素空间
   A.constants=(int * )malloc(dim *sizeof(int));
   if(!A.constans) exit(OVERFLOW);    //分配存放C i的空间
   A.constans[dim-1]=1;   //  L=1 
   for(i=dim-2;i>=0;--i)
      A.constants[i]=A.bounds[i+1]*A.constants[i+1];// b i+1    C i+1
   return OK;                 
 }
Status DestroyArray (Array &A)
{     //销毁数组A
   if ( ! A.base )  return   ERROR;
   free(A.base);//数组基址指针
   A .base  =  NULL;
   if ( ! A.bounds )  return ERROR;
   free( A .bounds );//各维长度保存区指针
   A.bounds = NULL;
   if ( !A.constants )   return ERROR;
   free ( A. constants ) ;//映像函数Ci保存区指针
   A. constants = NULL;
   return OK;
 }
Status Locate(Array A, va_list ap, int &off) {
//若ap指示的各下标值合法,则求出该元素在A中相对地址off
    off=0;
    for(i=0;i<A.dim;++i)
    {
      ind= va_arg(ap, int);
      if (ind<0||ind>A.bounds[i]) return OVERFLOW;
      off += A.constants[i]  * ind ;//C i * j i
    }                     
    return OK;
 }
Status Value(Array A, ElemType &e,…)
{
  //A是n维数组,e为元素变量,随后是n个下标值,若各下标不超界,则e赋值为所指定的A的元素值,即将指定元素值读到e变量中。
   va_start (ap, e);  // 将ap指向e后的参数
   if((result=Locate(A, ap, off))<=0) return result;
   e=*(A.base+off); 
   return OK;
 }
Status Assign(Array &A,ElemType e,…)
{
  //A是n维数组,e为元素变量,随后是n个下标值,若各下 标不超界,则e的值赋为所指定的A的元素值,即:将e值写入指定数组单元。
   va_start(ap,e);
   if( (result=Locate(A,ap,off ) )<=0) return result;
   *(A.base+off)=e;
   return OK;
 }

矩阵的压缩存储(即数组的应用)

1. 什么是压缩存储?

若多个数据元素的值都相同,则只分配一个元素值的存储空间,且零元素不占存储空间。

2. 什么样的矩阵具备压缩条件?      

特殊矩阵(对称矩阵,对角矩阵,三角矩阵) 和稀疏矩阵。

3. 什么叫稀疏矩阵?

矩阵中非零元素的个数较少(一般小于5%)

特殊矩阵的压缩存储—对称矩阵  对称矩阵特点:aij=aji

《数据结构入门----数组和广义表的概念及应用》

如何压缩存储?只存储下三角部分的元素。以一维数组sa[n(n+1)/2]作为存储结构。

1+2+…+n=n(n+1)/2

sa[k]和aij间的对应关系(1=<i,j<=n)

当i>=j时,aij是下三角中的元,k=i(i-1)/2+j-1

当i<j时, aij是上三角中的元, k=j(j-1)/2+i-1

aij的i和j是从1开始

sa[k]的k是从0开始

问题: 如果只存储稀疏矩阵中的非零元素,那这些元素的位置信息该如何表示?

解决思路: 对每个非零元素增开若干存储单元,例如存放其所在的行号和列号,便可准确反映该元素所在位置。

实现方法: 将每个非零元素用一个三元组(i,j,aij)来表示,则每个稀疏矩阵可用一个三元组表来表示。

用三元组表表示

《数据结构入门----数组和广义表的概念及应用》《数据结构入门----数组和广义表的概念及应用》

注意:为更可靠描述,通常再加一行“总体”信息:即总行数、总列数、非零元素总个数

稀疏矩阵压缩存储的缺点:将失去随机存取功能

用十字链表表示

当矩阵的非0元素个数和位置在操作中变化较大时,适合用十字链表。

用途:方便稀疏矩阵的加减运算;例如插入一个非0元素或者删除一个非0元素。

方法:每个非0元素占用5个域。

《数据结构入门----数组和广义表的概念及应用》

十字链表的特点:

①每行非零元素链接成带表头结点的链表;

②每列非零元素也链接成带表头结点的链表。 则每个非零元素既是行、链表中的一个结点;又是列循环链表中的一个结点,即呈十字链状。

三元组表的顺序存储表示

 #define MAXSIZE 125000  //设非零元素最大个数125000
 typedef struct  {
   int i;             //元素行号
   int j;            //元素列号
   ElemType e;     //元素值
} Triple;        //一个结点的结构定义

typedef struct  {
 Triple  data[MAXSIZE+1]; 
//三元组表,以行为主序存入一维向量 data[ ]中
    int mu;       //矩阵总行数
    int nu;       //矩阵总列数
    int tu;       //矩阵中非零元素总个数
} TsMatrix;     //整个三元组表的定义

《数据结构入门----数组和广义表的概念及应用》《数据结构入门----数组和广义表的概念及应用》

稀疏矩阵的操作(以转置运算为例)

《数据结构入门----数组和广义表的概念及应用》《数据结构入门----数组和广义表的概念及应用》

采用三元组压缩技术存储稀疏矩阵

(1)每个元素的行下标和列下标互换(即三元组中的i和j互换);

(2)T的总行数mu和总列数nu与M的不同(互换);        

(3)重排三元组内元素顺序,使转置后的三元组也按行(或列)为主序有规律的排列。

(1)和(2)容易实现,难点在(3)。有两种实现方法:压缩转置、(压缩)快速转置

压缩转置

思路:反复扫描a.data中的列序,从小到大依次进行转置。

《数据结构入门----数组和广义表的概念及应用》

压缩转置算法描述:

Status TransPoseSMatrix(TSMatrix M, TSMatrix &T)
{    //用三元组表存放稀疏矩阵M,求M的转置矩阵T
T.mu=M.nu;  T.nu=M.mu;  T.tu=M.tu;
 if (T.tu) { 
   q=1;          //q是转置矩阵T的结点编号
   for(col=1; col<=M.nu; col++) //col是扫描M三元表列序的变量
     {for(p=1; p<=M.tu; p++) //p是M三元表中结点编号
        {if (M.data[p].j==col)
            {T.data[q].i=M.data[p].j;  T.data[q].j=M.data[p].i;
                T.data[q].value=M.data[p].value;  q++;
            }
          }
      }
   }
     return OK;
} //TranposeSMatrix;

压缩转置算法的效率分析:

主要时间消耗在查找M.data[p].j=col的元素,由两重循环完成:  for(col=1; col<=M.nu; col++)  循环次数=nu ,for(p=1; p<=M.tu; p++)    循环次数=tu 所以该算法的时间复杂度为O(nu*tu)         —-即M的列数与M中非零元素的个数之积

最恶劣情况:M中全是非零元素,此时tu=mu*nu,时间复杂度为 O(nu2*mu )

注:若M中基本上是非零元素时,即使用非压缩传统转置算法的时间复杂度也不过是O(nu*mu) 

结论:压缩转置算法不能滥用。

前提:仅适用于非零元素个数很少(即tu<<mu*nu)的情况。

快速转置

思路:依次把a.data中的元素直接送入b.data的恰当位置上(即M三元组的p指针不回溯)。

《数据结构入门----数组和广义表的概念及应用》

设计思路:如果能预知M矩阵每一列(即T的每一行)的非零元素个数,又能预知第一个非零元素在b.data中的位置,则扫描a.data时便可以将每个元素准确定位(因为已知若干参考点)。请注意a.data特征:每列首个非零元素必定先被扫描到。

技巧:利用带辅助向量的三元组表,它正好携带每行(或列)的非零元素个数 NUM(i)以及每行(或列)的第一个非零元素在三元组表中的位置POS(i) 等信息。

令:M中的列变量用col表示;

num[ col ]:存放M中第col 列中非0元素个数

cpot[ col ]:存放M中第col列的第一个非0元素的位置,(即b.data中待计算的“恰当”位置所需参考点)

《数据结构入门----数组和广义表的概念及应用》

按列优先的辅助向量求出后, 由a.data中每个元素的列信息,即可直接查出b.data中的重要参考点之位置,进而可确定当前元素之位置!

快速转置算法描述:

Status FastTransposeSMatrix(TSMatirx M, TSMatirx &T)
{           //M用顺序存储表示,求M的转置矩阵T
T.mu = M.nu ;T .nu = M.mu ; T.tu = M.tu ;
 if ( T.tu ) {
for(col = 1; col <=M.nu; col++) num[col] =0;  //初始化M中各列元素个数为0
for( i = 1; i <=M.tu; i ++) {col =M.data[ i ] .j ; ++num [col] ;}
 cpot[ 1 ] =1;    //再生成每列首元位置辅助向量表
 for(col = 2; col <=M.nu; col++)  cpot[col ]=cpot[col-1]+num [col-1 ] ;
 for( p =1; p <=M.tu ; p ++ )    //p指向a.data,循环次数为非0元素总个数tu
  { col =M.data[ p ]. j ; q =cpot [ col ];     //查辅助向量表得q,即T中位置
                    T.data[q].i = M.data[p]. j;
                    T.data[q].j = M.data[p]. i;
                    T.data[q]. value = M.data[p]. value;
                    + + cpot[col] ;//重要语句!修改向量表中列坐标值,供同一列下一非零元素定位之用!
   }  //for
}  //if
return OK; 
}  //FastTranposeSMatrix;

快速转置算法的效率分析:

1. 与常规算法相比,附加了生成辅助向量表的工作。增开了2个长度为列长的数组(num[ ]和cpos[ ])。

2. 从时间上,此算法用了4个并列的单循环,而且其中前3个单循环都是用来产生辅助向量表的。

         for(col = 1; col <=M.nu; col++)  循环次数=nu;

         for( i = 1; i <=M.tu; i ++)            循环次数=tu;

         for(col = 2; col <=M.nu; col++)  循环次数=nu;

         for( p =1; p <=M.tu ; p ++ )       循环次数=tu;

该算法的时间复杂度=(nu*2)+(tu*2)=O(nu+tu)

最恶劣情况是tu=nu*mu(即矩阵中全部是非零元素), 而此时的时间复杂度也只是O(mu*nu),并未超过传统转置算法的时间复杂度。

传统转置:O(mu*nu)    压缩转置:O(mu*tu)     压缩快速转置:O(nu+tu)——牺牲空间效率换时间效率。

广义表的定义

广义表是线性表的推广,也称为列表(lists)。记为:《数据结构入门----数组和广义表的概念及应用》

在广义表中约定:① 第一个元素是表头,而其余元素组成的表称为表尾; ② 用小写字母表示原子类型,用大写字母表示列表。

广义表中元素既可以是原子类型,也可以是列表; 当每个元素都为原子且类型相同时,就是线性表。

《数据结构入门----数组和广义表的概念及应用》《数据结构入门----数组和广义表的概念及应用》

D=(A,B,C)=(( ),(e),(a,(b,c,d))),共享表

E=(a,E)=(a,(a,E))= (a,(a,(a,…….))),E为递归表

特点:

有次序性:一个直接前驱和一个直接后继

有长度:=表中元素个数

有深度:=表中括号的重数

可递归:自己可以作为自己的子表

可共享:可以为其他广义表所共享

《数据结构入门----数组和广义表的概念及应用》《数据结构入门----数组和广义表的概念及应用》

《数据结构入门----数组和广义表的概念及应用》《数据结构入门----数组和广义表的概念及应用》

①的长度为3,深度为3                                                ②的长度为2,深度为∞

深度=括号的重数=    结点的层数

两种特殊的基本操作: GetHead( L) ——取表头(可能是原子或列表); GetTail(L )   ——取表尾(一定是列表) 。

特别提示:任何一个非空表,表头可能是原子,也可能是列表;但表尾一定是列表。

广义表的存储结构

由于广义表中的数据元素的类型不统一,因此难以采用顺序存储结构来存储。

若广义表不空,则可分解为表头和表尾;反之,一对确定的表头和表尾可唯一地确定一个广义表。

采用头尾表示法存储广义表

广义表的存储结构——头尾表示法

广义表中的数据元素既可以是广义表也可以是单元素,  表结点——存储广义表原子结点——存储单元素

结点结构

《数据结构入门----数组和广义表的概念及应用》

tag:区分表结点和元素结点的标志; hp:指向表头结点的指针; tp:指向表尾结点的指针; data:数据域,存放单元素。

另外一种存储方法:

1.原子结点

《数据结构入门----数组和广义表的概念及应用》

2.表结点    

《数据结构入门----数组和广义表的概念及应用》

 

代码实现:矩阵的两种转置运算https://blog.csdn.net/qq1457346557/article/details/107122911

 

    原文作者:xulijian1009
    原文地址: https://blog.csdn.net/qq1457346557/article/details/107211191
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞