① 6.根据文件的逻辑结构,文件分为
文件的逻辑结构分为:字符流式的无结构文件和记录式的有结构文件
② 文件逻辑结构的定义
文件的逻辑结构是用户可见结构。逻辑文件从结构上分成二种形式:一种是无结构的流式文件,是指对文件内信息不再划分单位,它是依次的一串字符流构成的文件。一种是有结构的记录式文件, 是用户把文件内的信息按逻辑上独立的含义划分信息单位,每个单位称为一个逻辑记录(简称记录)。所有记录通常都是描述一个实体集的,有着相同或不同数目的数据项,记录的长度可分为定长和不定长记录两类。在文件系统设计时,选择何种逻辑结构才能更有利于用户对文件信息的操作呢?一般情况下,选取文件的逻辑结构应遵循下述原则: (1)当用户对文件信息进行修改操作时,给定的逻辑结构应能尽量减少对已存储好的文件信息的变动。(2)当用户需要对文件信息进行操作时,给定的逻辑结构应使文件系统在尽可能短的时间内查找到需要查找的记录或基本信息单位。(3)应使文件信息占据最小的存储空间。(4)应是便于用户进行操作的。显然,对于字符流的无结构文件来说,查找文件中的基本信息单位,例如某个单词,是比较困难的。但反过来,字符流的无结构文件管理简单,用户可以方便地对其进行操作。所以,那些对基本信息单位操作不多的文件较适于采用字符流的无结构方式,例如,源程序文件、目标代码文件等。除了字符流的无结构方式外,记录式的有结构文件可把文件中的记录按各种不同的方式排列,构成不同的逻辑结构,以便用户对文件中的记录进行修改、追加、查找和管理等操作 。记录是一个具有特定意义的信息单位,它由该记录在文件中的逻辑地址(相对位置)与记录名所对应的一组键、属性及其属性值所组成。图7.2是一个记录的组成例。图中,1296是名为R的记录在文件中的逻辑地址,‘姓名:A’是该记录的键,而‘性别’,‘出生年月’,‘工资’等是该记录的属性,紧跟在这些后面的是属性值。一个记录可以有多个键名,每个键名可对应于多项属性。再者,根据各系统设计的要求不一样,记录既可以是定长的,也可以是变长的。记录的长度可以短到一个字符,也可以长到一个文件,这要由系统设计人员确定。
③ 什么叫流式文档
在C语言中对文件的记录是以字符(字节)为单位的。输入输出的数据流的开始和结束仅受程序控制而不受物理符号(如回车换行符)控制。也就是说,在输出时不以回车换行符作为记录的间隔(事实上C文件并不由记录构成)。我们把这种文件称为流式文件。
中文名
流文件
单位
C语言
流式文件
文件中的数据是一串字符没有结构
释义
没有结构的文件
④ 什么是文件的逻辑结构和物理结构
逻辑结构:指一个文件在用户面前所呈现的形式。物理结构:指文件在专文件存储器上的属存储形式。逻辑结构有两种形式:①记录式文件(有结构式文件)。②字符流式文件(无结构式文件),也称流式文件。物理结构:所谓文件系统的物理结构是指数据存放在硬盘上时硬盘磁粉的排列形状。 物理结构的形式:①连续文件结构②串联文件结构③索引文件结构④散列文件结构。
⑤ 什么是文件的逻辑结构和物理结构
文件逻辑结构:指一个文件在用户面前所呈现的形式。物理结构:指文件在文件存储器上的存储形式。逻辑结构有两种形式:①记录式文件。②无结构的流式文件。文件物理结构:谓文件系统的物理结构是指数据存放在硬盘上时硬盘磁粉的排列形状.物理结构有两种形式:①连续结构。②串联结构。③索引结构。
⑥ 什么是文件的逻辑组织和物理组织文件的逻辑组织有几种形式
1 文件的逻辑组织文件的逻辑组织通常分为两种形式,即有结构文件和无结构文件.1)有结构文件又称作记录式文件,它在逻辑上可被看成一组连续记录的集合,即文件是由若干个相关的记录组成.每个记录是一组相关的数据集合,用于描述一个对象某个方面的属性.记录式文件按其记录的长度是否相同又可分为:定长记录文件和变长记录文件两种.(1)定长记录文件:指文件中所有记录的长度都相同.文件的长度可用记录的数目来表示.定长记录处理方便,开销小,被广泛用于数据处理中.(2)变长记录文件:指文件中各记录的长度不相同.在处理之前每个记录的长度是已知的.2)无结构文件无结构文件是指文件内部不再划分记录,它是由一组相关信息组成的有序字符流,即流式文件,其长度直接按字节计算.如大量的源程序、可执行程序、库函数等采用的文件形式是无结构文件形式.在UNIX系统中,所有的普通文件都被看做是流式文件,系统不对文件进行格式处理.2 文件的物理组织几种基本的文件物理存储组织形式:1)连续文件连续文件(又称做顺序文件)是基于磁带设备的最简单的物理文件结构,它是把一个逻辑上连续的文件信息存放在连续编号的物理块(或物理记录)中.连续文件的优点是在顺序存取时速度较快,常用于存放系统文件,如操作系统文件、编译程序文件和其它由系统提供的实用程序文件,因为这类文件往往被从头至尾依次存取.但连续文件也存在如下缺点:(1)要求建立文件时就确定它的长度,依此来分配相应的存储空间,这往往很难实现.(2)不便于文件的动态扩充.(3)可能出现外部碎片,就是在存储介质上存在很多空闲块,但它们都不连续,无法被连续的文件使用,从而造成浪费.2)串连文件为克服连续文件的缺点,可把一个逻辑上连续的文件分散存放在不同的物理块中,这些物理块不要求连续,也不必规则排列.为了使系统能找到下一个逻辑块所在的物理块,可在各物理块中设立一个指针(称为连接字),它指示该文件的下一个物理块.串连文件克服了连续文件的缺点,但它又带来新的问题:(1)一般仅适于对信息的顺序访问,而不利于对文件的随机存取.(2)每个物理块上增加一个连接字,为信息管理添加了一些麻烦.3)FAT文件串连文件的缺点可通过把连接字放在一个内存表格中的方式加以克服.这种在内存中的表格就称为文件分配表(FAT,File Allocation Table).由于连接字保存在FAT表项中,因此整个盘块都可以用来存放数据.另外,也更容易实现随机存取了.与串连文件相似,在文件目录中要添加一个整数,标明该文件的起始盘块号.这种方法的主要缺点是整个FAT必须在系统工作期间始终驻留在内存中,从而占用了较多内存空间.当然,可以把这个表移到分页内存中,采用调页方式进行管理.但是,仍然要占用大量的虚存空间和盘空间,同时也会产生额外缺页问题.4)索引文件索引文件是实现非连续分配的另一种方案:系统为每个文件建立一个索引表.其中的表项指出存放该文件的各个物理块号,而整个索引表由文件说明项指出.这种结构除了具备串连文件的优点之外,还克服了它的缺点.它可以方便地进行随机存取.但是这种组织形式需要增加索引表带来的空间开销.如果这些表格仅放在盘上,那么在存取文件时首先得取出索引表,然后才能查表、得到物理块号.这样就至少增加了一次访盘操作,从而降低了存取文件的速度,加重了 I/O负担.一种改进办法是同时把索引表部分或全部地放人内存.这是以内存空间为代价来换取存取速度的改善.5)多重索引文件为了用户使用方便,系统一般不应限制文件的大小.如果文件很大,那么不仅存放文件信息需要大量盘块,而且相应的索引表也必然很大.在这种情况下把索引表整个放在内存是不合适的,为此引出多重索引结构(又称多级索引结构).在这种结构中采用了间接索引方式,即由最初索引项中得到某一盘块号,该块中存放的信息是另一组盘块号;而后者每一块中又可存放下一组盘块号(或者是文件本身信息),这样间接几级(通常为1~3级),最末尾的盘块中存放的信息一定是文件内容.例如,UNIX文件系统就采用了多重索引的方式.这种方法具有一般索引文件的优点,但也存在间接索引需要多次访盘而影响速度的缺点.由于UNIX分时环境中多数文件都较小,这就大大减弱了其缺点所造成的不利影响。