Java文件流相关

Java里面,将IO流体系按操作方式分类,可分为字节流和字符流。相关类结构图如下:

《Java文件流相关》 字节流和字符流.png

字节流相关的基类是InputStream/OutputStream,其操作方式处理的最基本的数据单元是字节。字符流相关的基类是Reader和Writer,其操作方式处理的最基本的数据单元是Unicode编码的字符。

字节流

字节流通常用来二进制数据,所以适用的场景很多,比如网络数据传输,磁盘文件读写等等。
Java中最基本的两个字节流类是InputStream和OutputStream,它们分别代表了一组基本的输入字节流和输出字节流。InputStream类与OutputStream类均为抽象类,我们在实际使用中通常使用Java类库中提供的它们的一系列子类。我们以InputStream为例,介绍下Java的字节流。
InputStream类中定义了一个抽象方法read(),其子类通过实现该方法,处理从字节流读取字节的相关逻辑

public abstract int read() throws IOException;

read方法的功能是从字节流中读取一个字节,如果到了末尾则返回-1,否则就返回读取到的字节。调用这个方法需要注意的是,它会一直阻塞线程直到返回读取到的字节或者-1。另外,字节流默认情况下,是不支持缓存的。这意味着每次调用read()都会请求操作系统去读取一个字节,如果是文件读取,就会涉及到磁盘访问,因此效率会比较低。可能有人注意到InputStream类中还有另一个read(byte[])方法,其实它内部的实现也只是循环调用read()方法,本质上还是一样。基于这样的局限,就需要用到BufferedInputStream。它可以利用缓冲区来减少系统IO操作的次数,提高读写性能,缓冲区默认大小为8M。
以下是字节流的简单用法

File file = new File("H:/sourceCode/workspace4java/test.txt");
FileInputStream inputStream = new FileInputStream(file);
            int n = -1;
            byte[] bytes = new byte[(int)file.length()];
            int len = inputStream.read(bytes);
            System.out.println("文件字节长度为"+len);
            System.out.println(new String(bytes));
            inputStream.close();

            FileInputStream inputStream2 = new FileInputStream(file);
            BufferedInputStream bufferedInputStream = new BufferedInputStream(inputStream2,4*1024);
            byte[] bytes2 = new byte[(int)file.length()];
            int len2 = bufferedInputStream.read(bytes2);
            System.out.println("文件字节长度为"+len2);
            System.out.println(new String(bytes2));
            inputStream2.close();
            bufferedInputStream.close();

字符流

字符流通常用来处理文本数据。因为字符流操作的最基本的单元是Unicode码。Unicode码的范围是0x0000~0xFFFF,在这个范围内的每一个数字都与一个字符相对应,Java的String类型默认就是将字符以Unicode编码的形式存在内存中的。但在实际开发中,我们会发现,在某些系统或者存储文件中,字符并不都是以Unicode编码形式存储的。编码方式不同,会导致相同的字符会有不同的二进制表示。
所以实际上,字符流的工作机制是这样的:

  • 输入流:将要读取的字节序列按指定的编码方式转换成相应的字符序列(实际上是Unicode码序列),然后存入内存。
  • 输出流:将要传输的字符序列(实际上是Unicode码序列)按指定的编码方式转换成响应的字节流,然后输出。
    由于字符流在输出前,都要完成字符序列到字节序列之间的转换过程,所以它会用到内存缓存区来存放转换得到的字节序列。
    以下是字符流的简单用法:
File file = new File("H:/sourceCode/workspace4java/test.txt");
FileWriter writer = new FileWriter(file);
            writer.write("这是一个输出字符流");
            writer.close();
            FileReader reader = new FileReader(file);
            StringBuffer sb = new StringBuffer();
            int temp2 = -1;
            while((temp2 = reader.read())!=-1){
                //read方法一次只读取一个字符
                sb.append((char)temp2);
            }
            System.out.println(sb);
            reader.close();

            FileReader reader2 = new FileReader(file);
            BufferedReader bufferedReader = new BufferedReader(reader2);
            StringBuffer sb2 = new StringBuffer();
            String str = null;
            while((str = bufferedReader.readLine())!=null){
                sb2.append(str);
            }
            System.out.println(sb2);
            reader2.close();
            bufferedReader.close();
FileWriter和BufferedWriter的区别
//例1
FileWriter file = new FileWriter("foo.txt");
file.write("foobar");
file.close();
FileWriter file = new FileWriter("foo.txt");BufferedWriter bf = new BufferedWriter(file);
bf.write("foobar");
bf.close();
//例2
for(int i = 0; i < 100; i++) {
    writer.write("foorbar");
    writer.write(NEW_LINE);}
writer.close();
  • 写入单一数据(调用一次write方法)到文件时,FileWriter和BufferedWriter都是一次性写入到磁盘,也就是指有一次磁盘访问操作。而不是一个字符一个字符的写入。
  • 写入多条数据(如代码中的例2),每一次执行write方法,FileWriter都会请求系统进行磁盘操作。而BufferedWriter则会根据其配置的缓存区大小,默认是8M,如果多次执行write方法累积的数据没有超过8M, 则只会调用一次磁盘操作写入。

字节流和字符流的区别

  • 字节流操作的最基本的数据单元是字节,字符流操作的最基本的数据单元是字符。
  • 字节流默认不使用缓冲区,字符输出流则会使用缓冲区存放转换的字节序列
  • 字节流通常用于处理二进制数据,实际上可以处理任意类型的数据(图片,音视频,文本等),但它不支持直接读写Unicode码。字符流通常用来处理文本数据,它支持直接读写Unicode码。

随机访问文件

在实际开发中,文件的多线程下载和断点续传是经常会遇到的使用场景,这其中就涉及到从文件中的指定位置读写数据,这就需要用到Java中的RandomAccessFile类,随机访问文件。
一般的文件IO流,访问文件都是按照文件内容的顺序从头开始读写。RandomAccessFile类可以让我们从文件中的任何位置读写数据。
可以以4中模式创建RandomAccessFile对象:

模式含义
“r”文件以只读模式打开。
“rw”该文件以读写模式打开。 如果文件不存在,则创建该文件。
“rws”该文件以读写模式打开。 对文件的内容及其元数据的任何修改立即被写入存储设备。
“rwd”该文件以读写模式打开。 对文件内容的任何修改立即被写入存储设备。
//在构造方法中传入文件名称和访问模式
RandomAccessFile  raf = new RandomAccessFile("randomtest.txt", "rw");

RandomAccessFile常用的一些方法

  • 使用readUTF()和writeUTF()方法处理字符串。
  • 使用readInt()和writeInt()方法处理整数。
  • 通过getFilePointer()方法获取文件指针的位置,初始化时为0。
  • 通过seek()方法,将文件指针设置到指定的位置。
  • length() 返回文件当前的长度,我们也可以通过setLength()方法来扩展或者截断文件。
    以下是RandomAccessFile类的简单用法
RandomAccessFile raf = new RandomAccessFile("H:/sourceCode/workspace4java/test.txt","rw");
            raf.writeUTF("随机访问文件输出UTF-8");
            raf.seek(0);
            String str = raf.readUTF();
            System.out.println(str);

            raf.seek(8);
            byte[] bytes = new byte[12];
            raf.read(bytes);
            String s = new String(bytes);
            System.out.println(s);

            raf.seek(0);
            raf.writeUTF("访问文件RandomAccessFile");

            raf.seek(0);
            byte[] bytes2 = new byte[14];
            raf.read(bytes2);
            String s2 = new String(bytes2);
            System.out.println(s2);

            raf.seek(2);
            byte[] bytes3 = new byte[12];
            raf.read(bytes3);
            String s3 = new String(bytes3);
            System.out.println(s3);
            raf.close();

打印结果

随机访问文件输出UTF-8
访问文件
 访问文件
访问文件

值得注意的是,通过writeUTF方法写入数据,会默认在字符串开头多家两个字节。所以才会有上面的运行结果:从文件指针为0的位置,开始读取会读出开头的两个字节,而真实的数据内容从第三个字节的位置开始。

文章参考
https://stackoverflow.com/questions/21980090/javas-randomaccessfile-eofexception
https://www.ibm.com/developerworks/cn/java/j-lo-serial/index.html
http://www.importnew.com/23963.html
https://www.jianshu.com/p/509c78602ed2
https://stackoverflow.com/questions/12350248/java-difference-between-filewriter-and-bufferedwriter

    原文作者:zackyG
    原文地址: https://www.jianshu.com/p/113f92396a24
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞