Java文件流相关

2019年5月8日 146次阅读来源: zackyG

Java里面，将IO流体系按操作方式分类，可分为字节流和字符流。相关类结构图如下：

《Java文件流相关》字节流和字符流.png

字节流相关的基类是InputStream/OutputStream，其操作方式处理的最基本的数据单元是字节。字符流相关的基类是Reader和Writer，其操作方式处理的最基本的数据单元是Unicode编码的字符。

字节流

字节流通常用来二进制数据，所以适用的场景很多，比如网络数据传输，磁盘文件读写等等。
Java中最基本的两个字节流类是InputStream和OutputStream，它们分别代表了一组基本的输入字节流和输出字节流。InputStream类与OutputStream类均为抽象类，我们在实际使用中通常使用Java类库中提供的它们的一系列子类。我们以InputStream为例，介绍下Java的字节流。
InputStream类中定义了一个抽象方法read()，其子类通过实现该方法，处理从字节流读取字节的相关逻辑

public abstract int read() throws IOException;

read方法的功能是从字节流中读取一个字节，如果到了末尾则返回-1，否则就返回读取到的字节。调用这个方法需要注意的是，它会一直阻塞线程直到返回读取到的字节或者-1。另外，字节流默认情况下，是不支持缓存的。这意味着每次调用read()都会请求操作系统去读取一个字节，如果是文件读取，就会涉及到磁盘访问，因此效率会比较低。可能有人注意到InputStream类中还有另一个read(byte[])方法，其实它内部的实现也只是循环调用read()方法，本质上还是一样。基于这样的局限，就需要用到BufferedInputStream。它可以利用缓冲区来减少系统IO操作的次数，提高读写性能，缓冲区默认大小为8M。
以下是字节流的简单用法

File file = new File("H:/sourceCode/workspace4java/test.txt");
FileInputStream inputStream = new FileInputStream(file);
            int n = -1;
            byte[] bytes = new byte[(int)file.length()];
            int len = inputStream.read(bytes);
            System.out.println("文件字节长度为"+len);
            System.out.println(new String(bytes));
            inputStream.close();

            FileInputStream inputStream2 = new FileInputStream(file);
            BufferedInputStream bufferedInputStream = new BufferedInputStream(inputStream2,4*1024);
            byte[] bytes2 = new byte[(int)file.length()];
            int len2 = bufferedInputStream.read(bytes2);
            System.out.println("文件字节长度为"+len2);
            System.out.println(new String(bytes2));
            inputStream2.close();
            bufferedInputStream.close();

字符流

字符流通常用来处理文本数据。因为字符流操作的最基本的单元是Unicode码。Unicode码的范围是0x0000~0xFFFF，在这个范围内的每一个数字都与一个字符相对应，Java的String类型默认就是将字符以Unicode编码的形式存在内存中的。但在实际开发中，我们会发现，在某些系统或者存储文件中，字符并不都是以Unicode编码形式存储的。编码方式不同，会导致相同的字符会有不同的二进制表示。
所以实际上，字符流的工作机制是这样的：

输入流：将要读取的字节序列按指定的编码方式转换成相应的字符序列（实际上是Unicode码序列），然后存入内存。
输出流：将要传输的字符序列（实际上是Unicode码序列）按指定的编码方式转换成响应的字节流，然后输出。
由于字符流在输出前，都要完成字符序列到字节序列之间的转换过程，所以它会用到内存缓存区来存放转换得到的字节序列。
以下是字符流的简单用法：

File file = new File("H:/sourceCode/workspace4java/test.txt");
FileWriter writer = new FileWriter(file);
            writer.write("这是一个输出字符流");
            writer.close();
            FileReader reader = new FileReader(file);
            StringBuffer sb = new StringBuffer();
            int temp2 = -1;
            while((temp2 = reader.read())!=-1){
                //read方法一次只读取一个字符
                sb.append((char)temp2);
            }
            System.out.println(sb);
            reader.close();

            FileReader reader2 = new FileReader(file);
            BufferedReader bufferedReader = new BufferedReader(reader2);
            StringBuffer sb2 = new StringBuffer();
            String str = null;
            while((str = bufferedReader.readLine())!=null){
                sb2.append(str);
            }
            System.out.println(sb2);
            reader2.close();
            bufferedReader.close();

FileWriter和BufferedWriter的区别

//例1
FileWriter file = new FileWriter("foo.txt");
file.write("foobar");
file.close();
FileWriter file = new FileWriter("foo.txt");BufferedWriter bf = new BufferedWriter(file);
bf.write("foobar");
bf.close();
//例2
for(int i = 0; i < 100; i++) {
    writer.write("foorbar");
    writer.write(NEW_LINE);}
writer.close();

写入单一数据（调用一次write方法）到文件时，FileWriter和BufferedWriter都是一次性写入到磁盘，也就是指有一次磁盘访问操作。而不是一个字符一个字符的写入。
写入多条数据（如代码中的例2），每一次执行write方法，FileWriter都会请求系统进行磁盘操作。而BufferedWriter则会根据其配置的缓存区大小，默认是8M，如果多次执行write方法累积的数据没有超过8M，则只会调用一次磁盘操作写入。

字节流和字符流的区别

字节流操作的最基本的数据单元是字节，字符流操作的最基本的数据单元是字符。
字节流默认不使用缓冲区，字符输出流则会使用缓冲区存放转换的字节序列
字节流通常用于处理二进制数据，实际上可以处理任意类型的数据（图片，音视频，文本等），但它不支持直接读写Unicode码。字符流通常用来处理文本数据，它支持直接读写Unicode码。

随机访问文件

在实际开发中，文件的多线程下载和断点续传是经常会遇到的使用场景，这其中就涉及到从文件中的指定位置读写数据，这就需要用到Java中的RandomAccessFile类，随机访问文件。
一般的文件IO流，访问文件都是按照文件内容的顺序从头开始读写。RandomAccessFile类可以让我们从文件中的任何位置读写数据。
可以以4中模式创建RandomAccessFile对象：

模式	含义
“r”	文件以只读模式打开。
“rw”	该文件以读写模式打开。如果文件不存在，则创建该文件。
“rws”	该文件以读写模式打开。对文件的内容及其元数据的任何修改立即被写入存储设备。
“rwd”	该文件以读写模式打开。对文件内容的任何修改立即被写入存储设备。

//在构造方法中传入文件名称和访问模式
RandomAccessFile  raf = new RandomAccessFile("randomtest.txt", "rw");

RandomAccessFile常用的一些方法

使用readUTF()和writeUTF()方法处理字符串。
使用readInt()和writeInt()方法处理整数。
通过getFilePointer()方法获取文件指针的位置，初始化时为0。
通过seek()方法，将文件指针设置到指定的位置。
length() 返回文件当前的长度，我们也可以通过setLength()方法来扩展或者截断文件。
以下是RandomAccessFile类的简单用法

RandomAccessFile raf = new RandomAccessFile("H:/sourceCode/workspace4java/test.txt","rw");
            raf.writeUTF("随机访问文件输出UTF-8");
            raf.seek(0);
            String str = raf.readUTF();
            System.out.println(str);

            raf.seek(8);
            byte[] bytes = new byte[12];
            raf.read(bytes);
            String s = new String(bytes);
            System.out.println(s);

            raf.seek(0);
            raf.writeUTF("访问文件RandomAccessFile");

            raf.seek(0);
            byte[] bytes2 = new byte[14];
            raf.read(bytes2);
            String s2 = new String(bytes2);
            System.out.println(s2);

            raf.seek(2);
            byte[] bytes3 = new byte[12];
            raf.read(bytes3);
            String s3 = new String(bytes3);
            System.out.println(s3);
            raf.close();

打印结果

随机访问文件输出UTF-8
访问文件
访问文件
访问文件

值得注意的是，通过writeUTF方法写入数据，会默认在字符串开头多家两个字节。所以才会有上面的运行结果：从文件指针为0的位置，开始读取会读出开头的两个字节，而真实的数据内容从第三个字节的位置开始。

文章参考
https://stackoverflow.com/questions/21980090/javas-randomaccessfile-eofexception
https://www.ibm.com/developerworks/cn/java/j-lo-serial/index.html
http://www.importnew.com/23963.html
https://www.jianshu.com/p/509c78602ed2
https://stackoverflow.com/questions/12350248/java-difference-between-filewriter-and-bufferedwriter

    原文作者：zackyG
    原文地址: https://www.jianshu.com/p/113f92396a24
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。