在详解Java8特性之Stream API中,我用的例子使用的都是串行流,即单线程执行的,其实Stream API还提供了并行流,即多线程执行操作。
java.util.Collection<E>
新添加了两个默认方法
- default Stream stream() : 返回串行流
- default Stream parallelStream() : 返回并行流
可以发现,stream()
和parallelStream()
方法返回的都是java.util.stream.Stream<E>
类型的对象,说明它们在功能的使用上是没差别的。唯一的差别就是单线程和多线程的执行,关于Stream API还不了解的可以去我开头给出的链接那文章看看。下面我就使用一下并行流,对比串行流看看性能上的差距。
下面是例子
import java.time.Duration;
import java.time.LocalTime;
import java.util.ArrayList;
import java.util.List;
import org.junit.Test;
public class TestParallelStream {
@Test
public void testStream() {
// 起始时间
LocalTime start = LocalTime.now();
List<Integer> list = new ArrayList<>();
// 将10000-1存入list中
for (int i = 10000; i >= 1; i--) {
list.add(i);
}
list.stream()// 获取串行流
.sorted()// 按自然排序,即按数字从小到大排序
.count();// count()是终止操作,有终止操作才会执行中间操作sorted()
// 终止时间
LocalTime end = LocalTime.now();
// 时间间隔
Duration duration = Duration.between(start, end);
// 输出时间间隔毫秒值
System.out.println(duration.toMillis());
}
@Test
public void testParallelStream() {
// 起始时间
LocalTime start = LocalTime.now();
List<Integer> list = new ArrayList<>();
// 将10000-1存入list中
for (int i = 10000; i >= 1; i--) {
list.add(i);
}
list.parallelStream()// 获取并行流
.sorted()// 按自然排序,即按数字从小到大排序
.count();// count()是终止操作,有终止操作才会执行中间操作sorted()
// 终止时间
LocalTime end = LocalTime.now();
// 时间间隔
Duration duration = Duration.between(start, end);
// 输出时间间隔毫秒值
System.out.println(duration.toMillis());
}
}
这个测试类呢有两个方法,一个是testStream()
,另一个是testParallelStream()
,很明显前者是测试串行流的,后者是测试并行流的,这个两个方法的唯一区别也就在于list
调用的是stream()
方法还是parallelStream()
方法。它们都做同样的一件事,就是对10000-1进行自然排序。至于LocalTime
和Duration
类是Java 8提供新的操作日期时间的类,不了解的可以去这看看详解Java8特性之新的日期时间 API。其它的我注释已经写的很清楚了。
执行的结果呢是出乎意料的,在我的电脑上,testStream()
方法的执行时间在16毫秒左右,而testParallelStream()
方法的执行时间在23毫秒左右。
一般我们会认为多线程执行任务会比单线程执行快,其实也不一定,因为多线程的切换什么的也是需要消耗一定时间的,如果任务太小了,多线程的切换时间可能会占总的执行时间很大一个比例。还有就是如果CPU是单核的,多线程也是没单线程好的。关于这点我在Fork/Join框架及其性能介绍中有比较详细地说明了,Fork/Join框架也是利用多线程执行任务的,也会有上面的这个问题存在。
总之,串行流和并行流差别就是单线程和多线程的执行,至于具体选哪种,我的建议是如果任务太小或者运行程序的机器是单核的话,就用串行流,如果任务比较大且运行程序的机器是多核,就可以考虑用并行流。