Java 8 Streams中产生副作用的危险是什么?

我试图理解在“流文档”中发现的警告。我已经习惯了使用forEach()作为通用迭代器。这导致我编写这种类型的代码:

public class FooCache {

private static Map<Integer, Integer> sortOrderCache = new ConcurrentHashMap<>();

private static Map<Integer, String> codeNameCache = new ConcurrentHashMap<>();

public static void populateCache() {

List<Foo> myThings = getThings();

myThings.forEach(thing -> {

sortOrderCache.put(thing.getId(), thing.getSortOrder());

codeNameCache.put(thing.getId(), thing.getCodeName())

});

}

}

这是一个简单的例子。我了解该代码违反了Oracle关于有状态lamda和副作用的警告。但是我不明白为什么这个警告存在。

运行此代码时,它似乎表现出预期的效果。那么,我如何打破这一点来说明为什么这是一个坏主意?

在某种程度上,我读到以下内容:

如果并行执行,则ArrayList的非线程安全性将导致错误的结果,而添加所需的同步将导致争用,从而损害了并行性的好处。

但是,谁能增加清晰度以帮助我理解警告?

回答:

从Javadoc:

还要注意,尝试从行为参数访问可变状态会给您带来安全性和性能方面的错误选择;

。最好的方法是避免使用有状态的行为参数来完全流式处理操作。通常有一种方法可以重组流管道以避免状态化。

这里的问题是,如果您访问可变状态,则会在两个方面松动:

  • 安全,因为您需要Stream尽量减少同步的同步
  • 性能,因为所需的同步使您付出了代价(在您的示例中,如果使用ConcurrentHashMap,则要付出代价)。

现在,在您的示例中,这里有几点:

  • 如果要使用Stream多线程流,则需要使用parralelStream()in myThings.parralelStream();就目前而言,所forEach提供的方法java.util.Collection很简单for each
  • HashMap用作static成员并对其进行突变。HashMap不是线程安全的;您需要使用ConcurrentHashMap

在lambda中,对于a Stream,您不得更改流的源:

myThings.stream().forEach(thing -> myThings.remove(thing));

这可能有效(但我怀疑会抛出ConcurrentModificationException),但这可能不起作用:

myThings.parallelStream().forEach(thing -> myThings.remove(thing));

那是因为ArrayList不是线程安全的。

如果您使用同步视图(Collections.synchronizedList),则将获得性能,因为您在每次访问时都进行了同步。

在您的示例中,您宁愿使用:

sortOrderCache = myThings.stream()

.collect(Collectors.groupingBy(

Thing::getId, Thing::getSortOrder);

codeNameCache= myThings.stream()

.collect(Collectors.groupingBy(

Thing::getId, Thing::getCodeName);

装订器(此处为groupingBy)完成您正在做的工作,并且可能会被顺序调用(我的意思是,Stream可能会拆分为多个线程,装订器可能会被调用多次(在不同的线程中),然后可能需要合并。

顺便说一句,您最终可能会删除codeNameCache/ sortOrderCache并仅存储id-> Thing映射。

以上是 Java 8 Streams中产生副作用的危险是什么? 的全部内容, 来源链接: utcz.com/qa/407584.html

回到顶部