6

我们注意到偶尔会出现带有并发标记溢出的 G1 垃圾收集器的完整 GC。一旦出现并发标记重置溢出,此溢出将在下一个并发标记阶段继续。最终,它会导致完整的 GC,因为并发标记似乎不再起作用。

我们有四台机器运行相同的基于 Apache Storm 的应用程序,具有相同的数据流量。每周只有一台机器有这种体验。

这是否与错误有关:'G1 在并发标记期间发生标记堆栈溢出时不会扩展标记堆栈' https://bugs.openjdk.java.net/browse/JDK-806540​​2

根据上一页的建议,我们将并发标记线程从 4 个增加到 8 个,堆大小从 8GB 增加到 16GB。但是,完整的 GC 仍然会发生,唯一的区别是发生延迟。

还有其他建议吗?

这是GC日志:

Java HotSpot(TM) 64-Bit Server VM (25.65-b01) for linux-amd64 JRE(1.8.0_65b17), 
built on Oct  6 2015 17:16:12 by "java_re" with gcc 4.3.0 20080428 (Red Hat 4.3.0-8) 
Memory: 4k page, physical 529167668k(69283408k free), swap 33554424k(33552380k free) 
CommandLine flags: -XX:ConcGCThreads=8 -XX:G1ReservePercent=20 -XX:GCLogFileSize=104857600 
-XX:InitialHeapSize=17179869184 -XX:InitiatingHeapOccupancyPercent=45 -XX:MaxGCPauseMillis=100 
-XX:MaxHeapSize=17179869184 -XX:NumberOfGCLogFiles=10 -XX:ParallelGCThreads=30 
-XX:+PrintAdaptiveSizePolicy -XX:PrintFLSStatistics=2 -XX:+PrintGC -XX:+PrintGCApplicationStoppedTime 
-XX:+PrintGCDateStamps -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintHeapAtGC 
-XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseG1GC -XX:+UseGCLogFileRotation
...
...
2016-04-13T22:06:37.254-0400: 19839.175: [GC concurrent-root-region-scan-start]
2016-04-13T22:06:37.313-0400: 19839.234: [GC concurrent-root-region-scan-end, 0.0592966 secs]
2016-04-13T22:06:37.313-0400: 19839.234: [GC concurrent-mark-start]
2016-04-13T22:06:38.569-0400: 19840.490: [GC concurrent-mark-reset-for-overflow]
...
2016-04-13T22:06:42.810-0400: 19844.731: [GC concurrent-mark-reset-for-overflow]
...
2016-04-13T22:11:19.253-0400: 20121.175: [GC concurrent-mark-reset-for-overflow]
...
...
...
2016-04-14T01:58:17.254-0400: 33739.176: [GC concurrent-mark-reset-for-overflow]
...
2016-04-14T01:58:36.957-0400: 33758.878: [Full GC (Allocation Failure)
4

1 回答 1

8

来自 oracle g1_gc博客:

GC concurrent-mark-reset-for-overflow:这表示全局标记堆栈已满,堆栈溢出。并发标记检测到此溢出,必须重置数据结构以重新开始标记

因此,增加-XX:MarkStackSize是一种快速的胜利。

从您的 VM 参数中观察到的很少:

  1. G1 GC 是一种自适应垃圾收集器,其默认设置使其无需修改即可高效工作。快速浏览G1GC上的 oracle 文档页面
  2. 要设置的关键参数:将-XX:MaxGCPauseMillis, -XX:G1HeapRegionSize,-XX:ParallelGCThreads=n, -XX:ConcGCThreads=n 其他所有参数保留为默认值。
  3. 如果您的堆大小为 16 GB,则理想的区域大小应为8 MB. 确保您维护2048区域。
  4. 重新审视你的暂停时间目标。-XX:MaxGCPauseMillis. 如果200ms16 GB 堆不现实,请正确设置此值。
  5. 官方文档页面推荐了XX:ParallelGCThreads=n, -XX:ConcGCThreads=n根据您机器中的核心数量进行设置的方式。

    -XX:ParallelGCThreads=n:设置 STW 工作线程的值。将 n 的值设置为逻辑处理器的数量。n 的值与最大为 8 的逻辑处理器的数量相同。

    -XX:ConcGCThreads=n:设置并行标记线程的数量。将 n 设置为并行垃圾回收线程 (ParallelGCThreads) 数量的大约 1/4。

  6. 重温-XX:InitialHeapSize=17179869184 -XX:InitiatingHeapOccupancyPercent=45 -XX:G1ReservePercent=20参数。将它们保留为默认值,除非您迫切需要更改它们。

访问此页面以更好地了解G1GC日志。

于 2016-04-15T15:37:16.337 回答