免责声明:到目前为止,我还不是 GC 专家,但最近为了好玩而进入这些细节。
正如我在评论中所说,您正在使用已弃用的收集器,没有人支持它,也没有人想使用它,切换到G1
甚至更好的恕我直言切换到Shenandoah
:首先从这个简单的事情开始。
我只能假设你从它的默认值增加 ParGCCardsPerStrideChunk
了,这可能有一些帮助ms
(尽管我们没有证据)。我们也没有来自 GC、CPU 活动、日志等的日志;因此,这很难回答。
如果您确实有一个大堆(数十 GB)和一个大的年轻空间,并且您有足够的 GC 线程,那么将该参数设置为更大的值可能确实有帮助,甚至可能与card table
您提到的有关。进一步阅读原因。
CMS
将堆拆分为old space
and young space
,它本可以选择任何其他鉴别器,但他们选择了age
(就像G1
)。为什么需要这个?能够仅扫描和收集堆的部分区域(完全扫描它非常昂贵)。young space
是stop-the-world
暂停收集,所以最好是小,否则你会不开心;这也是为什么您通常会看到更多young collections
的原因old ones
。
扫描时唯一的问题young space
是:如果有 from 对来自old space
的对象的引用会发生什么young space
?收集这些显然是错误的,但是扫描整个old space
以找出答案将generational collections
完全违背收集的目的。因此:card table
。
这会跟踪对引用的old space
引用young space
,因此它知道究竟什么是垃圾。G1
也使用了 a card table
,但也添加了 a RememberedSet
(此处不详述)。在实践中,RememberedSets
结果是巨大的,这就是为什么G1
变成了代际。(仅供参考:Shenandoah
使用matrix
而不是card table
- 使其不是世代相传)。
所以这个巨大的介绍是为了表明确实增加ParGCCardsPerStrideChunk
可能有所帮助。您正在为每个 GC 线程提供更多工作空间。默认值是256
和卡表是512 bytes
,这意味着
256 * 512 = 128KB per stride of old generation
例如,如果您有一堆数十万步,那是多少32 GB
?恐怕太多了。
现在,你为什么还要reference counting
在这里讨论?我不知道。
您展示的示例具有不同的语义,因此很难推理;不过我还是会努力的。您必须了解对象的可达性只是从某些根(称为GC roots
)开始的图。我们先来看这个例子:
public void b(){
new ShortLivedObject().doSomething(new Object()); // actually now is shortlived
}
ShortLivedObject
一旦doSomething
方法调用完成并且它的范围仅在方法内,实例就会被“遗忘”,因此没有人可以到达它。因此剩下的部分是关于doSomething
:的参数new Object
。如果doSomething
没有对它获得的参数做任何可疑的事情(使其可以通过GC root
图表访问),那么在doSomething
完成之后,它也将有资格进行 GC。但即使doSomething
使new Object
可达,它仍然意味着该ShortLivedObject
实例有资格进行 GC。
因此,即使Example
是可访问的(意味着它不能被收集),ShortLivedObject
并且new Object()
可能被收集。它看起来像这样:
new Object()
|
\ /
ShortLivedObject
|
\ /
GC Root -> ... - > Example
您可以看到,一旦GC
将扫描Example
实例,它可能根本不扫描ShortLivedObject
(这就是为什么垃圾被识别为与活动对象相反的原因)。因此 GC 算法将简单地丢弃整个图而不扫描它。
第二个例子不同:
public void a(){
var shortLived = new ShortLivedObject(longLived);
shortLived.doSomething();
}
不同之处在于longLived
这里是一个实例字段,因此,图表看起来会有些不同:
ShortLivedObject
|
\ /
longLived
/ \
|
GC Root -> ... - > Example
很明显,ShortLivedObject
在这种情况下可以收集,但不能 longLived
。
Example
如果可以收集实例,您必须了解这根本不重要;这个图不会被遍历,所有Example
用到的都可以收集。
您现在应该能够理解 using 方法a
可以保留更多垃圾并可能将其移动到old space
(当它们变得足够老时)并且可能使您young pauses
变得更长并且确实增加ParGCCardsPerStrideChunk
可能会有所帮助;但这是高度投机的,你需要一个非常糟糕的相同分配模式才能发生所有这一切。没有日志,我非常怀疑这一点。