我不确定标题是否选对了,抱歉。如果这已经涵盖,请让我知道我在哪里找不到它。对于我正在做的分析,我在 JupyterLab 工作,主要是 scanpy。我想查看在莱顿聚类中共表达某些基因的细胞数量。到目前为止,我正在尝试使用 pandas 交叉表功能,并获得了每个集群的编号。但是,我有两个条件,我正在努力分离样本以分别获得细胞计数。
我用来获取总细胞数的代码可以正常工作。
pd.crosstab(adata_proc.obs['leiden_r05'], adata_proc.obs['CoEx'])
我正在努力获取样本数字的代码。我知道这aggfunc = ','.join
不是正确的方法,但这是为了解释问题所在。
pd.crosstab(adata_proc.obs['leiden_r05'], adata_proc.obs['CoEx'], adata_proc.obs['sample'], aggfunc = ','.join)
我可以在表格中列出条件的名称,但我不想要这个。我想要两个条件的数字。这怎么可能?也许有办法在一个单独的函数中做到这一点?