我的数据结构如下(这些只是样本数据,因为原始数据是保密的)
id | crime | location | crimedate
------------------------------
1 | Theft | public | 2019-01-04
1 | Theft | public | 2019-02-06
1 | Theft | public | 2019-02-20
1 | Theft | private | 2019-03-10
1 | Theft | private | 2019-03-21
1 | Theft | public | 2019-03-01
1 | Theft | private | 2019-03-14
1 | Theft | public | 2019-06-15
1 | Murder | private | 2019-01-04
1 | Murder | private | 2019-10-20
1 | Murder | private | 2019-11-18
1 | Murder | private | 2019-01-01
1 | Assault | private | 2019-03-19
1 | Assault | private | 2019-01-21
1 | Assault | public | 2019-04-11
1 | Assault | public | 2019-01-10
… | … | … | …
我的目标是创建一个线图(时间序列图),显示这三种犯罪的数量在一年中的变化情况。因此,我想在 x 轴上显示月份(1-12),在 y 轴上显示每个月的犯罪数量。应该有两条线(每个位置一条)。
我从这段代码开始:
DATA new;
SET old;
month=month(datepart(crimedate));
RUN;
PROC sgplot DATA=new;
series x=month y=no_of_crimes / group=location;
run;
但我不知道如何汇总每月的犯罪数量。谁能给我一个提示?我一直在互联网上寻找解决方案,但通常这些示例只使用已经聚合的数据。