我已经使用 Siphon 请求了一个 netCDF 子集,并形成了一个查询来检索边界框中的变量:
from siphon.catalog import TDSCatalog
cat = TDSCatalog("https://thredds.ucar.edu/thredds/catalog/grib/NCEP/GFS/Global_onedeg/catalog.xml?dataset=grib/NCEP/GFS/Global_onedeg/Best")
ncss = cat.datasets[0].subset()
query = ncss.query()
query.variables("Absolute_vorticity_isobaric")
query.lonlat_box(north=34., south=33., west=-102., east=-101.)
query.accept("netcdf4")
我正在寻找一种可靠、简洁的方法来获取该变量坐标的值,特别是时间和垂直水平。一种可行但不切实际的方法是请求并使用整个数据集。
实用但不实用的方法
获取数据
import xarray as xr
query.all_times()
data = ncss.get_data(query)
datastore = xr.backends.NetCDF4DataStore(data)
xarray.Dataset使用MetPy 的 xarray 访问器获取数据
ds = xr.open_dataset(datastore).metpy.parse_cf()
从成分中获取坐标轴xarray.DataArray
对于作为 的数据集的每个变量xarray.DataArray,调用ds.VARIABLE.metpy.DIMENSION都会使 MetPy 自动返回适当的坐标变量(无论其名称如何,例如lat、lon、time、time1、altitude_above_msl、isobaric3、height_above_ground1),其中、、和中DIMENSION的一个是。timeverticalxy
获取值
在这种情况下,ds.Absolute_vorticity_isobaric.metpy.time返回ds.time和ds.Absolute_vorticity_isobaric.metpy.vertical返回ds.isobaric2。添加.values到调用中只返回numpy.ndarray我一直试图获取的值。因此,调用ds.Absolute_vorticity_isobaric.metpy.time.values会产生以下内容(以下被截断):
array(['2019-11-17T00:00:00.000000000', '2019-11-17T03:00:00.000000000',
'2019-11-17T06:00:00.000000000', ..., '2020-01-02T06:00:00.000000000',
'2020-01-02T09:00:00.000000000', '2020-01-02T12:00:00.000000000'],
dtype='datetime64[ns]')
调用ds.Absolute_vorticity_isobaric.metpy.time.valuesandds.Absolute_vorticity_isobaric.metpy.vertical.values将只返回 NumPy 数组,这正是我所寻求的。
问题
虽然上面确实做了我想要的,但只运行一个变量就花了将近一分半钟,而且它(我假设)不必要地对 UCAR 服务器征税。有没有办法在没有加载所有数据本身的巨大开销的情况下获得上面的输出?