我是第一次与 Cassandra 合作,我有一些疑问。我的数据源是 csv 文件。我有三个:航班、飞机和机场。我将把每个 csv 文件的结构放在上下文中来说明我的问题。
飞机场
ID_机场 | 机场| 城市| 状态 | 国家 | 纬度 | 经度
飞机
ID_airplane |type |制造商 |issue_date |model |engine_type |aircraft_type
航班
ID_flight |日期 |Flight_Numb |ID_airplane |ID_airport_origin |ID_airport_dest
DepartureTime |Arrival_time |航空公司|距离|DepDelay |ArrivalDelay。
航班文件是主要文件,有数百万条记录。另外两个是补充数据。
根据我读到的关于 Cassandra 的内容,首先应该定义必要的查询,然后创建满足我们需求的列族。然而 Cassandra 不支持 JOIN 的。如何将 csv 文件中的数据与另一个文件关联,以便创建具有不同 csv 文件字段的列族?
例如,如果我想知道哪种机型的航班延误较多。在关系模型中,这是可能的,但在 Cassandra 中我认为这是不可能的。
有什么办法可以在 Cassadra 中做到这一点?如何拥有具有不同 csv 文件字段的列族?