从 spark 1.5.x 开始,添加了一些方便的方法来处理时间。
df.select(datediff($"A", $"B")).show
但这会返回天数的差异。是否有任何选项可以将其转换为不同的时间间隔,例如年?
我手动使用
df.select(year($"A")- year($"B")).show
这已经足够好了。但是,如果更准确地计算日期差异会更好,例如包括月份/天,如显示的http://howtodoinjava.com/for-fun-only/java-code-to-calculate-age-from-date-of-出生/
UDF 是当前 spark 2.0.2 的首选解决方案吗?还是我错过了将差异转换为天数的选项,例如年数?