1

我正在尝试计算制表符分隔的文本文件中 13 个变量之间的 Pearsons 相关性,其中每一列都是一个变量。我正在使用 java,并希望有人能给我一些关于我应该使用哪些库或哪些函数的指导。我猜我首先需要读取文件的内容,但无法弄清楚如何从本质上使程序知道每一列都是一个像数组一样的数组,这将使我能够进行所需的计算。我原以为 java.io 包对我来说是最好的起点,但就是不知道我可以使用哪些类来解决我的问题。我还查看了http://commons.apache.org/math/它具有测量 pearsons 相关性的功能,但这太容易了,因为这是一个 Uni 作业,我必须从头开始实现它。通过查看 appache pearsons 相关性,他们似乎已经像矩阵一样处理问题,其中矩阵的每一列都是一个变量。

很抱歉对我的问题进行了冗长的描述。如果你们知道任何网站或任何好的关键字搜索或任何其他信息,我将不胜感激。谢谢,阿林德。

4

1 回答 1

1

您应该能够只使用标准的 java Math、String、File I/O 库以及一些数组和循环来做到这一点!

首先阅读此内容以了解如何读取文件。 http://www.roseindia.net/java/beginners/java-read-file-line-by-line.shtml

在循环内部,使用 String.split(String regex) 方法解析您的 csv 文件。例如 strLine.split(",")。

通过对 String[] 中的每个 String 使用 Double.parseDouble 将其转换为双精度数组

从那里您可以使用 Math.sqrt(double a) 和 Math.pow(double a, double b) 函数以及一些简单的循环来计算每对变量的相关性。

希望这些信息足以让您入门,如果您需要更多帮助,请随时回复!

于 2010-12-12T03:55:13.393 回答