标题可能听起来很荒谬,但让我解释一下。我需要过滤一个txt文件。正如我所说,我应该执行的操作是非常基础的。我正在谈论的文件是这个: http: //gdac.broadinstitute.org/runs/analysiss__2014_10_17/reports/cancer/BRCA-TP/Mutation_Assessor/BRCA-TP.maf.annotated
起初,我专注于这个任务:请在数据文件中找到 Tumor_Sample_Barcode 列。如您所见,与该列对应的所有行都采用这样的格式:TCGA-02-0001-01C-01D-0182-01
“C”之前的两个字符在这里很重要。在示例格式中,这些字符是“01”。我正在寻找这些包含“01”的行。即,应消除具有任何其他字符对的行。
如果文件大小不是 56.2 MB,我可以用 MATLAB 轻松处理。但是,当我尝试使用以下行在 MATLAB 中拆分文件的列时,出现错误。
[numData,textData,rawData] = xlsread('BRCA-TP.maf.annotated.csv');
虽然我最大化了 MATLAB 的 Java 堆内存,但在编辑器中我得到了没有足够内存来实现这个任务的错误。
我寻找任何替代方法。JMP 可能会帮助我,但我没有使用该软件的经验。即使是像我上面描述的基本操作对我来说也可能是痛苦的。
有没有办法在MATLAB中实现我上面解释的操作?如果没有,您能帮我弄清楚如何在 JMP 中编写脚本来执行此操作吗?