我刚开始使用 Tensorflow。据我了解,SkFlow 是一个...
TensorFlow 的简化界面
对我来说,简单就是好的。
TensorFlow 的 Github有一些有用的入门示例,它们使用 SkFlow 中包含的 Iris 数据集。这来自第一个示例,线性分类器。
iris = datasets.load_iris()
feature_columns = learn.infer_real_valued_columns_from_input(iris.data)
该iris
对象具有类型<class 'sklearn.datasets.base.Bunch'>
,并且是一个类似于 dict 的结构,其中包含两个列表以及数据和目标。
此链接显示如何从 CSV(或至少是 URL)加载数据。在页面顶部,它显示了如何通过上述方法加载,然后通过 URL,如下所示
# Load the Pima Indians diabetes dataset from CSV URL
import numpy as np
import urllib
# URL REMOVED - SO DOES NOT LIKE SHORTENED URL
# URL for the Pima Indians Diabetes dataset
raw_data = urllib.urlopen(url)
# load the CSV file as a numpy matrix
dataset = np.loadtxt(raw_data, delimiter=",")
print(dataset.shape)
# separate the data from the target attributes
X = dataset[:,0:7]
y = dataset[:,8]
我知道 X 是数据,y 是目标。但这不是 github 示例或指南第一个示例中的数据结构。
我是否打算将 CSV 数据转换为单个对象,如
iris = datasets.load_iris()
还是我使用X
和y
输出?如果是这样,我如何使用 Github 上的线性分类器示例来做到这一点