Mnist
先贴一个介绍的很好的博客 https://blog.csdn.net/sysushui/article/details/53257185
mnist是一个手写体数字的数据集。上图是数据集的组成,分别为训练样本特征集、训练样本标签集、测试样本特征集、测试样本标签集。
训练样本有60000个,测试样本是10000个。
• 训练样本标签集
ubyte类型数据就是二进制流。
第0到第3字节:魔数(一个校验数,用来判断这个文件是不是MNIST里面的train-labels.idx1-ubyte文件)
第4到第7字节:样本容量数(这里就是60000)
从第8个字节开始每个字节代表了一个样本的标签(0到9之间的一个数值)
• 训练样本特征集
mnist图片集中,每张图片都有28*28=784个像素
第0到第3字节:魔数
第4到第7字节:样本容量数
第8到第11字节:表示每个图片的行数(28)
第12到第15字节:每个图片的列数(28)
从第16个字节开始是图片的像素值,每784个字节代表一幅图片
转载于:https://www.cnblogs.com/yingying7/p/9647194.html
相关资源:MNIST 下载