cs231n Assignment1 features.ipynb 笔记
作业思想:
纯像素的图片作为网络输入:性能低
从图片中提取的特征(HOG+颜色)作为网络输入:性能高 (输入层中只有特征,没有像素图了)
(**仅在网络只有1层隐藏层时得出的结论)
作业具体:
Linear svm:
32x32x3作为输入层 → 现在改成154(HOG方向柱状图和颜色柱状图)作为输入层,网络就是一层WX,score用svm来评估loss。
test上识别准确率从38% → 提升到44%
2 layer network:
32x32x3作为输入层 → 现在改成154(HOG方向柱状图+颜色柱状图合并)作为输入层,网络有1个隐藏层和1个输出层 [ f(WX)+WX ],激活函数是ReLU,score用softmax来评估好坏loss。
test上识别准确率从52% → 提升到60%。
附:HOG是啥
一文讲解方向梯度直方图(hog) - 知乎 (zhihu.com)

