动手学深度学习框架（4）- 手把手教你写一个功能完整的简易 Demo

0、前言

一定不要错过！一定不要错过！一定不要错过！重要的事情说 3 遍。本篇文章中，我将手把手教你写一个功能完整的深度学习框架 demo，本文将满足你对 Pytorch、Tensorflow、Paddle 中神秘的 C++ 后端的所有好奇心。

1、问题描述

为了在有限的篇幅中把深度学习框架讲明白，我们以一个简单的例子开始：

组网结构：超级简单的 FC（全连接），Loss（损失函数）采用 MSE（最小均方误差）

为了进一步简化，输入输出张量纬度均设为 1，也就是全为标量

上式中，是输入数据，是模型输出，是参数。

给定一条训练样本

2、数学推导

上述公式中的就是神经网络中的 loss，则该最优化问题可抽象为：

如何求解呢？3 板斧：反向梯度 + 链式求导 + 梯度更新

3、详细代码及解释

#include 
#include 
#include 
#include 
#include 
#include 
#include 

//自定义 Tensor 类型，这里数据成员非常简单，就是个标量，重载了基本数学运算符
class MyTensor {
public:
    uint32_t data;
public:
    MyTensor(){};
    MyTensor(uint32_t x) : data(x) {}
    MyTensor operator*(const MyTensor& a) {
        this->data = this->data * a.data;
        return *this;
    }
    MyTensor operator+(const MyTensor& a) {
        this->data = this->data + a.data;
        return *this;
    }
    MyTensor operator-(const MyTensor& a) {
        this->data = this->data - a.data;
        return *this;
    }
    MyTensor operator*(const int& a) {
        this->data = this->data * a;
        return *this;
    }
};

// Op 基类
class OpBase {
public:
    std::unordered_map inputs;
    std::unordered_map outputs;
    std::unordered_map labels;
public:
    virtual void Run() = 0;
};

// 乘法前向 Op
class MultipylyForward : public OpBase {
public:
    void Run() {
        MyTensor x = inputs["X"];
        MyTensor w = inputs["W"];
        MyTensor y1 = x * w;
        outputs["Y"] = y1;
    }
};

// 乘法反向 Op
class MultipylyBackward : public OpBase {
public:
    void Run() {
        MyTensor x = inputs["X"];
        outputs["Y"] = x;
    }
};

// 加法前向 Op
class AddForward : public OpBase {
public:
    void Run() {
        MyTensor x1 = inputs["X1"];
        MyTensor x2 = inputs["X2"];
        MyTensor y = x1 + x2;
        outputs["Y"] = y;
    }
};

// 加法反向 Op
class AddBackward : public OpBase {
public:
    void Run() {
        MyTensor x;
        x.data = 1;
        outputs["Y"] = x;
    }
};

// loss 前向 Op，这里选取 MSE 作为示例
class LossForward : public OpBase {
public:
    void Run() {
        MyTensor y = inputs["X"];
        MyTensor label = labels["Label"];
        MyTensor loss = (y - label) * （y - label）;
        outputs["Y"] = loss;
    }
};

// loss 反向 Op
class LossBackward : public OpBase {
public:
    void Run() {
        MyTensor y = inputs["X"];
        MyTensor label = labels["Label"];
        outputs["Y"] = (y - label) + (y - label);
    }
};

// 梯度更新 Op
class UpdateGrad : public OpBase {
public:
    double lr = 0.1;
    std::unordered_map inputs;
    std::unordered_map outputs;
public:
    void Run() {
        MyTensor w = inputs["W"];
        MyTensor grad = inputs["Grad1"] * inputs["Grad2"] * inputs["Grad3"];  // 链式求导
        MyTensor lr;
        lr.data = this->lr;
        outputs["Y"] = w - lr * grad;
    }
};

int main() 
{
    //1. 用户自定义前向组网
    std::vector program{"Multiply", "Add", "Loss"};

    //2. 框架生成前向op + 自动补全反向OP + 插入梯度更新op
    std::vector ops{"multiply_forward", "add_forward", "loss_forward",
        "loss_backward", "Add_forward", "multiply_backward", "update_grad"};

    //3. 实例化 c++ 端 op 对象
    std::vector opClass {new MultipylyForward(), new AddForward(), new LossForward(),
        new LossBackward(), new AddBackward(), new MultipylyBackward(), new UpdateGrad()};

    //4. 框架根据用户组网，自动给每个op的输入赋值，这里仅以乘法前向op作个例子。一定要记住一点：框架中所有输入数据、
    //参数、模型中间输入、输出、以及每个参数的梯度都有一个 string 类型的名字，它的存在是为了给op输入赋值服务的
    opClass[0]->inputs["X"] = MyTensor(10);
    opClass[0]->inputs["W"] = MyTensor(20);
    for (auto op : opClass) {
        op->Run();
    }

    //5. 测试第1个op的输出
    std::cout << opClass[0]->outputs["Y"].data;  // 输出结果：200
}

3.0、框架实现 7 个算子（Op）

Op 就可以简单理解为函数符号化，对于每个 Op（函数），我们需要指定输入是什么，输出是什么，所以很显然想到用 string 类型的名字去描述。在 Op 运行时，只要按名字找到实际的数据即可。

3.1、用户描述组网信息

由 python 前端接口提供，具体可参考本系列专题之前的文章。

3.2、框架生成前向 Op（3 个） + 框架生成反向 Op（3 个） + 框架插入参数更新 Op（1 个）

3.3、框架运行 Op

4、总结

当然，本文为了让大家理解神经网络框架的基本原理，所以非常简化。实际框架比这要复杂得多（功能更加完善、训练和推理的区别、静态图和动态图、cpu/gpu 等异构硬件、自动微分、序列化等等），但本质思想上是完全一样的。感兴趣的同学，可以去深入研究下 Pytorch、Paddle、Tensorflow 的源码吧。

之后的文章，我将重点介绍下深度学习分布式技术的方方面面，欢迎关注。

更多内容，也请关注我同名知乎账号『自由技艺』

展开阅读全文

页面更新：2024-03-07

标签：链式求导框架标量神经网络梯度乘法简易深度完整参数简单功能数据

1 2 3 4 5

动手学深度学习框架（4）- 手把手教你写一个功能完整的简易 Demo

0、前言

1、问题描述

2、数学推导

3、详细代码及解释

3.0、框架实现 7 个算子（Op）

3.1、用户描述组网信息

3.2、框架生成前向 Op（3 个） + 框架生成反向 Op（3 个） + 框架插入参数更新 Op（1 个）

3.3、框架运行 Op

4、总结

盘前必读丨春节档新片预售破亿，比亚迪跟进新能源车涨价潮

真正的流星，星系中高速奔跑的恒星

丹拿音箱，来自北欧的天籁音乐

约克水系统中央空调，家用中央空调的明智之选

华为酷派抱团取暖？一个“黑石奖”，道出了国产手机圈的发展之路

春节换机怎么选这三款看过来款款都是热销机价格还不贵满足你要求

对标iPadmini！小米8英寸大屏手机曝光，2.5K分辨率？

WBG或完成四外援阵容，BLG直接晋升联盟顶级豪强

Rookie官宣离开IG令人不解，阿水哭了，米勒直言是队史第一人

FC封神榜，游戏中的秘宝还可以卖？当年还以为留在最后有大用

学习强国：机会永远给有准备的人

继KPL无缘冠军之后，AIC也将无缘八强，成立两个月，AG已经尽力了

游戏讲坛：网易腾讯那么有钱，为什么不做个像魔兽的游戏？

《集合啦！动物森友会》出BUG 小动物的衣服都没了

“吃鸡”新军需“月下清影”，女玩家破涕为笑，光子终于换美工

最新版Lightroom 2022来啦，史诗级功能增强，看完忍不住换

普通人该怎么喝水？虽然简单，但很重要

广东婆婆教的滋养方子！简单一焖气血双补，体寒女性要多吃

阿公子新年的比赛数据

莱多深度观察：第二场命中率只有17%，为什么杜锋还允许他

C罗、梅西同时遭遇进球荒！详细对比两人1月份各项数据，看

王者数据榜：场均死亡最低的英雄是阿古朵，双刺客登上“死

2022年夜饭，分享10道凉菜，做法简单，爽口开胃，比肉菜先光盘

穿牛仔裤多学学赵露思，简单的搭配更美，保暖效果也不错

王者荣耀：8调1增！法装变动会带来什么？数据告诉你答案