课程总结：C++中的模板元編程

本文將給出一些C++模板以及模板元的寫法的基本介紹，將會結合具體的例子并竟可能的降低閱讀門檻。

C++ 模板元編程

jskyzero 2019/02/04

唔，起因大概是上了一節C++模板的課程，然後之前Sushiscript的時候也沒有精力好好理順一下模板以及模板元，平時也很少用到，唔，不過還是出於好奇寫了點相關的代碼，現在把一些內容整理出來。

先從模板開始說起吧，简单来说，模板提供了一种参数化类型的能力，模板在编译时对模板形参进行参数化，编译出对应不同类型的代码，C++是支持重载的，我们的方法（或者理解成操作，毕竟这里不能单独对应函数，应该也要包括操作符，类等）可以对于不同类型有不同的行为，模板使得这种对应不同类型的不同行为实现起来较为简单。

还是稍微扯远一点吧，上面已经说了重载和模板，再来说一下泛型和多态吧，泛型允许我们在”强类型语言”中编写代码时候，使用一些在实例化时才指定类型的类型，这些类型根据不同指定的类型可以有不同的行为。多态在我看来则指相同符号的行为的差异性，比如基类储存不同子类后调用相同函数的差异性，又比如函数在面对不同参数的差异性，后者就比较类似泛型。

还是把话题撤回来，接下来将从模板，模板元，再到最后的效率比较来展开文章。

模板速覽

还是老生常谈来说一下吧，上面已经说了模板是什么了，然后模板的好处的话，除了上面说的减少工作量，还有相比虚函数的运行时多态，模板的开销更少，能提高效率。模板大概可以分为函数模板、类模板、成员模板（类的成员函数）。模板形参则可以有类型模板参数、非类型模板参数、模板模板參數。然後一些邊緣情況需要用typename關鍵字手動指明這是個類型，防止編譯器誤解，另外的一些知識比如依賴名查找（ADL）這裡也不展開說了。

給一些可能平時不太會見得到的模板寫法吧，比如底層是指針的屬性綁定。

// 使用模板实现属性绑定：通过成员指针机制，将「访问/修改对象成员」的操作封装为可复用的对象
template <typename ParentType, typename MemberType>
struct Property {
  // typedef member ptr type
  // 定义成员指针类型别名（如 int SomeClass::*），指向 ParentType 中类型为 MemberType 的成员
  typedef MemberType ParentType::*MemberPtrType;
  // use pointer to change data
  // 储存实际指向的成员指针
  MemberPtrType p = nullptr; // 默认置空，实际使用前必须 Bind，否则解引用成员指针没有意义。
  // bind pointer
  // 绑定到指定的成员
  void Bind(MemberPtrType p_) { p = p_; }
  // change data
  // 通过成员指针设置对象的值：parent.*p = value
  // parent.*p 是成员指针语法：先选定对象 parent，再通过 p 指向的成员写入 value。
  void Set(ParentType& parent, const MemberType& value) { parent.*p = value; }
};

// 测试用例：演示 Property 将成员访问抽象为对象的基本流程
void Property_TEST() {
  SomeClass sc;
  // 实例化 Property，绑定到 SomeClass 的 int 成员
  auto prop = Property<SomeClass, int>();
  // 绑定成员指针
  prop.Bind(&SomeClass::SomeMember);
  // 通过 property 修改值
  prop.Set(sc, 10);

  assert_equal(sc.SomeMember, 10);

  std::cout << "Pass property test" << std::endl;
}

又比使用模板特化如從類的成員的指針中獲取成員或者類本身的類型。

#define TYPE_NAME(x) (typeid(x).name())

// 主模板声明：从成员指针类型中提取成员的类型
// 不提供默认实现，只有通过特化才能使用
template <typename MemPtrType>
struct GetMemTypeFromMemPtr {
};

// 特化：当模板参数为 Type ParentType::* 形式时，提取出成员类型 Type
template <typename ParentType, typename Type>
struct GetMemTypeFromMemPtr<Type ParentType::*> {
  // Result 是一个类型别名，不是值；使用时需要 typename ...::Result。
  typedef Type Result;
};


// 主模板声明：从成员指针类型中提取所属类的类型
template <typename MemPtrType>
struct GetClassTypeFromMemPtr {
};

// 特化：当模板参数为 Type ParentType::* 形式时，提取出父类类型 ParentType
template <typename ParentType, typename Type>
struct GetClassTypeFromMemPtr<Type ParentType::*> {
  // 通过偏特化匹配 Type ParentType::*，让编译器帮我们拆出 ParentType。
  typedef ParentType Result;
};

// 测试用例：验证类型萃取的正确性
void TypeTraits_TEST() {
  assert_equal(TYPE_NAME(int), TYPE_NAME(int));
  // 从 decltype(&SomeStruct::SomeMember) 中提取成员类型，应为 int
  assert_equal(
      TYPE_NAME(int),
      TYPE_NAME(GetMemTypeFromMemPtr<decltype(&SomeStruct::SomeMember)>::Result));
  // 从 decltype(&SomeStruct::SomeMember) 中提取所属类类型，应为 SomeStruct
  assert_equal(
      TYPE_NAME(SomeStruct),
      TYPE_NAME(GetClassTypeFromMemPtr<decltype(&SomeStruct::SomeMember)>::Result));

  std::cout << "Pass type-traits test" << std::endl;
}

模板元編程速覽

從簡單的開始

在談及模板元之前，不妨先想想什麼是元編程，簡單來說，元編程是指對編程語言進行編程，舉個例子，你可以用一段shell代碼生成重複若干次打印一個語句的C代碼，這就是元編程。模板元編程則是利用模板來進行元編程，接下來將會特化到C++中來，C++中的模板因為是圖靈完備的，所以可以在編譯時候就可以執行計算操作，這樣可以把計算過程放在編譯時期，提高效率，另一方面，模板元編程大體上比較反人類，而且調試困難，這種就會不利於團隊合作，所以大概自己寫寫玩還可以。

從一個簡單的計算階乘的例子開始吧。

#include <iostream>

// 编译期计算阶乘：递归模板，Factorial<N>::result = N * Factorial<N-1>::result
template<int N>
struct Factorial {
  // 每个 N 都会实例化一个不同的 Factorial<N> 类型。
  static const int result = N * Factorial<N - 1>::result;
};

// 模板特化：阶乘递归的终止条件，Factorial<0>::result = 1
template<>
struct Factorial<0> {
  static const int result = 1;
};


// 测试：Factorial<5>::result 在编译期就已计算为 120，运行时直接输出常量
void Factorial_Part() {
  std::cout << std::endl;
  std::cout << "Factorial(5) = " << Factorial<5>::result << std::endl;
}

唔，簡單的來說，我們聲明了一個Factorial類，然後這個類是一個接受非類型模板參數的模板類，會根據接受到參數的不同而實例化出不同的類，然後關鍵的部分在於那個遞歸，有遞歸自然有終止的地方，因此我們需要用參數特化來指定終結情況的行為。

這種思維方式非常類似之前寫過的haskell中的函數式編程，比如haskell裡面的取反可以這麼寫：

-- 函数类型签名：接受 Bool 类型参数，返回 Bool 类型结果
myNot :: Bool -> Bool
-- 模式匹配：输入 True 时返回 False
myNot True = False
-- 模式匹配：输入 False 时返回 True
myNot False = True
-- 等价实现：也可以直接复用内置的 not 函数
-- myNot x = not x

實現一個分數

唔，依稀記得haskell當初第一個個人作業就是實現一個符號完備的分數系統，那不妨我們也挪到這裡做做試試看好了。

// 类别名：方便统一修改底层整数类型（int / long long 等）
typedef int TYPE;

// 编译期数对：将两个整数值 x_, y_ 作为类型的静态常量成员储存
// 后续的分数将基于这个基础结构构建
template <TYPE x_, TYPE y_>
struct Pair {
  static const TYPE x = x_;
  static const TYPE y = y_;
};

我們使用int，或者long long，或者任何你想使用的整數數據類型來儲存分子和分母，為了方便更改這裡就開始就用了個別名。

// 编译期绝对值：x > 0 ? x : -x
template <TYPE x>
struct Abs {
  static const TYPE result = x > 0 ? x : -x;
};

// 编译期最大公约数（GCD）：使用欧几里得算法递归计算
template <TYPE x, TYPE y>
struct GCD {
  // 欧几里得算法：gcd(x, y) = gcd(y, x % y)。
  static const TYPE result = GCD<y, x % y>::result;
};

// GCD 递归终止条件：当 y = 0 时，x 即为最大公约数
template <TYPE x>
struct GCD<x, 0> {
  static const TYPE result = x;
};

// 编译期分数：自动约分并统一符号到分子
template <TYPE x_, TYPE y_>
struct Fraction {
  // 注意：这里没有处理 y_ == 0，真实库需要在编译期 static_assert 防止除零。
  // 计算分子分母绝对值的最大公约数，用于约分
  static const TYPE gcd = GCD<Abs<x_>::result, Abs<y_>::result>::result;
  //   输入符号        输出符号
  //   x_  y_  sign   x (分子)
  //   +   +    +1    +
  //   +   -    -1    -
  //   -   +    -1    -
  //   -   -    +1    +
  // 符号位：分母为负时取反（将符号统一到分子上）
  static const TYPE sign = y_ < 0 ? -1 : 1;
  // 约分后的分子（带符号）
  static const TYPE x = sign * x_ / gcd;
  // 约分后的分母（始终为正）
  static const TYPE y = Abs<y_>::result / gcd;
};

然後是為了能夠化簡的最大公因數的計算（GCD），以及這裡把符號留在分子上。

// 分数加法：a/b + c/d = (a*d + c*b) / (b*d)
template <typename f1, typename f2>
struct Addition {
  // result 仍然是类型，不是运行时对象；Fraction 会继续做约分。
  typedef Fraction<f1::x * f2::y + f1::y * f2::x, f1::y * f2::y> result;
};

// 分数减法：a/b - c/d = (a*d - c*b) / (b*d)
template <typename f1, typename f2>
struct Subtraction {
  typedef Fraction<f1::x * f2::y - f2::x * f1::y, f1::y * f2::y> result;
};

然後後面的就比較簡單了，加法減法乘法除法都可以隨手寫了。

// 将编译期分数转换为可打印的字符串，格式为 "( 分子 / 分母 )"
template <typename fraction>
std::string FractionToString() {
  return "( " + std::to_string(fraction::x) + " / " + std::to_string(fraction::y) +
         " )";
};

順路可以實現一個方便打印的函數。

實現一個列表

接下來可以稍微處理一些複雜的東西，比如列表。

typedef int TYPE;

// 将数值包装为类型：使得数值可以作为模板参数在类型系统中传递
template <TYPE x>
struct Type {
  // 把值挂到类型上，后续所有计算都可以在编译期通过 Type<3>::value 访问。
  static const TYPE value = x;
};

// 空列表标记：NIL 的 Head 和 Tail 都指向自身，表示列表的终点
struct NIL {
  // 让 NIL 自身也具备 Head/Tail，某些模板递归中可以减少额外分支。
  typedef NIL Head;
  typedef NIL Tail;
};

// 编译期列表：类似 Lisp 的 cons 单元，由 Head（当前元素）和 Tail（剩余列表）组成
// 默认 Tail 为 NIL，表示只有单个元素的列表
template <typename H, typename T = NIL>
struct List {
  typedef H Head;
  typedef T Tail;
};

簡單的來說，我們用Type進行一次轉換，就可以把一個基礎數據類型的值變成一個類型，然後就可以列表層層嵌套，這個時候如果要實例化這個列表，會比較像這個樣子typedef List<Type<3>> l3;typedef List<Type<2>, l3> l2;。

然後來實現一些基本的操作吧：

// 计算列表长度：递归展开 Tail，每层 +1
template <typename list>
struct Length {
  // typename 告诉编译器 list::Tail 是一个类型，而不是静态成员变量。
  static const size_t result = 1 + Length<typename list::Tail>::result;
};

// 递归终止条件：空列表 NIL 的长度为 0
template <>
struct Length<NIL> {
  static const size_t result = 0;
};

比如獲取列表的長度，插入，刪除指定位置的元素，等等，當然也包括打印。

// 将列表转换为可打印字符串，递归拼接每个元素的值
template <typename list>
std::string ListToString() {
  return "(" + std::to_string(list::Head::value) + ", " +
         ListToString<typename list::Tail>() + ")";
};

// 递归终止：空列表 NIL 输出字符串 "NIL"
template <>
std::string ListToString<NIL>() {
  return std::string("NIL");
};

唔，然後是兩個相對複雜的操作。

// 可变参数模板：从多个整数便捷创建编译期列表
// 使用示例：typedef CreateList<1, 2, 3>::result l;
template <TYPE... lists>
struct CreateList {
  // 内层模板：将可变参数逐个包装为 List 节点（递归处理）
  template <typename head, typename... tail>
  struct __CreateList {
    // 每次取出一个 head 放到链表头，tail... 递归构造剩余链表。
    typedef List<head, typename __CreateList<tail...>::result> result;
  };

  // 递归终止：最后一个参数，创建只含一个元素的列表
  template <typename head>
  struct __CreateList<head> {
    typedef List<head> result;
  };

  // 将整数参数通过 Type 包装后传入内层模板，得出最终的嵌套 List 类型
  typedef typename __CreateList<Type<lists>...>::result result;
};

我們不妨簡化一下創建列表的步驟，現在我們就可以直接typedef CreateList<1, 2, 3>::result l2;這麼創建一個列表了。

// 列表切片 [begin, end)：从编译期列表中提取指定范围的子列表
template <typename list, size_t begin, size_t end>
struct Slice {
  // 辅助类型：将 size_t 索引包装为类型值，用于模板参数的模式匹配
  template <size_t x>
  struct Type {
    static const TYPE value = x;
  };

  // 通用递归步骤：从列表尾部逐个移除元素，直到列表长度等于 end
  template <typename __list, typename __begin, typename __end>
  struct __Slice {
    // 先从尾部删到 end 位置，相当于去掉切片右侧多余元素。
    typedef typename __Slice<
        typename RemoveItemAt<__list, Length<__list>::result - 1>::result,
        __begin, __end>::result result;
  };

  // 当列表长度等于 end 时：开始从头部逐个移除元素，直到 begin 归零
  template <typename __list, typename __begin>
  struct __Slice<__list, __begin, Type<(Length<__list>::result)>> {
    // 再从头部删 begin 次，相当于去掉切片左侧多余元素。
    typedef typename __Slice<typename __list::Tail, Type<__begin::value - 1>,
                             Type<(Length<__list>::result - 1)>>::result result;
  };

  // 终止条件：begin = 0 且列表长度与剩余元素数一致，返回当前列表即为切片结果
  template <typename __list>
  struct __Slice<__list, Type<0>, Type<(Length<__list>::result)>> {
    typedef __list result;
  };

  // 入口：对 begin/end 做越界保护，然后启动内层递归切片
  // size_t 是无符号类型，begin >= 0 恒为真；这里保留原意，实际可简化。
  typedef typename __Slice<
      list, Type<begin >= 0 ? begin : 0>,
      Type<end <= Length<list>::result ? end : Length<list>::result>>::result
      result;
};

然後我們可以實現一個切片，不過感覺就會有點繁雜。

效率比较

唔，這裡的話簡單的比較一下就好，比如傳統的寫法可能是：

#include <iostream> // for std::cout
#include "cpp.tmp.hpp"  // for kLOOP_TIMES

// 运行时阶乘：使用递归函数计算（用于与编译期模板元版本做性能对比）
int fatorial(int n) { return n == 0 ? 1 : n * fatorial(n - 1); }

// 性能测试入口：循环调用 kLOOP_TIMES 次来测量耗时时长
int main() {
  for (int i = 0; i < kLOOP_TIMES; i++) {
    fatorial(10);
  }

  return 0;
}

雖然比較不一定準確，但是也對比了虛函數調用、循環可能被優化等等幾項，大概的結果是

# 运行时递归函数计算阶乘（普通版本）
# time ././bin/factorial.out
0.48user 0.01system 0:00.50elapsed 99%CPU (0avgtext+0avgdata 1456maxresident)k
0inputs+0outputs (0major+415minor)pagefaults 0swaps
# 模板元编程在编译期完成阶乘计算，运行时几乎没有额外开销
# time ././bin/factorial.tmp.out
0.03user 0.00system 0:00.02elapsed 106%CPU (0avgtext+0avgdata 1452maxresident)k
0inputs+0outputs (0major+413minor)pagefaults 0swaps
# 运行时多态（虚函数调用）的 vector 操作
# time ././bin/vector.out
4.59user 0.01system 0:04.59elapsed 100%CPU (0avgtext+0avgdata 1464maxresident)k
0inputs+0outputs (0major+417minor)pagefaults 0swaps
# 模板版本（编译期类型确定，消除虚函数开销）的 vector 操作
# time ././bin/vector.tmp.out
4.54user 0.00system 0:04.57elapsed 99%CPU (0avgtext+0avgdata 1460maxresident)k
0inputs+0outputs (0major+416minor)pagefaults 0swaps
# 虚函数多态调用（动态分发）
# time ././bin/polymorphic.out
0.25user 0.01system 0:00.26elapsed 101%CPU (0avgtext+0avgdata 1452maxresident)k
0inputs+0outputs (0major+415minor)pagefaults 0swaps
# 模板元编程替代虚函数的版本，编译期确定调用目标，性能更优
# time ././bin/polymorphic.tmp.out
0.18user 0.00system 0:00.19elapsed 94%CPU (0avgtext+0avgdata 1452maxresident)k
0inputs+0outputs (0major+414minor)pagefaults 0swaps
# make all compare finished

具體的代碼可以參考下面的參考的說。

參考

只貼一個好了，是上面提及的全部的代碼都在的倉庫，如果需要參考的話可以點開看看。