Technical FAQ

答:

  • 使用尽可能少的操作;
  • 让数据访问只发生在本地存储(1. 尽量少使用 全局操作。2. 集中且连续的使用 本地操作来完成计算。3. 编程中相邻 本地操作尽可能是生产者消费者关系。)
  • 科学切割数据,合理的Tensor 数据排布将提升 TPU 计算单元使用率;
  • 使能数据切分优化(尽量设置 shape 不大于 4 维,若数据很大,在设置 shape 时优先将大数设置在 S2 维度,其次 S0 维度)