我不知道是不是转换的问题,转换的脚本除了输出格式外其他完全一样,加载的时间差异在 15 倍以上…就算是初次加载这个时间也有点难以接受了,更何况图中还是中位数…
有大手子指导一下么?非常感谢!
P.S. 已经提了 issue 暂时还没人管…
![]() |
1
keakon 31 天前 ![]() 一些观点:
1. NN 图层更静态,加载时的动态处理较少。 2. INT8 等精度需要重新量化。 3. 支持 ANE 时会生成一个高度特化的 Metal-Shading-Language 内核,速度会慢一个数量级。第一次启动时可以使用 cpuAndGPU 的方式启动,后台再编译 cpuAndNeuralEngine 供后续加载加速。 4. ct.SpecializationStrategy.FastPrediction 可以减少设备特化时间。 |