合约量化（量化合约）开发详细丨合约量化（量化合约）系统开发策略及分析

2023-03-21 15:49 作者:bili_33032327742 0人读过 | 我要投稿

　　执行quantize.py，进行量化

　　整个量化过程：

　　设置量化参数-->载入数据-->执行量化（如果要看结果，则定制一个executor）-->导出所有层量化结果-->分析量化误差（总误差，每层误差）-->导出量化权重文件

　　量化文件最后在working/quantized.onnx

　　注意：该代码输入输出格式都是onnx，但是输出platfor和calibration方法与B站教程不同，该输出模型包含了量化-反量化节点，可以用onnxruntime测试AP

　　"""

　　这是一个PPQ量化的入口脚本，将你的模型和数据按要求进行打包：

　　This file will show you how to quantize your network with PPQ

　　You should prepare your model and calibration dataset as follow:

　　~/working/model.onnx<--your model

　　~/working/data/*.npy or~/working/data/*.bin<--your dataset

　　if you are using caffe model:关于区块链项目技术开发威:yy625019

　　~/working/model.caffemdoel<--your model

　　~/working/model.prototext<--your model

　　###MAKE SURE YOUR INPUT LAYOUT IS[N,C,H,W]or[C,H,W]###

　　quantized model will be generated at:~/working/quantized.onnx

　　"""

　　from ppq import*

　　from ppq.api import*

　　import os

　　#modify configuration below:

　　WORKING_DIRECTORY='working'#choose your working directory

　　TARGET_PLATFORM=TargetPlatform.PPL_CUDA_INT8#choose your target platform

　　MODEL_TYPE=NetworkFramework.ONNX#or NetworkFramework.CAFFE

　　INPUT_LAYOUT='chw'#input data layout,chw or hwc

　　NETWORK_INPUTSHAPE=[1,3,224,224]#input shape of your network

　　CALIBRATION_BATCHSIZE=16#batchsize of calibration dataset

　　EXECUTING_DEVICE='cuda'#'cuda'or'cpu'.

　　REQUIRE_ANALYSE=False

　　DUMP_RESULT=False#是否需要Finetuning一下你的网络

　　#SETTING对象用于控制PPQ的量化逻辑

　　#当你的网络量化误差过高时，你需要修改SETTING对象中的参数进行特定的优化

　　platform=TARGET_PLATFORM,finetune_steps=2500,

　　finetune_lr=1e-3,calibration='kl',#【改】量化算法可选'kl','pecentile','mse'

　　equalization=True,non_quantable_op=None)

　　SETTING=SETTING.convert_to_daddy_setting()

　　print('正准备量化你的网络，检查下列设置:')

　　print(f'WORKING DIRECTORY:{WORKING_DIRECTORY}')

　　print(f'TARGET PLATFORM:{TARGET_PLATFORM.name}')

　　print(f'NETWORK INPUTSHAPE:{NETWORK_INPUTSHAPE}')

　　print(f'CALIBRATION BATCHSIZE:{CALIBRATION_BATCHSIZE}')

　　#------------------------------------------------------------------------------

　　#此脚本针对单输入模型，输入数据必须是图像数据layout:[n,c,h,w]

　　#如果你的模型具有更复杂的输入格式，你可以重写下面的load_calibration_dataset函数

　　#请注意，任何可遍历对象都可以作为PPQ的数据集作为输入

　　#------------------------------------------------------------------------------

　　dataloader=load_calibration_dataset(

　　directory=WORKING_DIRECTORY,

　　input_shape=NETWORK_INPUTSHAPE,

　　batchsize=CALIBRATION_BATCHSIZE,

　　input_format=INPUT_LAYOUT)

　　print('网络正量化中，根据你的量化配置，这将需要一段时间:')

　　quantized=quantize(

　　working_directory=WORKING_DIRECTORY,setting=SETTING,

　　model_type=MODEL_TYPE,executing_device=EXECUTING_DEVICE,

　　input_shape=NETWORK_INPUTSHAPE,target_platform=TARGET_PLATFORM,

　　dataloader=dataloader,calib_steps=32)

　　#------------------------------------------------------------------------------

　　#如果你需要执行量化后的神经网络并得到结果，则需要创建一个executor

　　#这个executor的行为和torch.Module是类似的，你可以利用这个东西来获取执行结果

　　#请注意必须在executor之前执行此操作

　　#------------------------------------------------------------------------------

　　executor=TorchExecutor(graph=quantized)

　　#output=executor.forword(input)

　　#------------------------------------------------------------------------------

　　#导出PPQ执行网络的所有中间结果，该功能是为了和硬件对比结果

　　#中间结果可能十分庞大，因此PPQ将使用线性同余发射器从执行结果中采样

　　#对了对比中间结果，硬件执行结果也必须使用同样的随机数种子采样

　　#查阅ppq.util.fetch中的相关代码以进一步了解此内容

　　#查阅ppq.api.fsys中的dump_internal_results函数以确定采样逻辑

　　#------------------------------------------------------------------------------

　　if DUMP_RESULT:

　　dump_internal_results(

　　graph=quantized,dataloader=dataloader,

　　dump_dir=WORKING_DIRECTORY,executing_device=EXECUTING_DEVICE)

　　#-------------------------------------------------------------------

　　#PPQ计算量化误差时，使用信噪比的倒数作为指标，即噪声能量/信号能量

　　#量化误差0.1表示在整体信号中，量化噪声的能量约为10%

　　#你应当注意，在graphwise_error_analyse分析中，我们衡量的是累计误差

　　#网络的最后一层往往都具有较大的累计误差，这些误差是其前面的所有层所共同造成的

　　#你需要使用layerwise_error_analyse逐层分析误差的来源

　　#-------------------------------------------------------------------

　　print('正计算网络量化误差(SNR)，最后一层的误差应小于0.1以保证量化精度:')

　　reports=graphwise_error_analyse(

　　graph=quantized,running_device=EXECUTING_DEVICE,steps=32,

　　dataloader=dataloader,collate_fn=lambda x:x.to(EXECUTING_DEVICE))

　　for op,snr in reports.items():

　　if snr>0.1:ppq_warning(f'层{op}的累计量化误差显著，请考虑进行优化')

　　if REQUIRE_ANALYSE:

　　print('正计算逐层量化误差(SNR)，每一层的独立量化误差应小于0.1以保证量化精度:')

　　layerwise_error_analyse(graph=quantized,running_device=EXECUTING_DEVICE,

　　interested_outputs=None,

　　dataloader=dataloader,collate_fn=lambda x:x.to(EXECUTING_DEVICE))

　　print('网络量化结束，正在生成目标文件:')

　　export_ppq_graph(

　　graph=quantized,platform=TargetPlatform.ONNXRUNTIME,

　　graph_save_to=os.path.join(WORKING_DIRECTORY,'quantized.onnx'),

　　config_save_to=os.path.join(WORKING_DIRECTORY,'quant_cfg.json'),

　　quantized_param=True)#【改】platform：保证输出onnxruntime格式带量化和反量化节点；

　　#quantized_param：确保param储存int8格式，规避onnxruntime无法量化

标签：

合约量化（量化合约）开发详细丨合约量化（量化合约）系统开发策略及分析

合约量化（量化合约）开发详细丨合约量化（量化合约）系统开发策略及分析的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

合约量化（量化合约）开发详细丨合约量化（量化合约）系统开发策略及分析

本文作者的其他文章

合约量化（量化合约）开发详细丨合约量化（量化合约）系统开发策略及分析的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

合约量化（量化合约）开发详细丨合约量化（量化合约）系统开发策略及分析的评论 (共条)