TensorRT-YOLOv8/python/segment/infer_origin.py at main · emptysoal/TensorRT-YOLOv8

178 lines (140 loc) · 6.72 KB
# -*- coding:utf-8 -*-
    onnx 模型转 tensorrt 模型，并使用 tensorrt python api 推理
import time
from random import randint
import numpy as np
import tensorrt as trt
from cuda import cudart
from config import *
from preprocess import preprocess
from postprocess import postprocess
import calibrator
logger = trt.Logger(trt.Logger.ERROR)
def get_engine():
    if os.path.exists(trt_file):
        with open(trt_file, "rb") as f:  # read .plan file if exists
            engine_string = f.read()
        if engine_string is None:
            print("Failed getting serialized engine!")
            return
        print("Succeeded getting serialized engine!")
        builder = trt.Builder(logger)
        network = builder.create_network(1 << int(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH))
        profile = builder.create_optimization_profile()
        config = builder.create_builder_config()
        config.max_workspace_size = 1 << 30  # set workspace for TensorRT
        if use_fp16_mode:
            config.set_flag(trt.BuilderFlag.FP16)
        if use_int8_mode:
            config.set_flag(trt.BuilderFlag.INT8)
            config.int8_calibrator = calibrator.MyCalibrator(calibration_data_dir, n_calibration,
                                                             (8, 3, kInputW, kInputW), cache_file)
        parser = trt.OnnxParser(network, logger)
        if not os.path.exists(onnx_file):
            print("Failed finding ONNX file!")
            return
        print("Succeeded finding ONNX file!")
        with open(onnx_file, "rb") as model:
            if not parser.parse(model.read()):
                print("Failed parsing .onnx file!")
                for error in range(parser.num_errors):
                    print(parser.get_error(error))
                return
            print("Succeeded parsing .onnx file!")
        input_tensor = network.get_input(0)
        profile.set_shape(input_tensor.name, [1, 3, kInputH, kInputW], [1, 3, kInputH, kInputW],
                          [1, 3, kInputH, kInputW])
        config.add_optimization_profile(profile)
        engine_string = builder.build_serialized_network(network, config)
        if engine_string is None:
            print("Failed building engine!")
            return
        print("Succeeded building engine!")
        with open(trt_file, "wb") as f:
            f.write(engine_string)
    engine = trt.Runtime(logger).deserialize_cuda_engine(engine_string)
    return engine
def inference_one(data_input, context, buffer_h, buffer_d):
        使用tensorrt runtime 做一次推理
    buffer_h[0] = np.ascontiguousarray(data_input)
    cudart.cudaMemcpy(buffer_d[0], buffer_h[0].ctypes.data, buffer_h[0].nbytes,
                      cudart.cudaMemcpyKind.cudaMemcpyHostToDevice)
    context.execute_v2(buffer_d)  # inference
    cudart.cudaMemcpy(buffer_h[1].ctypes.data, buffer_d[1], buffer_h[1].nbytes,
                      cudart.cudaMemcpyKind.cudaMemcpyDeviceToHost)
    cudart.cudaMemcpy(buffer_h[2].ctypes.data, buffer_d[2], buffer_h[2].nbytes,
                      cudart.cudaMemcpyKind.cudaMemcpyDeviceToHost)
    out1 = buffer_h[1].copy().reshape((32, int(kInputH / 4), int(kInputW / 4)))  # shape: (32, 160, 160)
    out2 = buffer_h[2].copy().reshape((4 + kNumClass + 32, -1))  # shape: (116, 8400)
    return out1, out2
def draw_image(image, bboxes, masks, draw_bbox=True):
    if not bboxes.shape[0]:
        return
    # draw bbox
    if draw_bbox:
        label_color = (255, 255, 255)
        line_thickness = 2
        for x1, y1, x2, y2, conf, class_id in bboxes:
            bbox_color = (randint(0, 255), randint(0, 255), randint(0, 255))
            c1, c2 = (int(x1), int(y1)), (int(x2), int(y2))
            cv2.rectangle(image, c1, c2, bbox_color, thickness=line_thickness, lineType=cv2.LINE_AA)
            label = f"{class_name_list[int(class_id)]} {float(conf):.2f}"
            # label = class_name_list[int(class_id)]
            t_size = cv2.getTextSize(label, 0, fontScale=line_thickness / 3, thickness=line_thickness)[0]
            c2 = c1[0] + t_size[0], c1[1] - t_size[1] - 3
            cv2.rectangle(image, c1, c2, bbox_color, -1, cv2.LINE_AA)  # filled
            cv2.putText(image, label, (c1[0], c1[1] - 2), 0, line_thickness / 3, label_color,
                        thickness=line_thickness, lineType=cv2.LINE_AA)
    # draw masks
    for mask in masks:
        mask = mask.astype("bool")
        mask_color = np.array([randint(0, 255), randint(0, 255), randint(0, 255)])
        color_mask = np.zeros(image.shape, dtype="uint8")
        color_mask[mask] = mask_color
        image[mask] = image[mask] * 0.5 + color_mask[mask] * 0.5
if __name__ == '__main__':
    engine = get_engine()
    n_io = engine.num_bindings
    l_tensor_name = [engine.get_binding_name(i) for i in range(n_io)]
    n_input = np.sum([engine.binding_is_input(i) for i in range(n_io)])
    context = engine.create_execution_context()
    context.set_binding_shape(0, [1, 3, kInputH, kInputW])
    for i in range(n_io):
        print("[%2d]%s->" % (i, "Input " if i < n_input else "Output"), engine.get_binding_dtype(i),
              engine.get_binding_shape(i), context.get_binding_shape(i), l_tensor_name[i])
        [ 0]Input -> DataType.FLOAT (1, 3, 640, 640) (1, 3, 640, 640) images
        [ 1]Output-> DataType.FLOAT (1, 32, 160, 160) (1, 32, 160, 160) output1
        [ 2]Output-> DataType.FLOAT (1, 116, 8400) (1, 116, 8400) output0
    buffer_h = []
    for i in range(n_io):
        buffer_h.append(np.empty(context.get_binding_shape(i), dtype=trt.nptype(engine.get_binding_dtype(i))))
    buffer_d = []
    for i in range(n_io):
        buffer_d.append(cudart.cudaMalloc(buffer_h[i].nbytes)[1])
    for image_name in os.listdir("./images"):
        image_path = os.path.join("./images", image_name)
        if image_path.endswith("jpg") or image_path.endswith("jpeg"):
            image = cv2.imread(image_path, cv2.IMREAD_COLOR)  # read image
            start = time.time()
            input_data = preprocess(image, kInputH, kInputW)  # image preprocess
            input_data = np.expand_dims(input_data, axis=0)  # add batch size dimension
            output = inference_one(input_data, context, buffer_h, buffer_d)
            bboxes_res, masks_res = postprocess(image, output, kConfThresh, kNmsThresh, kInputH, kInputW, kNumClass)
            end = time.time()
            print("Infer image %s cost %d ms." % (image_name, (end - start) * 1000))
            draw_image(image, bboxes_res, masks_res)
            save_dir = "./output/"
            if not os.path.exists(save_dir):
                os.makedirs(save_dir)
            cv2.imwrite(save_dir + "_" + image_name, image)
    for b in buffer_d:
        cudart.cudaFree(b)
Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FilesExpand file tree

infer_origin.py

Latest commit

History

infer_origin.py

File metadata and controls