Program/딥러닝

Program/딥러닝ObjectDetection - TensorRT

사막여유 2025. 6. 17. 08:33
728x90

Tensor RT

  • NVIDIA에서 만든 프레임워크
  • NVIDIA GPU 최적화 기술

Advantages of Tensor RT

  • C++과 Pyhton을 API레벨에서 지원하므로 CUDA를 잘 모르는 DeepLearning 개발자들도 
    쉽게 사용할 수 있따.
  • Lantency, ThroughPut을 쉽게 향상
  • 다양한 Layer 및 연산에 대해 Customization할 수 있는 방법론을 제공
  • Latency (시간단위)
    • 작업을 처리하는데 걸리는 시간
  • Throughput (일단위)
    • 단위시간(초)당 처리하는 작업의 수
    • 일초당 몇장의 이미지를 처리할 수 있는지

 

Work Flow

  1. Optimizer
    • NVIDIA GPU연산에 적합한 최적화 기법들을 사용해 훈련된 딥러닝 모델을 최적화 하는 역할
  2. Engine
    • 배포할 NVIDIA GPU에 따라 최적의 연산을 수행할 수 있도록 도와주는 역할

 

딥러닝 가속화 방법

 

 

위 5가지의 방법으로 딥러닝의 경량화 및 가속화가 가능하다.

  1. Quantization & Precision Calibration
  2. Graph Optimization
  3. Kernel Auto-Tuning
  4. Dynamic Tensor Memonry
  5. Multi-Stream Execution

 

ONNX ( Open Neural Network Exchange )

  • ONNX는 인공지능 모델을 표준형식으로 표현하고, 서로다른 딥러닝 프레임워크간에 
    모델의 변환 및 공유를 지원
728x90