onnxruntime

首页

onnxruntime

我正在尝试使用onnxruntime-gpu创建一个推理会话，我已经严重困惑了。但是，print语句声明推理会话正在GPU上运行。这是否不会调用主机设备通信？

在python中，我正在加载预定义的模型：然后我加载一些数据并运行它：到目前为止，它仍在正常工作，但我希望它默认返回Tensor列表，而不是numpy数组。我对ONNX和PyTorch都是新手，我觉得这是我在这里缺少的基本内容。这将使转换中的一些开销相同。