mindspore/patches/0019-adaper-NNCore-Api.patch

be168c0dSopenharmony_ciFrom 3793994296c2ede3f79544d613acd8f6600ec9fb Mon Sep 17 00:00:00 2001
be168c0dSopenharmony_ciFrom: chengfeng27 <chengfeng27@huawei.com>
be168c0dSopenharmony_ciDate: Fri, 7 Jun 2024 15:31:09 +0800
be168c0dSopenharmony_ciSubject: fix lite_graph dequant crash
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci---
be168c0dSopenharmony_ci .../delegate/nnrt/checker/primitive_check.cc  | 115 -----------
be168c0dSopenharmony_ci .../delegate/nnrt/checker/primitive_check.h   |   1 -
be168c0dSopenharmony_ci .../litert/delegate/nnrt/nnrt_allocator.cc    |  64 +++---
be168c0dSopenharmony_ci .../src/litert/delegate/nnrt/nnrt_allocator.h |  20 +-
be168c0dSopenharmony_ci .../src/litert/delegate/nnrt/nnrt_delegate.cc |  32 +--
be168c0dSopenharmony_ci .../src/litert/delegate/nnrt/nnrt_delegate.h  |   1 +
be168c0dSopenharmony_ci .../litert/delegate/nnrt/nnrt_model_kernel.cc | 190 ++++++++++--------
be168c0dSopenharmony_ci .../litert/delegate/nnrt/nnrt_model_kernel.h  |  17 +-
be168c0dSopenharmony_ci mindspore/lite/src/tensor.h                   |   2 +
be168c0dSopenharmony_ci 9 files changed, 186 insertions(+), 256 deletions(-)
be168c0dSopenharmony_ci
be168c0dSopenharmony_cidiff --git a/mindspore/lite/src/litert/delegate/nnrt/checker/primitive_check.cc b/mindspore/lite/src/litert/delegate/nnrt/checker/primitive_check.cc
be168c0dSopenharmony_ciindex 6b191c8e..67d60f1b 100644
be168c0dSopenharmony_ci--- a/mindspore/lite/src/litert/delegate/nnrt/checker/primitive_check.cc
be168c0dSopenharmony_ci+++ b/mindspore/lite/src/litert/delegate/nnrt/checker/primitive_check.cc
be168c0dSopenharmony_ci@@ -7,121 +7,6 @@
be168c0dSopenharmony_ci #include "src/common/utils.h"
be168c0dSopenharmony_ci namespace mindspore {
be168c0dSopenharmony_ci namespace lite {
be168c0dSopenharmony_ci-
be168c0dSopenharmony_ci-Status CheckPrimitiveSupported(const schema::Primitive *primitive) {
be168c0dSopenharmony_ci-  if (primitive != nullptr) {
be168c0dSopenharmony_ci-    auto prim = primitive;
be168c0dSopenharmony_ci-    auto type = prim->value_type();
be168c0dSopenharmony_ci-    switch (type) {
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Activation:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_AddFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_ArgMaxFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_AvgPoolFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_BatchToSpaceND:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_BiasAdd:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Cast:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Concat:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Conv2DFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Conv2dTransposeFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_DivFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Eltwise:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_ExpandDims:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Fill:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_FullConnection:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_FusedBatchNorm:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Gather:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_LayerNormFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_LessEqual:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_MatMulFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Maximum:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_MaxPoolFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_MulFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_OneHot:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_PadFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_PowFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_PReLUFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_QuantDTypeCast:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_ReduceFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Reshape:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Resize:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Rsqrt:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_ScaleFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Shape:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_SliceFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Softmax:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_SpaceToBatchND:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Split:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Sqrt:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_SquaredDifference:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Squeeze:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Stack:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_StridedSlice:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_SubFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_TileFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_TopKFusion:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Transpose:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Unsqueeze:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      case schema::PrimitiveType_Custom:
be168c0dSopenharmony_ci-        return mindspore::kSuccess;
be168c0dSopenharmony_ci-      default: {
be168c0dSopenharmony_ci-        MS_LOG(WARNING) << "No primitive type :" << (int)(type);
be168c0dSopenharmony_ci-        return mindspore::kLiteSuccessExit;
be168c0dSopenharmony_ci-      }
be168c0dSopenharmony_ci-    }
be168c0dSopenharmony_ci-    return mindspore::kSuccess;
be168c0dSopenharmony_ci-  } else {
be168c0dSopenharmony_ci-    MS_LOG(ERROR) << "primitive is nullptr.";
be168c0dSopenharmony_ci-    return mindspore::kLiteError;
be168c0dSopenharmony_ci-  }
be168c0dSopenharmony_ci-}
be168c0dSopenharmony_ci namespace {
be168c0dSopenharmony_ci bool NeedBitUppackCheck(const schema::Tensor &src_tensor) {
be168c0dSopenharmony_ci   if (src_tensor.enableHuffmanCode()) {
be168c0dSopenharmony_cidiff --git a/mindspore/lite/src/litert/delegate/nnrt/checker/primitive_check.h b/mindspore/lite/src/litert/delegate/nnrt/checker/primitive_check.h
be168c0dSopenharmony_ciindex dbdd812c..46b812c0 100644
be168c0dSopenharmony_ci--- a/mindspore/lite/src/litert/delegate/nnrt/checker/primitive_check.h
be168c0dSopenharmony_ci+++ b/mindspore/lite/src/litert/delegate/nnrt/checker/primitive_check.h
be168c0dSopenharmony_ci@@ -4,7 +4,6 @@
be168c0dSopenharmony_ci #include "include/api/status.h"
be168c0dSopenharmony_ci namespace mindspore {
be168c0dSopenharmony_ci namespace lite {
be168c0dSopenharmony_ci-Status CheckPrimitiveSupported(const schema::Primitive *primitive);
be168c0dSopenharmony_ci Status CheckTensorSupported(const schema::Tensor *primitive);
be168c0dSopenharmony_ci }  // namespace lite
be168c0dSopenharmony_ci }  // namespace mindspore
be168c0dSopenharmony_cidiff --git a/mindspore/lite/src/litert/delegate/nnrt/nnrt_allocator.cc b/mindspore/lite/src/litert/delegate/nnrt/nnrt_allocator.cc
be168c0dSopenharmony_ciindex f79c1682..b38fff62 100644
be168c0dSopenharmony_ci--- a/mindspore/lite/src/litert/delegate/nnrt/nnrt_allocator.cc
be168c0dSopenharmony_ci+++ b/mindspore/lite/src/litert/delegate/nnrt/nnrt_allocator.cc
be168c0dSopenharmony_ci@@ -21,7 +21,6 @@
be168c0dSopenharmony_ci #include <mutex>
be168c0dSopenharmony_ci #include "src/litert/delegate/nnrt/nnrt_allocator.h"
be168c0dSopenharmony_ci #include "src/common/log.h"
be168c0dSopenharmony_ci-#include "interfaces/kits/c/neural_network_runtime/neural_network_runtime.h"
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci namespace mindspore {
be168c0dSopenharmony_ci namespace lite {
be168c0dSopenharmony_ci@@ -29,23 +28,17 @@ NNRTAllocator::~NNRTAllocator() {
be168c0dSopenharmony_ci   std::lock_guard<std::mutex> locker(mutex_);
be168c0dSopenharmony_ci   for (auto &it : allocated_list_) {
be168c0dSopenharmony_ci     auto membuf = it.second;
be168c0dSopenharmony_ci-    if (memory_category_ == NNRT_INPUT) {
be168c0dSopenharmony_ci-      OH_NNExecutor_DestroyInputMemory(executor_, index_, &(membuf->memory_));
be168c0dSopenharmony_ci-    } else {
be168c0dSopenharmony_ci-      OH_NNExecutor_DestroyOutputMemory(executor_, index_, &(membuf->memory_));
be168c0dSopenharmony_ci-    }
be168c0dSopenharmony_ci-    free(membuf);
be168c0dSopenharmony_ci+    OH_NNTensor_Destroy(&membuf->tensor_);
be168c0dSopenharmony_ci+    OH_NNTensorDesc_Destroy(&membuf->tensor_desc_);
be168c0dSopenharmony_ci+    delete membuf;
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci   allocated_list_.clear();
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci   for (auto &it : free_list_) {
be168c0dSopenharmony_ci     auto membuf = it.second;
be168c0dSopenharmony_ci-    if (memory_category_ == NNRT_INPUT) {
be168c0dSopenharmony_ci-      OH_NNExecutor_DestroyInputMemory(executor_, index_, &(membuf->memory_));
be168c0dSopenharmony_ci-    } else {
be168c0dSopenharmony_ci-      OH_NNExecutor_DestroyOutputMemory(executor_, index_, &(membuf->memory_));
be168c0dSopenharmony_ci-    }
be168c0dSopenharmony_ci-    free(membuf);
be168c0dSopenharmony_ci+    OH_NNTensor_Destroy(&membuf->tensor_);
be168c0dSopenharmony_ci+    OH_NNTensorDesc_Destroy(&membuf->tensor_desc_);
be168c0dSopenharmony_ci+    delete membuf;
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci   free_list_.clear();
be168c0dSopenharmony_ci }
be168c0dSopenharmony_ci@@ -57,8 +50,8 @@ void *NNRTAllocator::Malloc(size_t size) {
be168c0dSopenharmony_ci     auto membuf = iter->second;
be168c0dSopenharmony_ci     membuf->ref_count_ = 0;
be168c0dSopenharmony_ci     (void)free_list_.erase(iter);
be168c0dSopenharmony_ci-    allocated_list_[membuf->memory_->data] = membuf;
be168c0dSopenharmony_ci-    return membuf->memory_->data;
be168c0dSopenharmony_ci+    allocated_list_[membuf->data] = membuf;
be168c0dSopenharmony_ci+    return membuf->data;
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci   auto membuf = new (std::nothrow) MemBuf();
be168c0dSopenharmony_ci@@ -66,30 +59,36 @@ void *NNRTAllocator::Malloc(size_t size) {
be168c0dSopenharmony_ci     MS_LOG(ERROR) << "new Membuf failed.";
be168c0dSopenharmony_ci     return nullptr;
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci-
be168c0dSopenharmony_ci   membuf->ref_count_ = 0;
be168c0dSopenharmony_ci   if (memory_category_ == NNRT_INPUT) {
be168c0dSopenharmony_ci-    membuf->memory_ = OH_NNExecutor_AllocateInputMemory(executor_, index_, size);
be168c0dSopenharmony_ci+    membuf->tensor_desc_ = OH_NNExecutor_CreateInputTensorDesc(executor_, index_);
be168c0dSopenharmony_ci   } else {
be168c0dSopenharmony_ci-    membuf->memory_ = OH_NNExecutor_AllocateOutputMemory(executor_, index_, size);
be168c0dSopenharmony_ci+    membuf->tensor_desc_ = OH_NNExecutor_CreateOutputTensorDesc(executor_, index_);
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci-
be168c0dSopenharmony_ci-  if (membuf->memory_ == nullptr) {
be168c0dSopenharmony_ci-    MS_LOG(ERROR) << "malloc OH_NN_Memory return nullptr";
be168c0dSopenharmony_ci+  if (membuf->tensor_desc_ == nullptr) {
be168c0dSopenharmony_ci+    MS_LOG(ERROR) << "OH_NNExecutor_CreateInput/OutputTensorDesc failed, i = " << index_;
be168c0dSopenharmony_ci+    delete membuf;
be168c0dSopenharmony_ci+    return nullptr;
be168c0dSopenharmony_ci+  }
be168c0dSopenharmony_ci+  membuf->tensor_ = OH_NNTensor_CreateWithSize(device_id_, membuf->tensor_desc_, size);
be168c0dSopenharmony_ci+  if (membuf->tensor_ == nullptr) {
be168c0dSopenharmony_ci+    MS_LOG(ERROR) << "OH_NNTensor_CreateWithSize failed, i = " << index_;
be168c0dSopenharmony_ci+    OH_NNTensorDesc_Destroy(&membuf->tensor_desc_);
be168c0dSopenharmony_ci+    delete membuf;
be168c0dSopenharmony_ci     return nullptr;
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci-  if (membuf->memory_->data == nullptr) {
be168c0dSopenharmony_ci-    MS_LOG(ERROR) << "malloc OH_NN_Memory return nullptr";
be168c0dSopenharmony_ci-    if (memory_category_ == NNRT_INPUT) {
be168c0dSopenharmony_ci-      OH_NNExecutor_DestroyInputMemory(executor_, index_, &(membuf->memory_));
be168c0dSopenharmony_ci-    } else {
be168c0dSopenharmony_ci-      OH_NNExecutor_DestroyOutputMemory(executor_, index_, &(membuf->memory_));
be168c0dSopenharmony_ci-    }
be168c0dSopenharmony_ci+  membuf->data = OH_NNTensor_GetDataBuffer(membuf->tensor_);
be168c0dSopenharmony_ci+  if (membuf->data == nullptr) {
be168c0dSopenharmony_ci+    MS_LOG(ERROR) << "OH_NNTensor_GetDataBuffer failed, i = " << index_;
be168c0dSopenharmony_ci+    OH_NNTensor_Destroy(&membuf->tensor_);
be168c0dSopenharmony_ci+    OH_NNTensorDesc_Destroy(&membuf->tensor_desc_);
be168c0dSopenharmony_ci+    delete membuf;
be168c0dSopenharmony_ci     return nullptr;
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci-  allocated_list_[membuf->memory_->data] = membuf;
be168c0dSopenharmony_ci-  return membuf->memory_->data;
be168c0dSopenharmony_ci+  membuf->size = size;
be168c0dSopenharmony_ci+  allocated_list_[membuf->data] = membuf;
be168c0dSopenharmony_ci+  return membuf->data;
be168c0dSopenharmony_ci }
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci void NNRTAllocator::Free(void *ptr) {
be168c0dSopenharmony_ci@@ -105,12 +104,12 @@ void NNRTAllocator::Free(void *ptr) {
be168c0dSopenharmony_ci   auto membuf = iter->second;
be168c0dSopenharmony_ci   membuf->ref_count_ = 0;
be168c0dSopenharmony_ci   (void)allocated_list_.erase(iter);
be168c0dSopenharmony_ci-  (void)free_list_.insert(std::make_pair(membuf->memory_->length, membuf));
be168c0dSopenharmony_ci+  (void)free_list_.insert(std::make_pair(membuf->size, membuf));
be168c0dSopenharmony_ci }
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci int NNRTAllocator::RefCount(void *ptr) {
be168c0dSopenharmony_ci   if (ptr == nullptr) {
be168c0dSopenharmony_ci-    return -1;
be168c0dSopenharmony_ci+    return NNRT_ALLOCATION;
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci   std::lock_guard<std::mutex> locker(mutex_);
be168c0dSopenharmony_ci   auto iter = allocated_list_.find(ptr);
be168c0dSopenharmony_ci@@ -163,6 +162,5 @@ int NNRTAllocator::IncRefCount(void *ptr, int ref_count) {
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci   return -1;
be168c0dSopenharmony_ci }
be168c0dSopenharmony_ci-
be168c0dSopenharmony_ci }  // namespace lite
be168c0dSopenharmony_ci }  // namespace mindspore
be168c0dSopenharmony_ci\ No newline at end of file
be168c0dSopenharmony_cidiff --git a/mindspore/lite/src/litert/delegate/nnrt/nnrt_allocator.h b/mindspore/lite/src/litert/delegate/nnrt/nnrt_allocator.h
be168c0dSopenharmony_ciindex f6721369..52e6def7 100644
be168c0dSopenharmony_ci--- a/mindspore/lite/src/litert/delegate/nnrt/nnrt_allocator.h
be168c0dSopenharmony_ci+++ b/mindspore/lite/src/litert/delegate/nnrt/nnrt_allocator.h
be168c0dSopenharmony_ci@@ -23,6 +23,9 @@
be168c0dSopenharmony_ci #include <map>
be168c0dSopenharmony_ci #include <mutex>
be168c0dSopenharmony_ci #include "include/api/allocator.h"
be168c0dSopenharmony_ci+#include "src/tensor.h"
be168c0dSopenharmony_ci+#include "interfaces/kits/c/neural_network_runtime/neural_network_runtime.h"
be168c0dSopenharmony_ci+
be168c0dSopenharmony_ci struct OH_NN_Memory;
be168c0dSopenharmony_ci struct OH_NNExecutor;
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci@@ -32,8 +35,8 @@ enum MemoryCategory { NNRT_INPUT, NNRT_OUTPUT };
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci class NNRTAllocator : public Allocator {
be168c0dSopenharmony_ci  public:
be168c0dSopenharmony_ci-  NNRTAllocator(OH_NNExecutor *executor, int index, MemoryCategory memory_category)
be168c0dSopenharmony_ci-      : index_(index), memory_category_(memory_category), executor_(executor) {}
be168c0dSopenharmony_ci+  NNRTAllocator(OH_NNExecutor *executor, int index, size_t device_id, MemoryCategory memory_category)
be168c0dSopenharmony_ci+      : index_(index), device_id_(device_id), memory_category_(memory_category), executor_(executor) {}
be168c0dSopenharmony_ci   ~NNRTAllocator() override;
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci   void *Malloc(size_t size) override;
be168c0dSopenharmony_ci@@ -42,14 +45,25 @@ class NNRTAllocator : public Allocator {
be168c0dSopenharmony_ci   int SetRefCount(void *ptr, int ref_count) override;
be168c0dSopenharmony_ci   int DecRefCount(void *ptr, int ref_count) override;
be168c0dSopenharmony_ci   int IncRefCount(void *ptr, int ref_count) override;
be168c0dSopenharmony_ci+  NN_Tensor *GetNNTensor(void *ptr) {
be168c0dSopenharmony_ci+    auto iter = allocated_list_.find(ptr);
be168c0dSopenharmony_ci+    if (iter != allocated_list_.end()) {
be168c0dSopenharmony_ci+      return iter->second->tensor_;
be168c0dSopenharmony_ci+    }
be168c0dSopenharmony_ci+    return nullptr;
be168c0dSopenharmony_ci+  }
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci  private:
be168c0dSopenharmony_ci   struct MemBuf {
be168c0dSopenharmony_ci     std::atomic_int ref_count_{0};
be168c0dSopenharmony_ci-    OH_NN_Memory *memory_{nullptr};
be168c0dSopenharmony_ci+    NN_TensorDesc *tensor_desc_{nullptr};
be168c0dSopenharmony_ci+    NN_Tensor *tensor_{nullptr};
be168c0dSopenharmony_ci+    void *data{nullptr};
be168c0dSopenharmony_ci+    size_t size{0};
be168c0dSopenharmony_ci   };
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci   int index_{0};
be168c0dSopenharmony_ci+  size_t device_id_{0};
be168c0dSopenharmony_ci   MemoryCategory memory_category_{NNRT_INPUT};
be168c0dSopenharmony_ci   OH_NNExecutor *executor_{nullptr};
be168c0dSopenharmony_ci   std::mutex mutex_;
be168c0dSopenharmony_cidiff --git a/mindspore/lite/src/litert/delegate/nnrt/nnrt_delegate.cc b/mindspore/lite/src/litert/delegate/nnrt/nnrt_delegate.cc
be168c0dSopenharmony_ciindex d8450141..a949c910 100644
be168c0dSopenharmony_ci--- a/mindspore/lite/src/litert/delegate/nnrt/nnrt_delegate.cc
be168c0dSopenharmony_ci+++ b/mindspore/lite/src/litert/delegate/nnrt/nnrt_delegate.cc
be168c0dSopenharmony_ci@@ -169,7 +169,7 @@ Status NNRTDelegate::CreateFullModelKernel(DelegateModel<schema::Primitive> *mod
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci   OH_NNCompilation_Destroy(&nn_compilation);
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci-  auto nnrt_model_kernel = new (std::nothrow)NNRTModelKernel(nn_executor, model->inputs(), model->outputs());
be168c0dSopenharmony_ci+  auto nnrt_model_kernel = new (std::nothrow)NNRTModelKernel(nn_executor, nnrt_device_info_.device_id_, model->inputs(), model->outputs());
be168c0dSopenharmony_ci   if (nnrt_model_kernel == nullptr) {
be168c0dSopenharmony_ci     OH_NNExecutor_Destroy(&nn_executor);
be168c0dSopenharmony_ci     MS_LOG(ERROR) << "new NNRTModelKernel failed";
be168c0dSopenharmony_ci@@ -581,7 +581,7 @@ Status NNRTDelegate::CreateNNRTSubgraphKernels(DelegateModel<schema::Primitive>
be168c0dSopenharmony_ci       continue ;
be168c0dSopenharmony_ci     }
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci-    auto nnrt_model_kernel = new (std::nothrow)NNRTModelKernel(nn_executor, in_tensors, out_tensors);
be168c0dSopenharmony_ci+    auto nnrt_model_kernel = new (std::nothrow)NNRTModelKernel(nn_executor, nnrt_device_info_.device_id_, in_tensors, out_tensors);
be168c0dSopenharmony_ci     if (nnrt_model_kernel == nullptr) {
be168c0dSopenharmony_ci       MS_LOG(ERROR) << "new NNRTModelKernel failed";
be168c0dSopenharmony_ci       return kLiteError;
be168c0dSopenharmony_ci@@ -760,6 +760,15 @@ schema::Tensor *NNRTDelegate::TensorToSchemaTensor(Tensor *lite_tensor, schema::
be168c0dSopenharmony_ci   memcpy(tensor_buf, buf, fbb.GetSize());
be168c0dSopenharmony_ci   auto tensor = flatbuffers::GetRoot<schema::Tensor>(tensor_buf);
be168c0dSopenharmony_ci   fbb.Clear();
be168c0dSopenharmony_ci+  if (tensor != nullptr) {
be168c0dSopenharmony_ci+    // use to free tensor_buf
be168c0dSopenharmony_ci+    auto iter = dequant_schema_tensors_buffer_map_.find(const_cast<schema::Tensor *>(tensor));
be168c0dSopenharmony_ci+    if (iter != dequant_schema_tensors_buffer_map_.end()) {
be168c0dSopenharmony_ci+      MS_LOG(ERROR) << "schema tensor is duplicated.";
be168c0dSopenharmony_ci+      return nullptr;
be168c0dSopenharmony_ci+    }
be168c0dSopenharmony_ci+    dequant_schema_tensors_buffer_map_[const_cast<schema::Tensor *>(tensor)] = tensor_buf;
be168c0dSopenharmony_ci+  }
be168c0dSopenharmony_ci   return const_cast<schema::Tensor *>(tensor);
be168c0dSopenharmony_ci }
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci@@ -813,14 +822,6 @@ Status NNRTDelegate::DequantLiteGraph(LiteGraph *lite_graph) {
be168c0dSopenharmony_ci }
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci void NNRTDelegate::ShallowCopyLiteGraph(const lite::LiteGraph &lite_graph) {
be168c0dSopenharmony_ci-  Status ret;
be168c0dSopenharmony_ci-  for (auto node : lite_graph.all_nodes_) {
be168c0dSopenharmony_ci-    ret = lite::CheckPrimitiveSupported(static_cast<const schema::Primitive *>(node->primitive_));
be168c0dSopenharmony_ci-    if (ret == kLiteError) {
be168c0dSopenharmony_ci-      MS_LOG(ERROR) << " primitive supported check failed.";
be168c0dSopenharmony_ci-      return;
be168c0dSopenharmony_ci-    }
be168c0dSopenharmony_ci-  }
be168c0dSopenharmony_ci   std::vector<LiteGraph::Node *> node_list;
be168c0dSopenharmony_ci   node_list.reserve(lite_graph.all_nodes_.size());
be168c0dSopenharmony_ci   // copy node
be168c0dSopenharmony_ci@@ -856,7 +857,7 @@ void NNRTDelegate::ShallowCopyLiteGraph(const lite::LiteGraph &lite_graph) {
be168c0dSopenharmony_ci     subgraph_list.emplace_back(new_subgraph);
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci   for (auto tensor : lite_graph.all_tensors_) {
be168c0dSopenharmony_ci-    ret = lite::CheckTensorSupported(static_cast<const schema::Tensor *>(tensor));
be168c0dSopenharmony_ci+    Status ret = lite::CheckTensorSupported(static_cast<const schema::Tensor *>(tensor));
be168c0dSopenharmony_ci     if (ret == kLiteError) {
be168c0dSopenharmony_ci       MS_LOG(ERROR) << "tensor supported check failed.";
be168c0dSopenharmony_ci       return;
be168c0dSopenharmony_ci@@ -921,10 +922,13 @@ NNRTDelegate::~NNRTDelegate() {
be168c0dSopenharmony_ci   if (lite_graph_ != nullptr) {
be168c0dSopenharmony_ci     MS_LOG(ERROR) << "Delete NNRTDelegate.";
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci-  for (auto iter : dequant_schema_tensors_) {
be168c0dSopenharmony_ci-    delete iter.second;
be168c0dSopenharmony_ci-    iter.second = nullptr;
be168c0dSopenharmony_ci+  for (auto iter : dequant_schema_tensors_buffer_map_) {
be168c0dSopenharmony_ci+    if (iter.second != nullptr) {
be168c0dSopenharmony_ci+      free(iter.second);
be168c0dSopenharmony_ci+      iter.second = nullptr;
be168c0dSopenharmony_ci+    }
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci+  dequant_schema_tensors_buffer_map_.clear();
be168c0dSopenharmony_ci }
be168c0dSopenharmony_ci }  // namespace lite
be168c0dSopenharmony_ci }  // namespace mindspore
be168c0dSopenharmony_cidiff --git a/mindspore/lite/src/litert/delegate/nnrt/nnrt_delegate.h b/mindspore/lite/src/litert/delegate/nnrt/nnrt_delegate.h
be168c0dSopenharmony_ciindex 778553ef..db2f0ee7 100644
be168c0dSopenharmony_ci--- a/mindspore/lite/src/litert/delegate/nnrt/nnrt_delegate.h
be168c0dSopenharmony_ci+++ b/mindspore/lite/src/litert/delegate/nnrt/nnrt_delegate.h
be168c0dSopenharmony_ci@@ -95,6 +95,7 @@ class NNRTDelegate : public Delegate {
be168c0dSopenharmony_ci   std::vector<OH_NNExecutor *> nn_executor_list_;
be168c0dSopenharmony_ci   std::vector<Tensor *> *dequant_src_tensors_;
be168c0dSopenharmony_ci   std::map<uint32_t, schema::Tensor *> dequant_schema_tensors_;
be168c0dSopenharmony_ci+  std::map<schema::Tensor *, void *> dequant_schema_tensors_buffer_map_;
be168c0dSopenharmony_ci   std::vector<schema::Tensor *> replaced_schema_tensors_;
be168c0dSopenharmony_ci };
be168c0dSopenharmony_ci }  // namespace lite
be168c0dSopenharmony_cidiff --git a/mindspore/lite/src/litert/delegate/nnrt/nnrt_model_kernel.cc b/mindspore/lite/src/litert/delegate/nnrt/nnrt_model_kernel.cc
be168c0dSopenharmony_ciindex f83632dd..2a66d133 100644
be168c0dSopenharmony_ci--- a/mindspore/lite/src/litert/delegate/nnrt/nnrt_model_kernel.cc
be168c0dSopenharmony_ci+++ b/mindspore/lite/src/litert/delegate/nnrt/nnrt_model_kernel.cc
be168c0dSopenharmony_ci@@ -19,7 +19,7 @@
be168c0dSopenharmony_ci #include "litert/cxx_api/tensor/tensor_impl.h"
be168c0dSopenharmony_ci int mindspore::NNRTModelKernel::Prepare() {
be168c0dSopenharmony_ci   for (size_t i = 0; i < inputs_.size(); i++) {
be168c0dSopenharmony_ci-    auto nnrt_allocator = std::make_shared<lite::NNRTAllocator>(oh_nn_executor, i, lite::NNRT_INPUT);
be168c0dSopenharmony_ci+    auto nnrt_allocator = std::make_shared<lite::NNRTAllocator>(oh_nn_executor, i, device_id_, lite::NNRT_INPUT);
be168c0dSopenharmony_ci     if (nnrt_allocator == nullptr) {
be168c0dSopenharmony_ci       MS_LOG(ERROR) << "Create NNRTAllocator failed";
be168c0dSopenharmony_ci       return lite::RET_NULL_PTR;
be168c0dSopenharmony_ci@@ -27,7 +27,7 @@ int mindspore::NNRTModelKernel::Prepare() {
be168c0dSopenharmony_ci     inputs_[i].SetAllocator(nnrt_allocator);
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci   for (size_t i = 0; i < outputs_.size(); i++) {
be168c0dSopenharmony_ci-    auto nnrt_allocator = std::make_shared<lite::NNRTAllocator>(oh_nn_executor, i, lite::NNRT_OUTPUT);
be168c0dSopenharmony_ci+    auto nnrt_allocator = std::make_shared<lite::NNRTAllocator>(oh_nn_executor, i, device_id_, lite::NNRT_OUTPUT);
be168c0dSopenharmony_ci     if (nnrt_allocator == nullptr) {
be168c0dSopenharmony_ci       MS_LOG(ERROR) << "Create NNRTAllocator failed";
be168c0dSopenharmony_ci       return lite::RET_NULL_PTR;
be168c0dSopenharmony_ci@@ -39,25 +39,33 @@ int mindspore::NNRTModelKernel::Prepare() {
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci int mindspore::NNRTModelKernel::Execute() {
be168c0dSopenharmony_ci   MS_CHECK_TRUE_RET(this->outputs().empty() != true, lite::RET_ERROR);
be168c0dSopenharmony_ci-  zero_copy_ = this->outputs()[Index0].allocator() != nullptr;
be168c0dSopenharmony_ci+  zero_copy_ = IS_NNRT_ALLOCATOR(this->outputs()[Index0].allocator());
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci+  if (!zero_copy_) {
be168c0dSopenharmony_ci+    FreeNNTensor();
be168c0dSopenharmony_ci+  }
be168c0dSopenharmony_ci+  nn_input_tensors_.clear();
be168c0dSopenharmony_ci+  nn_output_tensors_.clear();
be168c0dSopenharmony_ci+  nn_input_tensor_descs_.clear();
be168c0dSopenharmony_ci+  nn_output_tensor_descs_.clear();
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci-  lite::STATUS ret_val = PrepareInputs();
be168c0dSopenharmony_ci+  lite::STATUS ret_val = SetInputs();
be168c0dSopenharmony_ci   if (ret_val != lite::RET_OK) {
be168c0dSopenharmony_ci-    MS_LOG(ERROR) << "NNRTModelKernel PrepareInputs failed, STATUS is " << ret_val;
be168c0dSopenharmony_ci+    MS_LOG(ERROR) << "NNRTModelKernel SetInputs failed, STATUS is " << ret_val;
be168c0dSopenharmony_ci     return ret_val;
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci-  ret_val = TransferOutputs();
be168c0dSopenharmony_ci+  ret_val = SetOutputs();
be168c0dSopenharmony_ci   if (ret_val != lite::RET_OK) {
be168c0dSopenharmony_ci-    MS_LOG(ERROR) << "NNRTModelKernel TransferOutputs failed, STATUS is " << ret_val;
be168c0dSopenharmony_ci+    MS_LOG(ERROR) << "NNRTModelKernel SetOutputs failed, STATUS is " << ret_val;
be168c0dSopenharmony_ci     return ret_val;
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci   MS_LOG(INFO) << "Running NNRtModel Kernel...";
be168c0dSopenharmony_ci   OH_NN_ReturnCode ret_code;
be168c0dSopenharmony_ci-  ret_code = OH_NNExecutor_Run(this->oh_nn_executor);
be168c0dSopenharmony_ci+  ret_code = OH_NNExecutor_RunSync(oh_nn_executor, nn_input_tensors_.data(), nn_input_tensors_.size(),
be168c0dSopenharmony_ci+                                   nn_output_tensors_.data(), nn_output_tensors_.size());
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci   if (ret_code != OH_NN_SUCCESS) {
be168c0dSopenharmony_ci-    MS_LOG(ERROR) << "NNExecutor Run failed, OH_NN_ReturnCode = " << ret_code;
be168c0dSopenharmony_ci+    MS_LOG(ERROR) << "OH_NNExecutor_RunSync Run failed, OH_NN_ReturnCode = " << ret_code;
be168c0dSopenharmony_ci     return lite::RET_ERROR;
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci   MS_LOG(INFO) << "Run NNRtModel Kernel success.";
be168c0dSopenharmony_ci@@ -120,97 +128,107 @@ OH_NN_DataType mindspore::NNRTModelKernel::ConvertDataType(mindspore::DataType d
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci   return oh_data_type;
be168c0dSopenharmony_ci }
be168c0dSopenharmony_ci-int mindspore::NNRTModelKernel::PrepareInputs() {
be168c0dSopenharmony_ci-  auto input_tensors = this->inputs();
be168c0dSopenharmony_ci-  for (size_t i = 0; i < input_tensors.size(); i++) {
be168c0dSopenharmony_ci-    auto tensor = input_tensors[i];
be168c0dSopenharmony_ci-    auto tensor_shape = tensor.Shape();
be168c0dSopenharmony_ci-    auto tmp_quant_param = tensor.QuantParams();
be168c0dSopenharmony_ci-    OH_NN_QuantParam *quant_param = nullptr;
be168c0dSopenharmony_ci-    std::vector<uint32_t> bit_num;
be168c0dSopenharmony_ci-    std::vector<double> scale;
be168c0dSopenharmony_ci-    std::vector<int32_t> zero_point;
be168c0dSopenharmony_ci-    if (!tmp_quant_param.empty()) {
be168c0dSopenharmony_ci-      quant_param = (new (std::nothrow) OH_NN_QuantParam);
be168c0dSopenharmony_ci-      if (quant_param == nullptr) {
be168c0dSopenharmony_ci-        MS_LOG(ERROR) << "new OH_NN_QuantParam failed.";
be168c0dSopenharmony_ci-        return lite::RET_NULL_PTR;
be168c0dSopenharmony_ci-      }
be168c0dSopenharmony_ci-      for (auto qparam : tmp_quant_param) {
be168c0dSopenharmony_ci-        bit_num.emplace_back(qparam.bit_num);
be168c0dSopenharmony_ci-        scale.emplace_back(qparam.scale);
be168c0dSopenharmony_ci-        zero_point.emplace_back(qparam.zero_point);
be168c0dSopenharmony_ci-      }
be168c0dSopenharmony_ci-      quant_param->quantCount = tmp_quant_param.size();
be168c0dSopenharmony_ci-      quant_param->numBits = bit_num.data();
be168c0dSopenharmony_ci-      quant_param->scale = scale.data();
be168c0dSopenharmony_ci-      quant_param->zeroPoint = zero_point.data();
be168c0dSopenharmony_ci+
be168c0dSopenharmony_ci+int mindspore::NNRTModelKernel::SetInputs() {
be168c0dSopenharmony_ci+  if (!zero_copy_) {
be168c0dSopenharmony_ci+    OH_NN_ReturnCode ret{OH_NN_FAILED};
be168c0dSopenharmony_ci+    size_t nn_input_count = 0;
be168c0dSopenharmony_ci+    ret = OH_NNExecutor_GetInputCount(oh_nn_executor, &nn_input_count);
be168c0dSopenharmony_ci+    if (ret != OH_NN_SUCCESS) {
be168c0dSopenharmony_ci+      MS_LOG(ERROR) << "OH_NNExecutor_GetInputCount failed.";
be168c0dSopenharmony_ci+      return lite::RET_ERROR;
be168c0dSopenharmony_ci     }
be168c0dSopenharmony_ci-    auto oprend = new (std::nothrow) OH_NN_Tensor;
be168c0dSopenharmony_ci-    if (oprend == nullptr) {
be168c0dSopenharmony_ci-      MS_LOG(ERROR) << "new OH_NN_Tensor Failed";
be168c0dSopenharmony_ci+    if (nn_input_count != inputs_.size()) {
be168c0dSopenharmony_ci+      MS_LOG(ERROR) << "input count is not equal between ms and nnrt.";
be168c0dSopenharmony_ci       return lite::RET_ERROR;
be168c0dSopenharmony_ci     }
be168c0dSopenharmony_ci-    oprend->dataType = ConvertDataType(tensor.DataType());
be168c0dSopenharmony_ci-    oprend->dimensionCount = tensor_shape.size();
be168c0dSopenharmony_ci-
be168c0dSopenharmony_ci-    std::vector<int32_t> dimensions_list;
be168c0dSopenharmony_ci-    for (auto shape : tensor_shape) {
be168c0dSopenharmony_ci-      if (shape < INT32_MAX) {
be168c0dSopenharmony_ci-        dimensions_list.emplace_back(static_cast<int32_t>(shape));
be168c0dSopenharmony_ci-      } else {
be168c0dSopenharmony_ci-        MS_LOG(ERROR) << "NNExecutor SetInput failed,tensor dimension is is too large, max dim = " << INT32_MAX
be168c0dSopenharmony_ci-                      << ", but get dimension = " << shape;
be168c0dSopenharmony_ci+    for (size_t i = 0; i < nn_input_count; i++) {
be168c0dSopenharmony_ci+      NN_TensorDesc *tensor_desc_tmp = OH_NNExecutor_CreateInputTensorDesc(oh_nn_executor, i);
be168c0dSopenharmony_ci+      if (tensor_desc_tmp == nullptr) {
be168c0dSopenharmony_ci+        MS_LOG(ERROR) << "OH_NNExecutor_CreateInputTensorDesc failed, i = " << i;
be168c0dSopenharmony_ci         return lite::RET_ERROR;
be168c0dSopenharmony_ci       }
be168c0dSopenharmony_ci+      nn_input_tensor_descs_.emplace_back(tensor_desc_tmp);
be168c0dSopenharmony_ci+      NN_Tensor *tensor_tmp = OH_NNTensor_Create(device_id_, tensor_desc_tmp);
be168c0dSopenharmony_ci+      if (tensor_tmp == nullptr) {
be168c0dSopenharmony_ci+        MS_LOG(ERROR) << "OH_NNTensor_Create input failed, i = " << i;
be168c0dSopenharmony_ci+        return lite::RET_ERROR;
be168c0dSopenharmony_ci+      }
be168c0dSopenharmony_ci+      nn_input_tensors_.emplace_back(tensor_tmp);
be168c0dSopenharmony_ci+      void *nn_data = OH_NNTensor_GetDataBuffer(nn_input_tensors_[i]);
be168c0dSopenharmony_ci+      size_t tensor_size;
be168c0dSopenharmony_ci+      ret = OH_NNTensorDesc_GetByteSize(tensor_desc_tmp, &tensor_size);
be168c0dSopenharmony_ci+      if (ret != OH_NN_SUCCESS || tensor_size != inputs_[i].DataSize()) {
be168c0dSopenharmony_ci+        MS_LOG(ERROR) << "NN_Tensor size is not equal to MSTensor, i = " << i;
be168c0dSopenharmony_ci+        return lite::RET_ERROR;
be168c0dSopenharmony_ci+      }
be168c0dSopenharmony_ci+      memcpy(nn_data, inputs_[i].MutableData(), inputs_[i].DataSize());
be168c0dSopenharmony_ci     }
be168c0dSopenharmony_ci-    oprend->dimensions = dimensions_list.data();
be168c0dSopenharmony_ci-    oprend->quantParam = quant_param;
be168c0dSopenharmony_ci-    oprend->type = OH_NN_TENSOR;
be168c0dSopenharmony_ci-    MS_LOG_INFO << "input tensor: " << tensor.Name() << ", data: " << (void *)tensor.MutableData()
be168c0dSopenharmony_ci-                << ", size: " << tensor.DataSize();
be168c0dSopenharmony_ci-
be168c0dSopenharmony_ci-    OH_NN_ReturnCode ret_code;
be168c0dSopenharmony_ci-    if (zero_copy_) {
be168c0dSopenharmony_ci-      OH_NN_Memory mem{tensor.MutableData(), tensor.DataSize()};
be168c0dSopenharmony_ci-      ret_code = OH_NNExecutor_SetInputWithMemory(oh_nn_executor, i, oprend, &mem);
be168c0dSopenharmony_ci-    } else {
be168c0dSopenharmony_ci-      ret_code = OH_NNExecutor_SetInput(oh_nn_executor, i, oprend, tensor.MutableData(), tensor.DataSize());
be168c0dSopenharmony_ci-    }
be168c0dSopenharmony_ci-
be168c0dSopenharmony_ci-    delete (oprend);
be168c0dSopenharmony_ci-
be168c0dSopenharmony_ci-    if (!tmp_quant_param.empty()) {
be168c0dSopenharmony_ci-      free(quant_param);
be168c0dSopenharmony_ci-      quant_param = nullptr;
be168c0dSopenharmony_ci-    }
be168c0dSopenharmony_ci-
be168c0dSopenharmony_ci-    if (ret_code != OH_NN_SUCCESS) {
be168c0dSopenharmony_ci-      MS_LOG(ERROR) << "NNExecutor SetInput failed, current input tensor is" << tensor.Name()
be168c0dSopenharmony_ci-                    << "OH_NN_ReturnCode = " << ret_code;
be168c0dSopenharmony_ci-      return lite::RET_ERROR;
be168c0dSopenharmony_ci+  } else {
be168c0dSopenharmony_ci+    for (size_t i = 0; i < inputs_.size(); i++) {
be168c0dSopenharmony_ci+      void *data = inputs_[i].MutableData();
be168c0dSopenharmony_ci+      NN_Tensor *tensor_tmp = reinterpret_cast<lite::NNRTAllocator *>(inputs_[i].allocator().get())->GetNNTensor(data);
be168c0dSopenharmony_ci+      if (tensor_tmp == nullptr) {
be168c0dSopenharmony_ci+        MS_LOG(ERROR) << "NNRTAllocator GetNNTensor failed, i = " << i;
be168c0dSopenharmony_ci+        return lite::RET_ERROR;
be168c0dSopenharmony_ci+      }
be168c0dSopenharmony_ci+      nn_input_tensors_.emplace_back(tensor_tmp);
be168c0dSopenharmony_ci     }
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci-
be168c0dSopenharmony_ci   return lite::RET_OK;
be168c0dSopenharmony_ci }
be168c0dSopenharmony_ci-int mindspore::NNRTModelKernel::TransferOutputs() {
be168c0dSopenharmony_ci-  auto output_tensors = this->outputs();
be168c0dSopenharmony_ci-  for (size_t i = 0; i < output_tensors.size(); i++) {
be168c0dSopenharmony_ci-    auto tensor = output_tensors[i];
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci-    OH_NN_ReturnCode ret_code;
be168c0dSopenharmony_ci-    if (zero_copy_) {
be168c0dSopenharmony_ci-      OH_NN_Memory mem{tensor.MutableData(), tensor.DataSize()};
be168c0dSopenharmony_ci-      ret_code = OH_NNExecutor_SetOutputWithMemory(oh_nn_executor, i, &mem);
be168c0dSopenharmony_ci-    } else {
be168c0dSopenharmony_ci-      ret_code = OH_NNExecutor_SetOutput(oh_nn_executor, i, tensor.MutableData(), tensor.DataSize());
be168c0dSopenharmony_ci+int mindspore::NNRTModelKernel::SetOutputs() {
be168c0dSopenharmony_ci+  if (!zero_copy_) {
be168c0dSopenharmony_ci+    OH_NN_ReturnCode ret{OH_NN_FAILED};
be168c0dSopenharmony_ci+    size_t nn_output_count = 0;
be168c0dSopenharmony_ci+    ret = OH_NNExecutor_GetOutputCount(oh_nn_executor, &nn_output_count);
be168c0dSopenharmony_ci+    if (ret != OH_NN_SUCCESS) {
be168c0dSopenharmony_ci+      MS_LOG(ERROR) << "OH_NNExecutor_GetOutputCount failed.";
be168c0dSopenharmony_ci+      return lite::RET_ERROR;
be168c0dSopenharmony_ci     }
be168c0dSopenharmony_ci-    if (ret_code != OH_NN_SUCCESS) {
be168c0dSopenharmony_ci-      MS_LOG(ERROR) << "NNExecutor SetOutput failed, current out tensor is" << tensor.Name()
be168c0dSopenharmony_ci-                    << ", OH_NN_ReturnCode = " << ret_code;
be168c0dSopenharmony_ci+    if (nn_output_count != outputs_.size()) {
be168c0dSopenharmony_ci+      MS_LOG(ERROR) << "output count is not equal between ms and nnrt.";
be168c0dSopenharmony_ci       return lite::RET_ERROR;
be168c0dSopenharmony_ci     }
be168c0dSopenharmony_ci+    for (size_t i = 0; i < nn_output_count; i++) {
be168c0dSopenharmony_ci+      NN_TensorDesc *tensor_desc_tmp = OH_NNExecutor_CreateOutputTensorDesc(oh_nn_executor, i);
be168c0dSopenharmony_ci+      if (tensor_desc_tmp == nullptr) {
be168c0dSopenharmony_ci+        MS_LOG(ERROR) << "OH_NNExecutor_CreateOutputTensorDesc failed, i = " << i;
be168c0dSopenharmony_ci+        return lite::RET_ERROR;
be168c0dSopenharmony_ci+      }
be168c0dSopenharmony_ci+      nn_output_tensor_descs_.emplace_back(tensor_desc_tmp);
be168c0dSopenharmony_ci+      NN_Tensor *tensor_tmp = OH_NNTensor_Create(device_id_, tensor_desc_tmp);
be168c0dSopenharmony_ci+      if (tensor_tmp == nullptr) {
be168c0dSopenharmony_ci+        MS_LOG(ERROR) << "OH_NNTensor_Create output failed, i = " << i;
be168c0dSopenharmony_ci+        return lite::RET_ERROR;
be168c0dSopenharmony_ci+      }
be168c0dSopenharmony_ci+      nn_output_tensors_.emplace_back(tensor_tmp);
be168c0dSopenharmony_ci+      auto data = OH_NNTensor_GetDataBuffer(nn_output_tensors_[i]);
be168c0dSopenharmony_ci+      reinterpret_cast<LiteTensorImpl *>(outputs_[i].impl().get())->lite_tensor()->FreeData();
be168c0dSopenharmony_ci+      outputs_[i].SetData(data, false);
be168c0dSopenharmony_ci+    }
be168c0dSopenharmony_ci+  } else {
be168c0dSopenharmony_ci+    for (size_t i = 0; i < outputs_.size(); i++) {
be168c0dSopenharmony_ci+      void *data = outputs_[i].MutableData();
be168c0dSopenharmony_ci+      NN_Tensor *tensor_tmp = reinterpret_cast<lite::NNRTAllocator *>(outputs_[i].allocator().get())->GetNNTensor(data);
be168c0dSopenharmony_ci+      if (tensor_tmp == nullptr) {
be168c0dSopenharmony_ci+        MS_LOG(ERROR) << "NNRTAllocator GetNNTensor failed, i = " << i;
be168c0dSopenharmony_ci+        return lite::RET_ERROR;
be168c0dSopenharmony_ci+      }
be168c0dSopenharmony_ci+      nn_output_tensors_.emplace_back(tensor_tmp);
be168c0dSopenharmony_ci+    }
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci   return lite::RET_OK;
be168c0dSopenharmony_ci }
be168c0dSopenharmony_ci+
be168c0dSopenharmony_ci+void mindspore::NNRTModelKernel::FreeNNTensor() {
be168c0dSopenharmony_ci+  for (size_t i = 0; i < nn_input_tensors_.size(); i++) {
be168c0dSopenharmony_ci+    OH_NNTensor_Destroy(&nn_input_tensors_[i]);
be168c0dSopenharmony_ci+    OH_NNTensorDesc_Destroy(&nn_input_tensor_descs_[i]);
be168c0dSopenharmony_ci+  }
be168c0dSopenharmony_ci+  for (size_t i = 0; i < nn_output_tensors_.size(); i++) {
be168c0dSopenharmony_ci+    OH_NNTensor_Destroy(&nn_output_tensors_[i]);
be168c0dSopenharmony_ci+    OH_NNTensorDesc_Destroy(&nn_output_tensor_descs_[i]);
be168c0dSopenharmony_ci+  }
be168c0dSopenharmony_ci+}
be168c0dSopenharmony_cidiff --git a/mindspore/lite/src/litert/delegate/nnrt/nnrt_model_kernel.h b/mindspore/lite/src/litert/delegate/nnrt/nnrt_model_kernel.h
be168c0dSopenharmony_ciindex 33df925c..40800a2a 100644
be168c0dSopenharmony_ci--- a/mindspore/lite/src/litert/delegate/nnrt/nnrt_model_kernel.h
be168c0dSopenharmony_ci+++ b/mindspore/lite/src/litert/delegate/nnrt/nnrt_model_kernel.h
be168c0dSopenharmony_ci@@ -31,9 +31,9 @@ class NNRTModelKernel : public kernel::Kernel {
be168c0dSopenharmony_ci    * Because nnr can't run single op, but the whole model. So we decide to make the whole model into one kernel.
be168c0dSopenharmony_ci    * */
be168c0dSopenharmony_ci  public:
be168c0dSopenharmony_ci-  NNRTModelKernel(OH_NNExecutor *oh_nn_executor, const std::vector<mindspore::MSTensor> &inputs,
be168c0dSopenharmony_ci+  NNRTModelKernel(OH_NNExecutor *oh_nn_executor, size_t device_id, const std::vector<mindspore::MSTensor> &inputs,
be168c0dSopenharmony_ci                   const std::vector<mindspore::MSTensor> &outputs)
be168c0dSopenharmony_ci-      : kernel::Kernel(inputs, outputs, nullptr, nullptr), oh_nn_executor(oh_nn_executor) {}
be168c0dSopenharmony_ci+      : kernel::Kernel(inputs, outputs, nullptr, nullptr), device_id_(device_id), oh_nn_executor(oh_nn_executor) {}
be168c0dSopenharmony_ci   int Prepare() override;
be168c0dSopenharmony_ci   int Execute() override;
be168c0dSopenharmony_ci   int ReSize() override {
be168c0dSopenharmony_ci@@ -41,14 +41,23 @@ class NNRTModelKernel : public kernel::Kernel {
be168c0dSopenharmony_ci     return lite::RET_ERROR;
be168c0dSopenharmony_ci   };
be168c0dSopenharmony_ci   OH_NN_DataType ConvertDataType(mindspore::DataType data_type);
be168c0dSopenharmony_ci-  int PrepareInputs();
be168c0dSopenharmony_ci-  int TransferOutputs();
be168c0dSopenharmony_ci+  int SetInputs();
be168c0dSopenharmony_ci+  int SetOutputs();
be168c0dSopenharmony_ci+  void FreeNNTensor();
be168c0dSopenharmony_ci   ~NNRTModelKernel() override {
be168c0dSopenharmony_ci+    if (!zero_copy_) {
be168c0dSopenharmony_ci+      FreeNNTensor();
be168c0dSopenharmony_ci+    }
be168c0dSopenharmony_ci     MS_LOG(INFO) << "NNRTModelKernel Destroy.";
be168c0dSopenharmony_ci   }
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci  protected:
be168c0dSopenharmony_ci+  size_t device_id_;
be168c0dSopenharmony_ci   OH_NNExecutor *oh_nn_executor = nullptr;
be168c0dSopenharmony_ci+  std::vector<NN_Tensor *> nn_input_tensors_;
be168c0dSopenharmony_ci+  std::vector<NN_TensorDesc *> nn_input_tensor_descs_;
be168c0dSopenharmony_ci+  std::vector<NN_Tensor *> nn_output_tensors_;
be168c0dSopenharmony_ci+  std::vector<NN_TensorDesc *> nn_output_tensor_descs_;
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci  private:
be168c0dSopenharmony_ci   bool zero_copy_{false};
be168c0dSopenharmony_cidiff --git a/mindspore/lite/src/tensor.h b/mindspore/lite/src/tensor.h
be168c0dSopenharmony_ciindex f2eb4d1a..501e28e5 100644
be168c0dSopenharmony_ci--- a/mindspore/lite/src/tensor.h
be168c0dSopenharmony_ci+++ b/mindspore/lite/src/tensor.h
be168c0dSopenharmony_ci@@ -38,10 +38,12 @@ namespace lite {
be168c0dSopenharmony_ci #define STATIC_ALLOCATION -271964
be168c0dSopenharmony_ci #define RUNTIME_REFCOUNT 0x9999
be168c0dSopenharmony_ci #define OPENCL_ALLOCATOR_REFCOUNT -10000
be168c0dSopenharmony_ci+#define NNRT_ALLOCATION -10001
be168c0dSopenharmony_ci #define IS_STATIC_ALLOCATOR(allocator) ((allocator != nullptr) && (allocator->RefCount(nullptr) == STATIC_ALLOCATION))
be168c0dSopenharmony_ci #define IS_RUNTIME_ALLOCATOR(allocator) ((allocator != nullptr) && (allocator->RefCount(nullptr) == RUNTIME_REFCOUNT))
be168c0dSopenharmony_ci #define IS_OPENCL_ALLOCATOR(allocator) \
be168c0dSopenharmony_ci   ((allocator != nullptr) && (allocator->RefCount(nullptr) == OPENCL_ALLOCATOR_REFCOUNT))
be168c0dSopenharmony_ci+#define IS_NNRT_ALLOCATOR(allocator) ((allocator != nullptr) && (allocator->RefCount(nullptr) == NNRT_ALLOCATION))
be168c0dSopenharmony_ci
be168c0dSopenharmony_ci struct LiteQuantParam {
be168c0dSopenharmony_ci   double scale;
be168c0dSopenharmony_ci--
be168c0dSopenharmony_ci2.17.1
be168c0dSopenharmony_ci