1. 张量的基本定义
在计算机图像处理中,张量(Tensor)是一种多维数组结构,用于高效表示和操作图像数据及其他高维数据。
数学背景:张量是向量和矩阵的高维推广,可视为多维数组。其"阶"(或"秩")表示维数:
- 0阶张量:标量(单个数值)
- 1阶张量:向量(一维数组)
- 2阶张量:矩阵(二维数组)
- 更高阶:三维及以上数组(如RGB图像、视频序列等)
图像处理中的张量:通常指3阶或4阶张量,用于表示批量的图像数据。
在计算机图像处理中,张量(Tensor)是一种多维数组结构,用于高效表示和操作图像数据及其他高维数据。
数学背景:张量是向量和矩阵的高维推广,可视为多维数组。其"阶"(或"秩")表示维数:
图像处理中的张量:通常指3阶或4阶张量,用于表示批量的图像数据。
*5阶张量则出现于深度学习批量处理短视频或长视频(由4阶的视频片段组成)中
*C表示通道数,H表示高度,W表示宽度,N表示个数