image-20221003152451996

关于yolo中图像的提取

1 、 我们可以发现 由于使用了 pytorch 所以把 img都变成了 tensor类型

image-20221003152606759

在第一次 提取的时候 可以发现 h = 330 w = 494

这是一个长方形 明显不 符合规格 所以 采取了填充 无标题

也就是把他pading一下 变成一个正方形 让多余的地方是 0 不影响特征提取

标签

image-20221003153543945

明显标签和图片是一致的

image-20221003154109297

明显 label是一个txt 所以要 用numpy来 loadtxt读取

但是 由于用的torch 于是又用 formnumpy函数 转化为tensor

什么究极套娃

然后 把坐标 变成padding之后的坐标 也就是变成正方形之后的

image-20221003154717902

这 是图片增强

就是通过变化图像来增加 图片数量 增加 特征提取的数量

貌似 coco数据集很大 应该不需要进行图像增强了