Pytorch中的Fivecrop

霞舞

发布时间：2025-02-05 10:44:19

463人浏览过

来源于dev.to

转载

给我买咖啡☕

*备忘录：

我的帖子解释了牛津iiitpet（）。

> fivecrop（）可以将图像裁剪成5个部分（左上角，右上，左下，右下和中心），如下所示：

*备忘录：

单个值（int或tuple/list（int））是指[size，size]。

张量必须为2d或3d。

不使用img =。

建议根据v1或v2使用v2？我应该使用哪一个？

from torchvision.datasets import OxfordIIITPet
from torchvision.transforms.v2 import FiveCrop

fivecrop = FiveCrop(size=100)

fivecrop
# FiveCrop(size=(100, 100))

fivecrop.size
# (100, 100)

origin_data = OxfordIIITPet(
    root="data",
    transform=None
)

s500_394origin_data = OxfordIIITPet( # `s` is size.
    root="data",
    transform=FiveCrop(size=[500, 394])
)

s300_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=300)
)

s200_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=200)
)

s100_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=100)
)

s50_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=50)
)

s10_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=10)
)

s1_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=1)
)

s200_300_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=[200, 300])
)

s300_200_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=[300, 200])
)

import matplotlib.pyplot as plt

def show_images1(fcims, main_title=None):
    plt.figure(figsize=[10, 5])
    plt.suptitle(t=main_title, y=0.8, fontsize=14)
    titles = ['Top-left', 'Top-right', 'Bottom-left',
              'Bottom-right', 'Center']
    for i, fcim in zip(range(1, 6), fcims):
        plt.subplot(1, 5, i)
        plt.title(label=titles[i-1], fontsize=14)
        plt.imshow(X=fcim)
    plt.tight_layout()
    plt.show()

plt.figure(figsize=(7, 9))
plt.title(label="s500_394origin_data", fontsize=14)
plt.imshow(X=origin_data[0][0])
show_images1(fcims=s500_394origin_data[0][0], main_title="s500_394origin_data")
show_images1(fcims=s300_data[0][0], main_title="s300_data")
show_images1(fcims=s200_data[0][0], main_title="s200_data")
show_images1(fcims=s100_data[0][0], main_title="s100_data")
show_images1(fcims=s50_data[0][0], main_title="s50_data")
show_images1(fcims=s10_data[0][0], main_title="s10_data")
show_images1(fcims=s1_data[0][0], main_title="s1_data")
show_images1(fcims=s200_300_data[0][0], main_title="s200_300_data")
show_images1(fcims=s300_200_data[0][0], main_title="s300_200_data")

# ↓ ↓ ↓ ↓ ↓ ↓ The code below is identical to the code above. ↓ ↓ ↓ ↓ ↓ ↓
def show_images2(im, main_title=None, s=None):
    plt.figure(figsize=[10, 5])
    plt.suptitle(t=main_title, y=0.8, fontsize=14)
    titles = ['Top-left', 'Top-right', 'Bottom-left',
              'Bottom-right', 'Center']
    if not s:
        s = [im.size[1], im.size[0]] 
    fc = FiveCrop(size=s) # Here
    for i, fcim in zip(range(1, 6), fc(im)):
        plt.subplot(1, 5, i)
        plt.title(label=titles[i-1], fontsize=14)
        plt.imshow(X=fcim) # Here
    plt.tight_layout()
    plt.show()

plt.figure(figsize=(7, 9))
plt.title(label="s500_394origin_data", fontsize=14)
plt.imshow(X=origin_data[0][0])
show_images2(im=origin_data[0][0], main_title="s500_394origin_data")
# show_images2(im=origin_data[0][0], main_title="s500_394origin_data",
#              s=[500, 394])
show_images2(im=origin_data[0][0], main_title="s300_data", s=300)
show_images2(im=origin_data[0][0], main_title="s200_data", s=200)
show_images2(im=origin_data[0][0], main_title="s100_data", s=100)
show_images2(im=origin_data[0][0], main_title="s50_data", s=50)
show_images2(im=origin_data[0][0], main_title="s10_data", s=10)
show_images2(im=origin_data[0][0], main_title="s1_data", s=1)
show_images2(im=origin_data[0][0], main_title="s200_300_data", s=[200, 300])
show_images2(im=origin_data[0][0], main_title="s300_200_data", s=[300, 200])

image description

SnapEdit

AI移除图片中的任何物体

下载

image description

PythonAI成长瓶颈突破教程_为什么学不会AI

PythonAI数学基础教程_线性代数概率论快速掌握

Python转AI数据方向教程_数据驱动智能决策

PythonAI模型训练实战教程_从零构建预测模型

python 的优势在哪里

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1010

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

611

2024.08.29

c++怎么把double转成int

本专题整合了 c++ double相关教程，阅读专题下面的文章了解更多详细内容。

334

2025.08.29

C++中int的含义

本专题整合了C++中int相关内容，阅读专题下面的文章了解更多详细内容。

235

2025.08.29

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

467

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

热门下载

网站特效

网站源码

网站素材

前端模板