PyTorch 中的 FiveCrop

碧海醫心

发布时间：2025-01-21 12:42:13

992人浏览过

来源于dev.to

转载

请我喝杯咖啡☕

*备忘录：

我的帖子解释了 oxfordiiitpet()。

fivecrop() 可以将图像裁剪为 5 个部分（左上、右上、左下、右下和中心），如下所示：

*备忘录：

初始化的第一个参数是 size(required-type:int or tuple/list(int) or size()): *备注：
- 它是[高度，宽度]。
- 必须是 1 <= x。
- 元组/列表必须是具有 1 或 2 个元素的一维。
- 单个值（int 或 tuple/list(int) 表示 [size, size]。
第一个参数是img（必需类型：pil图像或张量（int））： *备注：
- 张量必须是一个或多个元素的 2d 或 3d。
- 不要使用img=。
v2建议按照v1还是v2使用？我应该使用哪一个？

from torchvision.datasets import OxfordIIITPet
from torchvision.transforms.v2 import FiveCrop

fivecrop = FiveCrop(size=100)

fivecrop
# FiveCrop(size=(100, 100))

fivecrop.size
# (100, 100)

origin_data = OxfordIIITPet(
    root="data",
    transform=None
)

p500p394origin_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=[500, 394])
    # transform=FiveCrop(size=[600])
    # transform=FiveCrop(size=[600, 600])
)

p300_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=300)
)

p200_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=200)
)

p100_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=100)
)

p50_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=50)
)

p10_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=10)
)

p200p300_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=[200, 300])
)

p300p200_data = OxfordIIITPet(
    root="data",
    transform=FiveCrop(size=[300, 200])
)

import matplotlib.pyplot as plt

def show_images1(fcims, main_title=None):
    plt.figure(figsize=(10, 5))
    plt.suptitle(t=main_title, y=0.8, fontsize=14)
    titles = ['Top-left', 'Top-right', 'bottom-left',
              'bottom-right', 'center']
    for i, fcim in zip(range(1, 6), fcims):
        plt.subplot(1, 5, i)
        plt.title(label=titles[i-1], fontsize=14)
        plt.imshow(X=fcim)
    plt.tight_layout()
    plt.show()

plt.figure(figsize=(7, 9))
plt.title(label="Origin_data", fontsize=14)
plt.imshow(X=origin_data[0][0])
show_images1(fcims=p500p394origin_data[0][0], main_title="p500p394origin_data")
show_images1(fcims=p300_data[0][0], main_title="p300_data")
show_images1(fcims=p200_data[0][0], main_title="p200_data")
show_images1(fcims=p100_data[0][0], main_title="p100_data")
show_images1(fcims=p50_data[0][0], main_title="p50_data")
show_images1(fcims=p10_data[0][0], main_title="p10_data")
show_images1(fcims=p200p300_data[0][0], main_title="p200p300_data")
show_images1(fcims=p300p200_data[0][0], main_title="p300p200_data")

# ↓ ↓ ↓ ↓ ↓ ↓ The code below is identical to the code above. ↓ ↓ ↓ ↓ ↓ ↓
def show_images2(im, main_title=None, s=None):
    plt.figure(figsize=(10, 5))
    plt.suptitle(t=main_title, y=0.8, fontsize=14)
    titles = ['Top-left', 'Top-right', 'bottom-left',
              'bottom-right', 'center']
    if not s:
        s = [im.size[1], im.size[0]] 
    fc = FiveCrop(size=s) # Here
    for i, fcim in zip(range(1, 6), fc(im)):
        plt.subplot(1, 5, i)
        plt.title(label=titles[i-1], fontsize=14)
        plt.imshow(X=fcim) # Here
    plt.tight_layout()
    plt.show()

plt.figure(figsize=(7, 9))
plt.title(label="Origin_data", fontsize=14)
plt.imshow(X=origin_data[0][0])
show_images2(im=origin_data[0][0], main_title="p500p394origin_data")
# show_images2(im=origin_data[0][0], main_title="p500p394origin_data",
#              s=[500, 394])
show_images2(im=origin_data[0][0], main_title="p300_data", s=300)
show_images2(im=origin_data[0][0], main_title="p200_data", s=200)
show_images2(im=origin_data[0][0], main_title="p100_data", s=100)
show_images2(im=origin_data[0][0], main_title="p50_data", s=50)
show_images2(im=origin_data[0][0], main_title="p10_data", s=10)
show_images2(im=origin_data[0][0], main_title="p200p300_data", s=[200, 300])
show_images2(im=origin_data[0][0], main_title="p300p200_data", s=[300, 200])

image description

Chromox

Chromox是一款领先的AI在线生成平台，专为喜欢AI生成技术的爱好者制作的多种图像、视频生成方式的内容型工具平台。

下载

image description

PythonAI成长瓶颈突破教程_为什么学不会AI

PythonAI数学基础教程_线性代数概率论快速掌握

Python转AI数据方向教程_数据驱动智能决策

PythonAI模型训练实战教程_从零构建预测模型

python 的优势在哪里

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1030

2023.08.02

int占多少字节

int占4个字节，意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值，在某些情况下也可能是2个字节或8个字节，int是一种常用的数据类型，用于表示整数，需要根据具体情况选择合适的数据类型，以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

612

2024.08.29

c++怎么把double转成int

本专题整合了 c++ double相关教程，阅读专题下面的文章了解更多详细内容。

334

2025.08.29

C++中int的含义

本专题整合了C++中int相关内容，阅读专题下面的文章了解更多详细内容。

235

2025.08.29

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

469

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开，系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示，帮助开发者构建稳定高效的 Go 并发任务处理系统，提高系统在高负载环境下的处理能力与稳定性。

2026.03.10

Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开，重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析，帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系，提升团队协作效率与项目迭代速度。

2026.03.09

热门下载

网站特效

网站源码

网站素材

前端模板