0

0

Pytorch中的Fivecrop

霞舞

霞舞

发布时间:2025-02-05 10:44:19

|

463人浏览过

|

来源于dev.to

转载

给我买咖啡☕

*备忘录:

  • 我的帖子解释了牛津iiitpet()。

> fivecrop()可以将图像裁剪成5个部分(左上角,右上,左下,右下和中心),如下所示:

*备忘录:

    >初始化的第一个参数是大小(必需类型:int或tuple/list/list(int)或size()): *备忘录:
    • 是[高度,宽度]。
    • >必须是1个
  • 元组/列表必须是具有1或2个元素的1d。
  • 单个值(int或tuple/list(int))是指[size,size]。
  • 第一个参数是img(必需类型:pil图像或张量(int)): *备忘录:
张量必须为2d或3d。
  • 不使用img =。
    • 建议根据v1或v2使用v2?我应该使用哪一个?
    from torchvision.datasets import OxfordIIITPet
    from torchvision.transforms.v2 import FiveCrop
    
    fivecrop = FiveCrop(size=100)
    
    fivecrop
    # FiveCrop(size=(100, 100))
    
    fivecrop.size
    # (100, 100)
    
    origin_data = OxfordIIITPet(
        root="data",
        transform=None
    )
    
    s500_394origin_data = OxfordIIITPet( # `s` is size.
        root="data",
        transform=FiveCrop(size=[500, 394])
    )
    
    s300_data = OxfordIIITPet(
        root="data",
        transform=FiveCrop(size=300)
    )
    
    s200_data = OxfordIIITPet(
        root="data",
        transform=FiveCrop(size=200)
    )
    
    s100_data = OxfordIIITPet(
        root="data",
        transform=FiveCrop(size=100)
    )
    
    s50_data = OxfordIIITPet(
        root="data",
        transform=FiveCrop(size=50)
    )
    
    s10_data = OxfordIIITPet(
        root="data",
        transform=FiveCrop(size=10)
    )
    
    s1_data = OxfordIIITPet(
        root="data",
        transform=FiveCrop(size=1)
    )
    
    s200_300_data = OxfordIIITPet(
        root="data",
        transform=FiveCrop(size=[200, 300])
    )
    
    s300_200_data = OxfordIIITPet(
        root="data",
        transform=FiveCrop(size=[300, 200])
    )
    
    import matplotlib.pyplot as plt
    
    def show_images1(fcims, main_title=None):
        plt.figure(figsize=[10, 5])
        plt.suptitle(t=main_title, y=0.8, fontsize=14)
        titles = ['Top-left', 'Top-right', 'Bottom-left',
                  'Bottom-right', 'Center']
        for i, fcim in zip(range(1, 6), fcims):
            plt.subplot(1, 5, i)
            plt.title(label=titles[i-1], fontsize=14)
            plt.imshow(X=fcim)
        plt.tight_layout()
        plt.show()
    
    plt.figure(figsize=(7, 9))
    plt.title(label="s500_394origin_data", fontsize=14)
    plt.imshow(X=origin_data[0][0])
    show_images1(fcims=s500_394origin_data[0][0], main_title="s500_394origin_data")
    show_images1(fcims=s300_data[0][0], main_title="s300_data")
    show_images1(fcims=s200_data[0][0], main_title="s200_data")
    show_images1(fcims=s100_data[0][0], main_title="s100_data")
    show_images1(fcims=s50_data[0][0], main_title="s50_data")
    show_images1(fcims=s10_data[0][0], main_title="s10_data")
    show_images1(fcims=s1_data[0][0], main_title="s1_data")
    show_images1(fcims=s200_300_data[0][0], main_title="s200_300_data")
    show_images1(fcims=s300_200_data[0][0], main_title="s300_200_data")
    
    # ↓ ↓ ↓ ↓ ↓ ↓ The code below is identical to the code above. ↓ ↓ ↓ ↓ ↓ ↓
    def show_images2(im, main_title=None, s=None):
        plt.figure(figsize=[10, 5])
        plt.suptitle(t=main_title, y=0.8, fontsize=14)
        titles = ['Top-left', 'Top-right', 'Bottom-left',
                  'Bottom-right', 'Center']
        if not s:
            s = [im.size[1], im.size[0]] 
        fc = FiveCrop(size=s) # Here
        for i, fcim in zip(range(1, 6), fc(im)):
            plt.subplot(1, 5, i)
            plt.title(label=titles[i-1], fontsize=14)
            plt.imshow(X=fcim) # Here
        plt.tight_layout()
        plt.show()
    
    plt.figure(figsize=(7, 9))
    plt.title(label="s500_394origin_data", fontsize=14)
    plt.imshow(X=origin_data[0][0])
    show_images2(im=origin_data[0][0], main_title="s500_394origin_data")
    # show_images2(im=origin_data[0][0], main_title="s500_394origin_data",
    #              s=[500, 394])
    show_images2(im=origin_data[0][0], main_title="s300_data", s=300)
    show_images2(im=origin_data[0][0], main_title="s200_data", s=200)
    show_images2(im=origin_data[0][0], main_title="s100_data", s=100)
    show_images2(im=origin_data[0][0], main_title="s50_data", s=50)
    show_images2(im=origin_data[0][0], main_title="s10_data", s=10)
    show_images2(im=origin_data[0][0], main_title="s1_data", s=1)
    show_images2(im=origin_data[0][0], main_title="s200_300_data", s=[200, 300])
    show_images2(im=origin_data[0][0], main_title="s300_200_data", s=[300, 200])
    
  • image description

    image description

    image description

    image description

    SnapEdit
    SnapEdit

    AI移除图片中的任何物体

    下载

    image description

    image description

    image description

    image description

    image description

    热门AI工具

    更多
    DeepSeek
    DeepSeek

    幻方量化公司旗下的开源大模型平台

    豆包大模型
    豆包大模型

    字节跳动自主研发的一系列大型语言模型

    通义千问
    通义千问

    阿里巴巴推出的全能AI助手

    腾讯元宝
    腾讯元宝

    腾讯混元平台推出的AI助手

    文心一言
    文心一言

    文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

    讯飞写作
    讯飞写作

    基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

    即梦AI
    即梦AI

    一站式AI创作平台,免费AI图片和视频生成。

    ChatGPT
    ChatGPT

    最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

    相关专题

    更多
    string转int
    string转int

    在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

    1010

    2023.08.02

    int占多少字节
    int占多少字节

    int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

    611

    2024.08.29

    c++怎么把double转成int
    c++怎么把double转成int

    本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

    334

    2025.08.29

    C++中int的含义
    C++中int的含义

    本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

    235

    2025.08.29

    pytorch是干嘛的
    pytorch是干嘛的

    pytorch是一个基于python的深度学习框架,提供以下主要功能:动态图计算,提供灵活性。强大的张量操作,实现高效处理。自动微分,简化梯度计算。预构建的神经网络模块,简化模型构建。各种优化器,用于性能优化。想了解更多pytorch的相关内容,可以阅读本专题下面的文章。

    467

    2024.05.29

    Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习
    Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

    PyTorch 是一种用于构建深度学习模型的功能完备框架,是一种通常用于图像识别和语言处理等应用程序的机器学习。 使用Python 编写,因此对于大多数机器学习开发者而言,学习和使用起来相对简单。 PyTorch 的独特之处在于,它完全支持GPU,并且使用反向模式自动微分技术,因此可以动态修改计算图形。

    27

    2025.12.22

    C# ASP.NET Core微服务架构与API网关实践
    C# ASP.NET Core微服务架构与API网关实践

    本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

    76

    2026.03.11

    Go高并发任务调度与Goroutine池化实践
    Go高并发任务调度与Goroutine池化实践

    本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

    38

    2026.03.10

    Kotlin Android模块化架构与组件化开发实践
    Kotlin Android模块化架构与组件化开发实践

    本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

    83

    2026.03.09

    热门下载

    更多
    网站特效
    /
    网站源码
    /
    网站素材
    /
    前端模板

    精品课程

    更多
    相关推荐
    /
    热门推荐
    /
    最新课程
    10分钟--Midjourney创作自己的漫画
    10分钟--Midjourney创作自己的漫画

    共1课时 | 0.1万人学习

    Midjourney 关键词系列整合
    Midjourney 关键词系列整合

    共13课时 | 0.9万人学习

    AI绘画教程
    AI绘画教程

    共2课时 | 0.2万人学习

    关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
    php中文网:公益在线php培训,帮助PHP学习者快速成长!
    关注服务号 技术交流群
    PHP中文网订阅号
    每天精选资源文章推送

    Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号