[C#]winform使用纯opencvsharp部署yolox-onnx模型

【官方框架地址】

https://github.com/Megvii-BaseDetection/YOLOX
【算法介绍】

YOLOX是一个高性能的目标检测算法,它是基于YOLO(You Only Look Once)系列算法的Anchor  Free版本。YOLOX由Megvii Technology的研究团队开发,并在2021年推出。该算法在保持YOLO系列原有速度与精度优势的同时,引入了新的改进和创新点,使得在各种规模的数据集上都能取得卓越的性能。

### YOLOX的主要特点

#### 锚框(Anchor boxes)的去除
YOLOX摒弃了传统的锚框机制。锚框是一种预设的框,用于在训练初期引导模型识别物体的大致位置和尺寸。但锚框也存在局限性,比如需要手动设计、可能引入先验偏差等。YOLOX通过引入anchor-free的机制,直接预测目标的中心点和宽高,从而减少了对先验知识的依赖,简化了算法结构。

#### 解耦头(Decoupled head)
YOLOX采用解耦头设计,将分类和回归两个任务分开处理。这种设计有助于专门化网络的每个部分以处理不同的任务,从而提高整体性能。

#### 强化数据增强(Strong data augmentation)
为了提高模型的泛化能力,YOLOX采用了包括Mosaic和MixUp在内的多种强化数据增强策略。这些策略可以有效扩充数据集,增加模型训练时的样本多样性,进而提高模型对各种变化的适应能力。

#### 支持多尺度训练
YOLOX支持在不同尺寸的图片上进行训练,这意味着模型可以适应各种分辨率的输入,增强了模型的鲁棒性和适应性。

#### SimOTA标签分配策略
YOLOX引入了一种新的标签分配策略SimOTA,用于在训练过程中更高效地分配正负样本。这种策略可以自动调整与不同检测框关联的目标数量,从而优化训练过程。

#### 模型剪枝和量化
YOLOX还考虑了模型部署的需求,提供了模型剪枝和量化的方案,用以减少模型的大小和提高推理速度,使其更适合在移动或边缘计算设备上运行。

### YOLOX与其他YOLO版本的比较

YOLOX不仅继承了YOLOv4的优点,并且结合了YOLOv3和YOLOv5的一些特性。YOLOX相对于YOLOv4,在速度和精度上都有显著提升,同时也具有更好的扩展性。与YOLOv5相比,YOLOX在开放测试集上通常能够实现更高的精确度和更快的速度。

### 应用场景

YOLOX的高速度和高精度特性使其非常适合用于实时视频分析、自动驾驶、无人机监视、工业自动化检测等多个领域。它可以快速地在视频流中检测出多个目标和分类,满足对实时性要求较高的应用场景。

### 开源与社区

YOLOX是一个开源项目,代码和预训练模型可以在GitHub上找到。它的开源特性吸引了全球的开发者和研究者参与贡献,使得YOLOX能够持续进化和改进。

综合来看,YOLOX是一个强大的目标检测算法,它在YOLO家族中脱颖而出,不断突破目标检测的边界。其创新的设计和优异的性能使得YOLOX在计算机视觉领域有着广泛的应用前景。

【效果展示】


【实现部分代码】

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Diagnostics;
using System.Drawing;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using System.Windows.Forms;
using OpenCvSharp;

namespace FIRC
{
    public partial class Form1 : Form
    {
        Mat src = new Mat();
        YoloxManager detector = new YoloxManager();
        public Form1()
        {
            InitializeComponent();
        }

        private void button1_Click(object sender, EventArgs e)
        {
            OpenFileDialog openFileDialog = new OpenFileDialog();
            openFileDialog.Filter = "图文件(*.*)|*.jpg;*.png;*.jpeg;*.bmp";
            openFileDialog.RestoreDirectory = true;
            openFileDialog.Multiselect = false;
            if (openFileDialog.ShowDialog() == DialogResult.OK)
            {
              
                src = Cv2.ImRead(openFileDialog.FileName);

                pictureBox1.Image = OpenCvSharp.Extensions.BitmapConverter.ToBitmap(src);


            }


        }

        private void button2_Click(object sender, EventArgs e)
        {
            if(pictureBox1.Image==null)
            {
                return;
            }

            var result = detector.Inference(src);
            var resultMat = detector.DrawImage(result,src);
            pictureBox2.Image= OpenCvSharp.Extensions.BitmapConverter.ToBitmap(resultMat); //Mat转Bitmap
        }

        private void Form1_Load(object sender, EventArgs e)
        {
            detector.LoadWeights(Application.StartupPath+"\\weights\\yolox_s.onnx", Application.StartupPath + "\\weights\\coco.names");
        }

        private void button3_Click(object sender, EventArgs e)
        {
     
       
        }
    }
}


【视频演示】

https://www.bilibili.com/video/BV1V5411i7Zz/
【源码下载】

https://download.csdn.net/download/FL1623863129/88723523
【测试环境】

vs2019

netframework4.7.2

opencvsharp4.8.0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/309960.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

打架识别摄像机

随着社会治安问题的增加,打架事件在公共场所频繁发生,给社会治安带来了一定程度的威胁。因此,为了提高公共场所的安全性,可以利用现代科技,如人工智能和摄像技术,开发一种打架识别摄像机。 这种摄像机可以通…

AIGC实战——改进循环神经网络

AIGC实战——改进循环神经网络 0. 前言1. 堆叠循环网络2. 门控制循环单元3. 双向单元相关链接 0. 前言 我们已经学习了如何训练长短期记忆网络 (Long Short-Term Memory Network, LSTM) 模型,以学习使用给定风格生成文本,接下来,我们将学习如…

软件测试|MySQL HAVING分组筛选详解

简介 在 MySQL 数据库中,HAVING 子句用于在使用 GROUP BY 子句对结果进行分组后,对分组后的数据进行筛选和过滤。它允许我们对分组后的结果应用聚合函数,并基于聚合函数的结果进行条件过滤,从而得到我们需要的最终结果集。本文将…

RISC-V Bytes: Caller and Callee Saved Registers

原文链接1:https://danielmangum.com/posts/risc-v-bytes-caller-callee-registers/ 原文链接2:https://zhuanlan.zhihu.com/p/77663680 //主要讲栈帧 原文链接3:https://www.jianshu.com/p/b666213cdd8a //主要讲栈帧 This is part of a new…

2024年中级工程师职称业绩报告该怎么写呢?

1、在写报告时一定要注意时间问题,需要与项目实际时间一致,要把自己的工作经历写清楚,在项目里主要负责什么内容,担任什么职务。 2、可以写发现了什么问题,并如何去解决的,或者因为你发现和创新给项目带来的…

Mermaid 教程

Mermaid 教程 Mermaid 介绍 Mermaid 是一个用于生成流程图、时序图、甘特图等图表的 JavaScript 库。它使用类似于 Markdown 的文本语法,使得创建图表变得简单直观。以下是一个简单的 Mermaid 教程,介绍如何使用 Mermaid 创建流程图、时序图和甘特图。…

docker启动mongo

用户名:root 密码:123456 version: 3.1 services:mongo:image: mongo:7container_name: mongorestart: alwaysports:- 27017:27017volumes:- /opt/data/mongo:/data/dbenvironment:TZ: Asia/ShanghaiMONGO_INITDB_ROOT_USERNAME: rootMONGO_INITDB_ROO…

数字孪生+可视化技术 构建智慧新能源汽车充电站监管平台

前言 充电基础设施为电动汽车提供充换电服务,是重要的交通能源融合类基础设施。近年来,随着新能源汽车产业快速发展,我国充电基础设施持续增长,已建成世界上数量最多、服务范围最广、品种类型最全的充电基础设施体系。着眼未来新…

《C++ Primer》第14章 重载运算与类型转换(二)

参考资料: 《C Primer》第5版《C Primer 习题集》第5版 14.8 函数调用运算符(P506) 如果类重载了函数调用运算符,则我们可以像使用函数一样使用该类的对象。这样的类同时也能存储状态,所以它们比普通函数更加灵活。…

Android可换行的RadioGroup

Android可换行的RadioGroup,有时候需要换行显示的单选列表,当然可以有多种实现方式,比如recycleview或者listview实现,本文采用的是RadioGrouprediobutton方式实现。 一、首先自定义view public class WrapRadioGroup extends RadioGroup {pr…

【XR806开发板试用】+ FreeRtos开发环境搭建

获取SDK SDK可以通过官网直接下载。 下载完成之后,通过gzip命令解压文件 gzip -d xr806_sdk.tar.gz 获取编译链工具 还是按照官网操作指南,下载 gcc-arm-none-eabi-8-2019-q3-update 下载之后进行解压,同理。 注意修改GCC路径&#xff0c…

三、C语言分支与循环知识点补充——随机数生成

本章分支结构的学习内容如下: 三、C语言中的分支与循环—if语句 (1) 三、C语言中的分支与循环—关系操作符 (2) 三、C语言中的分支与循环—条件操作符 与逻辑操作符(3) 三、C语言中的分支与循环—switch语句(4)分支结构 完 本章循环结构的…

直播预告丨看零售场,如何玩转 MaaS

今年,有一个被频繁提及的词是MaaS 这类工具正在帮助千行百业实现大模型落地产业 在零售场,特别是像京东这样拥有超高并发、超复杂协同的电商场内 也沉淀出了一套通用的AI基础设施——九数算法中台 从提升客户服务体验、平台效率出发,训练各…

AtCoder ABC194

这期比193稍微简单一点 C - Squared Error 手玩一下: N 3 N3 N3时 展开得 a 2 b 2 − 2 a b b 2 − c 2 − 2 b c a 2 c 2 − 2 a c a^2b^2-2abb^2-c^2-2bca^2c^2-2ac a2b2−2abb2−c2−2bca2c2−2ac 每个数平方项都要计算 n − 1 n-1 n−1次 减的那一份可…

MYSQL篇--事务机制高频面试题

事务 1 什么是数据库事务? 事务是一个不可分割的数据库操作序列,也是数据库并发控制的基本单位,其执行的结果必须使数据库从一种一致性状态变到另一种一致性状态。事务是逻辑上的一组操作,要么都执行,要么都不执行。…

图纸版本管理混乱怎么办?彩虹PDM系统帮你搞定!

在现代制造业和工程领域,图纸版本管理的混乱常常是一个棘手的问题。不同版本的图纸可能导致严重的错误和生产问题,影响了产品质量和交付时间。然而,有一个强大的工具可以帮助企业解决这个问题,那就是PDM产品数据管理系统。彩虹PDM…

云流量回溯的工作原理及关键功能

云计算和网络技术的快速发展为企业提供了更灵活、高效的业务运营环境,同时也引发了一系列网络安全挑战。在这个背景下,云流量回溯成为网络安全领域的一个关键技术,为企业提供了对网络活动的深入洞察和实时响应的能力。 一、 云流量回溯的基本…

pkuseg按照用户自定义词典分词错误修正

import pkusegc pkuseg.pkuseg(user_dict"./data/dict.txt") sentence 数字传播实验班 print(c.cut(sentence))字典中包含“”数字传媒与人文学院",添加自定义词典后,文本被错误分成““数字传 播 实验班” ,debug发现solve…

OpenShift 4 - 在 OpenShift 上运行物体检测 AI 应用

《OpenShift / RHEL / DevSecOps 汇总目录》 说明:本文已经在 OpenShift 4.14 RHODS 2.5.0 的环境中验证 说明:请先根据《OpenShift 4 - 部署 OpenShift AI 环境,运行 AI/ML 应用(视频)》一文完成 OpenShift AI 环境…

python爬虫实战(8)--获取虎pu热榜

1. 需要的类库 import requests from bs4 import BeautifulSoup import pandas as pd2. 请求地址 def fetch_data():url "https://bbs.xxx.com/" # Replace with the actual base URLresponse requests.get(url)if response.status_code 200:return response.c…
最新文章