如何使用Python的OpenCV库处理图像和视频

2023-02-20 原文

介绍

众所周知，计算机视觉在机器学习和人工智能领域获得了巨大的普及。图像识别技术允许计算机处理比人眼更多的信息，通常更快、更准确，或者只是在人们不参与观看的情况下处理。因此，你可能想知道机器如何学习和解释视觉世界。

在本文中，我将介绍如何使用 Python 的 OpenCV 库开始处理图像和视频。我们将涵盖以下主题：

计算机视觉简介
OpenCV 库及其应用简介
如何使用 OpenCV 库处理图像和视频

计算机视觉

它是人工智能和计算机科学的一个领域，训练计算机理解视觉世界。它是机器学习的主要组成部分之一。它处理自然世界的图像（高维数据）。它执行各种任务，例如获取、分析和处理以理解图像并将其转换为数字或符号信息。

当今的计算机视觉算法基于模式识别，通常依赖于卷积神经网络 (CNN)。由于该领域的各种进步，计算机视觉正在蓬勃发展，并且它的受欢迎程度在过去几年中呈指数增长。

计算机视觉的应用范围从缺陷检测到入侵者检测、口罩检测到肿瘤检测、作物监测到植物监测、车辆分类到交通流量分析等。该技术主要应用于零售和制造、交通、媒体、农业、医疗保健、体育、银行、增强现实、家庭安全等。

OpenCV

Python 包含一个名为 OpenCV 的库，用于在计算机视觉领域工作。它是一个开源库，于 1999 年推出。我们可以执行图像处理、图像分析、视频分析等任务。该库主要用 C 编写，具有 C 、Python、Java 和 MATLAB 等接口。

应用：

2D 和 3D 特征工具包
视频/图像搜索检索
人脸识别系统
手势识别
移动机器人
对象识别
医学影像分析
运动追踪
增强现实

安装

使用 pip 命令可以轻松安装 OpenCV，如下所示

pip install opencv-python

使用 OpenCV 处理图像

在处理图像时，OpenCV 有许多可以对图像执行的操作。其中，我将讨论：

读取图像
调整图像大小
旋转图像
翻转图像
重写图像
裁剪图像
在图像上绘制各种形状

1. 从文件中读取图像

使用函数imread()读取图片（支持BMP、jpeg、tiff、png、便携图片格式等）
为了显示我们在上一步中读取的图像，我们使用函数“imshow()”。这个函数的第一个参数是标题，第二个是我们读到的图像。
waitkey() 函数显示一个窗口几毫秒。毫秒数作为参数传递给函数。如果 0 作为参数传递，它将永远等待，直到按下任何键。
最后，destroyAllWindows() 将图像窗口显示后从内存中删除。

例子：

python 代码：

import cv2
 
img=cv2.imread('img.jpeg')
cv2.imshow('Image',img)
cv2.waitKey()
cv2.destroyAllWindows()

输出

2. 调整图像大小：

在图像处理中，经常需要调整图像的大小。OpenCV 为我们提供了几种轻松重新缩放图像的方法。让我们通过一个例子来理解。

例子：

img2=cv2.resize(img,(400,400))
#resize by a fraction of original size
img3=cv2.resize(img,(0,0),fx=0.5,fy=0.6)
#using INTER_AREA to shrink the image
img4=cv2.resize(img,(600,700),interpolation=cv2.INTER_AREA)

3. 旋转图像

使用 OpenCV 旋转图像的语法是

M=cv2.getRotationMatrix2D(center, angle,scale)

然后我们使用方法

cv2.wrapAffine(src,M, (h,w))

让我们通过一个例子来深入了解：

例子：

#calculate height and width to get center
(h,w)=img.shape[:2]
center=(w/2,h/2)
 
#rotate by 90 degrees
M = cv2.getRotationMatrix2D(center, 90, 1.0)
img90 = cv2.warpAffine(img, M, (h, w))
 
#rotate by 180 degrees
M = cv2.getRotationMatrix2D(center, 180, 1.0)
img180 = cv2.warpAffine(img, M, (h, w))
 
#rotate by 270 degrees
M = cv2.getRotationMatrix2D(center, 270, 1.0)
img270 = cv2.warpAffine(img, M, (h, w))

4. 翻转图像：

要翻转图像，我们使用函数 cv2.flip() 并传递参数，即图像和翻转代码（水平或垂直）

例子：

#flip- vertical axes
img=cv2.flip(img,0) 
#flip- horizontal axes
img=cv2.flip(img,1)

5. 重写图像

要将图像重写为新文件，我们使用函数 imwrite() 如下：

cv2.imwrite('new_img.jpg',img)

6. 裁剪图像

#crop from top
img=img[0:100,0:100]
#crop by specifying height and width
img=img[50:200,50:100]

7. 绘制形状

使用 OpenCV，我们可以使用不同的函数在图像上快速绘制各种形状，如圆形、矩形、多边形等。让我们用一个例子来理解：

例子：

#creating a blank image
import cv2 as cv2
import numpy as np
img=np.zeros((500,500,3),dtype=float)
#changing the color of the image to green
img[:]=0,255,0
#Red
img[:]=0,0,255

#changing the color of a particular portion
img[200:300,300:450]=0,255,0
#drawing a rectangle
cv2.rectangle(img,(100,100),(180,180),color=(255,0,0),thickness=5)
#draw a circle with filling the color
cv2.circle(img,center=(100,300),radius=60,color=(0,255,0),thickness=-1)
#drawing a line 
cv2.line(img,(0,0),(317,356),thickness=3,color=(0,255,0))
#adding text
cv2.putText(img,org=(50,50),fontScale=3,color=(255,0,0)
,thickness=2,lineType=cv2.LINE_AA,text="IMAGES", fontFace=cv2.FONT_HERSHEY_COMPLEX_SMALL)
cv2_imshow(img)
cv2.waitKey(0)

使用 OpenCV 处理视频

视频是帧序列或图像序列。图像通常采用 BGR（蓝、绿、红）的形式。每个像素的值都在 0-255 之间。要开始使用 OpenCV 处理视频，我们使用以下函数：

Cv2.VideoCapture()：它建立与视频的连接。它带有一个参数，该参数指示是使用内置摄像头还是附加摄像头。值“0”表示内置摄像头。

Cap.read()：这个方法可以让我们得到一个帧。

Cv2.cvtColor()：允许你更改图像使用的颜色模型。这包括从 BGR 转换为 RGB 和灰度。

在处理视频方面，在本文中，我们将学习

如何捕获视频帧的不同属性
读取视频文件
写视频

1. 捕获视频帧的属性：

让我们看几个捕获视频属性的示例。

要捕获帧形状：

frame.shape
(2160, 3840, 3)
plt.imshow(frame)
plt.show()

要更改框架的颜色，我们使用函数 cv2.cvtColor()，如下所示：

#changing the color of the frame
plt.show()
plt.imshow(cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY))

为了捕捉视频，我们使用函数 cv2.VideoCapture()

cap=cv2.VideoCapture('/content/video.mp4')
cap.read()

要获取框架的高度，我们使用 cap.get() 函数如下：

#height
cap.get(cv2.CAP_PROP_FRAME_HEIGHT)

为了获得框架的宽度，我们使用：

#width
cap.get(cv2.CAP_PROP_FRAME_WIDTH)

要获取帧数，我们使用函数 cap.get() 如下：

#number of frames

cap.get(cv2.CAP_PROP_FRAME_COUNT)

为了获得每秒的帧数，我们使用

#number of frames per sec
cap.get(cv2.CAP_PROP_FPS)

2. 读取视频文件

导入 cv2
然后我们使用函数 cv2.VideoCapture() 来捕捉视频。
接下来，我们循环遍历每一帧并使用函数 cap.read() 读取帧。
为了显示每一帧，我们使用方法 cv2.imshow()。
最后，我们使用 waitKey() 函数中断循环，当用户按下任意键时，该函数会中断循环。
destroyAllWindows() 函数将关闭窗口。

例子：

#importing dependencies
import cv2
from matplotlib import pyplot as plt
#establish capture
cap=cv2.VideoCapture('/content/video.mp4')
#loop through each frame
while(cap.isOpened()):
  ret,frame=cap.read()
  frame=cv2.resize(frame,(1200,700))
  cv2.imshow(‘Video',frame)
  if cv2.waitKey(10) & 0xFF == ord('q'):
    break
#close down everything
cap.release()
cv2.destroyALLWindows()

3. 编写视频文件

导入 cv2
使用函数 cv2.VideoCapture() 捕获视频
然后我们使用函数 cv2.VideoWriter 来编写视频。该函数将参数作为
1. cv2.VideoWriter(filename, fourcc, fps, framesize)
2. filename - 捕获的输入视频文件
3. Fourcc - 用于指定视频编解码器的代码
4. fps - 每秒帧数
5. framesize - 视频框的高度和宽度
接下来，我们循环遍历每一帧并使用对象 video_writer 来写入帧。
最后，我们使用 waitKey() 函数来打破循环
使用函数 destroyAllWindows() 关闭窗口

import cv2
from google.colab.patches import cv2_imshow
cap=cv2.VideoCapture('/content/video.mp4')
height=int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
width=int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
fps=int(cap.get(cv2.CAP_PROP_FPS))
frame_size = (width,height)
video_writer= cv2.VideoWriter('/content/output.avi',cv2.VideoWriter_fourcc('M','J','P','G'), fps, frame_size)
for frame_idx in range(int(cap.get(cv2.CAP_PROP_FRAME_COUNT))):
  ret,frame=cap.read()
  gray=cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)
  video_writer.write(gray)
  if cv2.waitKey(10) & 0xFF== ord('q'):
    break
cap.release()
cv2.destroyALLWindows()

结论

本文帮助你创建了与计算机视觉相关的出色应用程序。希望你现在对以下内容有一个很好的了解：

什么是计算机视觉
OpenCV 库的应用
使用 OpenCV 库处理图像
使用 OpenCV 库处理视频

总结

到此这篇关于如何使用Python的OpenCV库处理图像和视频的文章就介绍到这了,更多相关Python OpenCV处理图像和视频内容请搜索Devmax以前的文章或继续浏览下面的相关文章希望大家以后多多支持Devmax！

如何使用Python的OpenCV库处理图像和视频的更多相关文章

iOS使用openCV检测来自摄像头的矩形

如果我在处理它之前克隆matimage,通过记录它,它似乎处理图像甚至找到矩形,但矩形不会被绘制到图像输出到imageView.我很确定我错过了一些东西,可能是因为我没有正确传递某个对象,指向对象的指针等等,而我需要修改的对象则没有.无论如何,如果这不是正确的方法,我真的很感谢他们做这样的事情的教程或例子,使用openCV或GPUImage…它不需要尝试使用matimage来设置imageView.image,而只需要将matimage转换为在imageView中实际修改,因为CvVideoCamera已
XCode 3.2 Ruby和Python模板

在xcode3.2下,我的ObjectiveCPython/Ruby项目仍然可以打开更新和编译,但是你无法创建新项目.鉴于xcode3.2中缺少ruby和python的所有痕迹(即创建项目并添加新的ruby/python文件),是否有一种简单的方法可以再次安装模板？我发现了一些关于将它们复制到某个文件夹的信息,但我似乎无法让它工作,我怀疑文件夹的位置已经改变为3.2.解决方法3.2中的应用程序模板
使用Xcode为OS X Lion / Mountain Lion编译OpenCV(2.3.1)

任何人都可以为我提供一些如何使用Xcode在OSXLion上编译OpenCV2.3.1的详细指南吗？我对此感到生气…我得到了源码,使用cmake创建Xcode模板并尝试构建它,但它失败了大约200个错误.提前致谢,大教堂解答我的回答帖子.解决方法详细指南如何使用MacPorts在Xcode4.2.1的OSXLion下启动和运行OpenCV2.3.1编辑08/06/2012：这也适用于OpenCV2.4.1.只需确保您获得最新版本的Xcode并安装“命令行工具”.编辑15/08/2012：使用Mountai
ios – OpenCV构建问题,找不到ext/atomicity.h

我得到编译器错误抱怨在构建包含OpenCV的项目时.环境是针对iOS的Xcode4.5.它为模拟器编译良好,但在为设备构建时失败.这是错误文本：我正在使用opencv2.framework,使用指令here构建cmake.解决方法默认情况下,XCode4.5使用libc(支持C11的LLVMC标准库)生成要构建的新项目.但OpenCV期望针对GNUlibstd
从IOS / iPad / iPhone的最大速度

我使用OpenCVforiOS完成计算密集型应用程序.当然这很慢.但它比我的PC原型慢了200倍.所以我正在优化它.从最初的15秒,我能够获得0.4秒的速度.我想知道我是否找到了所有的东西以及别人想要分享的东西.我做了什么：>将OpenCV中的“double”数据类型替换为“float”.双倍是64位,32位cpu不能轻易处理,所以浮动给了我一些速度.OpenCV经常使用双倍.>为编译器选项添加了
Swift基本使用-函数和闭包(三)

声明函数和其他脚本语言有相似的地方，比较明显的地方是声明函数的关键字swift也出现了Python中的组元，可以通过一个组元返回多个值。传递可变参数，函数以数组的形式获取参数swift中函数可以嵌套，被嵌套的函数可以访问外部函数的变量。可以通过函数的潜逃来重构过长或者太复杂的函数。
10 个Python中Pip的使用技巧分享

众所周知，pip 可以安装、更新、卸载 Python 的第三方库，非常方便。本文小编为大家总结了Python中Pip的使用技巧，需要的可以参考一下
Swift、Go、Julia与R能否挑战 Python 的王者地位

本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至dio@foxmail.com举报，一经查实，本站将立刻删除。
红薯因 Swift 重写开源中国失败，貌似欲改用 Python

本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至dio@foxmail.com举报，一经查实，本站将立刻删除。
在Swift iOS中使用OpenCV

在我的xcode项目中添加OpenCV2框架后，我试图搜索samlpes或教程与swift集成。有什么好的教程同样吗？OpenCV是用C编写的框架。苹果的reference告诉我们YoucannotimportC++codedirectlyintoSwift.Instead,createanObjective-CorCwrapperforC++code.所以你不能在一个swift项目中直接导入和使用OpenCV，但这实际上并不坏，因为你(需要)继续使用框架的C语法，这是在网络上有很多文档。那么你怎么进行呢

随机推荐

10 个Python中Pip的使用技巧分享

众所周知，pip 可以安装、更新、卸载 Python 的第三方库，非常方便。本文小编为大家总结了Python中Pip的使用技巧，需要的可以参考一下
python数学建模之三大模型与十大常用算法详情

这篇文章主要介绍了python数学建模之三大模型与十大常用算法详情，文章围绕主题展开详细的内容介绍，具有一定的参考价值，感想取得小伙伴可以参考一下
Python爬取奶茶店数据分析哪家最好喝以及性价比

这篇文章主要介绍了用Python告诉你奶茶哪家最好喝性价比最高，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习吧
使用pyinstaller打包.exe文件的详细教程

PyInstaller是一个跨平台的Python应用打包工具，能够把 Python 脚本及其所在的 Python 解释器打包成可执行文件,下面这篇文章主要给大家介绍了关于使用pyinstaller打包.exe文件的相关资料,需要的朋友可以参考下
基于Python实现射击小游戏的制作

这篇文章主要介绍了如何利用Python制作一个自己专属的第一人称射击小游戏，文中的示例代码讲解详细，感兴趣的小伙伴可以跟随小编一起动手试一试
Python list append方法之给列表追加元素

这篇文章主要介绍了Python list append方法如何给列表追加元素，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
Pytest+Request+Allure+Jenkins实现接口自动化

这篇文章介绍了Pytest+Request+Allure+Jenkins实现接口自动化的方法，文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
利用python实现简单的情感分析实例教程

商品评论挖掘、电影推荐、股市预测……情感分析大有用武之地,下面这篇文章主要给大家介绍了关于利用python实现简单的情感分析的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
利用Python上传日志并监控告警的方法详解

这篇文章将详细为大家介绍如何通过阿里云日志服务搭建一套通过Python上传日志、配置日志告警的监控服务，感兴趣的小伙伴可以了解一下
Pycharm中运行程序在Python console中执行,不是直接Run问题

这篇文章主要介绍了Pycharm中运行程序在Python console中执行,不是直接Run问题，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教