AR增强现实及视觉检测技术学习

学习内容

AR增强现实开发学习路线

学习路线推荐Hololens操作-->c#语言-->unity开发-->混合现实开发
所有涉及c#及unity的相关知识建议浅尝辄止,后续有需要再查找资料

了解Hololens智能眼镜

Hololens2是微软设计开发的一款全息计算机,且运行的是Windows系统。具体信息可在微软官网查看:Microsoft HoloLens,主要了解使用Hololens部署Hololens两部分。
Hololens爆炸图

学习C#编程语言

C#语言入门主要有两种方式:

  1. 文档资料学习
    有编程基础情况下推荐此学习方式,编程语言基本内容相同,只有具体语法结构及语法特性会有变化,通过直接查阅资料文档可以快速上手。对于项目来说只需要简单了解,项目中遇到问题再详细查找资料。
    学习文档可参考:c#菜鸟教程
    有较好编程基础可参考:微软官方c#指南
  2. 网课
    通过网课了解语言的语法,常用IDE,语言特性等内容,同样只需要简单了解,项目中遇到问题再详细查找资料。
    可参考:C#零基础入门教程 Visual Studio 2022

学习unity开发

unity开发学习推荐以视频学习为主,简单了解unity开发工具的使用及其基本开发逻辑和c#脚本编写方法,学习视频可参考unity2022入门教程,了解其基本用法后在实际开发中有所需要直接查看unity官方文档(根据自己版本进行选择)。

如果基础较好也可以实际参考官方教程进行学习unity官方教程,学习速度更快。

MRTK3混合现实开发

基于MRTK3的unity混合显示开发是AR开发的重中之重,一定要了解吃透,避免项目开发中出现大问题。学习过程如下:

  1. 部署MRTK3工具包
    MRTK3
  2. 完成微软官方Hololens开发教程
    只需完成至第三节——三位对象交互入门指南,即可。
    第三节截图

视觉检测技术学习路线

学习路线推荐深度学习基础原理-->python语言-->深度学习环境部署与练手-->读论文

了解深度学习原理

  1. 深度神经网络
    了解深度神经网络的原理,误差反向传递的方法等基本深度学习知识。学习视频可参考吴恩达深度学习教程(了解完基本原理,大致第一节结束即可)
  2. 卷积神经网络
    卷积神经网络是各类cv深度学习模型的基础,学习后对后续深度学习模型的应用和理解非常有用。学习视频可参考吴恩达CNN教程

python语言学习

python语言语法简单,功能强,第三方库多,如果有编程基础建议直接使用文本类资料进行。
可参考书籍《Python编程——从入门到实践》或网站python菜鸟教程,可以快速上手。
《Python编程——从入门到实践》
也可随视频教程进行黑马python教程

与c#学习相同,仅需了解基本语法和特性,其他知识需要时再进行学习。

深度学习环境部署及练手

环境部署

深度学习涉及环境有:

  1. Anaconda python虚拟环境管理器
  2. cuda、cudnn 英伟达N卡深度学习支持
  3. pytorch python深度学习框架
  4. git 版本控制器,主要用于拉取已有程序代码

自行上网搜索教程,cuda和cudnn安装可能较为麻烦,一定要认真看。
Anaconda和git安装完成后一定要熟悉命令行控制,可以减少后期精力花费

项目练习

可参考李沐的视频进行学习,也可参考b站教学视频(视频可能较老,遇到问题再上网查)。

如果上一步深度学习原理了解比较全面,学习框架后此步应该不存在较大问题,如果有余力可以自己找一些简单的网络结构自行实现,并利用网络数据集进行训练尝试。

了解深度学习图像处理论文

可以按照一下顺序阅读,可以仅作了解,了解目标检测算法的发展过程,不必深入探究

论文精度可直接去B站搜索,有很多精读视频

YOLO算法精读与模型实践

算法精读

YOLO作为目前目标检测的SOTA方法,发展迭代数量非常多,但其最基本思想都是一致的,所以建议深入学习YOLOv1论文,后面的论文主要了解其改进的方法和思想,最后精读最新的YOLO论文。

模型实践

YOLO模型再python上的实现有一个较为完整的第三方库ultralytics,可直接使用pip命令进行安装,官方网站如下:ultralytics官网
ultralytics
所有相关资料均可在官网查询,没有基础的话建议先阅读quick start
部分,熟悉基本使用方法后即可自行标注数据集尝试进行微调,并检查微调结果。
现在,开始享受自己训练的模型吧!!!

滇ICP备2023009291号-1
京公网安备11010802043399号