
人工智能和行为
|
289
讨论
Core ML
是用来训练机器学习模型以用于预测的框架。这些模型采用各种不同的输
入,如文本、数字、图片,并根据它们的训练方式进行预测。
Core ML
只能使用
.mlmodel
格式的模型,但苹果提供了一个模型转换工具,能对
各种机器学习系统比如
Keras
、
Theano
、
Torch
和
TensorFlow
所产生的模型进行转换。
关于更多
Core ML
的内容,请看苹果的文档:
http://developer.apple.com/
documentation/coreml
。
9.16
识别图片中的物体
问题
你想用
Core ML
和
Vision
框架识别图片中的内容。
解决方案
在这个例子中,我们将使用
Inceptionv3
模型,研究者称,它可用于“识别图片中
出现的
1000
种类别的主要对象,包括树木、动物、食物、车辆、任务等”。我们
也使用了
9.14
节中的技术。
特别的是,我们会添加一个
AVCaptureOutput
,用它不停地从相机抓取图片并传递
给一个方法,这个方法用这些数据运行
Core ML
模型。最终在一个文字
Label
中输
出一个字符串,描述模型认为图片中物体是什么。
因为从
AVSession
中出来的原始的视频帧是一种非常低级的格式,我们还需要用到
Vision
框架,这个框架中的某些类能够为我们进行格式转换:
1.
从苹果的
Core ML
网站下载
Inceptionv3.mlmodel
文件。
2.
将
.mlmodel
文件添加到项目。
3.
编译项目,确认 ...