
104 |
第
3
章
base_storage_url = "<URL of the images folder>"
tags = [None] * df.size
#
每分钟查询
20
张图像
,
然后暂停
,
#
因为这样可以免费使用
Computer Vision API
for i, row in df.iterrows():
tags[i] = describe_image(base_storage_url+df["rel_url"][i])
print("counter: {0}. Tags {1}".format(i, tags[i]))
if(i % 20 == 0):
time.sleep(60)
创建数据帧
接下来,我们将标记数组添加到数据帧。由于我们知道图像的标签(因为图
像分别在“室内”和“室外”文件夹中),因此我们在第
3
列中提取标签,
仅在验证子集上使用,以计算经验精度:
#
附加标签数组
df["tags"] = tags
#
提取标签
df["label"] = df.apply(lambda x: INDOOR if "indoor" in str(x["Path"])
else OUTDOOR) , axis=1)
df.head(3)
数据帧如表
3-5
所示。
表
3
-
5
:包含 Computer Vision API tags 输出结果的数据帧
路径
标签
C:\images\outdoor\378.jpg,1” [outdoor, sky, ground, mountain...”
C:\images\indoor\763.jpg,-1, ...