同一張圖片內可能同時被偵測到許多物件或特徵,此時回傳的值會像是這樣:
“labelAnnotations”: [
{
“mid”: “/m/017m8l”,
“description”: “waterway”,
“score”: 0.9609974
},
{
“mid”: “/m/0838f”,
“description”: “water”,
“score”: 0.9603445
},
{
“mid”: “/m/03ktm1”,
“description”: “body of water”,
“score”: 0.93432164
},
{
“mid”: “/m/08rrcl”,
“description”: “water transportation”,
“score”: 0.9240506
},
{
“mid”: “/m/019jd”,
“description”: “boat”,
“score”: 0.9176671
},
…………
…………
]
這個案例就是上面這張圖的回傳結果,API 認為「水路運輸」是圖片中的主角,因此給了最高分;下面說的「大面積的水」、「船」、「划船」等特徵也都會列出來。
利用這個特徵值,可以輕易找出照片內容關鍵字,對於大量照片的分類、關鍵資訊的抽取都很有幫助。
臉部偵測(FACE_DETECTION)
可以偵測輸入圖片中的多個臉孔,並可指出臉部特徵。此 API 會回傳一組非常龐大的特徵集 faceAnnotations,包含人臉的位置、是否高興、是否生氣、是否有戴眼鏡、是否模糊等等,甚至包含左眼在哪裡、眼睛上緣、下緣的位置等極細微的特徵都能透過此 API 獲取。