這5項圖像標註服務,常見又重要!

全文共1908字,預計學習時長4分鐘

在計算機視覺中,圖像標註是最重要的工作之一。

在大量應用程序中,計算機視覺本質上是擁有一雙機器眼睛——擁有看見世界和解讀世界的能力。

有時,機器學習項目的目的在於解鎖那些黑科技,例如增強現實技術、自動語音識別和神經網絡機器翻譯,這些AI應用程序擁有改變全球範圍內個體生命和企業的潛能。同樣的,計算機視覺能夠帶給人們的技術體驗(如自動駕駛汽車、面部識別、無人機等等)也是超凡的。

然而,沒有圖像標註,計算機視覺的一切高超技術皆無可能。本文將解釋何爲圖像標註,以及五項由衆多世界級訓練數據公司提供的圖像標註服務。

什麼是圖像標註?

圖像標註是一項用標籤標註圖像的工作。這些標籤由AI 工程師預設,並被選取以爲計算機視覺模型提供信息,展示圖像的內容。

由於項目不同,每一圖像上的標籤數量也各不相同。一些項目僅需一個標籤就可以表示整幅圖像的內容(圖像分類)。而另外一些項目可能需要給多個對象打標籤,每一圖像都需要不同的標籤。

圖像標註如何工作?

創建標註圖像需要三樣東西:

1. 圖像

2. 標註圖像的人

3. 標註圖像的平臺

大多圖像標註項目都起步於尋找和訓練標註師,從而實現標註任務。AI 是個極其專業化的領域,但是AI 訓練數據標註並非總是如此。爲了打造一輛自動駕駛汽車,也許需要在機器學習領域獲得更高學歷,但並不需要獲得在圖像上劃汽車邊框(邊界框標註)的碩士學位。因此,許多標註師都沒有機器學習領域相關學歷。

然後,需要對這些標註師進行有關每一標註項目技術規範和指引的充分訓練,因爲每個公司都會有不同的要求。只要標註師進行了如何標註數據的訓練,他們就會在一個圖像標註專用平臺上標註成百上千的圖像。這個平臺是一款軟件,爲了某一特定標註類型的實現,它必須包含所有必要工具。

5種常見圖像標註服務

 

1. 2D 和3D 邊界框

使用2D 邊界框,標註師必須在要標註的對象四周劃邊框。有時這些目標對象是一樣的,即「請在圖像中的每輛自行車四周劃邊框」。

也會存在不止一個目標對象的情況,「請在圖像中的每一輛汽車、每個行人及每一輛自行車周圍劃邊框」。在這種情況下,劃好邊框後,標註師接着需要從標籤列表中選取一些標籤分配給每一邊框內的對象。

 

3D 邊界框,也稱爲立方體,除了還可以展現被標註對象的近似深度,幾乎和2D 邊界框是一樣的。和2D 邊界框標註類似,標註師在目標對象周圍劃邊框,確保在對象的邊緣放置了錨點。有時目標對象的某個部分可能是成塊的。在這種情況下,標註師會大概估計目標對象成塊邊緣的位置。

2. 圖像分類

邊界框在一幅圖像中處理了多個對象的標註,而圖像分類則是將整幅圖像與一個標籤聯繫起來的過程。圖像分類的一個簡單例子就是給動物種類註明標籤。標註師會得到動物圖像,其任務就是基於物種對圖像進行分類。

將這類已標註圖像的數據導入計算機視覺模型能讓模型理解每一類動物特有的可視化特徵。理論上來說,模型隨之能夠對未標註的新動物圖像進行較準確的物種分類。

3. 直線與曲線

顧名思義,直線與曲線標註是在圖像上給直線或曲線打標籤。標註師的任務是標註車路、人行道、電線杆以及其他表明邊界的事物。標註了直線和曲線的圖像主要用於車路和邊界的識別。它們也常用於無人機的路徑規劃。

從自動駕駛汽車和無人機,載到倉庫中的機器人及其他事物,直線與曲線標註在多種情況下都適用。

4. 多邊形

有時,不規則目標對象無法通過邊界框或立方體進行簡單標註。多邊形標註使得標註師能夠在目標對象的每一頂點繪製點位。無論形狀如何,這一標註方法能夠準確標註對象的所有邊緣。

 

正如邊界框,標註邊緣內的像素點隨後會被打上標籤以描繪目標對象。

5. 語義分割

邊界框、立方體和多邊形都處理了一幅圖像內單個對象的標註任務。然而,語義分割是某一圖像內每一像素點的標註。給標註師的是一系列分割標籤以分離圖像,而不是一系列需要標註的對象。

語義分割有個很好的實例,就是交通圖像中的自動駕駛汽車。其典型任務是要求標註師「按汽車、自行車、行人、路障、人行道、行車道和建築物分割圖像」。

每一部分通常以某種獨特的顏色表示。標註師在要標註的像素點周圍畫線,並選擇合適的標籤。最終結果將如下所示:

圖源:medium.com/intro-to-artificial-intelligence

留言 點贊 關注

我們一起分享AI學習與發展的乾貨
歡迎關注全平臺AI垂類自媒體 「讀芯術」

(添加小編微信:dxsxbb,加入讀者圈,一起討論最新鮮的人工智能科技哦~)