
有時候看著一張照片,盯久了,腦袋會突然卡殼,辨認不出照片里面是什么東西,每當遇到這種情況的時候,我想我內心是崩潰的。
可這樣的煩惱,我想也許以后就不存在了,MindStore 分享了一個由微軟推出的智能圖像識別機器人 CaptionBot,可以像人類一樣識別并且能夠描述圖片的內容。除了能夠告訴我圖片中的物體是什么,還能讓我知道它正在做什么。
CaptionBot 的出現主要是微軟為了展示其通過多年的研究成果,特意推出的微軟認知服務(Microsoft Cognitive Services)。確切地說,CaptionBot 由計算機視覺 API、人工情感 API 和必應圖像搜索 API 等三個部分組成。
不可思議的辨認識別度

我們可以發現 CaptionBot 網站本身有提供六張圖片作為測試,只是想嘗嘗鮮的人只要輕點其中一張圖片,不久就會出現分析結果。

CaptionBot 識別的準確度比想象中要高很多,不僅僅能識別出圖片中的物體是三明治,還知道它是被切成兩塊的三明治。在三明治的下面,我們還可以為識別的結果打分,根據評分來判斷識別結果的正確性。
也許隨著評分人數的增加,CaptionBot 的深度學習系統使其智能識別準確度越來越高。
當然,像我這種具備強烈好奇心的人,自然不會忽略頁面下面的“Upload a photo”的字眼。CaptionBot 提供由本地上傳和圖片鏈接等兩種圖片上傳的方式,操作方式跟平時使用的一樣,按提示一步步完成即可。

有時候 CaptionBot 充滿人性化的語氣真是讓人忍俊不禁。

實際上 CaptionBot 的出現,讓我想起微軟在 2015 年開發者大會上,用來展示自家人臉識別 API 的網站 How-old.net,用戶只要上傳照片,系統就會自動判斷你的性別和年齡。
當時這個產品在國內外的社交平臺上都火了一圈,不知道大家還記不記得,當時的朋友圈幾乎每張照片上,每個人的臉都被方框框住,每個方框上面都飄著一個數字,說不定 CaptionBot 就是下一個轉瘋朋友圈的?How-old.net.

當時每個人都以年齡數字小為榮,可有一個詭異的事件不知道大家有沒有發現。大家可以觀察一下上面這張圖片,然后在評論區給我留言發現了什么。
他們的“第三只眼睛”
CaptionBot,是微軟在其圖像識別等領域取得的成果的展現, 目前它可能僅僅只是作為一個小測試,識別某張圖片的內容。
我在剛打開這個網站的時候,心里也是嘀咕著說:“這玩意兒有什么用啊?不就是識別圖片嘛。”
沒錯,對于普通人來說,CaptionBot 可能僅僅是在社交媒體上充當一個玩具的作用,我利用這樣一個玩具達到我娛樂和社交的目的,這樣就完了,也沒有后面的東西了,也許僅僅是兩三天后我就已經忘記這樣一個網站的存在了。

可是仔細想一想,對于盲人等一些有缺陷的人來說,這可能就是打開新世界的大門了。假如一個盲人戴著裝有能實現 CaptionBot 功能的 Google Glass 出門,任何圖像內容能夠被智能識別并且轉化為語音,那盲人是否也能通過這樣的“第三只眼”來“看到”這個世界了?
期待這一天的到來。
題圖來自:unsplash
文章來自愛范兒,?MindStore專欄,微信ID:mindStoredyh
?
(編輯:小酷)
掃碼添加客服微信
掃碼關注公眾號
酷網(大連)科技有限公司
致力于為客戶品牌提供完善解決方案
統一服務電話:0411-62888851